전자 상거래 사이트의 경우 패싯 내비게이션(Faceted Navigation)(색상, 크기, 가격, 브랜드별 필터링)은 궁극적인 양날의 검입니다.
사용자 경험(UX)에는 필수적이지만, 확인하지 않고 방치하면 수백만 개의 저품질 URL을 생성하고 "크롤링 예산(Crawl Budget)"을 낭비하며 중복 콘텐츠를 통해 순위를 파괴하는 "거미 함정(Spider Trap)"을 만듭니다.
이 가이드에서는 대규모 인벤토리와 기술적 패싯 구현을 전문적으로 관리하는 방법을 자세히 설명합니다.
1. 문제: "무한 URL" 함정
사용자가 여러 필터를 선택하면 CMS는 모든 조합에 대해 새 URL을 생성합니다.
- 기본 URL:
example.com/mens-shoes - 필터링된 URL:
example.com/mens-shoes?color=red&size=10&brand=nike&sort=price_asc
이것이 SEO를 파괴하는 이유:
- 중복 콘텐츠: Google은 거의 동일하게 보이는 수천 개의 페이지를 봅니다(동일한 제품, 순서만 변경됨).
- 크롤링 예산 낭비: Googlebot은 마진이 높은 새 제품을 찾는 대신
?price=10-12를 크롤링하는 데 제한된 시간을 소비합니다. - 링크 자산 희석: 백링크 권한은 기본 카테고리 페이지에 집중되는 대신 10,000개의 변형 URL에 얇게 퍼집니다.
2. "색인 또는 무시" 전략
기술적 수정을 적용하기 전에 어떤 패싯이 순위를 매길 가치가 있는지 결정해야 합니다. 모든 필터가 동일하게 생성되는 것은 아닙니다.
카테고리 A: 색인 가능한 패싯(높은 수요)
이들은 사용자가 실제로 검색하는 필터입니다. 이들의 순위가 매겨지기를 원합니다.
- 예: "빨간색 나이키 신발", "가죽 소파", "4K TV".
- 전략: 이들은 고유하고 깨끗한 URL(예:
/shoes/nike/red)과 자체 참조 표준 태그(canonical tags)를 가져야 합니다.
카테고리 B: 색인 불가능한 패싯(낮은 수요/효용)
이들은 탐색에는 유용하지만 검색량은 0인 필터입니다.
- 예: "가격: $50-$100", "정렬 기준: 최신순", "재고 있음만".
- 전략: 크롤링 예산을 절약하려면 Google에서 차단해야 합니다.
3. 패싯 관리를 위한 기술적 솔루션
Google이 보는 패싯을 제어하는 세 가지 주요 방법이 있습니다.
방법 A: Robots.txt("차단" 방법)
가장 적합한 대상: 대규모 사이트(100만 개 이상의 SKU)에서 크롤링 예산 절약.
Googlebot에게 말합니다. "이 매개변수가 있는 URL은 쳐다보지도 마십시오."
구현: robots.txt 파일에 줄을 추가합니다.
User-agent: *
Disallow: /*?price=
Disallow: /*?sort=
Disallow: /*?session_id=장점: 매우 효율적입니다. Googlebot은 즉시 시간 낭비를 중단합니다.
단점: 이 페이지에 갇힌 링크 자산(백링크가 있는 경우)은 아무데도 흐르지 않습니다.
방법 B: Meta Noindex("소프트" 차단)
가장 적합한 대상: 소규모 사이트(1만 페이지 미만) 또는 크롤링되기를 원하지만 순위에 오르지 않으려는 패싯.
Google이 페이지를 크롤링하도록 허용하지만 페이지는 Google에 "나를 검색 결과에 넣지 마십시오"라고 말합니다.
구현: 필터링된 페이지의 <head>에 이 태그를 추가합니다.
<meta name="robots" content="noindex, follow">장점: 페이지의 링크를 통해 "링크 주스"가 흐르도록 허용합니다("follow" 태그 덕분에).
단점: Google은 태그를 보기 위해 여전히 페이지를 크롤링해야 하므로 크롤링 예산을 잡아먹습니다.
방법 C: 표준 태그("통합" 방법)
가장 적합한 대상: 제품 변형(예: 파란색 대 빨간색 셔츠).
Google에 말합니다. "이 필터링된 페이지는 기본 카테고리의 복사본일 뿐입니다. 모든 공로를 기본 카테고리에 돌리십시오."
구현:?color=red에서 표준 태그는 다음을 가리킵니다. href="https://example.com/mens-shoes"
장점: 모든 권한을 기본 "머니 페이지"에 통합합니다.
단점: 콘텐츠가 너무 다르면 Google이 표준 태그를 무시하는 경우가 있습니다.
요약: 어떤 방법을 사용해야 합니까?
| 시나리오 | 최고의 솔루션 |
|---|---|
| 정렬 매개변수(가격 낮은순-높은순, 최신순) | Robots.txt (Disallow) |
| 가격 필터($10-$20) | Robots.txt (Disallow) |
| 제품 변형(크기, 색상) | 기본 제품에 대한 Canonical Tag |
| 내부 검색 결과 | Robots.txt (Disallow) |
| 페이지네이션(2, 3페이지...) | Self-Ref Canonical + rel="prev/next" |
4. 방대한 인벤토리의 고급 처리
100,000개 이상의 제품을 관리할 때 표준 아키텍처는 실패합니다. 다음 고급 전술을 사용하십시오.
"더 보기" 대 페이지네이션 딜레마
- 무한 스크롤: 봇이 "스크롤"할 수 없기 때문에 SEO에 위험합니다. 사용하는 경우 봇이 따라갈 수 있는 고유한 URL 구조(예:
/page-2)가 뒤에 있는지 확인하십시오. - 페이지네이션: 가장 안전한 베팅입니다. "2페이지"가 색인화 가능하지만 1페이지와 경쟁하지 않는지 확인하십시오.
팁: 페이지네이션된 페이지에 "Noindex"를 사용하지 마십시오. 2페이지에 noindex를 지정하면 Google은 결국 해당 페이지의 링크 추적을 중단하고 2페이지의 제품은 고아가 됩니다.
만료된 제품 처리
품절된 제품을 삭제하면 404 오류가 발생하고 백링크 가치가 사라집니다.
- 일시적인 품절: 페이지를 활성화 상태로 유지하십시오. "알림 받기" 버튼을 추가하십시오.
- 영구 단종: URL을 가장 가까운 관련 카테고리(홈페이지 아님)로 301 리디렉션합니다.
예: "iPhone 13 Pro 256GB" 리디렉션 -> "iPhone 13 시리즈 카테고리".
내부 링크 자동화
메뉴에 의존하지 마십시오.
- 브레드크럼(Breadcrumbs): 전자 상거래의 필수 요소입니다. 자연스러운 피라미드 구조를 만듭니다.
- "관련 제품": 알고리즘을 사용하여 제품을 동일한 의미론적 클러스터의 다른 제품과 연결합니다(예: "이 카메라를 산 사람이 이 삼각대도 샀습니다").
결론
전자 상거래 SEO는 혼란과의 싸움입니다. robots.txt로 크롤링 예산을 잠그고 표준 태그를 사용하여 권한을 통합하면 Google이 고가치 카테고리 및 제품 페이지에 집중하도록 할 수 있습니다.
기억하십시오. 필터에 검색량이 없으면 색인 가능한 URL이 필요하지 않습니다.