구글 블로거(Blogspot) 색인 오류 및 리디렉션 오류

#17에서 크몽 첫 매출이 발생했다. STEP 3 진입을 선언한 직후였다. 콘텐츠는 23개가 쌓였다. 네이버 AI 요약에도 노출이 됐다.

그런데 구글 서치콘솔을 열면 한 줄이 나를 막아서고 있었다.

색인이 생성된 페이지: 0개

글이 없는 게 아니다. 오류가 없는 것도 아니다.
구글이 내 글을 세상에 내놓지 않고 있다는 뜻이다.
수익화를 막 시작하려던 시점에 만난 기술적 절벽이었다.

이 글은 그 절벽을 어떻게 해결해가고 있는지, 시행착오 전체를 그대로 기록한 것이다. 아직 완전히 해결된 상태가 아니다. 같은 상황에 있다면 참고가 될 수 있다.

포스팅 수23개

색인된 페이지0개

네이버 노출작동 중

구글 색인차단 상태

한 달간의 사투 — 시행착오 전체 타임라인

처음엔 당연히 sitemap.xml부터 시작했다. 블로그 색인 방법을 검색하면 가장 먼저 나오는 게 사이트맵 등록이다. 했다. 그리고 연속으로 벽에 부딪혔다.

SITEMAP 시행착오 로그 — aisystemarchive.blogspot.com

STEP
01

sitemap.xml 등록 거부

sitemap.xml을 서치콘솔에 제출했다. 결과는 "가져올 수 없음". 구글 블로거는 기본 sitemap.xml이 존재하지 않거나 접근이 막혀 있다. 삭제하는 방법도 몰라서 그냥 방치했다.

STEP
02

RSS(Atom) 피드 등록 희망고문

Atom 피드(feeds/posts/default?alt=rss)를 등록하니 "발견된 페이지 13"이 나왔다. 뭔가 됐나 싶어서 기다렸다. 색인은 안 생겼다. 발견과 색인은 전혀 다른 개념이었다.

STEP
03

sitemap.xml?page=1 우회 숫자의 함정

상태가 '성공'으로 바뀌고 "발견된 페이지 18". 실제 색인은 여전히 0개였다. 발견 숫자가 올라가는 것과 색인이 생기는 건 전혀 다른 일이다.

STEP
04

max-results=500 피드 제출 배신

atom.xml?redirect=false&start-index=1&max-results=500을 제출했다. 즉시 "20"이 찍혔다. 기뻤다. 며칠이 지나도 구글은 색인을 만들지 않았다. 피드를 읽는 것과 색인을 만드는 건 전혀 다른 일이었다.

STEP
05

리디렉션 방지 스크립트 삽입 관찰 중

기존 사이트맵·RSS 전부 삭제. 테마 HTML에 국가별 리디렉션 방지 스크립트를 직접 삽입했다. 삽입 직후 서치콘솔 '제외' 페이지 수가 21에서 26으로 상승했다. 구글이 재크롤링을 시작했다는 신호로 해석했지만, 색인 생성까지 이어질지는 아직 확인되지 않았다.

발견과 색인은 완전히 다른 개념이다

가장 많이 헷갈리는 부분이다. "발견된 페이지 20"이 나오면 뭔가 된 것 같다. 아니다.

발견 (Discovered)

색인 (Indexed)

구글봇이 URL 존재를 인식한 것

구글이 내용을 읽고 DB에 등록한 것

사이트맵·RSS 피드를 읽으면 카운트됨

크롤링, 렌더링, 색인 생성 단계 모두 통과해야 함

검색 결과에 노출되지 않음

검색 결과에 노출될 수 있는 상태

한 달 동안 발견 숫자만 보고 기다렸던 게 문제였다. 색인 생성 탭에서 실제 색인 수를 봤어야 했다.

병목으로 추정되는 원인 — .kr 리디렉션 문제

구글 블로거는 한국에서 접속하면 URL이 자동으로 .com에서 .kr로 바뀐다. 서치콘솔에 등록된 주소는 .com인데, 구글봇이 .kr을 마주치면 '리디렉션 오류'로 처리하고 색인을 중단한다는 가설이다. 서치콘솔에 뜬 21개 리디렉션 오류가 이 가설을 뒷받침하는 데이터였다.

이를 해결하기 위해 테마 HTML에 .com으로 강제 고정하는 스크립트를 삽입했다. 효과 여부는 아직 확인 중이다.

Blogger 테마 HTML — <head> 바로 아래 삽입 (시도한 코드)

<!-- 국가별 리디렉션 방지: .kr/.jp -> .com 강제 고정 -->
<script>
  var blog = document.location.hostname.split(".");
  if (blog[blog.length - 1] != "com") {
    var nsy = document.location.pathname + document.location.search + document.location.hash;
    window.location.replace("https://" + blog[0] + ".blogspot.com" + nsy);
  }
</script>

참고 — 오류 사이트맵 삭제하는 법

구글 서치콘솔 → 사이드바 '색인 생성' → '사이트맵' → 삭제하려는 항목 클릭 → 우상단 더보기 버튼 → '사이트맵 삭제'.

오류 상태 사이트맵을 방치하면 구글봇 크롤링 우선순위에 영향을 줄 수 있다. 빨리 정리하는 게 낫다.

코드 삽입 직후 — 관찰된 데이터 변화

21 → 26

제외된 페이지 수 즉각 상승

한 달 동안 21에서 멈춰있던 수치가 코드 삽입 직후 26으로 올라갔다. 구글이 다시 크롤링을 시작했다는 신호로 해석했다. 색인으로 이어질지는 더 지켜봐야 한다.

현재 상태 — 확인 중

서치콘솔 오류 항목 중 "리디렉션 오류" 항목의 유효성 검사가 진행 중 상태로 바뀌었다. 이것이 실제 색인 생성으로 이어지는지는 아직 알 수 없다. 며칠에서 수 주가 더 필요할 수 있다.

구글이 잠든 사이 네이버는 이미 읽고 있었다

색인이 0개인 동안에도 네이버 AI 브리핑은 내 글을 전문가 콘텐츠로 인용하기 시작했다. 구글 색인 지연이 콘텐츠 자체의 가치를 훼손하지 않는다는 관찰이다.

시스템의 지연과 콘텐츠의 가치는 별개다.
구글이 아직 색인을 만들지 않았다는 건 글이 별로라는 뜻이 아니다.
기술적 병목이 있는 것이고, 그 병목이 어디인지 아직 찾고 있는 중이다.

STEP 3에서 제휴 마케팅 리퍼럴을 연결하려면 구글 색인이 실제로 완료되어야 한다. 색인된 포스팅이 늘어날수록 롱테일 키워드 유입이 시작되고, 그게 전환으로 이어지는 구조다. 이 디버깅이 단순한 기술 수정이 아니라 수익화 구조의 핵심 선행 과제인 이유다.

TAKEAWAY · #20

색인이 0개라면 글 문제가 아닐 수 있다.
기술적 병목을 먼저 찾아야 한다. 아직 찾는 중이다.

발견된 페이지 수와 색인된 페이지 수는 전혀 다른 개념이다
사이트맵 숫자가 올라간다고 색인이 생기는 게 아니다
Blogspot의 .kr 리디렉션이 구글봇 색인을 막는 원인 중 하나로 추정된다
HTML에 정규화 스크립트를 삽입했고 제외 페이지 수 변화는 관찰됐다
색인 생성 여부는 아직 미확인 — 계속 기록 예정

←

이전 글 · AI 시스템 아카이브 #19

블로그 글은 쌓이는데 검색 유입이 없는 이유

노출은 됐는데 클릭이 없다 — 제목 방식의 문제

›

이 블로그 검색

AI 시스템 아카이브