[AI 시스템 아카이브 #20] 구글 블로거(Blogspot) 색인 오류 및 리디렉션 오류 해결법

구글 블로거 색인 오류 및 리디렉션 오류 해결법 | AI 시스템 아카이브 #20
AI 시스템 아카이브 · #20 · 기술 디버깅 기록

구글 블로거(Blogspot)
색인 오류 및 리디렉션 오류 해결법

글 23개, '가져올 수 없음'부터 '.kr 리디렉션'까지 — 수익화 직전에 만난 기술적 절벽을 해결한 한 달 기록.

#17에서 크몽 첫 매출이 발생했다. STEP 3 진입을 선언한 직후였다. 콘텐츠는 23개가 쌓였다. 네이버 AI 요약에도 노출이 됐다.

그런데 구글 서치콘솔을 열면 한 줄이 나를 막아서고 있었다.

색인이 생성된 페이지: 0개

글이 없는 게 아니다. 오류가 없는 것도 아니다.
구글이 내 글을 세상에 내놓지 않고 있다는 뜻이다.
수익화를 막 시작하려던 시점에 만난 기술적 절벽이었다.

이 글은 그 절벽을 어떻게 해결했는지, 시행착오 전체를 그대로 기록한 것이다. 같은 상황에 있다면 참고가 될 수 있다.

포스팅 수23개
색인된 페이지0개
네이버 노출작동 중
구글 색인차단 상태

한 달간의 사투 — 시행착오 전체 타임라인

처음엔 당연히 sitemap.xml부터 시작했다. 블로그 색인 방법을 검색하면 가장 먼저 나오는 게 사이트맵 등록이다. 했다. 그리고 연속으로 벽에 부딪혔다.

SITEMAP 시행착오 로그 — aisystemarchive.blogspot.com
STEP
01
sitemap.xml 등록 거부
sitemap.xml을 서치콘솔에 제출했다. 결과는 "가져올 수 없음". 구글 블로거는 기본 sitemap.xml이 존재하지 않거나 접근이 막혀 있다. 삭제하는 방법도 몰라서 그냥 방치했다.
STEP
02
RSS(Atom) 피드 등록 희망고문
Atom 피드(feeds/posts/default?alt=rss)를 등록하니 "발견된 페이지 13"이 나왔다. 뭔가 됐나 싶어서 기다렸다. 색인은 안 생겼다. 발견과 색인은 전혀 다른 개념이었다.
STEP
03
sitemap.xml?page=1 우회 숫자의 함정
상태가 '성공'으로 바뀌고 "발견된 페이지 18". 실제 색인은 여전히 0개였다. 발견 숫자가 올라가는 것과 색인이 생기는 건 전혀 다른 일이다.
STEP
04
max-results=500 피드 제출 배신
atom.xml?redirect=false&start-index=1&max-results=500을 제출했다. 즉시 "20"이 찍혔다. 기뻤다. 며칠이 지나도 구글은 색인을 만들지 않았다. 피드를 읽는 것과 색인을 만드는 건 전혀 다른 일이었다.
STEP
05
리디렉션 방지 스크립트 삽입 반등
기존 사이트맵·RSS 전부 삭제. 테마 HTML에 국가별 리디렉션 방지 스크립트를 직접 삽입했다. 삽입 직후 서치콘솔 '제외' 페이지 수가 21 → 26으로 즉각 상승. 구글이 재검토(Validation)를 시작했다는 신호였다.

발견과 색인은 완전히 다른 개념이다

가장 많이 헷갈리는 부분이다. "발견된 페이지 20"이 나오면 뭔가 된 것 같다. 아니다.

발견 (Discovered)
색인 (Indexed)
구글봇이 URL 존재를 인식한 것
구글이 내용을 읽고 DB에 등록한 것
사이트맵·RSS 피드를 읽으면 카운트됨
크롤링 → 렌더링 → 색인 생성 단계 모두 통과해야 함
검색 결과에 노출되지 않음
검색 결과에 노출될 수 있는 상태

한 달 동안 발견 숫자만 보고 기다렸던 게 문제였다. 색인 생성 탭에서 실제 색인 수를 봤어야 했다.


병목을 뚫은 코드 — .kr 리디렉션 방지 스크립트

구글 블로거는 한국에서 접속하면 URL이 자동으로 .com에서 .kr로 바뀐다. 서치콘솔에 등록된 주소는 .com인데, 구글봇이 .kr을 마주치면 '리디렉션 오류'로 처리하고 색인을 중단한다. 서치콘솔에 뜬 21개 리디렉션 오류가 바로 이 병목의 증거였다.

해결책은 테마 HTML에 .com으로 강제 고정하는 스크립트를 삽입하는 것이다.

Blogger 테마 HTML — <head> 바로 아래 삽입
<!-- 국가별 리디렉션 방지: .kr/.jp → .com 강제 고정 -->
<script>
  var blog = document.location.hostname.split(".");
  if (blog[blog.length - 1] != "com") {
    var nsy = document.location.pathname + document.location.search + document.location.hash;
    window.location.replace("https://" + blog[0] + ".blogspot.com" + nsy);
  }
</script>
💡 오류 사이트맵 삭제하는 법

구글 서치콘솔 → 사이드바 '색인 생성' → '사이트맵' → 삭제하려는 항목 클릭 → 우상단 버튼 → '사이트맵 삭제'.

오류 상태 사이트맵을 방치하면 구글봇 크롤링 우선순위에 영향을 줄 수 있다. 빨리 정리하는 게 낫다.


코드 삽입 직후 — 데이터의 즉각적 반응

2126
제외된 페이지 수 즉각 상승

한 달 동안 21에서 멈춰있던 수치가 코드 삽입 직후 26으로 올라갔다. 구글이 다시 크롤링을 시작했다는 신호다.

✓ VALIDATION 시작

서치콘솔 오류 항목 중 "리디렉션 오류" 항목의 유효성 검사가 진행 중 상태로 바뀌었다. 색인이 생기기까지는 며칠에서 수 주가 걸릴 수 있지만, 방향은 달라졌다.


구글이 잠든 사이 네이버는 이미 읽고 있었다

색인이 0개인 동안에도 네이버 AI 브리핑은 내 글을 전문가 콘텐츠로 인용하기 시작했다. 구글 색인 지연이 콘텐츠 자체의 가치를 훼손하지 않는다는 증거다.

시스템의 지연과 콘텐츠의 가치는 별개다.
구글이 아직 색인을 만들지 않았다는 건 글이 별로라는 뜻이 아니다.
기술적 병목이 있었을 뿐이다. 병목은 뚫리고, 콘텐츠는 남는다.

STEP 3에서 제휴 마케팅 리퍼럴을 연결하려면 구글 색인이 실제로 완료되어야 한다. 색인된 포스팅이 늘어날수록 롱테일 키워드 유입이 시작되고, 그게 전환으로 이어지는 구조다. 이 디버깅이 단순한 기술 수정이 아니라 수익화 구조의 필수 과정이었던 이유다.

TAKEAWAY · #20

색인이 0개라면 글 문제가 아니다.
기술적 병목이다. 먼저 찾아야 한다.

  • 발견된 페이지 수와 색인된 페이지 수는 전혀 다른 개념이다
  • 사이트맵 숫자가 올라간다고 색인이 생기는 게 아니다
  • Blogspot의 .kr 리디렉션은 구글봇 색인을 막는 핵심 원인이다
  • HTML에 정규화 스크립트를 삽입하면 즉각적인 반응이 온다
  • 이 문제를 해결해야 STEP 3 리퍼럴 유입 구조가 완성된다
이전 글 · AI 시스템 아카이브 #19
블로그 글은 쌓이는데 검색 유입이 없는 이유
노출은 됐는데 클릭이 없다 — 제목 방식의 문제

댓글

가장 많이 본 글