[AI 시스템 아카이브 #08] STEP 2 — 시스템 실행 : 구글 서치콘솔 색인 상태 분석과 Blogger SEO 구조 점검
구글 색인 0, 클릭 0 — 문제를 처음으로 구조에서 찾았다
구글에서 단 한 페이지도 색인되지 않았다. 클릭도, 수익도 모두 0이었다. 당혹스러웠지만, 멈춰있을 수는 없었다. 숫자 하나에 맥을 놓는 대신, 데이터를 하나씩 뜯어보기 시작했다. 그리고 고민 끝에 가능성 있는 원인을 추려냈고, 추리는 즉시 실행으로 이어졌다. 이 글은 그 과정의 기록이다.
이 글에서는 구글 색인이 되지 않는 원인을 실제 데이터 기준으로 분석하고, 해결 과정을 정리했다.
구글 색인 0의 원인 — 왜 페이지가 검색되지 않았나
노출 54회는 전부 네이버에서 나온 수치다. 구글 서치 콘솔에서 확인한 구글 측 색인 페이지 수는 0개. 같은 블로그, 같은 콘텐츠인데 왜 이렇게 반응이 다를까. 이 차이를 이해하는 것이 오늘 분석의 출발점이었다.
네이버와 구글은 신규 사이트를 바라보는 방식 자체가 다르다. 네이버는 새 블로그가 생기면 비교적 빠르게 수집을 시작한다. 완성도가 좀 부족해도 일단 목록에 올리고, 반응을 보면서 순위를 조정하는 방식이다. 그래서 개설 후 1주일 만에 수집이 시작되고, 04월 19일에는 하루에만 약 50여 회의 노출이 발생했다.
구글은 훨씬 신중하다. 신규 도메인에 대해서는 일정 기간 동안 색인 생성을 의도적으로 늦추는 검토 구간을 운용한다. SEO 업계에서는 이 기간을 샌드박스(Sandbox)라고 부른다. 쉽게 말하면, 신규 업체가 처음 거래를 시작할 때 신뢰를 확인하기 위해 거치는 엄격한 검토 기간과 같은 개념이다. 이 기간에는 아무리 좋은 콘텐츠를 올려도 검색 결과에 잘 노출되지 않는다. 샌드박스가 현재 상황의 주요 원인 중 하나일 가능성이 높다.
그런데 노출 54회라는 숫자를 그대로 받아들이면 안 된다. 검색 키워드 데이터를 열어보니, 전체 노출 중 51회가 'site:https://aisystemarchive.blogspot.com'이라는 키워드에서 발생했다. 이건 일반 사용자가 검색한 게 아니다. SEO 도구나 봇이 "이 사이트가 색인에 등록됐는지" 확인하기 위해 치는 탐색성 쿼리다. 진짜 유저가 콘텐츠를 찾아서 노출된 건 2위 키워드(노출 2회)가 전부였다.이나저도 내가 검색했을 확률이 더 높다.
경고등이 15개 켜져 있었다 - 구조적 문제의 가능성
네이버 서치어드바이저의 사이트 진단 화면을 열었을 때, 색인은 10페이지로 정상이었지만 SEO 경고가 15건 켜져 있었다. 색인은 됐지만, 봇이 내 사이트를 제대로 이해하지 못하고 있을 가능성을 보여주는 신호였다.
H1 태그 중복이 왜 문제인가
H1 태그는 HTML 문서에서 가장 중요한 제목을 표시하는 요소다. 검색 엔진 봇은 H1 태그를 보고 "이 페이지가 무엇에 관한 내용인가"를 판단한다. 페이지마다 H1이 하나여야 봇이 명확하게 주제를 파악한다는게 일반적인 SEO 이론이다.
그런데 Blogspot의 기본 테마는 블로그 상단의 블로그 이름과 포스팅 제목을 둘 다 H1 태그로 출력하는 구조를 갖고 있다. 건물 정문이 두 개인 셈이다. 손님(봇)이 어느 문으로 들어가야 하는지 몰라 혼란스러워할 수 있다. 이런 구조가 검색 결과 우선순위에 부정적 영향을 줄 가능성이 있다.
Title 태그 중복도 같은 맥락에서 살펴볼 수 있다. 브라우저 탭에 표시되는 페이지 이름이 두 개가 생기는 격이다. 봇 입장에서는 어느 것이 이 페이지의 진짜 대표 제목인지 판단하기 어려워 질 수 있다.
구글은 왜 아무것도 색인하지 않았나 — 리디렉션 오류와 사이트맵 문제
구글 서치 콘솔에서는 더 직접적인 문제가 드러났다. 색인 미생성 페이지가 10개인데, 그 이유가 세 가지로 분류되어 있었다.
리디렉션(Redirect)이란 A 주소로 접속하면 B 주소로 자동 이동시키는 안내 시스템이다. 정상적으로 작동하면 문제없지만, 오류가 생기면 가게 문을 열고 들어갔는데 뒷문으로 뱅글뱅글 돌아 나가는 고장 난 회전문 같은 상황이 된다. 구글 봇이 페이지를 수집하러 왔다가 그 회전문에 걸려 그냥 돌아가버렸을 가능성이 있다.
사이트맵 문제도 확인됐다. 사이트맵은 검색 봇에게 "우리 사이트에 이런 페이지들이 있어요"라고 알려주는 목차 역할을 한다. 그런데 기본 경로인 /sitemap.xml이 '가져올 수 없음' 상태였다. 봇이 목차를 받으러 왔는데 목차 자체가 열리지 않은 것이다.
이 두 가지 문제는 서로 영향을 주고 있을 가능성이 있다. H1 중복으로 구조가 봇의 Canonical(표준 URL) 판단을 흐리게 만들고, 사이트맵까지 열리지 않으니 봇이 어떤 페이지를 기준 삼아야 할지 결정하지 못한 채 색인 생성을 보류했을 수 있다는 추정이다. Canonical이란 비슷한 내용의 페이지가 여러 개일 때 "이게 진짜 원본입니다"라고 구글에게 알려주는 태그다. 이 신호가 흐려지면 구글은 색인 대상 페이지 선정 자체를 미루게 된다.
코드를 몰라도 할 수 있었다 — Claude Code와 함께한 HTML 수정 시도
원인이 될 만한 지점들을 찾았으면 일단 건드려봐야 했다. 유료 SEO 툴도, 외주 개발자도 없다. 있는 건 Claude Code라는 AI 코딩 도우미의 무료 크레딧뿐이었다. 이걸 꼭 필요한 지점에만 정밀하게 투입했다.
- 진단: 네이버 서치어드바이저로 H1, Title 중복 위치 확인
- 교차 검증: 구글 서치 콘솔로 리디렉션 오류 3건, 사이트맵 fetch 실패 확인
- 분석 및 코드 생성: Claude Code에 Blogspot 테마 HTML 구조를 붙여넣고, 수정이 필요한 태그 위치와 수정 코드 생성 요청
- 적용: Blogspot 테마 편집기에서 블로그 제목 영역 H1을 H2로 변경, 포스트 제목만 H1로 단일화, Title 태그 중복 제거
- 재제출: Google Search Console에서 /sitemap.xml?page=1을 표준 사이트맵으로 재제출, 오류 페이지 3건 색인 재요청
수정의 핵심은 간단했다. Blogspot 기본 테마가 블로그 이름과 포스팅 제목을 둘 다 H1으로 찍어내고 있었기 때문에, 블로그 이름 쪽 태그를 H2로 내려주는 작업이었다. 이렇게 하면 적어도 HTML 구조상에서는 각 포스팅 페이지에 포스팅 제목 하나만 H1으로 남게 된다. 정문이 하나가 되는 구조다. 이게 실제 SEO 점수 개선으로 이어질지는 아직 확인이 필요하다.
사이트맵은 오류가 있는 /sitemap.xml 대신, 정상 작동이 확인된 /sitemap.xml?page=1을 구글 서치 콘솔에 표준 경로로 재등록했다. 봇이 찾아올 수 있는 정상 작동하는 목차를 다시 연결해준 것이다.
일단 문을 고쳤다 — 효과는 다음 데이터가 말해줄 것이다.
오늘 작업으로 정리된 현황은 다음과 같다.
- 네이버 색인 10페이지 유지
- H1, Title 태그 중복 구조 수정 완료(효과 검증 대기 중)
- 사이트맵 정상 경로로 재제출 완료
- 구글 색인 재요청 3건 제출 완료
- 구글 반영까지 약 7~14일 소요 예정
솔직히 말하면, 아직 눈에 보이는 성과는 없다. 수익은 여전히 $0이고, 구글에서 색인된 페이지도 0개다. 오늘의 수정이 실제로 효과가 있었는지는 다음 크롤링 사이클 이후에나 확인할 수 있다. H1 구조 수정이 핵심 원인이었을 수도 있고, 단순히 샌드박스 기간이 끝나면서 자연스럽게 해소됐던 것일 수도 있다. 어느 쪽이든, 그 데이터가 다음 글의 소재가 될 것이다.
목표는 포스팅 15개다. 오늘 이 글이 11번째다. 4개가 남았다. 구조적으로 손볼 수 있는 곳은 건드렸다. 남은 건 기다리는 것과, 계속 쓰는 것이다
SYSTEM ARCHIVE · POST #08
오늘의 디버깅 과정을 이해하기 위해 초기 설계 로직이 궁금하신 분들은
[#03. 무자본 자동화 수익 엔진 설계도]를 추천합니다.
기초 공사를 알아야 오늘 수술의 의미가 더 명확해지니까요.
#AI자동화 #트래픽분석 #SEO최적화 #네이버서치어드바이저 #구글서치콘솔 #디버깅기록 #수익형블로그 #아키텍트











댓글
댓글 쓰기