본문 바로가기
경제적 자유를 위한 한 걸음/Step 1. 블로그 운영

네이버 블로그, 씨랭크(C-rank) 검색알고리즘은 공부하고 시작하자

by 혜날블리 2020. 4. 20.
반응형

재택근무, 투잡, 디지털 노마드의 열풍이 강해지고 있다. 블로그, 유튜브에 이어 인스타그램, 스마트 스토어와 아마존까지 도전하는 개인이 증가하는 추세다. 그중에서도 기본은 블로그가 아닐까 싶다. 이제는 한물 갔다, 다른 플랫폼을 파야 한다 등 말이 많지만 여전히 그 영향력은 무시할 수가 없다. 일회성으로 소비되며 금방 사라지는 콘텐츠가 아니라 플랫폼에 꾸준히 축적되며 포트폴리오로서 개인을 브랜딩 할 수 있다는 매력으로 '나'를 대표하는 개인 홈페이지로 작용할 수 있기 때문이다.

 

이러한 블로그를 같은 시간과 노력을 투자하면서도 높은 성과를 발휘하기 위해서는 먼저 '알고리즘'을 파악해야 한다. 대표적으로 티스토리와 네이버블로그가 있지만 접근 방법이 쉽고, 필자 역시 오래 운영해왔던 네이버부터 다뤄보려고 한다. 네이버블로그를 운영하기 전에 씨랭크(C-rank)부터 제대로 알고 시작하자.

 

 

 

 

 

검색 알고리즘이란?

씨랭크(C-rank)란 2016년부터 네이버에서 도입한 검색 알고리즘의 하나다. 현재 네이버는 다양한 서비스들을 제공하며 판을 키워가고 있는데, 본래 네이버는 ‘검색’ 플랫폼이다. 지금이야 구글이나 유튜브에 검색하는 비중도 늘고 있지만, 여전히 하루에도 수 만 명의 사용자가 네이버 초록창에 검색하며 정보를 소비한다. 

 

하나의 특정 검색어와 관련된 글은 적게는 몇 천, 많게는 수 십만 개가 인터넷 세상에 흩어져 있다. 그 수많은 글들 중에서 사용자가 가장 만족할만한 최적의 콘텐츠를 선별하여 제공해주는 것이 검색 알고리즘이다. 사용자들은 주로 검색 후 바로 뜨는 글(일명 상위노출된 글)을 클릭하기 때문에 이 알고리즘은 최적의 콘텐츠를 골라 상단에 띄워준다. 

 

 

 

 

 

알고리즘의 폐해, C-rank의 등장

그런데 이러한 검색 알고리즘을 악용하는 사례가 빈번해지기 시작했다. 알고리즘이 결국은 "정해진 패턴이 있음"을 의미하기에, 이를 분석하고 파악한 사람들 사이에서 ‘상위 노출법’이 돌게 된 것이다. 어느 순간부터 네이버에서 검색을 하려고 하면 죄다 광고글이니 사용자들의 불만이 커져갔다. 흔히 말하는 어뷰징 블로그들이 장악한 것이다. 사용자뿐 아니라 파워링크라는 별도의 광고서비스를 운영하며 수익을 얻는 네이버 또한 이 상황을 달가워하지 않았다. 블로그는 누구나 무료로 이용할 수 있는 서비스이기에 업체들이 유료광고 서비스를 이용하지 않고 블로그를 통해 홍보하고 있기 때문이다. 

이러한 문제가 한창 붉어진 때의 검색 알고리즘은 ‘리브라’였다. 글 형식이나 주제와 상관없이 약 45일 정도 열심히 글을 쓰기만 하면 상위에 노출될 수 있었다. 그러니 정보의 가치가 낮은 무분별한 글들도 상위 노출이 되면서 사용자들의 검색 만족도가 떨어졌다. 

반면에 이러한 문제를 해결하고자 2016년에 도입한 C-rank는 출처를 중시하는 알고리즘이다. 이는 단순히 글 자체만 보고 상위노출을 판단하는 것이 아니라, 그 글의 출처(블로그, 카페 등)가 신뢰할만한 것인지까지 고려하는 것이다. 실제로 네이버 검색 공식블로그에서 C-rank를 정의한 바는 다음과 같다.

 


검색 랭킹의 정확도를 높이기 위해 사용되는 기술 중 문서 자체보다는 해당 문서의 출처인 블로그의 신뢰도를 평가하는 알고리즘이 있는데, 네이버 검색에서는 이를 ‘C-Rank’라고 부릅니다. C-Rank 알고리즘에서 블로그 신뢰도를 평가할 때는 맥락(Context), 내용(Content), 연결된 소비/생산(Chain)과 같은 요소를 종합적으로 계산하며 그 결과는 블로그 검색 랭킹에 일부 반영됩니다.
(출처 : 네이버 검색 공식블로그)
 

 

이 조건에 따르면, 단순히 방문자수를 늘리기 위해 키워드를 난잡하게 사용하는 글은 상위노출에서 제외된다. 운이 좋아 노출이 잘 되어 방문자 수가 많아졌다고 해도, 블로그 자체가 신뢰할 수 없다고 판단이 되면 순식간에 제외가 될 수 있는 것이다. 흔히 말하는 저품질 블로그가 되는 것이다. 

 

 

 

 

 

 

검색에 최적화 되기 위해서

블로그 수익에 방문자 수가 결정적인 요소는 아니지만, 내 글을 소비하는 사람들이 어느 정도 있어야 부가가치를 창출하는 것이 가능하다. 내 글을 읽고 진정으로 반응해주는 ‘팬’을 확보하기 위해서는 일단 검색 결과에 노출이 되어야 하는 것이다. 이를 위해서는 내 블로그가 ‘신뢰할 수 있어야’ 한다는데….

그렇다면 그 출처의 신뢰도라는 것은 어떻게 형성하는 것일까?

 

C-Rank 알고리즘 (출처 : 네이버 검색 공식 블로그)  

 

네이버 검색 공식 블로그에서는 그 요소를 위와 같은 세 가지로 정의하였다. 바로 맥락, 내용, 연결된 소비/생산이다. 쉽게 풀어 말하자면, 하나의 주제(context)에 대해 지속적인 포스팅(content)을 하고 방문자가 그 글을 읽고 좋아요, 공유, 댓글, 긴 체류 시간 등의 반응(chain)을 하는 블로그(Creator)에 대하여 신뢰도와 인기도를 부여하는 것이다. 물론 완벽한 판단은 어렵겠지만 네이버는 이 조건에 부합하도록 알고리즘을 계속 업데이트해오고 있다.

알고리즘은 로봇이다. 사람은 속일 수 있어도 로봇은 속일 수 없다. 사용자는 사람이지만 그 사용자에게 글을 노출시키는 것은 로봇이며, 로봇은 ‘융통성 없이 철저’ 하기 때문에 가이드라인을 따르지 않고 꼼수를 부린다면 철저히 외면당한다. 그러니 웬만한 노하우가 있는 것이 아니라면 위의 최적화 가이드라인을 준수하여 안전하게 시작하자.

 

 

 

최적화와 인기도를 높이는 구체적인 방법에 대해서는 다음 글에서 하나씩 다루도록 하겠다.

 

 

 

 

반응형

댓글