네이버 뷰(View) 알고리즘의 이해
국내 시장을 타게팅하는 비즈니스의 온라인 마케팅 전략에서 네이버 전략을 빼놓을 수 없습니다. 조사 기관에 따라 조금씩 다르게 나타나고 있으나 네이버와 구글의 검색 점유율이 7:3 정도로 네이버는 국내 검색 시장을 점유하고 있습니다.
네이버와 구글은 모두 검색엔진으로 불리우고 있으나, 엄밀히 말하면 형식이 전혀 다른 플랫폼이라고 볼 수 있습니다. 구글이 검색을 통해 사용자와 컨텐츠를 연결하는 다리 역할을 한다면, 네이버는 검색자에게 수많은 관련 정보를 펼쳐주는 포탈 역할을 이어왔기 때문입니다.
비교적 단순한 구글의 검색결과 화면과 달리 네이버 검색 결과 레이아웃은 상대적으로 복잡합니다. 파워링크 및 브랜드검색광고와 같은 광고 섹션과 VIEW, 쇼핑, 지도, 지식인 그리고 SEO 검색결과 등 다양합니다. 그중 광고 섹션과 함께 대부분 상단에 위치한 섹션은 VIEW섹션입니다.
VIEW 섹션은 네이버 카페, 네이버 블로그, 네이버 포스트의 결과를 보여주는 섹션입니다. 앞서 말한대로 광고 섹션과 함께 검색결과 상단에 위치하는 섹션이기 때문에 검색결과 내 쉐어 오브 보이스 – SoV(Share of Voice)를 높이는 효과적인 섹션이라고 볼 수 있습니다. 해당 섹션을 타겟팅 하지 않고는 네이버 검색엔진 마케팅을 제대로 진행했다고 볼 수 없습니다.
그렇다면 네이버 카페, 블로그, 포스트 등 네이버 섹션을 차지하는 플랫폼은 어떤 알고리즘이 적용되며 네이버 블로그 최적화 글쓰기는 무엇을 고려해야 할까요?
우선 네이버 카페/블로그/포스트(이하 ‘네이버 블로그’로 총칭)는 씨랭크(C-Rank)와 다이아플러스(D.I.A+) 두가지 알고리즘이 적용됩니다. 두 알고리즘은 기본적으로 구글을 포함해 검색엔진이 추구해야 할 관련성 있는 고품질의 컨텐츠를 제공하고자 하는 검색엔진의 의도가 반영되었다고 볼 수 있습니다. 각 알고리즘에 대해서 아래와 같이 간략하게 설명 드리겠습니다.
씨랭크 (C-Rank)
문서의 맥락(Context), 내용(Content), 연결된 소비/생산(Chain)을 고려하는 알고리즘입니다. C-Rank는 기본적으로 문서 단위로 적용이 되지만 전체적인 채널의 신뢰도를 측정하는 알고리즘입니다. 신뢰할 수 있는 컨텐츠를 바탕으로 현재 가장 주목받는 문서와 생산자를 측정하며 ‘특정 관심사에 대하여 얼마나 깊이 있는 좋은 컨텐츠를 생산하는가’를 판별합니다.
Context 요소는 문서가 얼마나 키워드로 검색된 관심사에 집중하고 있는지를 판단합니다. Content는 문서의 품질을 판단하며, 신뢰할 수 있는 문서의 전문성, 문서의 양, 신뢰할 수 있는 출처 등 전반적인 컨텐츠 품질을 측정합니다. Chain은 문서가 사용자로 하여금 어떠한 상호작용을 하는지를 확인합니다. 문서의 소비와 함께 연계되는 사용자 참여 요소가 반영됩니다.
1. Blog Collection – 블로그 문서의 제목 및 본문, 이미지, 링크 등 문서를 구성하는 기본 정보를 참고해 문서의 기본 품질을 계산
2. NAVER Database – 인물, 영화, 정보 등 네이버에서 보유한 컨텐츠 데이터베이스를 연동해 출처 및 문서의 신뢰도를 측정
3. Search LOG – 네이버 검색 사용자의 검색 로그 데이터를 이용하여 문서 및 문서 출처의 인기도를 측정
4. Chain Score – 웹문서, 사이트, 뉴스 등 다른 출처에서의 관심 정도를 이용해 신뢰도와 인기도를 측정
5. Blog Activity – 블로그 서비스에서의 활동 지표를 참고해 얼마나 활발한 활동이 있는 블로그인지를 측정
6. Blog Editor 주제 점수 – 딥러닝을 이용한 문서의 주제를 분류, 주제 집중도를 측정
다이아 플러스 (D.I.A+)
D.I.A+는 C-Rank의 맹점을 보완한 또 다른 알고리즘입니다. C-Rank가 블로그 채널의 영향력을 참고했다면 D.I.A는 문서의 정보성에 집중합니다. 즉 문서의 품질보다 출처의 품질이 고려될 수 있는 C-Rank의 단점을 보완했다고 볼 수 있는 것인데요. D.I.A+는 Deep Intent Analysis라는 명칭에서 확인할 수 있듯이 사용자의 검색의도를 보다 깊고 자세하게 파악하여 결과에 반영하는 알고리즘이라고 볼 수 있습니다. 네이버 서치텍에 의하면 D.I.A+는 기존은 D.I.A 모델에서 딥매칭과 패턴분석, 동적 랭팅 등에 대한 새로운 연구들이 반영되었다고 합니다.
D.I.A+는 의미 기반 클러스터링과 학습을 통해 질의 패턴을 분석하여 문서 패턴 분석기에 의하여 분석된 문서를 랭킹 로직에 반영합니다. 문서확장 모듈을 통해 유의어를 추가하여 매칭 확률을 높입니다. 이러한 검색 데이터가 쌓일수록 알고리즘은 계속적으로 학습하고 개선하게 되는 것인 D.I.A+ 로직이라고 볼 수 있습니다.
D.I.A의 핵심은 사용자의 질의를 분석하는 것에 있습니다. 검색의도를 보다 정확하게 파악하는 것이 관련된 문서를 수집하는 것만큼 중요하기 때문입니다. 컨텐츠는 검색자의 의도를 명확하게 타겟팅 하여야 노출이 될 수 있습니다. 문서는 검색자의 의도에 따라 컨텐츠 내부에 경험, 의견, 리뷰가 포함되는지 확인합니다. 또한 낚시성 문서를 판별하여 문서의 신뢰도를 확보합니다. 이러한 D.I.A+ 알고리즘의 정보 분석은 작년 말 포함된 VIEW섹션 검색 결과 페이지의 스니펫 정보에 반영되기도 합니다. D.I.A+ 알고리즘이 판단하는 요인은 아래와 같습니다.
1. 문서의 주제 적합도
2. 경험 정보
3. 정보의 충실성
4. 어뷰징 척도
5. 독창성
6. 적시성
7. 질의 의도와 문서의 부합성
<NAVER Search and Tech View 랭킹 모듈 업데이트 관련 포스트(4월 29일 업데이트)>
지난 달 4월 29일 NAVER는 네이버 서치앤텍 채널을 통해 올해 5월 6일 VIEW 검색의 랭킹 알고리즘을 업데이트한다고 발표하였습니다.
기존의 여러개의 모듈로 돌아가던 다양한 랭킹 기능들과 분석 모듈을 새로운 랭킹 모델로 통합한다고 발표하였습니다. 이는 사용자의 질의 의도와 피드백을 더욱 잘 반영하여 질의별로 더욱 효과적으로 동작할 수 있는 구조로 업데이트 되는 것입니다.
기존의 C Rank 및 D.I.A+ 모델들은 기존과 동일한 기준으로 작동하게 될 예정이므로 현재 랭킹에 변화를 주는 것은 아니라고 합니다.
새로운 기준의 VIEW 검색 랭킹 알고리즘의 다이어그램은 아래와 같습니다.
네이버 알고리즘을 고려한 최적화 블로그 글쓰기
검색 노출을 위한 블로그 글쓰기는 위에 설명 드린 검색 알고리즘의 특성을 파악하면 방향을 쉽게 잡을 수 있습니다. 우선 무엇보다 사용자가 해당 문서를 소비했을 때, 컨텐츠가 사용자에게 정확하고 독창적이고 유익한 정보를 제공하는지 확인하는 글쓰기가 필요합니다. 좀더 자세하게 말하자면, 아래와 같은 질문을 고려하며 블로그를 작성하는 것이 바람직합니다.
1. 정확한 주제와 키워드를 가지고 컨텐츠를 작성하는가? – 사용자의 검색 의도를 정확하게 타겟팅
2. 주제에 대하여 충분한 내용을 담고 있는가? – 충분하고 상세한 정보를 제공
3. 주제에 대하여 독창적인 내용 담고 있는가? – 자신만의 기준으로 해석한 글, 직접 체험한 자신의 의견을 담은 글
4. 주제에 대한 전문성을 담고 있는가? – 전문분야뿐만이 아니라 일상 주제에 관련하여서도 해당 소재에 대한 전문성은 알고리즘의 높은 평가를 받음.
5. 타 컨텐츠를 복제하였는가? – 약간의 변형을 주었다고 하여도 알고리즘은 문서의 독창성을 컨텍스트를 판별하므로 컨텐츠 복제는 지양. 일부 전문 의견을 발췌할 경우 출처를 정확하게 밝혀 놓는 것이 중요.
6. 자신이 직접 체험한 것을 기술하는가? – 리뷰 형식의 컨텐츠의 경우 자신이 직접 경험한 것을 바탕으로 자신의 의견을 기술하는 것이 중요.
7. 검색 사용자를 배려하여 작성되고 있는가? – 주제에 따라 컨텐츠의 난이도를 조절하는 것이 필요. 사용자가 컨텐츠를 부담 없이 소화할 수 있도록 작성.
8. 대가성 리뷰 등을 분명하게 명시하는가? – 그 어떠한 대가라도 받고 작성된 컨텐츠는 이 사실을 사용자가 명확하게 인지할 수 있도록 표시.(문구 내용, 폰트색상 등) 업체에서 전달한 컨텐츠를 그대로 올리는 것은 지양
글쓰기 관련한 영역 외에도 채널 최적화를 위하여 고려해야 할 부분들은 아래와 같습니다.
1. 사용자 참여에 적절하게 대응하는가? – 이벤트 진행 및 댓글 관리 등 사용자 참여 활동에 원활하게 대응하는 것이 중요
2. 컨텐츠는 지속적으로 업로드 및 업데이트 되는가? – 알고리즘은 활성화된 채널을 좋게 평가. 일정 기간 단위로 컨텐츠 업로드를 플래닝하고 새로 업데이트되는 내용에 대해서는 기존 글에 반영.
3. 네이버 서치어드바이저 활용 – 블로그 SEO를 위한 기본적인 관리가 가능
알고리즘을 정확하게 알고 분석하는 것은 어려운 작업입니다. 수많은 테스트 등을 통한 검증과정이 필요합니다. 그래서 알고리즘의 세부적인 내용을 모두 확이하고 적용할 수 없습니다. 단, 알고리즘이 추구하는 방향은 명확하게 제시되고 있습니다. 네이버의 블로그 알고리즘은 정확하고, 독창적이고, 신뢰할 수 있으며 소비자가 부담 없이 소화할 수 있는 컨텐츠를 적시에 제공하기 위한 것입니다. 이부분을 유념한다면 블로그 마케팅 생각보다 어렵고 복잡하지 않을 것입니다.
* 해당 컨텐츠는 네이버 서치앤텍(NAVER Search&Tech) 블로그의 시각자료와 내용을 참고하여 작성되었습니다.
2021년 5월 3일 업데이트