[Daum] 검색엔진의 검색원칙 > 웹문서/검색 마케팅

본문 바로가기
사이트 내 전체검색

웹문서/검색 마케팅

[Daum] 검색엔진의 검색원칙

페이지 정보

profile_image
작성자 금탑
댓글 0건 조회 7,524회 작성일 21-07-19 12:15

본문

아래는 Daum이 이용자에게  정확하고 공정한 검색 결과를 제공함에 있어서 필요한 데이터 수집과 노출 정책의 원칙입니다. 


    1. 공정한 데이터의 수집 및 구축 원칙


가)   Daum 검색은 인터넷상에 존재하는 가능한 모든 자료를 수집하거나 새롭게 구성한 결과물을 검색 서비스로 제공하기 위해서 노력하고 있습니다특히 국내 이용자들을 위한 한글 콘텐츠를 수집하고 서비스하는 것에 주력하고 있습니다.
이를 위해 Daum 검색은 크롤러(crawler)라 명명된 검색로봇을 통해 인터넷상의 데이터를 수집하고 있습니다검색로봇은 웹 상에 존재하는 웹 페이지를 방문하며방문한 페이지의 운영자가 Daum 검색로봇의 수집을 거부하는 정책을 가지고 있지 않는 한가능한 모든 정보를 수집합니다이 과정에서 Daum의 검색로봇은 임의적으로 특정 사이트를 수집의 대상에서 배제하거나 차별을 두지 않습니다.
또한검색로봇은 문서 내에 포함된 링크의 분석을 통해 문서간의 연결관계를 파악하여 새로운 문서를 자동으로 찾기도 합니다이를 통해서 Daum은 자동적으로 대량의 데이터를 수집 할 수 있습니다이로서 Daum 검색결과에서는 경쟁사의 블로그나 SNS데이터도 쉽게 찾아보실 수 있습니다.


나)    실질적으로 인터넷의 한글 콘텐츠는 전세계 콘텐츠 0.3%에 불과합니다때문에 Daum 검색은 양질의 콘텐츠를 구축하고 인터넷 생태계를 풍성하게 만들 수 있도록 카페블로그지식 등 서비스를 제공해왔습니다이 서비스를 통해서 구축된 콘텐츠들은 단순히 개별 서비스로만 사용된 것이 아니라 훌륭한 검색 자료로서의 가치를 가지게 되었습니다. 이에 Daum 검색은 이용자들의 콘텐츠 중에서 검색을 허용하는 정보에 한해서 검색 결과로 제시하고 있습니다.


다)    Daum은 이용자가 원하는 정보를 제공함에 있어 불편함을 줄여주고검색 품질 향상을 위해 지속적으로 전문정보(DB)를 확보하기 위해 노력 중입니다음악영화부동산쇼핑 등의 서비스의 경우해당 콘텐츠를 제공하는 외부 회사와 계약 혹은 제휴를 통하여 제공받고 있습니다이 데이터는 계약 및 제휴 내용에 근거하여 저작권의 보호 하에 검색 콘텐츠로서 사용하고 있습니다더불어 이러한 서비스가 ‘쇼핑하우’ ‘Daum 영화’, ‘책 검색’, ‘Daum 부동산’, ‘멜론 뮤직’ 등 자사 서비스로서 제공된다는 사실을 이용자가 쉽게 인지할 수 있도록 명시하고 있습니다.


 


    2.  검색 결과 노출 원칙의 구성 요소 및 구성 방법


가)    Daum은 검색서비스를 제공함에 있 "한국형 통합검색방식을 활용하고 있습니다이용자가 입력하는 ‘검색어에 대해서 뉴스블로그카페이미지동영상인물영화음악 및 쇼핑 등 이른바 컬렉션이라 명명된 개별적인 검색 결과를 모아서 한 화면에 보여주는 방식을 말합니다이는 이용자가 어떤 의도를 가지고 검색하는지를 입력된 검색어 만으로는 판단이 어렵기 때문에 검색 결과를 풍부하게 보여주고자 하는 의도를 담고 있습니다예컨대 ‘이효리’ 를 검색하는 이용자가 이효리의 나이를 알고 싶은 것인지사진을 보고 싶은 것인지음악을 찾는 것인지 알 수 없기 때문입니다.


나)    검색 결과의 핵심은 그 결과가 이용자의 질문에 적합도가 높은 정보인지에 대한 여부입니다이 적합도를 구성하는 요소는 컬렉션이 가지는 고유의 특성에 따라서 조금씩 다를 수 있습니다만유사성문서품질최신성이용자가의 피드백 등이 있습니다아래는 구성 요소에 대한 간략한 정보입니다.

     유사성검색 결과로 제시된 문서가 이용자가 입력한 검색어와 얼마나 유사한 내용을 포함하고 있는지 여부를 말합니다제목본문 등 문서의 중요한 영역에 검색어가 포함될 경우유사성이 높다고 할 수 있습니다.


     문서품질내용이 부실한 문서의 제목에 이용자가 입력한 검색어가 있다고 해서이를 검색 결과물로 보여준다면 이용자의 불편만 가중될 수 있습니다따라서 문서자체의 기본 품질도 적합도의 중요 요소가 됩니다.
입력된 검색어와 상관 없이 문서 자체가 얼마나 좋은지 여부와 문서를 구성하는 주제의 일관성 그리고 콘텐츠의 내용이 풍부할 수록 상대적으로 품질이 높게 평가됩니다.
또한 댓글이나 트랙백 등 다른 이용자들과 교류가 많은 문서조회수가 많은 문서들 즉인기가 많은 문서는 품질이 높게 평가됩니다더불어 문서 작성자가 평소 좋은 글을 많이 쓰는지 여부 등도 품질 판단 요소가 될 수 있습니다.


     최신성문서가 얼마나 최근에 작성되었는지 여부를 말합니다일반적으로 검색어를 입력한 시점과 검색 결과로 보여질 문서의 작성 시점의 차이가 적게 날수록 관련성이 높다고 볼 수 있습니다또한최근에 작성된 문서는 그 문서가 담고 있는 내용이 유효할 가능성도 높습니다.
다만컬렉션의 종류에 따라 최신성을 고려하는 비중이 다를 수 있습니다뉴스처럼 새로운 정보에 대한 수요가 많은 경우와 지식처럼 고정된 정보를 주로 다루는 경우는 최신성을 고려하는 비중이 상반될 수 있는 것이 그것입니다.
검색어 자체에서도 최신성을 고려하는 비중이 상이 할 수 있는데, ‘제자백가’ 같은 검색어에 비해 ‘박지성 골’ 같은 경우최신성 비중이 높은 것을 예로 들 수 있습니다.


     이용자의 반응이용자가 검색 결과를 소비하기 위하여 보여주었던 일련의 행태 정보는 적합도를 확인할 수 있는 중요한 요소입니다. 
대표적으로, 어떠한 컬렉션 또는 문서가 검색 결과 내에서 상위에 노출되었음에도 불구하고 클릭이 많이 발생하지 않는 경우는 이용자의 낮은 만족도에 기인했다고 해석할 수도 있습니다. 반대로 클릭이 많이 발생했거나 해당 검색 결과를 오랜 시간 소비한 경우 그리고 해당 결과를 소비한 이 후 다른 검색 결과를 소비하지 않았다면 그 문서 혹은 컬렉션에서 가장 높은 검색 만족도를 얻었다고 해석할 수도 있습니다.
이와 같이 Daum은 이용자의 검색 결과 만족도에 도움이 되는 정보 및 요소들과 그 반대의 것들을 지속적으로 확인하고 있으며, 검색 결과 만족도를 떨어뜨리는 요소가 발견되면 추후 검색 결과를 구성함에 있어 적절한 조치를 취하고 있습니다.


     적합도 방해요소 4가지와는 상반되는 검색의 적합도에 방해가 되는 요소들이 존재하며 다음과 같습니다.

       - 성인 콘텐츠

       - 마약도박 등의 불법적 콘텐츠

       - 영화음악서적 등의 저작권을 침해하는 콘텐츠

       - 주민등록번호 등 타인에 의해서 불법적으로 활용될 개인정보가 포함된 콘텐츠

       - 의도적으로문서 클릭 시 해당 문서가 아닌 다른 문서로 이동하게 하게하거나  문서내에 악성코드가 있는 콘텐츠

       - 키워드이미지링크 처리 등을 통해서 비정상적인 방법으로 만들어진 콘텐츠

       - 특정 키워드를 반복해서 작성하든 등 대량반복적인 방법으로 만들어진 콘텐츠

       - 상업적인 목적을 위해서 만들어진 콘텐츠


다)    즉 Daum 검색에서 생각하는 좋은 문서는 다음과 같습니다.

     어떤 대상에 대한 생각이나 경험한 내용을 작성자가 본인이 직접 작성하여 검색 이용자들로 하여금 실제적 정보를 제공 할 수 있는 문서

     내용을 이해하는데 도움을 주는 사진지도 등의 부가정보가 풍부한 문서

     비교적 최신의 신뢰할 수 있는 정보를 담고 있는 문서

     비슷한 내용의 많은 문서 보다 그 문서만의 고유한 정보가 있는 소수의 문서

     영리목적이 아닌 웹 콘텐츠 생산을 위한 순수한 목적으로 작성된 문서

 라)    이와 같이 적합도를 기준으로 선별된 적합한 문서들은 이용자가 검색어를 입력함으로써 확인 할 수 있습니다검색은 이용자가 검색어를 입력하면검색엔진이 Daum이 수집하거나 새롭게 구성한 결과물과 검색어 간의 적합도를 계산하고 그 확률이 높은 순서대로 보여주게 됩니다헌데이 과정에서 Daum이 자체적으로 서비스하는 정보를 우대하여 타 서비스 정보보다 무조건 먼저 보여준다면검색 품질이 떨어질 수 밖에 없습니다때문에검색 적합도를 최우선 목표로 하는 Daum에서는 자사 서비스 외에 다른 서비스에 대해 차별하지 않습니다.

Daum은 Daum의 문서와 외부로부터 수집 혹은 제공된 문서를 노출하는 방법에 있어이처럼 문서들의 출처를 구분하지 않고이용자가 입력한 검색어와 적합할 확률이 높은 문서를 먼저 보여주는 정책을 가지고 있습니다.


마)    더불어 검색어에 따라 제시되는 컬렉션 및 컬렉션을 구성하는 문서의 종류와 숫자는 최적의 검색 결과를 위해 자동으로 결정되며 수정이 불가능합니다인위적으로 개입해 검색 결과를 조정 할 경우오히려 이용자의 검색 만족도와 서비스의 경쟁력을 떨어뜨릴 수 있기 때문입니다.


바)    또한, Daum은 검색 품질을 높이기 위해서 이용자의 검색 활용 정보를 적극 반영하고 있습니다이를 반영해 적합도와 관련된 다양한 요소들의 가중치를 재구성 하는 개선 작업을 꾸준히 수행하고 있습니다일반적으로 임의로 추출된 검색어를 별도의 ‘평가자 그룹을 통해서 검색 만족도를 평가하며그 결과를 검색 품질 개선에 반영하는 방법을 사용하고 있습니다때문에 검색 결과는 검색 시점에 따라 다르게 나타날 수 있습니다.



출처 : Daum 고객센터

댓글목록

등록된 댓글이 없습니다.

회원로그인

회원가입

Copyright © admoim.kr All rights reserved.