검색엔진의 시대는 (내가 봤을 때) 딱 두개로 나뉘어진다.
구글 이전, 구글 이후.
거북거북님의 포스팅으로 알게된 조정후 박사님의 PageQuality에서도 이와 비슷한
'1세대 검색이 페이지의 content에 기반한 ranking metric, 2세대 검색이 현재의 link structure에 기반한 PageRank ranking metirc 로 나누고 있다.
이하의 내용은 작년말에 써놓고 포스팅하지못한 페이지랭크의 이야기(구글 이전과 이후)이다. 페이지랭크에 관해서라면 거북거북님의 포스팅이 더 정리가 깔끔하다 ㅠㅠ.
팀 버너스리에 의해 제안된 웹의 목적- '누구라도 중요하게 여기는 자료를 보관하고 찾을 수 있게 하는 '-은 소수의 사람들만이 접근할 수 있었던 웹의 원시시대에 매우 잘 지켜졌다.
1.검색엔진의 태동-구글 이전의 시대
2.웹에 질서를 가져오다-구글 이후의 시대
3. 그렇다면 구글 다음의 시대는?
현재 웸검색은 분명 구글이 가장 절대적이다. 방대한 문서 수집량과 정교하게 다듬어진 랭크(페이지랭크 이외에도 많은 요소가 랭킹을 결정하는데 사용된다)를 보유한 구글의 기술은 웹 검색에 있어서 가장 검색품질이 높다.
웹 자체가 미디어화하면서, 현재는 검색엔진이 다루어야할 데이터의 종류가 다양해지고, 이를 통합하여 보여주는 통합검색의 형태가 되어가고 있다. 통합검색에서는 검색의 본연 목적인 '정확성'만이 아닌, 미디어로써의 특징인 '신속성'이라는 측면에 대한 요구가 발생하게 된것이다.
두개를 모두 만족시킨다는것은 불가능하다. 차후의 검색은 '정확성'을 더욱 정교하는 방법과 '신속성'을 더욱 반영하는 노선으로 갈라질것이다. 이것을 가르는 기준은 어떤 데이터 영역을 검색하는지에 달린 문제가 될것이다.
신속성은 이미 테크노라티라는 대표적인 케이스가 존재한다. 구글이 정확도를 만족시키는 결과를 출력한다면, 테크노라티는 신속성을 만족시키는 결과를 출력한다.
정확성을 더욱 정교히 하는 방법은 아직까진 성공적인 사례는 없다. 링크분석외에 추가적인 정보가 존재한다면, 이를 이용하여 정확도를 올릴 수 있다. 최근 Tag가 관심을 받는 이유가, 바로 추가적인 정보가 될 수 있기 때문이 아닐까한다.
검색이 지원되어야 하는 데이터 영역은 앞으로도 무한히 늘어날것이다. 그 모든 영역을 커버하는 공룡이 나올 수도 있지만, 몇몇 영역에 특화된 서비스들이 공존하게 될 수 도있다. 구글이 무서운 이유는 바로 공룡에 가장 근접한 존재이기 때문이다. 신속성이건, 정확성이건 데이터 자체가 적다면 아무 의미가 없다. 데이터를 보유한 크기에서 구글은 공룡이 될 수 있는 충분한 가능성이 있다.
구글 이전, 구글 이후.
거북거북님의 포스팅으로 알게된 조정후 박사님의 PageQuality에서도 이와 비슷한
'1세대 검색이 페이지의 content에 기반한 ranking metric, 2세대 검색이 현재의 link structure에 기반한 PageRank ranking metirc 로 나누고 있다.
이하의 내용은 작년말에 써놓고 포스팅하지못한 페이지랭크의 이야기(구글 이전과 이후)이다. 페이지랭크에 관해서라면 거북거북님의 포스팅이 더 정리가 깔끔하다 ㅠㅠ.
팀 버너스리에 의해 제안된 웹의 목적- '누구라도 중요하게 여기는 자료를 보관하고 찾을 수 있게 하는 '-은 소수의 사람들만이 접근할 수 있었던 웹의 원시시대에 매우 잘 지켜졌다.
1.검색엔진의 태동-구글 이전의 시대
웹의 매력은...
2.웹에 질서를 가져오다-구글 이후의 시대
페이지랭크는 웹의 질서를 가져왔다..
3. 그렇다면 구글 다음의 시대는?
현재 웸검색은 분명 구글이 가장 절대적이다. 방대한 문서 수집량과 정교하게 다듬어진 랭크(페이지랭크 이외에도 많은 요소가 랭킹을 결정하는데 사용된다)를 보유한 구글의 기술은 웹 검색에 있어서 가장 검색품질이 높다.
웹 자체가 미디어화하면서, 현재는 검색엔진이 다루어야할 데이터의 종류가 다양해지고, 이를 통합하여 보여주는 통합검색의 형태가 되어가고 있다. 통합검색에서는 검색의 본연 목적인 '정확성'만이 아닌, 미디어로써의 특징인 '신속성'이라는 측면에 대한 요구가 발생하게 된것이다.
두개를 모두 만족시킨다는것은 불가능하다. 차후의 검색은 '정확성'을 더욱 정교하는 방법과 '신속성'을 더욱 반영하는 노선으로 갈라질것이다. 이것을 가르는 기준은 어떤 데이터 영역을 검색하는지에 달린 문제가 될것이다.
신속성은 이미 테크노라티라는 대표적인 케이스가 존재한다. 구글이 정확도를 만족시키는 결과를 출력한다면, 테크노라티는 신속성을 만족시키는 결과를 출력한다.
정확성을 더욱 정교히 하는 방법은 아직까진 성공적인 사례는 없다. 링크분석외에 추가적인 정보가 존재한다면, 이를 이용하여 정확도를 올릴 수 있다. 최근 Tag가 관심을 받는 이유가, 바로 추가적인 정보가 될 수 있기 때문이 아닐까한다.
검색이 지원되어야 하는 데이터 영역은 앞으로도 무한히 늘어날것이다. 그 모든 영역을 커버하는 공룡이 나올 수도 있지만, 몇몇 영역에 특화된 서비스들이 공존하게 될 수 도있다. 구글이 무서운 이유는 바로 공룡에 가장 근접한 존재이기 때문이다. 신속성이건, 정확성이건 데이터 자체가 적다면 아무 의미가 없다. 데이터를 보유한 크기에서 구글은 공룡이 될 수 있는 충분한 가능성이 있다.

