좋은 블로그와 나쁜 블로그를 구분하는 것은 쉽지 않다. 왜냐하면, 무엇이 좋고 무엇이 나쁜지 그 기준을 정하기가 어렵기 때문이다. 내가 좋게 생각하는 블로그를 다른 사람은 그렇지 않게 생각할 수 있는 법이고, 나름의 서로가 인정할 수 있는 기준을 갖고 있을 것이다. 그러나, 스팸 블로그는 나쁜 블로그다라고 말한다면, 대부분이 동의 할 수 있을 것이다. 윤리적 측면에서는 여전히 무엇이 좋은 블로그고 무엇이 나쁜 블로그인지 해결 된 것은 아니지만, 만약, 블로그를 검색해 주는 서비스를 제공하는 사람이라면 일단, 무엇이 좋은 블로그이고 무엇이 나쁜 블로그인지 해결은 된 셈이다. 즉, 질 높은 검색 결과를 제공하려면 일단, 스팸 블로그가 검색되지 않게 하여 좋은 블로그만이 검색 결과로 나오게 노력하면 될 것이다.
지금까지 내가 한 말이 말 장난이라고 생각하면, 그냥 지나쳐도 무방하다. 지금부터 소개하려는 내용은 구글이 어떤 블로그가 좋은 블로그이다라고 생각할때 따져보는 몆가지 기준에 대한 것이다. 내가 이 기준을 보게 된 곳은 Search Engine Roundtable의 Google Blog Search Ranking Patent Application을 통해서인데, 좋은 블로그로 보게되는 플러스(+)요인과 스팸 블로그로 보는 마이너스(-)요인들로 나누어 져 있다. 플러스 요인을 많이 갖추면 블로그 검색 결과의 상위에 위치 지워질 가능성이 높게 될 것이고, 마이너스 요인들을 많이 갖고 있다면 검색 결과에 노출될 가능성이 떨어질 것이라고 보아도 될 것 같다.
플러스 요인
- RSS 구독자 수
- 검색결과에서 해당 블로그를 클릭하는 수치
- 다른 블로거의 블로그롤(Blogroll)에 포함된 수치
- 좋은 블로그라고 판명된 블로그의 블로그롤에 포함된 수치
- 해당 블로그가 방문자로 하여금 자신의 포스트에 태그를 걸게 할 수 있게 한 경우, 실제 방문자가 태깅을 하는지 여부
- 다른 블로그로부터 참조(링크)된 수치
- 페이지랭크(Pagerank)
- 기타 요소
마이너스 요인(스팸성 블로그로 판명할 수 있는 요인)
- 짧은 순간에 많은 포스트가 올라오는 경우와 다음 포스트가 올라올 시간을 예측할 수 있을 때
- RSS 피드내용과 블로그 사이트의 내용이 다른 때
- 포스트 내용에 스팸 블로그가 쓰는 키워드가 많이 포함된 때
- 다른 블로그 또는 웹 사이트에서 복사 또는 스크랩한 포스트가 많은 때
- 포스트 길이가 거의 비슷한 때
- 특정 웹 페이지로의 링크가 지나치게 많은 때
- 다른 블로그 또는 웹 사이트로의 링크가 지나치게 많은 때
구글 블로그 검색의 우리말 블로그 검색이 아직 만족스럽지는 않지만,
저 대단한 구글 조차 추천을 통해 랭킹을 매기고 있으며(Page Rank) 라는 오해를 받을 만큼 단순한 것 같지는 않다. 구글은 일반 웹 페이지의 신뢰도와 적합도를 결정하는 데 페이지랭크라는 기술을 이용하는 데, 페이지랭크만으로 검색결과의 순위를 결정하는 것도 아니다. 위에 소개한 리스트가 구글에서 공식적으로 밝힌 것은 아니지만, 적어도 검색 서비스를 제공하는 사람들이 고려하고 또 알고리즘으로 포함시켜 볼만한 내용인 것은 분명한 사실인 것 같다. 물론, 이를 기술화 하는 것은 당연히 쉽지가 않겠지만......





댓글을 달아 주세요
그 뒤에 쓴 글과, 그 외의 경우를 고려해 보지 않은 것은 아니라는 것은 익히 아시겠죠? ^^
중요한 것은 완전한 자동화 또는 수동화라는 것은 없다는거랄까요..^^a