블로그 지수 계산법 질문
가끔가다 블로그 지수를 계산해주는 사이트에 몇번 들어가서 보면 최적2, 준최1 이런식으로 결과를 받았다고 하시는 분들이 계시던데, 이런 지수는 어떤 공식으로 계산이 되는지 너무 궁금합니다.
블로그 지수
개발을 하시는 블로그해 님의 질문입니다. 지수는 곧 점수를 뜻한다고 기초 미친강의에 나왔죠. 그리고 또 심화 약빤강의에서 다음과 같이 말합니다. ‘모든 점수는 0과 1점 사이로 계산된다.’라고. 다시 말해, 실제로 이 회사에서 0과 1점 사이의 점수가 존재합니다. 그리고 그 숫자는 찾는 방식이 프로그램마다 조금씩 다릅니다.
초창기의 방식
초창기에 나왔던 프로그램들은 rss에서 문서의 주요 속성만 긁어서 계산을 하기도 했고, 상대적으로 최근에 나온 프로그램들은 실제로 이 회사의 숨겨진 코드 속에서 해당 값을 도출할 수 있는 코드의 일부를 찾아서 만든 것도 있습니다. 하지만, rss의 경우, 문서의 앞부분만 가져오기 때문에 정확한 점수를 도출한다는 것이 무리였죠.
현재의 방식
하지만, 말 그대로 ‘일부’를 찾았습니다. 실제로, 랭킹이 결정되기 위해 사람들이 생각하는 요소는 ‘텍스트, 이미지, 영상, 링크’ 정도가 전부이겠지만, 이 요소는 ‘대표적으로 눈에 띄는 요소’인 것이지, 실제 눈에 보이지 않거나, 잘 띄지 않는 요소들이 작용합니다.
그리고 함정
하지만 여기에도 문제는 있습니다. 다시 말해, 해당 블로그가 만들어진 시간(오래된 블로그가 무작정 좋은 건 아니니 오해는 하지 마세요.), 블로그 제목, 닉네임, 설명글, 카테고리, 그 카테고리의 뎁스(Depth), 작성된 시간, 작성자, 블로그의 주제, 게시글의 주제, 제목, 본문, 태그, 키워드, 키워드의 빈도, 랭킹과 상대적인 위치의 차이 등.. 이루 말할 수 없을 정도로 수없이 많습니다.
블로그 지수, 이건 반드시 알고 계세요!
모든 것은 0~1점 사이에 존재한다.
즉, 그 수많은 것들에 대한 ‘점수’가 존재하고, 그 모든 점수는 ‘0과 1 사이의 숫자’로 결괏값이 나옵니다. 그런데 문제는 여기에서부터 시작됩니다. 만약 요소가 20가지라면, 각각의 요소별로 가중치가 존재하는데 그 가중치는 이 회사에서 공개된 적도 없고, 알아낼 수도 없습니다. 가중치를 안다고 하면, 이 포털 사이트를 만들었거나, 사기꾼일 확률이 칠십팔십구만 퍼센트..
하지만 그 해석은 하늘과 땅 차이.
다시 말해, ‘금칙어’, ‘키워드의 빈도수’ 등으로 설명을 하는 건, 99% 정도는 제 강의를 카피했다 보시면 되고.. 실상은 위에 적어드린 바와 같습니다. 이게 무슨 뜻이냐… 하면, 코드 일부를 실제 찾아냈지만, ‘기준’이 이 회사의 기준이 아니라 각자의 기준으로 해석했다는 의미예요.
어떤 프로그램은 0점부터 0.1111까지가 일반 블로그이다!라고 했다면, 어떤 프로그램은 0점부터 0.1124까지가 일반 블로그이다.라고 한다는 거죠. 그리고 저는 기초 미친강의에서 설명드렸습니다. ‘최적화’와 ‘저품질’이란 단어가 나온 이유에 대해서.
사이트마다 다른 블로그 지수 결과
즉, 그들이 만든 기준, 일반 – 준최적화 1~n – 최적화 1~n을, 이 회사에서 해야 할 것에 해당하는 점수를 두고, 같이 식으로 스코어의 처리를 정하고, 그로 인해서 사이트마다 결괏값도 다르게 나옵니다. 거기에 몇 가지 자잘한 경우(키워드를 위해 수 등)과 금칙어에 대한 이야기를 하였었습니다.
그래도 성과는 나오죠. 다만, 그 프로그램을 만든 업체들은, 이 회사에서 자꾸 Ban을 주니까 서버를 옮겨 다니다가 검색해도 안 나오기 시작하고, 기존에 꾸준히 이용하는 회원들의 추천을 받아서 가입을 시킵니다.
다시 말해… 불법적 요소가 충분하다는 점은 주의하셔야겠습니다. 😀