SEO – Search Engine Optimization의 우리말 표현은 검색 엔진 최적화입니다. ‘웹사이트 품질지수 관리’로 보면 더 적합하지 않을까 합니다.
5년 전, 구글의 검색엔진과 번역엔진 분석 및 리포트 작업을 한 경험이 있습니다. 작업의 구체적인 내용을 공유하지 않는다는 협의하에 이루어진 작업이었습니다. 그런 이유로 메뉴얼을 참조하지 않고 쓰겠습니다. 위키피디아를 제외하면, 이 문서에서 예로 든 웹싸이트가 메뉴얼에 언급되지 않습니다. 광고 단가에 대한 이야기도 메뉴얼에 없습니다.
제목에서 말한 평가 가이드는 웹사이트와 웹페이지의 점수를 매기는 가이드입니다. 메뉴얼은 직접 SEO를 언급하지 않습니다.
[품질]
품질지수는 콘텐츠를 만드는 입장이 아닌, 콘텐츠를 보는 사용자의 시각에서 출발합니다. 구글을 예로 들어 이야기하고 있지만, 서비스를 이용하는 사용자에게 더 좋은 결과를 제시하는 것이 모든 검색엔진의 역할입니다.
구글 평가 가이드의 핵심과 평가체계는 “상식과 사용자 편의”라고 할 수 있습니다. 사람이 정책을 정하고, 기계가 이를 수행하면서 학습하는 이유는 상식적인 수준에서 더 좋은, 더 검색어와 가까운 결과를 도출하기 위한 것입니다.
이를 위해서 웹사이트와 웹페이지 각각 점수를 부여합니다. 어떤 웹사이트가 품질기준을 만족하면, 거기 포함된 웹페이지의 점수 기준은 이미 어느정도 확보된 상태지만, 기준에 부합하지 않으면 특정한 웹페이지의 점수는 낮게 책정될 수 있습니다. 콘텐츠의 품질이 좋지 않으면 전체 웹사이트의 점수는 낮을 수 밖에 없습니다.
플랫폼과 콘텐츠의 성격을 명확하게 하고, 독자 입장에서 출처를 가늠하기 편하게 하는 것은 웹사이트와 웹페이지의 품질을 높입니다.
제품을 만드는 제조사라면 홈페이지에 제품의 정보, 메뉴얼, 온라인과 오프라인 고객서비스를 포함합니다. 이 정보를 웹과 모바일을 통해 쉽게 이용할 수 있어야 합니다. 제품이 아닌 정보를 제공하는 웹사이트라면 좋은 품질의 콘텐츠가 잘 정리되어 있으면 됩니다.
위키피디아는 좋은 예입니다. 이 플랫폼은 검증되어 있습니다. 그리고 역시 검증된 많은 개별 페이지를 포함합니다. 하지만 정보의 양이 빈약하거나, 그 빈약한 상태에서 업데이트가 없다면 해당 페이지의 점수는 낮게 책정됩니다. 검색결과에 포함되지 않는 위키피디아 문서는 실제로 많습니다.
웹사이트와 웹페이지를 구분해서 정책을 결정하는 것은 유리합니다.
[정보의 양]
정보의 품질이 정보의 양과 직접 연관된 경우도 많습니다.
예를 들어, 맥주에 대한 글이 있습니다. 상표만 나열되고 다른 내용이 없으면, ‘이런이런 상표가 있구나’ 하는 정도만 사용자에게 도움이 됩니다. 많은 상표를 리스트로 만들고 분류를 더하면, 더 도움이 됩니다. 모든 분류에 좋은 설명을 더하지 못하더라도, 하나씩 그 분류에 따른 정보를 추가하면 많이 도움이 됩니다. 결국, 웹페이지의 품질지수와 웹사이트의 품질지수를 같이 높이게 됩니다.
맥주와 연관된 다른 주제가 포함된다면, 이제는 깊이가 아닌 범위와 양의 문제가 됩니다. 이 경우, 여전히 맥주라는 기본주제를 다룬 페이지의 우선순위는 높고, 이와 연관된 다른 페이지들의 우선순위는 낮지만, 그 양적 측면에서의 우선순위는 전체적으로 높아집니다.
‘도움이 된다’는 표현은 사용자 입장입니다. 동시에 구글의 품질기준입니다. 그래서 SEO에도 도움이 됩니다.
[검색어의 성격]
구글의 검색엔진은 검색어와 검색된 페이지의 성격을 이해합니다. 그 대상이 물건인지, 사람인지, 사회적 이슈인지 구별하고, 무엇을 사용자에게 우선해서 보여줄지 결정합니다.
정보의 어떤 측면이 중요한지는, 사회적인 흐름에 따라 계속 달라집니다. 새로운 것이라면 그것의 정의, 그것을 다루고 있는 뉴스 등이 우선순위가 됩니다. 이미 모든 사람이 알고 있는 종류의 정보라면, 그 정보의 특정한 측면에서 시작하는 것이 유리합니다.
성격을 정의하고, 특정한 측면을 선택할 때, 아래의 기준을 생각할 수 있습니다.
– 정보의 대상인가, 소비, 혹은 구매의 대상인가, 두가지 모두라면 무엇을 먼저 제시할것인가. 하나의 페이지나 메뉴에 넣을것인가, 분리할 것인가
– 추가되거나 변경할 내용은 시점에 영향을 받는가, 받지 않는가
– 해당 주제의 소유주체가 있는 경우인가 그렇지 않은가. 소유주체가 있거나, 해당 주제를 뛰어나게 다루고 있는 곳이 있다면, 나는 어떤 측면에서 경쟁할 것인가
콘텐츠를 채우는 플랫폼의 형태는 이미 정해져 있을 것입니다. 위의 기준에 따라 플랫폼을 변경하거나, 현재의 플랫폼을 어떻게 이용할지 선택하는 것은, 웹사이트 순위, 개별 웹페이지의 순위 모두에 영향을 줍니다.
[콘텐츠의 패턴과 블랙리스트]
‘지금 시점에서’ 검증된, 혹은 검증할 대상인 정보, 정보를 담은 문서는 copy & paste 로 만들어질 수 없습니다. 다른 문서를 활용할 경우, 출처를 명시하는 것은 언제나 기본이 됩니다.
외부 문서의 출처를 늘 밝히다가 누락하는 경우, 반복적으로 copy & paste를 하는 경우 등의 패턴도 검색엔진은 인식합니다.
검색엔진이나 SEO를 이해하고, 어떤 측면을 이용하려고 하면, 그 방법이 객관적으로 공정하면 됩니다. 그래서 검색엔진에 대한 이해가 필요 없다고 말할 수 있습니다. SEO를 잘 하려면 SEO에 얽매이지 않는게 오히려 유리할 수 있습니다.
반대로, 특정한 페이지가 spam으로 인식되고, 이것이 반복되면, 웹사이트 자체가 블랙리스트에 올라갑니다. 블랙리스트에 올라간다고 해서 검색결과에서 완전히 배제되는 것은 아닙니다. 누군가 그 페이지와 밀접한 검색을 하면 노출될 수도 있습니다. 그런 경우가 아니라면 배제됩니다. 당연히 스패머가 올린 스팸이 아닌, 웹사이트 자체 콘텐츠 기준입니다.
[업데이트]
10년 20년이 지나도 내용을 업데이트할 필요가 없는 페이지가 있고, 업데이트가 필요한 페이지가 있습니다. 고정된 페이지가 아닌 플랫폼 형태의 WordPress, Ruby on Rails, Wiki 스타일의 공개 소스로 구성된 웹싸이트를 이용하는 것은 좋은 방법 중에 하나입니다.
업데이트는 이런 경우를 말합니다.
– 콘텐츠 자체를 수정하는 경우, 변경부분을 명시하면 좋습니다. 업데이트된 날짜가 나오면 더 좋습니다. 엔진은 이 정보가 표시되지 않더라도 인식합니다. 하지만, 독자를 위한 행위는 객관성, 즉 품질지수를 높입니다.
– 콘텐츠에 댓글이 추가되는 경우 – 댓글을 포함해서 해당 글타래(thread)의 업데이트를 사용자가 인식하기 편할 수록 좋습니다. 좋은 방법은 오래된 글이라도 댓글이 있으면 날짜와 무관하게 상단에 위치하는 것입니다.
– 웹사이트나 내부의 특정 웹페이지와 연관된 주제의 콘텐츠가 추가되는 경우. 구글은 각종 포럼 검색과 내용 인식에 뛰어납니다. 예를 들어 A라는 제품정보를 검색했는데 B라는 제품에 대한 결과를 표시합니다. A의 정보가 없지만 B의 정보가 활용가능한 양질의 정보일 때인데, 이렇게 결과를 도출하는 수준이 계속 높아집니다. 질이 떨어지는 정보를 거르는 수준도 높아지고 있습니다.
[정보의 소유자, 혹은 정보가 가진 대상의 생산자]
1. 특정한 제품명을 가지고 검색한다면 어떤 웹페이지가 가장 먼저 보여야 할까요? 그 제품을 만든 제조사의 해당 제품 페이지가 검색한 언어와 지역에 따라 표시되어야 합니다.
2. 특정한 기업을 검색해도 같습니다. 대신 제품이 아닌 해당 기업의 홈페이지에서 해당 언어가 나오면 됩니다.
3. 최근 10년간 많이 등장한 패턴입니다. 망한 기업의 상표권만 구입하거나, 제조사와 무관한 유럽의 어떤 나라 도메인으로 홈페이지를 만들고 핵심적인 내용을 빼거나, 기업의 역사를 과장하거나 만들어낸 웹싸이트들이 있습니다. 이건 쉽게 검색엔진이 분류하고, 다시 사람이 검증하는 절차를 거칩니다. 그리고 다시 엔진을 업데이트해서 사람이 관여할 필요를 최소화합니다. 인공지능을 활용하기 좋은 대상입니다. 구글은 이미 20년 이상 모든 브랜드와 웹페이지의 히스토리를 가지고 있습니다. 어떤 회사나 제품을 검색해서 제조사가 나오지 않거나, 제조사가 있는데도 불구하고 검색결과에서 뒤로 밀려있다면 이런 경우일 수 있습니다. 물론 검색에 문제가 있는 경우에 구글에 해당 내용을 통보할 수 있습니다.
4. 특정 제품의 사용법, 문제점 교류 – 우선순위는 내용이 빈약하더라도 제조사에서 제공하는 소비자 게시판이나 포럼입니다. 그리고 나서, 해당 제품에 대한 토론이나 ‘정보가 포함된 외부 정보’가 우선순위를 가집니다.
외부 정보는 꾸준히 업데이트되는 블로그, 클리앙과 같은 유저 커뮤니티, 영어권을 예로 들면, stack overflow 처럼 분야를 한정한 포럼, Reddit처럼 모든 것을 이야기하지만 주제별로 정리가 되어 있고 활동이 유지되는 포럼을 포함합니다. 여기에서 다시 품질에 따라 우선순위가 결정되고, 변경됩니다. 품질에는 사용자가 어떤 글을 선택하는가, 즉 피드백이 포함됩니다. 이역시 패턴 인식의 대상이기 때문에, 개관성을 해치는 인위적인 개입은 오히려 역효과를 냅니다.
[언어]
언어에 대한 기술적인 접근과 방향은 꾸준히 개선되고 있습니다. 어떤 단계에서는 혼란스러울 수도 있습니다. 근본적인 방향은 검색한 언어, 지역이 우선순위에 있다는 역시 상식적인 판단입니다.
구글, 페이스북, IMDB 역시 언어를 활용해서 검색의 질을 높이는 작업을 하고 있으며, 접근하는 철학은 조금씩 다르지만 그 근본은 다를 수 없습니다.
여기에서는 방향만 말씀드리겠습니다. 사용자가 두개의 언어를 조합해서 검색하면 두개의 언어에서 연관도가 높다고 판단되는 결과를 보여줍니다. IMDB를 예로 든 만큼, 영화 제목으로 얘기해보겠습니다. IMDB는 영어로 우리말 발음을 흉내낸 DB를 가지고 있고 아주 천천히, 그리고 읽기 어렵게 이를 확장하고 있습니다. 이렇게 10년 정도 답보 상태입니다. 언어 확장면에서 효용성이 없습니다.
페이스북 안에서 영어로 검색을 하더라도, 제목을 우리말로 보여준다거나, 우리말 영화정보가 내부에 있는 경우에 그것을 표시합니다. 페이스북은 사람간의 관계를 포함하기 때문에, 기업이나 특정 정보의 페이지만 검색대상이 됩니다. 언어 처리가 점점 좋아지고는 있지만, 영화정보를 게시한 주체가 영화와 상관이 있지 않다면 언어처리와 무관하게 검색 우선순위는 낮아집니다.
구글은 당연히 복수의 검색결과를 보여줄 수 있으니, 가장 쓸모있는 방법이 무엇인지 계속 찾아냅니다.
글로벌한 서비스를 기획한다면, 웹사이트에서 언어를 어떻게 처리할지 결정하고 발전시키는 것도 유리합니다. 때로는 검색엔진, 혹은 검색엔진 팀이 이런 면에서 새로운 기준을 발견할 수도 있습니다. 특정한 분야나 검색어는 자국어와 연관성이 높은 외국어를 함께 활용하는 방법이 유리할 수도 있습니다. 대신 단순한 나열은 의미가 없습니다.
[나쁜 예 모음]
메뉴얼에 있는 몇몇 나쁜 경우입니다.
– 한페이지에 담아도 될 내용을 쪼개서 반복적인 클릭을 유도하는 경우
– 같은 내용을 약간씩 변경해서 여러 페이지에 담는 경우
– 출처가 없는 외부 콘텐츠
– 보기 민망한 광고나 사진
[SEO와 광고 – 메뉴얼과 무관한 내용입니다.]
SEO의 목적은 더 많이 노출되기 위한 것입니다. 품질 유지가 SEO의 원동력이라면, SEO를 통해서 이루고자 하는 목표는 더 높은 수익성입니다. 더 많은 사용자는 더 많은 광고수익과, 더 많은 유료서비스 고객을 유치합니다.
여기에서 혼란을 가지지 말아야 할 것은, 더 많은 광고수익과 더 많은 광고는 상관관계가 없거나, 오히려 반비례 관계인 경우도 많다는 점입니다.
1. BBC의 웹싸이트를 예로 들어보겠습니다. BBC는 클릭당과금 CPC를 장기간 사용하지 않은 적도 있고, 제품광고가 아닌 기업광고만을 게시하기도 합니다. 계속 연구하고 실험하는 모습을 볼 수 있습니다.
이런 과정에서도, 광고를 보는 대상을 특정할 수 없는 경우, 대부분의 사람들에게 필요한 서비스나 제품, 카테고리로 광고를 제한합니다.
User tracking을 사용하는 경우에도 광고의 카테고리를 한정합니다. 이는 1번과 연장선상에 있습니다. 예를 들어 국제적인 서비스를 하는 항공사, 해외 여행과 관련된 광고들, 누구에게나 필요하고 지구상의 대부분 지역에서 구매가 가능한 제품을 생산하는 제품이나 기업광고 등으로 제한합니다.
2. BBC가 좋은 예라면, 나쁜 예를 들어보겠습니다. 페이스북에는 리뷰를 가장한 광고가 많습니다. 그리고 여기에는 검증되지 않거나 검증할 방법이 없는 제품을 리뷰어를 가장한 마케터들이 광고합니다. 우리나라의 많은 신문사 웹사이트에도 이런 광고가 많습니다. 이미 많은 유저를 확보하고 있으니 SEO는 배제할 수도 있겠지만, 대형 광고주와 광고 대행사는 같은 기준으로 웹사이트를 평가합니다.
4. 또 다른 예를 들겠습니다. “비교적” 좋은 예입니다. Reddit과 Quora는 글과 글 사이, 글과 댓글 사이 등에 광고를 삽입합니다. 어떤 페이지에 있어도 괜찮은 광고와, 특정한 페이지에만 노출되는 광고를 구분합니다. 구글의 내용기반 광고일 수도 있고, 광고주, 혹은 대형 광고 대행업체와 계약된 특정 광고를 ‘콘텐츠와 독자에 맞추어’ 배치합니다. 그런데 어떤 페이지나 어떤 광고는 콘텐츠와 구분하기 어렵거나, 정작 글을 읽는데 방해가 됩니다. 장기적으로 보면, 이 역시 고가의, 그리고 장기 계약이 가능한 높은 수익의 광고의 수주 가능성을 떨어뜨립니다.
경제적 측면의 결론 – 광고 수익을 높이고 싶다면, 혹은 더 많은 방문자를 원한다면, 웹페이지의 수준을 높이는 방법을 연구하는 것이 유리합니다. 특정 웹서비스에만 의존한다면, 확장성에 한계가 생깁니다.
[좋은 예 한가지 – 메뉴얼에 없는 내용입니다.]
20대 초반의 한 친구는 축구를 아주 좋아합니다. 이 친구는 브라질에 삽니다. 블로그에 자기가 관심이 있는 국내외 리그의 대전표를 꾸준히 올리고, 그 결과를 업데이트하고, 관심 있는 선수나, 시청한 경기의 관전평을 꾸준히 썼습니다. 쓰다보니 일일이 표를 그리기 귀찮아서 자신이 할 수 있는 가장 간단한 방법으로 표에 입력하면 디스플레이 되도록 저가의 웹 호스팅을 선택해서 홈페이지를 만들었습니다.
브라질은 과거에 포르투갈의 식민지였기 때문에, 포르투갈어를 씁니다. 포르투갈 어는 스페인어와 거의 비슷합니다. 그래서 스페인어를 사용하는 해외 트래픽이 점점 발생했고, 호스팅 비용때문에 고민을 하게 되었습니다. 비슷한 시기에 코카콜라와 나이키에서 연락이 왔습니다. 1년이나 2년 단위로 배너를 개제하고 싶고, 특정한 위치를 할당해달라는 요구가 있었습니다. 호스팅 비용을 걱정할 필요가 없으니 당연히 수용을 했습니다. 이렇게 지난 5년간 1년 단위로 하나, 혹은 두개만의 기업광고만 유치하고 있습니다.
이 친구의 일상은 세계를 여행하면서 자기 홈페이지를 업데이트하고, 직접 경기를 관람하는 것입니다. 물론 직원을 두고 기업화하기에는 어렵습니다. 그렇지만, 분야와 홈페이지의 성격을 명확하게 해서, 기업화한 경우, 그러니까 Reddit, Craig’s List, Reddit, Stack overflow, Quora와 크게 다르지 않습니다. 언론사의 성격과 광고의 방향을 가지고 꾸준히 실험하는 BBC도 좋은 예입니다.
[맺는 말]
SEO는 트릭이 아닙니다. 기술적인 접근은 두번째 우선순위입니다. 구글의 내용기반 광고의 정확성은 여전히 부족합니다. 그러니 컨텐츠와 광고 카테고리를 홈페이지 성격에 맞추고, 좋은 컨텐츠를 위해 노력하는 것은 SEO 측면에서나 광고수익에서나 유리합니다. 많은 양의 광고와 여기저기서 퍼담은 컨텐츠로 수익을 올리고 있는 홈페이지도 여기저기 있습니다. 심지어 같은 사람이나 기업이 형태만 바꾸어, 여러개를 운영하면서 트래픽을 유발하도록 서로 연결한 경우도 있구요. 모든 방식은 장단점이 있겠지만, 장기적으로 유리한 방법은 아닙니다.
피해야 할 트릭 몇가지를 소개합니다. 이미 구글의 엔진이 걸러내고 있는 방식들입니다.
1. 과도한 태그와 키워드 – A라는 제품을 얘기하면서 검색노출 목적으로 B, C, D를 언급하거나, 사용자에게 보이지 않는 키워드를 삽입하는 경우.
2. 어디에나 있는 컨텐츠, 출처를 밝히지 않는 copy & paste – 앞서 설명했고 모두 아는 내용입니다. 참고로 DB에서 날짜를 조작해도 원본과 카피는 대부분 구별합니다. 엔진은 어떤 웹페이지가 ‘원본’인지 구별하고 품질지수에 적용합니다. 페이지와 사이트 모두 점수를 떨어뜨리게 됩니다.
3. 무관하면서 순간적인 노출 빈도가 높은 컨텐츠 – 이런 경쟁으로 얻을 수 있는 광고는 단가가 낮은 것들이 대부분입니다. 이 방법에 특화된 업체들도 물론 있습니다.
효과적인 홈페이지 노출, 광고의 단가, 검색엔진의 품질지수(SEO)는 같이 움직입니다. SEO의 기준이나 방법보다 품질과 사용자 편의를 우선하고, 광고를 최소화하는 것이 오히려 쉬운 접근일 수 있습니다. Similarweb과 같은 서비스를 이용해서 여러 홈페이지의 트래픽을 모니터링해보는 것도 도움이 될테구요.
Be the first to post a comment.