Google Data Mine 활용

Anonim

너 오늘 "봤 거든"? 이 페이지를 '검색'으로 연결 했습니까?

그렇다면 미래를 보았고, 아직 깨닫지 못했다고해도 그 부분이됩니다. 실제로 검색하는 것보다 Google에서 더 많은 일이 발생합니다. 나는 Google이 무엇을하고, 알고 있는지에 대해 이야기 할 것입니다. 또한 최대한 활용하기 위해 무엇을해야하고 알아야하는지에 관해 이야기 할 것입니다.

$config[code] not found

사실, Google은 웹 페이지, 동영상, 이미지, 주식 시세, 전화 번호, 주소 및 기타 미디어 및 데이터 덩어리로 구성된 대규모 데이터베이스를 활용하여 관련 정보를 제공하는 강력한 검색 엔진으로 가장 잘 알려져 있습니다. 열쇠를 치는 데 걸리는 시간.

세계 최대 검색 엔진의 이름은 인터넷 검색과 동의어가되었습니다. 우리의 일상 언어에서 동사가되기도합니다 (구글은 우리가 그런 식으로 사용하는 것을 좋아하지 않더라도). 우리는 "google"자동차 리뷰, 어린 시절 친구의 현재 주소, 그리고 화려하고 위엄있는 비행에서 우리 자신을 표현합니다.

우리가 검색 할 때 우리가 혼자가 아니라는 것을 잊기 쉽습니다. Google 환경 (및 Google 외부에서 수행하는 일부 작업) 내에서 수행하는 모든 작업이 기록, 저장 및 분석됩니다. 회사에서 사용 가능한 많은 데이터가 있다는 것을 알게되면,이 모든 정보가 즐거운 검색 경험 그 이상을 위해 사용될 수 있다는 것을 깨닫는 데 오랜 시간이 걸리지 않습니다.

Google의 잠재력을 완전히 이해하려면 잠시 자리에 앉아 Google의 작동 방식을 조금 더 자세하게 고려하십시오. Google의 작동 원리

일반 검색 사용자에게는 Google이 인터넷을 그렇게 빠르게 검색하고 좋은 결과를 얻는 방법이 즉시 명백하지 않습니다. 비밀은 쿼리를 입력 할 때 인터넷을 전혀 검색하지 않는다는 것입니다. 대신 Google은 하루 24 시간 연중 무휴 계속 증가하고 업데이트되는 데이터베이스를 검색합니다.

이 모든 일은 인간 개입없이 일어납니다. "스파이더"또는 "크롤러"라 불리는 작은 프로그램은 스파이더가 웹의 스레드를 따르는 방식으로 한 페이지에서 다른 페이지로의 링크를 독립적으로 따릅니다. 거미가 웹 페이지를 크롤링하면 모든 문장, 이미지, 전화 번호 및 기타 발생할 수있는 모든 정보를 수집합니다. 그들은 방문하는 각 페이지를 스캔하고, 키워드를 색인하고 페이지와주고받는 링크를 기록합니다. 그런 다음이 정보는 방대한 데이터베이스에 저장됩니다. 동일한 링크와 페이지가 반복적으로 크롤링되므로 Google의 정보가 최신 상태로 유지됩니다.

Google은 거미가 수집 한 정보를 사용하여 페이지의 순위를 매 깁니다. 이 랭킹 프로세스에는 다음이 포함됩니다.

  • 키워드 빈도 및 위치 (더 눈에 잘 띄는 위치의 키워드가 많을수록 좋습니다.)
  • 페이지의 나이 (더 잘 설립 된 페이지는 더 좋다);
  • 페이지에 연결되는 페이지 수 (링크가 많을수록 좋습니다).

Google이 고려해야 할 다른 요소도 있지만, 실제로 유용한 정보를 제공하지 않으면 서 시스템을 조작하고 순위를 매길 수있는 사람들을 방해하기 위해 비밀로 유지됩니다. 또한 과용하여 중복 된 정보, 키워드 목록 및 정크 링크로 페이지를 채우는 경우 Google에서 처벌하거나 데이터베이스에서 사이트를 삭제할 수 있습니다. 분명히 균형이 잘 잡혀 있어야합니다. 페이지상의 요인의 균형은 과학만큼이나 예술입니다.

이 기준에 따라 페이지 점수가 높을수록 검색 결과 순위가 높아집니다. 가장 높은 순위의 페이지는 Google 검색의 첫 번째 페이지에 표시됩니다. 대부분의 Google 사용자는 첫 페이지를 넘지 않으므로 순위가 높은 페이지는 인터넷 트래픽이 지나치게 많이 발생합니다.

이 모든 말은 구글에서 검색을 실행하면 그 순간에 전체 인터넷을 검색하지 않으므로 너무 빨리 응답 할 수 있습니다. 고도로 조직되고 우선 순위가 높은 데이터베이스를 컨설팅하고 있습니다. 그러나 번개 빠른 검색을 만드는 것보다 더 중요한 것은 Google에 인터넷에있는 데이터에 대한 방대한 데이터 저장소가 있으며 더 중요한 것은 무엇을 언제 어디서 어떤 목적으로 사용 하는지를 의미합니다.

Google은 무엇을 알고 있습니까?

Google은 실제로 "많이"알고 있습니다. Google은 검색을 추적하고 IP 주소 또는 Google 로그인을 기반으로 특정 검색에 파일을 보관합니다. 그것은 그들에게 당신의 마음에 작은 창문을 제공하여 관심사가 무엇인지 밝히고, 걱정하고, 흥분 시키며, 겁 먹게합니다. 이것만으로도 강력한 마케팅 정보입니다.

해당 데이터베이스를 활용할 수 있다면 관심 분야, 구매 습관, 건강 문제, 가족 문제 등 개인에 대한 상세한 프로필을 구성 할 수 있습니다. 회사가 성공하든 실패하든, 합병이나 인수를 고려하고 있는지, 어떤 제품 라인으로 확장하고 있는지를 나타내는 표지판을 발견 할 수 있습니다. 선거, 경제, 건강 관리 및 사회적, 재정적, 정치적으로 중요한 여러 분야의 역사적 추세를 추적 할 수 있습니다.

또한, 의도적으로 또는 모르는 사이에 다른 Google 서비스를 사용하는 경우 더 많은 정보를 제공하는 것입니다. Gmail을 검색하여 친구와 공동 작업자가 누구인지뿐만 아니라 귀하의 서신에서 검색과 동일한 정보를 얻습니다. Google 문서를 통해 문서를 공유하면 작업 대상자와 프로젝트를 알 수 있습니다. Google Checkout은 구매 패턴, 지출 습관 및 예산에 대한 데이터를 추가합니다.

자신이 그렇게하고 있다는 것을 알지 못해도 Google에 전송하는 정보가 있습니다. Google은 다른 인터넷 서비스처럼 IP 주소와 MAC 주소를 수집합니다. 귀하의 IP 주소는 귀하가 전세계 어디에서 지리적으로 알려주고 MAC 주소는 귀하의 컴퓨터에 고유 한 서명입니다; 이를 통해 사용자는 항상 동일한 시스템을 사용하는지, 얼마나 많은 시스템을 사용하는지 등을 추적 할 수 있습니다. 따라서 Google은 귀하가 검색하는 내용과 귀하가 통신하고있는 대상을 알 수있을뿐만 아니라 귀하가 어디에 있고 어떤 기계 또는 기계를 사용하고 있는지도 알고 있습니다.

물론 한발 뒤로 물러나서 거의 모든 인터넷 사이트가이 정보의 일부 또는 전부에 액세스 할 수 있음을 인정하십시오. 예를 들어 IP 주소는 해커 및 서비스 거부 공격으로부터 보호하기 위해 정기적으로 수집됩니다. 누군가의 사이트를 방문하는 장소, 도착하고 떠날 때, 출입하는 장소에 대한 정보는 가장 작은 개인 사이트에서도 사용할 수있는 모든 표준 웹 통계입니다.

Google이 다른 점은 서비스의 규모와 다양성 때문입니다. 더 많은 사람들로부터 다양한 정보를 수집 할 수 있습니다.

정보가 수백 가지 데이터에서 수십억 가지가되면 다른 사람이 수행하지 않는다는 통찰력을 얻을 수 있습니다. Google을 진정으로 강력하게 만드는 이유는 다른 사람보다 더 많은 맥락에서 사람들을 관찰 할 수 있다는 것입니다. Google은 사용자가 컴퓨터를 사용하지 않아도 나를 지켜보고 있습니다. Google지도는 미국의 대부분뿐 아니라 전 세계의 고해상도 사진을 제공합니다. 집이 Google지도에 표시 될 가능성이 높습니다. 위성이 지나갔을 때 마당에 물을 대게되면 가장 반바지 한 반바지에서도 자신을 볼 수 있습니다.

Google이 할 수있는 일

Google 데이터베이스에는 상당히 분명한 용도가 있습니다. 애드워즈는 현재 가장 인기 있고 눈에 띄는 사이트입니다.

Google에서 검색을 실행할 때마다 페이지 상단의 처음 몇 가지 목록이 표시되고 오른쪽에있는 목록은 "스폰서 링크"와 같은 검색을하는 사용자가 구매 한 유료 광고입니다. 그들의 상품과 서비스에 관심이있을 것입니다. 이 기술은 다른 웹 페이지로 확산되었으며 다른 웹 사이트의 페이지에 대한 관련 광고를 게재하는 "Google 광고"라는 별명을 설명합니다.

분명히이 광고 공간을 판매하는 것이 Google의 우수한 수익원입니다. 2007 년, 애드워즈는 Google의 수익을 160 억 달러 이상으로 끌어 올렸으므로 Google의 최대 수입원이되었습니다. 이와는 대조적으로 Google 데이터 스토어는 간신히 도청 된 금광입니다.

지금까지 우리가 본 Google 기능은 주로 현재 시장 동향에 반응하는 데 주력했습니다. 사람들은 무언가에 관심을 갖게됩니다. X 박스의 새로운 버전, 온라인 전기 기사, 슈퍼 볼 기념품 등을 찾는 사람들입니다. Google은 사람들이 잠재 고객과 연결될 수 있도록 도와줍니다.

그러나 충분한 정보가 있으면 Google과 같은 회사는 번개 속도로 현재에 반응하는 것 이상을 할 수 있습니다. 미래를 볼 수도 있고 미래를 창조 할 수도 있습니다. 이것이 단지 편집증 과학 공상 백일몽이라고 생각하기 전에이 문제에 대해 약간의 고려를하십시오.

간단한 경우를 생각해 봅시다. 검색 순위가 높은 페이지를 표시하지 못하는 검색 (검색자에게 유용한 정보를 제공하지 못하는 검색 실패)을 기록하도록 프로그램을 설정했다고 가정합니다. 이러한 실패를 추적하는 프로그램은 검색자가 원하는 것을 기록하고 실패한 검색을 범주에 넣습니다.

이러한 조사를 살펴보면, Google이 열 감지기 (Thermopolis, WY)에서 스스로 할 수있는 슈퍼마켓을 찾는 데 실패한 수많은 실패한 검색어가 있다는 것을 알게되면 어떻게 될까요? 좀 더 자세히 살펴보면 DIY 슈퍼마켓 검색 기능이 많이 실패한 장소 목록이 있습니다. 그 목록은 DIY 점포를 프랜차이즈하는 회사 (모든 이름을 지칭하지 않고 모든 교외에있는 큰 주황색 창고를 생각하는 회사에게는 엄청나게 가치있을 것입니다. 알고 싶지 않습니까?).

그들은 거기에 DIY 가게가 없다는 것을 알뿐만 아니라 특정 수의 사람들이 그런 가게를 찾고 있다는 것을 알았을 것입니다. 그리고 그들은 아마 거기에서 구매하기를 바랬던 것, 즉 가전 제품, 건축 자재, 가스 그릴 등을 알게 될 것입니다. 이것은 Google이 자동으로 정렬하고 분석 한 고통없는 시장 조사입니다.

같은 방법으로이 정보는 특정 제품에 대한 잠재 구매자를 확인하고 아동 포르노 그라시에 종사하는 범죄자를 추적하며 잠재적 인 도둑을 집이나 상점에 붙잡을 수 있습니다. 개발자가 새로운 주택과 상점을위한 사이트를 선택하고, 거주 지역의 악천후에 대해 경고하고, 등록 된 유권자를 찾고, 습관과 관심사에 대해 배우고, IRS가 세금을 속이는 사람들을 찾도록 도울 수 있습니다. 해석의 실수가있을 수도 있습니다. 작은 마을의 암에 대한 조사는 암 환자를 많이 의미 할 수도 있지만, 의과 대학이 있다는 것을 의미 할 수도 있습니다.

보시다시피, 우리는이 정보의 일부 사용에 박수를 보냅니다. 그러나 그것들은 모두 가능하며 모두 동일한 기본 기술을 사용합니다. 당신이 원하는 거의 모든 것을 찾을 수 있습니다, 당신은 단지 그것을 찾는 방법을 알아야합니다.

다음 기사에서 우리는이 모든 것이 당신에게 개인으로서 … 그리고 기업가로서 무엇을 의미하는지 살펴볼 것입니다. 이동: Google 데이터 마인 및 귀하의 비즈니스.

* * * * *

저자에 관하여: 햄릿 바티스타 (Hamlet Batista)는 NEMedia S.A의 사장으로, 기업가와 중소기업이 자연 검색 트래픽의 질을 높이고 그들이하는 일에 집중하도록 돕는 SEO 자동화 소프트웨어 공급 업체입니다. 햄릿의 블로그 인 햄릿 바티스타 닷컴 (Hamlet Batista dot Com)은 가장 진보 된 검색 엔진 최적화 (SEO) 연구는 물론 경쟁자보다 중요한 전략 및 전략을 탐구합니다.

17 코멘트 ▼