Udostępnienie zawartości ostatniego patentu nadanego Google to jedna z nielicznych okazji na bliższe poznanie mechanizmów działania tej najpopularniejszej wyszukiwarki. Patent daje również wgląd w niepublikowane dotąd plany firmy w zakresie pozyskiwania i wyszukiwania informacji. Nie pozostało nam zatem nic innego, jak tylko poddać ten niecodzienny dokument analizie.
Jeżeli nie wiedziałeś, że Google otrzymało nowy patent w marcu ubiegłego roku, to znaczy, że ostatnie miesiące spędziłeś na bezludnej wyspie. Wszystkim właścicielom i specom od stron internetowych ten patent daje realne wyobrażenie o przyszłości wyszukiwarek internetowych. Ujawnia on, że niektóre ze strategii optymalizacji mogą okazać się prawdziwym skrótem prowadzącym prosto do sukcesu.
Przeglądanie patentu w poszukiwaniu wskazówek i rad byłoby jednak na pewno długą oraz żmudną pracą, i dlatego zrobiliśmy to za ciebie. Na następnych trzech stronach przeczytasz, jak patent może wpłynąć na funkcjonowanie twojej strony w praktyce.
Zrozumienie tego, w jaki sposób Google kalkuluje swoje rankingi stron internetowych, jest niczym święty Graal optymalizacji stron internetowych: taka wiedza pozwoliłaby wygrywać wszelkie zestwienia. Kiedy więc odkryto, że 31 marca 2005 r. Google wzbogacił się o patent określający metodę pozycjonowania stron w oparciu o archiwalne dane, wielu pomyślało, że oto wreszcie znaleźli odpowiedź.
Niestety, wszyscy byli w błędzie. Mimo, że dokument opisuje z wieloma szczegółami, jak \”historyczne dane\” (oryginalne określenie użyte przez Google) mogą zostać użyte do tworzenia rankingów dokumentów, to nie wspomina, jak wiele z tych cech zostało już wdrożonych w praktyce. Patent zawiera listę wielu czynników, które Google może wziąć pod uwagę podczas procesu wyszukiwania, nie wyjawia jednak ich znaczenia, co uniemożliwia realne określenie, które z nich są najważniejsze.
Jakkolwiek, wraz z naszymi ekspertami od pozycjonowania stron, byliśmy przekonani, że dokument zdecydowanie wart jest uwagi (odwiedź stronę http://www.uspto.gov/patft/index.html, a następnie wyszukaj patent o numerze 20050071741). Już po wszystkim okazało się, że Google sprawiło sobie kłopoty, chroniąc swoją technologię za pomocą patentu, co potwierdziło tylko, jak wartościowe są to dane. Oto nasza analiza.
Strategie aktualizacji stron
Patent nosi tytuł \”Wyszukiwanie informacji oparte o dane historyczne\”. Jego opis brzmi: \”System identyfikuje dokument i określa jeden lub więcej typów danych historycznych powiązanych z dokumentem. System może generować wynik dla dokumentu bazującego, przynajmniej w części, na jednym lub więcej typów danych historycznych\”. A typów danych historycznych patent wymienia naprawdę mnóstwo.
Pierwsza opisana została data stworzenia dokumentu: stare dokumenty mogą otrzymać inny wynik niż dokumenty nowe. Zgadza się to z obiegową opinią, że opłaca się aktualizować strony, szczególnie te o charakterze komercyjnym. Lecz to nie wszystko. Patent mówi także, że ranking może zawierać, przynajmniej częściowo, ocenę dokumentu pod kątem częstotliwości przeprowadzanych zmian. Nie wyobrażaj sobie więc, że po roku ignorowania strony wystarczy, że raz ją zaktualizujesz, aby Google uznało serwis za coś nowego. Wyszukiwarka bierze pod uwagę, jak często dokonujesz aktualizacji na równi z datą stworzenia każdej strony.
To jednak nie wszystko. Formuła zapisana w patencie uznaje również rozmiar zmian, które zachodziły na przestrzeni czasu. Dopuszcza się możliwość porównania wagi różnych fragmentów strony, w zależności od ich przypuszczalnego znaczenia. Liczba dodanych przez ten czas nowych stron powiązanych z dokumentem również jest istotna. Co więc można z tego wywnioskować?
Po pierwsze, regularna aktualizacja strony to dobry pomysł, ale pamiętaj, aby robić to w pewnym porządku. Jeżeli częstotliwość aktualizacji spadnie, pozycja twojej strony może na tym ucierpieć.
Po drugie, dokonywanie niewielkich zmian, jak np. zmiana daty na bardziej aktualną nie wystarczy, aby oszukać Google. Wyszukiwarka ceni duże modyfikacje w tych sekcjach, które uzna za najbardziej istotne dla dokumentu – przypuszczalnie te zawierające wszystkie słowa kluczowe, których użyłeś do optymalizacji strony. (Pamiętałeś o tym, prawda? Użyj takich narzędzi jak np. goRank ze strony http://www.gorank.com, jeżeli jeszcze tego nie zrobiłeś.)
Wreszcie, po trzecie, staraj się dodawać nowe strony odnoszące się do twojego serwisu. Nawet gdy nie przeprowadzisz aktualizacji, Google nadal będzie uznawać taką stronę za świeżą, jeżeli stale rośnie liczba witryn publikujących do niej linki (co wyjaśnia, dlaczego niektóre stare strony nadal utrzymują wysokie pozycje w rankingach Google). Lecz uwaga! Nie pędź od razu do któregoś z systemów wymiany linków, ponieważ tego typu udogodnienia wymagają bardzo ostrożnego działania.
Ludzkie oblicze Google
Bez względu na to, jak sprytny i wyrafinowany jest algorytm wyszukiwania Google, niczym wszystkie skomplikowane konstrukcje, popełnia od czasu do czasu błędy. Dlatego też Google zatrudnia do pracy nad ocenianiem strony także zwykłych ludzi.
Jednym z głównych zadań stawianych przed pracownikami jest wyłapywanie spamu – stron pozbawionych własnej treści. Dobrym przykładem są witryny uruchomione jedynie w celu nabijania kliknięć w ramach programów partnerskich. Ludzki umysł jest również wykorzystywany do odnajdywania ukrytych przekierowań, tekstów, odnośników i wszelkich innych wykroczeń, które przekłamują wyniki wyszukiwania.
Oczywiście najlepiej byłoby móc dokładnie poznać sposób działania żywych kontrolerów, tak aby wyprzedzić ich potencjalne kroki. Dzięki szczęśliwemu zbiegowi okoliczności masz taką szansę! Na stronie Search Bistro pojawił się swego czasu odnośnik do kopii oficjalnego podręcznika wyjaśniającego wszystkie te niuanse i używanego wyłącznie wewnątrz firmy, zatytułowanego Google Spam Guide. Więcej informacji znajdziesz pod adresem http://www.searchbistro.com/index.php?/archives/28-Googles-Unknow-Spam-Recognition-Guide.html. Podręcznik ściągniesz natomiast z http://www.searchbistro.com/spamguide.doc.
Google a detekcja spamu
W Google zdają sobie sprawę z tego, że w sieci funkcjonuje cały przemysł walczący z ich systemem generowania wyników. Patent ujawnia niektóre ze sposobów, za pomocą których próbuje się z tym walczyć. Jeżeli Google stwierdzi, że używasz spamu do oszukania wyszukiwarki, stracisz miejsce w rankingu. Cena za zrozumienie reguł bywa więc wysoka.
Przyjrzyjmy się dla przykładu odnośnikom prowadzącym do twojej strony. Patent jasno określa, że nagły wzrost wzajemnych linków może sygnalizować próbę zaspamowania systemu. Płacenie za bycie obsypanym przez tony odnośników może mieć więc wpływ na prędkość, z jaką obraca się licznik wejść, ale jednocześnie doprowadzi do obniżenia zamiast podwyższenia pozycji strony w rankingu. Jeżeli przekroczysz granicę, Google stanie się podejrzliwe.
Nawet gdy twoja strona nie opływa w niewyobrażalne ilości odnośników, istnieją jeszcze inne potencjalne problemy. Patent sugeruje, że Google może również monitorować tempo, z jakim zanikają linki do dokumentu, co pozwala przede wszystkim na wyłapywanie nieaktualnych już serwisów. Jeżeli jednak zdecydujesz się na kupno porcji odnośników, które znikną już po kilku miesiącach, musisz mieć świadomość, że podobnie podobny los spotka również twoją pozycję w rankingu.
Schemat działania Google sugeruje, że odnośniki do twojego serwisu mogą podlegać ocenie w zależności od tego, jak bardzo godne są zaufania. W jaki sposób to przebiega? Patent tego nie tłumaczy, ale podaje przykłady stron rządowych oraz sklepu Amazon.com jako zaufanych serwisów, a witryn dla dorosłych jako dokumentów o niskim poziomie zaufania. Wnioski możesz wysnuć sam.
Inne potencjalne sygnały o zagrożeniu wspominają o trafieniach wynikających z całkowicie odmiennych słów kluczowych, takich jak np. \”okna PVC\”, \”laptopy Centrino\” i \”stylowe meble\” (to tylko nasze przykłady!). Sugeruje to, że napakowanie strony różnymi słowami kluczowymi może dać efekt na samym początku, ale w pewnym momencie odbije się czkawką.
Nie wystarczy wybrać jednego zestawu słów kluczowych – trzeba pracować nad ich spójnością. Jeżeli Google wykryje istotne zmiany w doborze tematyki dokumentu, posłuży to za podstawę do domniemania, że strona zmieniła właściciela, a co za tym idzie – poprzednie wyniki i miejsce w rankingu nie są już zobowiązujące. Nagle okazuje się, że dodanie nowych elementów jest tak samo złym rozwiązaniem, jak pozbycie się tych oryginalnych.
Oznacza to, że dopływ odnośników do twojej strony powinien być równomierny, nie nagły, a najlepiej prowadzący ze stron o wysokim statusie. Zawartość strony już od samego początku powinna składać się z tylko najlepszych i odpowiednio dobranych słów kluczowych, ponieważ każda późniejsza zmiana może uderzyć w twoją pozycję w rankingu.
Jeżeli nie masz potrzeby zmodyfikowania treści jednocześnie na wielu podstronach, to najlepiej będzie zachować ten stan przez jak najdłuższy okres czasu. Google nagradza strony, które pozostają spójne i wierne obranemu tematowi i to jest właśnie stan, jaki powinieneś osiągnąć.
Złapanie linków do twojej strony od cenionych serwisów powinno sprawdzić się na początku, ale nie można polegać jedynie na tej metodzie. Musisz poświęcić także szczególną uwagę opisom towarzyszącym tym odnośnikom.
Opisy odnośników
Wyjaśniliśmy już, że tekst związany z odnośnikami powinien wykorzystywać słowa kluczowe. Potwierdza to również patent. Oczywiście, prowadzi to do innych kwestii takich jak konieczność modyfikowania opisów po każdej większej zmianie na stronach samego serwisu. Jeżeli tego nie zrobisz, Google szybko zauważy, że opis \”szwedzkie wakacje\” nie pasuje już do strony poświęconej \”hodowli żab dla zabawy i zysku\”, ucinając w efekcie twój rankingowy dorobek.
Może to zbyt drastyczny przykład, ale w patencie wiele miejsca poświęcono opisaniu znaczenia tego zagadnienia. Generalnie rzecz biorąc, Google wymaga, aby opisy odnośników zmieniały się (i pozostawały prawidłowe) za każdym razem, gdy strona ulegnie znaczącym zmianom. Jasne jest, że tego czynnika w pełni kontrolować się nie da. Miejmy więc nadzieję, że ewentualne kary jakie za to grożą, nie są zbyt dotkliwe.
Na pewno będziesz chciał zaplanować to wszystko z wyprzedzeniem, obmyślić perfekcyjny opis, a następnie zadbać o wstawienie go na wszystkich zaprzyjaźnionych stronach… Stop! To zły pomysł. Wiemy już, że system bywa podejrzliwy w stosunku do dużej liczby odnośników do twojego serwisu pojawiających się nagle w krótkim czasie. Jest bardzo prawdopodobne, że zastosowanie identycznych opisów spowoduje tylko tyle, że zostaniesz oskarżony o spam. Staraj się więc konstruować je w ten sposób, aby mimo wykorzystania jak największej liczby słów kluczowych, poszczególne formułki różniły się od siebie najbardziej jak to tylko możliwe.
Oczywiście może to się przerodzić w zbędne zawracanie głowy, jeżeli za bardzo weźmiesz sobie powyższe wskazówki do serca. Czy na pewno 100 odnośników wymaga 100 różnych opisów? Naszym zdaniem nie, to przesada – po prostu pamiętaj o kilku wariacjach, które dadzą lepszy efekt niż całkowity brak różnorodności. Jeżeli więc tworzysz 100 odnośników, poprzestań na dwóch lub trzech zestawach opisów.
Wpływ nazwy domeny
Jednym z najbardziej zaskakujących wtrąceń, które można znaleźć w tekście patentu, odnosi się do działu nazwanego Domain-Related Information (informacje powiązane z domeną). Opisano w nim interesujące metody, których system może używać do oddzielenia \”właściwych i niewłaściwych domen\”.
Data, kiedy dokonałeś rejestracji domeny, to z kolei inny czynnik. Google podkreśla, że \”wartościowe domeny bywają często opłacane kilka lat z rzędu, podczas gdy domeny przelotnie rzadko są wykorzystywane dłużej niż rok\”. Takie podejście sugeruje, że opłacenie ważności domeny na kilka lat z rzędu powinno zagwarantować serwisowi lepszą pozycję już od samego początku.
Setny punkt patentu odnosi się natomiast do monitorowania wpisów na temat domeny, zawierających na przykład dane kontaktowe do administratora lub opiekuna technicznego w celu sprawdzenia ich niezmienności. Google nadzoruje również, czy strona była przenoszona pomiędzy różnymi serwerami i firmami hostingowymi, przypuszczalnie w celu śledzenia osób, które z powodu permanentnego spamowania lub nielegalnych praktyk mają systematycznie blokowane konta.
Patent wspomina także o śledzeniu aktywności serwera sprzężonego ze stroną i sprawdzaniu, jakie inne domeny są na nim hostowane. Jeżeli korzystasz z lokalizacji, która obsługuje wiele domen należących od dawna do wielu właścicieli, masz szczęście – Google nie omieszka przesunąć twojego serwisu o kilka miejsc wyżej w rankingu.
Jeżeli jednak twój dostawca hostingu obsługuje jakieś niegrzeczne strony lub przejściowe domeny, sprawy mogą nie wyglądać już tak różowo. To samo dotyczy lokalizacji obsługujących dużą liczbę domen, w nazwach których występują komercyjne zwroty, co jak sugeruje patent, bywa często znakiem rozpoznawczym spamu. W takim przypadku Google może ocenić twoją stronę jako mniej wiarygodną, co znajdzie odbicie w gorszej pozycji. Najlepszym wyjściem będzie wybór sprawdzonego i cieszącego się dobrą opinią dostawcy usług internetowych, gdyż powinno to odnieść pozytywny efekt w zestawieniu generowanym przez wyszukiwarkę.
Blisko, ale jeszcze nie to
Zła wiadomość jest taka, że nadal nie odkryto magicznego zaklęcia, które w prosty sposób zaniosłoby dowolną stronę na sam szczyt wyników wyszukiwania. Wszystko, co przeczytałeś w tym artykule, zostało opublikowane przez Google w formie patentu, ale nikt nie ma pewności, które z mechanizmów zostały już wdrożone do algorytmów wyszukiwarki oraz jak duży mają wpływ na ostateczny kształt rankingu.
Przybliżyliśmy wiedzę, która może pomóc w zrozumieniu sposobu funkcjonowania silnika Google – podstawowego punktu odniesienia dla każdej strategii optymalizacji strony – lecz nadal wiele kwestii pozostało niewyjaśnionych. Wszystko wskazuje na to, że twoja taktyka powinna wyglądać następująco: pielęgnuj stronę niczym zadbany ogród, powtarzaj bez przerwy, że najważniejsza jest treść i stale trzymaj rękę na pulsie w dziedzinie wyszukiwarek internetowych.
Google patrzy na wszystkich…
Patent przyznany Google opisuje wiele metod mających na celu określenie prawdziwej wartości dokumentu, ale istnieje tylko jedna osoba, która może to zweryfikować w rzeczywistości: użytkownik. Patent wyjaśnia również, w jaki sposób monitorowanie zachowań internautów pomaga w procesie oceniania stron.
Nie będzie wielkim zaskoczeniem stwierdzenie, że opracowanie określa zliczanie liczby kliknięć jako jedno z podstawowych narzędzi. Jakkolwiek patent wspomina także o monitorowaniu czasu spędzonego przez użytkowników na konkretnej stronie. Jeżeli wizyta nie trwa dużej niż kilka sekund, oczywiste jest, że nie świadczy to najlepiej o jakości serwisu.
Komentarz nr 115 do patentu rekomenduje monitorowanie danych \”zachowanych lub wygenerowanych przez użytkownika\”, takich jak np. ulubione. Jeżeli duża liczba osób zapamiętuje odnośnik do strony na przyszłość, oznacza to, że uznali ją za cenną i chcą niebawem ponownie ją odwiedzić. Google stwierdza również, iż w ocenie popularności przydatne może okazać się śledzenie odniesień do strony znalezionych w plikach cookies.
Pytanie, w jaki sposób Google zamierza uzyskać dostęp do tych danych? Patent sugeruje, że może się to odbywać za pomocą \”asystenta przeglądarki internetowej\”, co jednoznacznie kojarzy się z takim oprogramowaniem jak chociażby popularny Google Toolbar. Na razie tak się nie dzieje, ale jeżeli informacje zawarte w patencie są dokładne, może to wkrótce ulec zmianie. Miej więc na oku politykę prywatności Google.
…Wszyscy patrzą na Google
1. Nieoficjalny blog Google
http://google.weblogsinc.com
Blog prowadzony przez Brada Hilla to doskonałe źródło najnowszych informacji na temat nowych projektów Google, planów i analiz. Strona zawiera także pomocną kolekcję innych odnośników na ten temat.
2. Search Engine Watch
http://www.searchenginewatch.com
Serwis zawiera obszerną bazę aktualności oraz artykułów poświęconych szeroko pojętej tematyce wyszukiwarek internetowych.
3. Google Watch
http://www.google-watch.org
Artykuły zatytułowane \”Nowy toolbar: Jeszcze bardziej diabelski niż kiedykolwiek wcześniej\” utwierdzają w przekonaniu, że twórcy tej strony nie przepadają za Google. Warto ją odwiedzić, szczególnie jeżeli interesujesz się tematyką ochrony danych osobowych, o których wspomnieliśmy w artykule.
4. SEOmoz
http://www.seomoz.org/articles/google-historical-data-patent.php
Blog, katalog pomocnych narzędzi oraz archiwum tekstów – ta strona zainteresuje każdego. Nie przegap dyskusji poświęconej omawianemu w artykule patentowi!
5. InsideGoogle
http://google.blognewschannel.com
To nie kolejny blog poświęcony Google, a zbiór historii ciekawszych i sięgających głębiej niż wszystkie inne. To także strona z najlepszymi materiałami pomocniczymi oraz zbiorem przydatnych odnośników.