Google króluje wśród wyszukiwarek. Jednak w sieci tego typu serwisów jest mnóstwo. Warto z nich korzystać, bo potrafią pozytywnie zaskoczyć. Według firm badawczych Hitwise i com-Score, internauci na całym świecie wpisują co minutę do wyszukiwarek około 1,5 mln zapytań. Dwóch na trzech użytkowników sieci korzysta przy tym z Google.
Serwis ten odnotowuje ponad 37 miliardów wyszukiwań w ciągu miesiąca. Kolejny w stawce Yahoo! Search ma tylko 22% udziałów w rynku (8,5 mld zapytań). Następne są Live Search (dawniej MSN Search, 7,5% – 2,2 mld) i Ask.com (4,8% – 1,4 mld). Słabe wyniki mają także największe nieanglojęzyczne wyszukiwarki – chińska Baidu (3,3 mld) i południowokoreańska NHN (2 mld). W Polsce dominacja Google jest jeszcze większa.
Według firmy Gemius, najpopularniejsza na świecie wyszukiwarka posiada nad Wisłą 88% udziały w rynku (dane za listopad 2007 r.). Drugi na liście Onet ma zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%). Polska witryna Google jest najpopularniejszą stroną w naszym kraju – może pochwalić się prawie 11 milionami użytkowników i ponad dwoma miliardami odsłon miesięcznie.
Jednak Google to nie wszystko. Publikowane w sieci listy wyszukiwarek obejmują często po sto kilkadziesiąt pozycji. Duża część z tych stron jest przeznaczona dla zapaleńców lub specjalistów z danych dziedzin. Ale wiele serwisów ma charakter na tyle ogólny, że może przydać się praktycznie każdemu użytkownikowi sieci. Chodzi tu zarówno o typowe, googlopodobne strony, np. Yahoo! Search czy Live Search, jak i tematyczne witryny – skanujący blogi Technorati, poszukujący obrazów Picsearch czy prawniczy Lexis.
Trochę historii
Pierwszym narzędziem wykorzystywanym do
przeszukiwania sieci był Archie. Stworzył go
w 1990 roku kanadyjski student Alan Emtage.
Mechanizm pobierał listy zasobów ze wszystkich
ogólnodostępnych serwerów FTP, nie analizował
jednak zawartości plików. Dlatego wiele zależało
od tego, jak dokładne były nazwy tych ostatnich.
Popularyzacja protokołu Gopher zaowocowała
powstaniem Veroniki i Jugheada. Działały na podobnej
zasadzie co Archie.
Pierwszą wyszukiwarką z prawdziwego zdarzenia
był Wandex, który opierał się o robota World Wide
Web Wanderer stworzonego przez Matthewa
Graya z Massachusetts Institute of Technology
(MIT) w 1993. W tym samym roku pojawił się
Aliweb, a nieco później Lycos i WebCrawler
(wszystkie istnieją do dziś). W 1995 r. rozpoczęła
się era AltaVisty i Excite’a, które rywalizowały
z Yahoo! (wtedy jeszcze serwis ten był katalogiem
stron). Wraz z początkiem XXI wieku dominującą
pozycję zaczęło zdobywać Google.
Ścigając się z Google
Obecnie wyszukiwarką numer dwa na świecie jest Yahoo! Search. Sam serwis Yahoo! był początkowo katalogiem stron internetowych. Pod koniec lat dziewięćdziesiątych projekt przekształcił się w portal WWW z prawdziwego zdarzenia.
Usługa wyszukiwania stała się jedną z jego licznych funkcji. Najpierw mechanizm oparty był na rozwiązaniu HotBot dostarczonym przez kalifornijską spółkę Inktomi. Później pałeczkę przejęło Google, które wycofało się ze współpracy z Yahoo! w 2004 roku. W tym czasie portal kupił Inktomi oraz drugą firmę – Overture Services, właściciela wyszukiwarki AltaVista. W rezultacie opracowano autorski mechanizm Yahoo! Slurp, który wykorzystywany jest do dziś.
Usługa jest dostępna pod adresem http://search.yahoo.com. Wyniki są bardzo podobne do tych, które uzyskuje się w Google. Przykładowo, po wpisaniu słowa \”Apple\” w pierwszej kolejności pojawia się strona główna producenta iPodów, następnie jego sklep internetowy, później wpisy z Digga, Technorati i Wikipedii. Jedyna różnica to brak polskich wyników na czele listy. W przypadku Google stanowią one ponad połowę w pierwszej dziesiątce linków. Zaletą Yahoo! jest funkcja Search Assist. Znajduje ona podobieństwa między wynikami wyszukiwania a innymi, pokrewnymi stronami.
Wyszukiwarki ogólne (oprócz Google)
A9.com http://www.a9.com, http://generic.a9.com
AltaVista http://www.altavista.com
Answers.com http://www.answers.com
Ask.com http://www.ask.com
Exalead http://www.exalead.pl
Gigablast http://www.gigablast.com
HotBot http://www.hotbot.com
Live Search http://search.live.com
MetaCrawler http://www.metacrawler.com
WebCrawler http://www.webcrawler.com
Wikia Search http://www.search.wikia.com
Yahoo! Search http://search.yahoo.com
Dzięki temu po wpisaniu – na przykład – marki danego producenta komputerów pojawiają się szczegółowe słowa kluczowe, których kliknięcie doprecyzowuje listę wyświetlanych URL-i. Znacznie mniejszym graczem jest Live Search (http://search.live.com). Usługę tę uruchomiono jesienią 2006 r. jako następcę MSN Search Microsoftu. Prezentuje się nieźle, choć atmosferę psuje typowe dla giganta z Redmond pytanie o \”domyślność\” (Czy chcesz ustawić Live Search jako domyślnego dostawcę usługi?). Strona jest po polsku – niestety, pełne korzystanie ze wszystkich funkcji wymaga wyłączenia blokady JavaScriptu.
Wyniki wyszukiwania nie zachwycają. Po wpisaniu \”Asus\” w pierwszej kolejności pojawiły się odnośniki do głównych stron tego producenta – w wersji angielskiej, niemieckiej, a nawet chińskiej i japońskiej. Wśród nich znalazł się – nie wiedzieć czemu akurat ten – jeden z lokalnych dilerów Asusa z południowej Polski. Live Search (podobnie jak Google i Yahoo!) udostępnia wyszukiwarki wyspecjalizowane – obrazów, aktualności czy filmów. Na szczególną uwagę zasługują: specjalny serwis katalogujący kanały RSS oraz możliwość zapisywania wyników ogólnych lub tematycznych i automatycznego ich aktualizowania.
Dla biznesu i społeczności
Kolejna grupa wyszukiwarek dostarcza informacji o ludziach i firmach. Tu liderem jest Yellowpages (http://www.yellowpages.com), strona kontrolowana przez koncern telekomunikacyjny AT&T. Serwis istnieje od 1996 roku, choć już wcześniej pod tą marką publikowano w USA książkę telefoniczną, na której wzoruje się polska Panorama Firm. Ważnym graczem na rynku wyszukiwarek biznesowych jest także założony w 1999 roku Business.com (http://www.business.com).
Stanowi połączenie katalogu i typowego mechanizmu wyszukującego. Można przeglądać poszczególne kategorie lub wpisywać słowa kluczowe. W bazie znajduje się około 400 tys. firm. Jeszcze większy indeks (650 tys.) ma strona ThomasNet (http://www.thomasnet.com), będąca internetowym wydaniem publikowanego od XIX wieku \”Rejestru Amerykańskich Producentów Przemysłowych\”.
Dla klientów ważne są nie tylko adresy firm, ale także ceny. Dlatego w sieci działa wiele porównywarek cen. Tu oprócz Google Product Search (dawniej Froogle) i microsoftowego MSN Shopping, znajdziemy takie serwisy jak istniejące od 2006 roku ShopWiki czy Kelkoo (http://www.kelkoo.com) – dawniej francuskie, należące obecnie do Yahoo!. To ostatnie działa w 10 europejskich krajach. Silną obecnością nie tylko na Starym Kontynencie, ale i w USA może pochwalić się szwedzki PriceRunner (http://www.pricerunner.com). Różnica między tymi dwoma serwisami polega na tym, że w Kelkoo (a także, na przykład, w Shopping.com) konkurują tylko sprzedawcy, którzy podpisali umowę z porównywarką. Misją PriceRunnera jest uwzględnienie jak największej liczby podmiotów.
Podobny do Yellowpages profil mają witryny InfoSpace (http://www.infospace.com) oraz ZoomInfo (http://www.zoominfo.com). Pozwalają także na indeksowanie profili indywidualnych osób. Wyłącznie tę funkcję spełniają z kolei Ex.plode.us (http://ex.plode.us), Spock (http://www.spock.com) czy Wink (http://wink.com). Ciekawą propozycją są również wyszukiwarki społecznościowe, takie jak Rollyo (http://rollyo.com), które pozwala stworzyć indywidualną, zamkniętą listę stron objętych analizą, czy Cha- Cha (http://www.chacha.com), zatrudniająca sztab pracowników odpowiadających na najtrudniejsze zapytania internautów.
Wokół wirtualnych społeczności koncentrują się także serwisy śledzące zawartość forów i grup dyskusyjnych. Najpopularniejsza strona tego rodzaju to Omgili (http://www.omgili.com). W jej indeksie znajduje się ponad 100 tys. witryn, za pośrednictwem których użytkownicy sieci wymieniają się informacjami czy opiniami. Usługa działa dopiero od roku, ale już uruchomiono w ramach niej dodatkowe elementy – na przykład funkcję Buzz, która pozwala przejrzeć najpopularniejsze tematy sieciowych dyskusji. Z kolei internauci działający w Usenecie zainteresują się wyszukiwarką funkcjonującą w ramach Google Groups, gdzie umieszczono archiwum wypowiedzi grup Usenetu począwszy od 1981 r.
Oprócz tego w sieci funkcjonuje jeszcze mnóstwo wyspecjalizowanych wyszukiwarek. Można tu wymienić takie grupy jak:
- serwisy medyczne dostarczające informacji o lekach i firmach farmaceutycznych, przeznaczone dla lekarzy lub pacjentów (Searchmedica, Bioinformatic Harvester, Entrez, Healia),
- strony poświęcone nieruchomościom, pozwalające wyszukiwać oferty i wystawiać domy czy mieszkania na sprzedaż (Home.co.uk, Rightmove, Zillow),
- witryny oparte o przeszukiwanie map i znajdywanie obiektów geograficznych (Geoportail – tylko Francja, MapQuest, Google Maps, Yahoo! Maps),
- serwisy dla osób poszukujących pracy (Career-Builder, Hotjobs, Monster, Recruit),
- usługi przeszukujące kod open source, przeznaczone dla programistów i twórców stron WWW (Koders, Krugle, JExamples).
Wyszukiwanie po polsku
W krajowej sieci funkcjonuje kilka rodzimych wyszukiwarek. Najbardziej znany jest działający od 2000 r. Net-Sprint. W indeksie serwisu znajduje się ponad 120 mln polskojęzycznych stron. Firma działa także na rynku litewskim.
Mechanizm dostępny jest pod adresem http://www.netsprint.pl oraz na około 150 innych, dużych witrynach WWW, w tym w portalu Wirtualna Polska (http://www.wp.pl). NetSprint potrafi wyszukiwać grafikę, firmy, aktualności oraz wpisy do encyklopedii i słowników. Interia korzysta z silnika Google, zaś Onet działa na opracowanym przez specjalistów z Uniwersytetu Karola w Pradze mechanizmie Morfeo. Jego cechą charakterystyczną jest uwzględnianie specyfiki języków słowiańskich – konkretnie dużego zróżnicowania końcówek wyrazów. Silnik NetSprint ma około 3% udział w rynku wyszukiwarek w Polsce (dane Gemiusa za listopad).
Morfeo Onetu może pochwalić się 5%. Trzeci rodzimy serwis to Szukacz (http://www.szukacz.pl), który ma zasięg rzędu 0,5-0,8%. Został uruchomiony przez wydawnictwo Prószyński i S-ka. Podobnie jak Morfeo, rozpoznaje odmiany słów w języku polskim. Potrafi także wyszukiwać ulice i miejscowości na mapach miast. Oprócz tego w krajowej sieci istnieje szereg serwisów tematycznych. W blogach specjalizuje się Blogfrog (http://blogfrog.pl), firmy znajdują Polskie Książki Telefoniczne (http://www.pkt.pl) i Panorama Firm (http://www.pf.pl). Za porównywanie cen odpowiadają Ceneo (http://www.ceneo.pl) czy Nokaut (http://www.nokaut.pl).
Wyszukiwarki polskie
Yellowpages (firmy) http://www.yellowpages.com
ZoomInfo (firmy, ludzie) http://www.zoominfo.com
Blogfrog (blogi) http://blogfrog.pl
Ceneo (ceny) http://www.ceneo.pl
Onet (ogólna) http://www.onet.pl
NetSprint/WP (ogólna) http://www.netsprint.pl
Nokaut (ceny) http://www.nokaut.pl
Panorama Firm (firmy) http://www.pf.pl
Polskie Książki Telefoniczne (firmy) http://www.pkt.pl
Szukacz (ogólna) http://www.szukacz.pl
Jak widać, Google nie jest jedyną wyszukiwarką w internecie. Owszem, to najbardziej uniwersalne narzędzie, które sprawdza się w wielu sytuacjach. Ale często konieczne jest przeprowadzenie bardziej profesjonalnego i dogłębnego przeszukania zasobów sieci. Wtedy do akcji wkraczają serwisy specjalistyczne, które dają gwarancję, że uda się znaleźć na dany temat wszystko.
Oczywiście korzystanie z kilku witryn jest bardziej czasochłonne niż ograniczanie się do samego Google. Czasem da się wyeliminować tę wadę korzystając z tzw. multiwyszukiwarek (jak WebCrawler, HotBot czy MetaCrawler). Jednak aby mieć gwarancję, że udało się znaleźć wszystko, trzeba poświęcić trochę więcej czasu i poszperać także w niszowych serwisach.
Druga liga
Trzeci konkurent Google to istniejący od 1996 roku Ask.com (http://www.ask.com). Dawniej nazywał się Ask Jeeves – od imienia wirtualnego asystenta, którego miał do dyspozycji każdy użytkownik. Internauci mogli zadawać pytania, posługując się nie tylko słowami kluczowymi, ale także zwykłym, codziennym językiem. Usługa ta działa do dziś i to całkiem sprawnie. Ask.com zapytany po angielsku: Jaka jest temperatura Słońca? – odpowiedział: Na powierzchni wynosi ona 5506 stopni Celsjusza. W jądrze osiąga 15 mln stopni Celsjusza. Serwis nie potrafił ustalić, ile jest krajów na świecie. Podał jednak w pierwszej kolejności link do strony, gdzie dokładnie taką informację zamieszczono. Więcej kłopotów miał z podaniem wartości rynkowej Microsoftu. Podobne problemy ma witryna – Answers.com
(http://www.answers.com).
Wśród innych, mniej popularnych wyszukiwarek ogólnego przeznaczenia warto wymienić francuski Exalead (http://www.exalead.com, http://www.exalead.fr). Powstał w 2000 roku. Obecnie w jego indeksie znajduje się ponad 8 mld stron, a interfejs – wzorem większych serwisów – dostępny jest w kilku językach. Strona umożliwia tropienie kanałów RSS, plików audio i wideo oraz wpisów w Wikipedii.
Mechanizm obsługuje operator NEAR (wyszukiwanie zbliżeniowe) oraz rozpoznaje zapis fonetyczny (gdy użytkownik nie zna prawidłowej pisowni, np. w obcym języku). Tak samo jak w Google, internauta może wybrać język poszukiwanych stron oraz typ pliku, a dodatkowo jeszcze zawęzić położenie geograficzne operatorów witryn. Pod adresem http://www.exalead.pl działa polska wersja serwisu. Nietypową usługą jest Gigablast (http://www.gigablast. com). Jej twórca to Matt Wells, który był w latach dziewięćdziesiątych pracownikiem InfoSeeka, bardzo popularnej wtedy wyszukiwarki, która obecnie już nie istnieje. Wells w 2000 roku założył własną firmę i od podstaw stworzył Gigablasta.
Obecnie w jego indeksie znajduje się około 10 mld stron. Serwis nie oferuje wielu typowych dla współczesnych wyszukiwarek funkcji – nie można na przykład ograniczać wyników do samej grafiki. Funkcjonuje za to usługa Gigabits, podobna do Yahoo! Search Assist – witryna sama \”zgaduje\” hasła powiązane z wpisanym słowem kluczowym i proponuje ich wykorzystanie. Do tego dochodzi możliwość przeszukiwania starych, zarchiwizowanych wersji stron WWW oraz transferu wyników do innych popularnych usług, jak Google czy Ask.com.
Spore możliwości ma także A9 (http://www.a9.com). Ta oparta na silniku Live Search (dawniej Google) wyszukiwarka została uruchomiona w 2004 r. przez sklep internetowy Amazon. Serwis przeszukuje nie tylko standardowe zasoby sieciowe, ale także indeksy Amazonu, Answers. com, Wikipedii, ZoomInfo (ludzie), IceRocket (blogi) i IMDB (filmy). Specjalny interfejs pozwala na łączenie różnych wyszukiwań i porównywanie wyników. A9 wywołała burzę, gdy ogłosiła, że zapisuje historię znalezionych stron każdego użytkownika. Internauci bali się bombardowania reklamami. Dlatego udostępniono wersję Generic A9 (http://generic.a9.com), która nie rejestruje aktywności odwiedzających.
W latach dziewięćdziesiątych bardzo znaną wyszukiwarką była AltaVista (http://www.altavista.com). Serwis ruszył w 1995 roku. Analizował sieć dzięki szybkiemu, wielowątkowemu robotowi o nazwie Scooter. Strona AltaVisty była na początku bardzo uboga – dzięki temu ładowała się szybko nawet na wolnych łączach. Ten korzystny trend utrzymuje się do dziś – interfejsy takich witryn jak Google czy Yahoo! Search są bardzo proste i lekkie graficznie. AltaVista przez długi czas współpracowała z Yahoo!, ale w 1999 odłączyła się i stała się portalem internetowym. Po pęknięciu giełdowej bańki spekulacyjnej firma ograniczyła działalność i skoncentrowała się ponownie na rozwijaniu wyszukiwarki. W 2004 r. AltaVista została kupiona przez Yahoo! i obecnie wykorzystuje mechanizm Yahoo! Search. Jej pozycja na rynku jest jednak marginalna.
Mało znana jest także Wikia Search (http://search.wikia.com). Wynika to jednak z tego, że projekt znajduje się dopiero w fazie tworzenia. Szczegóły ujawniono w styczniu 2007 roku. Pomysłodawcą przedsięwzięcia jest twórca Wikipedii Jimmy Wales. Cel Amerykanina to stworzenie rywala dla Google i Yahoo! Search opartego o kod open source oraz dostępne dla każdego interfejsy programowania aplikacji (API). Wyszukiwarka ma być tworzona przez samych użytkowników, podobnie jak Wikipedia. Upłynie jednak sporo czasu, zanim usługa zacznie działać.
Specjaliści w natarciu
Oprócz licznych wyszukiwarek ogólnych w sieci można znaleźć co najmniej kilkadziesiąt znanych serwisów tematycznych, które specjalizują się w indeksowaniu jednego lub kilku typów stron i plików. W związku z rozwojem blogosfery pojawiło się wiele witryn pozwalających przeglądać zawartość internetowych dzienników. Najpopularniejszą jest Technorati, które ma w swojej bazie prawie 100 mln blogów. Wyszukiwarka dostępna jest pod adresem http://www.technorati.com. Oparto ją o kod open source – stale pracuje nad nią społeczność programistów. Twórcom wielokrotnie zarzucano, że strona nie działa poprawnie, na przykład nie uwzględnia \”blogów\” prowadzonych w serwisie społecznościowym MySpace.
Drugi ważny projekt w tej kategorii to Blogscope. W bazie, która jest projektem Uniwersytetu w Toronto, znajduje się 14 mln blogów. Strona działa pod adresem http://www.blogscope.net. Pozostałe ciekawe serwisy to IceRocket (http://www.icerocket.com) oraz Sphere
(http://sphere.com).
Dużą popularnością w sieci cieszą się także wyszukiwarki aktualności. Oferują je zarówno branżowe tuzy (Google News, Yahoo! News), jak i mniejsi gracze. Wśród tych ostatnich warto wymienić opensource\’owy serwis Newslookup (http://www.newslookup.com), założony w 2000 r. przez Michaela Kynasta. Mechanizm witryny przeszukuje kilka tysięcy źródeł wiadomości z całego świata. Pozwala na zawężenie wyników do gazet, telewizji, radia lub sieci. Istnieje także możliwość określenia geograficznego obszaru, z którego pochodzi wiadomość. Inne serwisy tego typu to MagPortal (http://www.magportal.com), skoncentrowany na kwestiach prawniczych Lexis Nexis (http://www.lexisnexis.com) oraz Project Topix (http://www.topix.com).
Współczesny internet jest pełen grafiki, plików audio i wideo. Dlatego też powstało wiele wyszukiwarek specjalizujących się w znajdowaniu właśnie tego rodzaju zawartości. Prym wiedzie tu Picsearch (http://www.picsearch.com). Szwedzka firma nie tylko oferuje w sieci własną usługę, ale także sprzedaje wynaleziony przez siebie silnik innym serwisom. Wśród jej klientów są Ask.com oraz Lycos, portal koncentrujący się na dostarczaniu plików multimedialnych.
Wyszukiwarki specjalizowane
Blinkx (wideo) http://www.blinkx.com
Blogscope (blogi) http://www.blogscope.net
Business.com(firmy) http://www.business.com
ChaCha (\”żywa\”) http://www.chacha.com
Ex.pl/ode.us (ludzie) http://ex.pl, ode.us
FileSearch (pliki) http://www.filesearching.com
IceRocket (blogi) http://www.icerocket.com
InfoSpace (firmy, ludzie) http://www.infospace.com
Kelkoo (ceny) http://www.kelkoo.com
Lexis Nexis (prawo) http://www.lexisnexis.com
MagPortal (newsy) http://www.magportal.com
Newslookup (newsy) http://www.newslookup.com
Omgili (fora) http://www.omgili.com
Picsearch (grafika) http://www.picsearch.com
PriceRunner (ceny) http://www.pricerunner.com
Rollyo (wysz. spersonalizowana) http://rollyo.com
Sphere (blogi) http://sphere.com
Spock (ludzie) http://www.spock.com
Technorati (blogi) http://www.technorati.com
ThomasNet (firmy) http://www.thomasnet.com
Topix (newsy) http://www.topix.com
Wink (ludzie) http://wink.com
Picsearch powstał w 2000 roku i obecnie indeksuje 2 mld obrazków – więcej niż Yahoo! Search (1,6 mld) i niewiele mniej niż Google (2,2 mld). Szwedzka wyszukiwarka automatycznie filtruje pornograficzne zdjęcia, umożliwia też autorowi zgłoszenie żądania usunięcia jego fotografii z publicznego zbioru. Obsługuje polskie znaki w nazwiskach, nazwach własnych itp. Umożliwia też zdefiniowanie rozmiaru obrazków, które chce pozyskać internauta.
Następną wyszukiwarką specjalistyczną jest blinkx (http://www.blinkx.com) – istniejący od 2003 r. projekt, który reklamuje się hasłem: \”18 milionów godzin wideo – przeszukaj je\”. W bazie znajdują się także dźwięki. Indeks obejmuje nie tylko fizyczne pliki, ale również streaming media – multimedialną zawartość odtwarzaną w obrębie stron internetowych, np. za pośrednictwem aplikacji flash. Wyszukiwarka potrafi \”słuchać\” muzyki i filmów, robić transkrypcje i na tej podstawie kategoryzować pliki. Uwzględnia wideoblogi oraz podcasty. Technologia blinkx jest wykorzystywana przez Microsoft, Lycosa, Ask.com i AOL. Mniejszą popularnością cieszą się wyszukiwarki plików analizujące otwarte serwisy FTP – np. rosyjska witryna FileSearch (http://www.filesearching.com).