Jak znaleźć igłę w stogu siana?

opublikowano: 2007-03-26 13:00
wszystkie prawa zastrzeżone
poleć artykuł:
Technologie, które miały nam zapewnić łatwy dostęp do informacji i wiedzy, powodują informacyjny przesyt. W globalnej sieci jesteśmy zarzucani wiadomościami dotyczącymi najprzeróżniejszych tematów. Aby odnaleźć to, co naprawdę nas interesuje, trzeba wykazać się pewnymi umiejętnościami.
REKLAMA
Bartłomiej Dymecki od 6 lat korzysta z sieci, zajmuje się dziennikarstwem, współpracując z czasopismami „Magazyn Internet” i „Internet Maker”. Trudni się również tworzeniem stron internetowych, analizą ich użyteczności oraz e-biznesem i e-marketingiem. W wolnych chwilach prowadzi blog poświęcony różnym zagadnieniom technicznym: http://www.BelloisNadaje.pl .

Wiedza na temat wyszukiwania informacji, którą mam na myśli, jest łatwo dostępna, a jednak obca zatrważającej większości zwykłych użytkowników. Jej nabycie wymaga ciekawości i chęci do nauki. Jest też pochodną zdobywanego doświadczenia. W niniejszym artykule spróbuję podzielić się z Wami swoją wiedzą w tym zakresie.

Jeśli jesteś doświadczonym użytkownikiem i dobrze orientujesz się w Internecie, zapewne nie znajdziesz tu niczego odkrywczego. W przeciwnym razie poniższe rady być może pomogą Ci w zwiększeniu efektywności korzystania z sieci.

Wyszukiwarka czyli Google

Dzisiaj w Polsce liczy się tylko jedna wyszukiwarka — Google. Używa jej obecnie ok. 80% polskich internautów. Nie znaczy to, że poszukiwanie informacji na określony temat powinniśmy na niej zakończyć. Wręcz przeciwnie — to dopiero początek. O innych wyszukiwarkach powiemy sobie w dalszej części tego tekstu.

Wydawać by się mogło, że korzystanie z Google jest banalne: wchodzimy na stronę, wpisujemy hasło i odczytujemy wyniki. Jednak życie nie jest aż tak piękne.

Na początek powinieneś pamiętać o elementarnych zasadach, którymi należy się kierować, szukając informacji przy pomocy Google lub innych wyszukiwarek:

  1. Wybierz słowa kluczowe najlepiej charakteryzujące poszukiwaną informację.
  2. Wpisując te słowa do wyszukiwarki zapomnij o gramatyce, interpunkcji i innych urozmaiceniach. Nie pisz całym zdaniem.
  3. Zwiększaj ilość użytych słów kluczowych dopóty, dopóki nie uzyskasz zadowalających Cię wyników.

Ta recepta jest teoretycznie prosta, jednak nie dla wszystkich. Niektórzy wpisują do wyszukiwarki frazy typu „jak stworzyć stronę WWW?”, nie zdając sobie sprawy, że jest ona — w uproszczeniu oczywiście — tylko i wyłącznie programem odczytującym wystąpienia określonych słów. Z tego właśnie powodu najlepszą metodą na znalezienie cennych informacji jest wpisywanie słów kluczowych.

Podam prosty przykład. Interesują mnie książki biznesowe. Chcę przejrzeć ofertę kilku księgarni i coś sobie wybrać. Wpisuję do wyszukiwarki słowo biznes, ale wyniki mnie nie zadowalają. Wpisuję więc dwa słowa: biznes księgarnia. W ten sposób bez problemu odnajduję księgarnie z książkami biznesowymi. Zauważ, że te dwa wyrazy pisane są ze złamaniem reguł gramatyki. One nie tworzą jednego zdania. To po prostu odrębne dwa słowa kluczowe. Co ciekawe, wpisanie frazy książki biznesowe daje zdecydowanie gorsze rezultaty.

Google po hakersku

Teraz będziemy hakować. Tak, tak, tylko prawdziwi hakerzy potrafią wpisywać do Google skomplikowane ciągi znaczków i zawsze dostawać to, na czym im zależy ;-). Użyjemy zaawansowanych operatorów. Do czego one służą? Do tego, aby w lepszy sposób przekazać wyszukiwarce, czego szukamy. Czy szukasz pojedynczych wyrazów, czy całej frazy? Czy chcesz pominąć strony zawierające określone słowa? A może interesują Cię wyniki przeszukiwania jednej, wybranej domeny? To wszystko da się załatwić. Oto lista możliwości:

REKLAMA
  1. Cudzysłów, np. zapytanie "warszawa jest brzydka" wyszukuje strony zawierające całą tę frazę. To zupełnie co innego niż wpisanie warszawa jest brzydka, ponieważ w takiej sytuacji otrzymujemy strony zawierające wszystkie te słowa w dowolnej kolejności i dowolnym miejscu.
  2. Słowo OR znaczące lub. Zapytanie warszawa OR wrocław zwraca uwagę na strony zawierające informacje na temat chociażby jednego z tych miast, włączając w to również te traktujące o nich obu.
  3. Zapytanie zawierające myślnik: warszawa —wrocław wskaże nam strony zawierające nazwę naszej stolicy, ale pomijane będą wszystkie strony choćby wzmiankujące o Wrocławiu.
  4. Polecenie site: umożliwia wyszukiwanie informacji tylko w obrębie określonej strony, np. warszawa site:wp.pl pokaże informacje na temat Warszawy opublikowane w Wirtualnej Polsce.
  5. Polecenie intitle: pozwala wyszukiwać strony zawierające określone słowa w tytule, np.: warszawa intitle:restauracja umożliwia znalezienie stron o Warszawie mających w tytule słowo restauracja.
  6. allintitle: to odmiana powyższego polecenia. Używamy go wtedy, gdy chcemy wyszukiwać strony zawierające w tytule wszystkie wybrane przez nas słowa, np. allintitle: warszawa restauracja.
  7. inurl: — dane słowo musi znaleźć się w adresie strony, np. restauracja inurl:warszawa.
  8. allinurl: — wszystkie słowa muszą znaleźć się w adresie.
  9. intext: — słowo musi wystąpić w treści strony.
  10. allintext: — wszystkie słowa muszą wystąpić w treści, np. allintext: restauracja warszawa.

Te zaawansowane możliwości wyszukiwarki Google możesz wykorzystać np. do znajdowania plików muzycznych! Przykładem jest serwis http://g2p.org/ pozwalający wyszukiwać pliki MP3. Cała jego magia polega na automatycznym konstruowaniu odpowiednich zapytań.

Nie tylko Google człowiek żyje...

Google to oczywiście nie jedyna wyszukiwarka internetowa, choć jest ona uważana za najlepszą przez dużą część świata internetowego, szczególnie w Polsce. Faktem jest, że często jakość wyników w polskich wyszukiwarkach pozostawia wiele do życzenia. Jednak z drugiej strony nie można pozwolić im umrzeć, bo konkurencja jest zawsze kluczem do wysokiej jakości.

Osobiście korzystam niekiedy z wyszukiwarki NetSprint (http://www.netsprint.pl). Inne rodzime wyszukiwarki to Szukacz (http://www.szukacz.pl) czy Gooru (http://www.gooru.pl). Jeżeli jesteś przywiązany (tak jak ja) do wyszukiwarki Google, to czasem spróbuj skorzystać z jej polskich konkurentów, gdy nie możesz odnaleźć interesujących Cię informacji. Celowo pomijam tu wyszukiwarki znajdujące się na stronach polskich portalów — są one oparte na silnikach niezależnych wyszukiwarek i nie ma sensu wymienianie ich jako osobnych.

REKLAMA

Na ogół nie narzekam na jakość wyników zwracanych przez wyszukiwarkę MSN (teraz http://www.live.com). Na pewno jest ona niezłym rozwiązaniem dla osób szukających wiadomości w Internecie anglojęzycznym, ale jej wyniki dla polskich witryn są również coraz lepsze. Na rynku amerykańskim liczy się także wyszukiwarka portalu Yahoo! (http://www.yahoo.com) oraz wyszukiwarka Ask (http://www.ask.com). Sytuacja nie jest tam tak jednoznaczna na korzyść Google, choć powoli zdobywa coraz większą przewagę. Jednak pamiętajmy, że w tym biznesie wszystko może się zdarzyć.

Udziały wyszukiwarek wśród polskich użytkowników

google.com - 82.4%

onet.pl - 7.3%

wp.pl - 6.4%

msn.com - 1.1%

interia.pl - 1.1%

szukacz.pl - 0.5%

yahoo.com - 0.5%

netsprint.pl - 0.3%

Źródło: Gemius SA, gemiusTraffic, 27.II.2007 – 5.III.2007, http://www.ranking.pl

Czy będziemy mieć przełom?

Ostatnimi czasy podbój Internetu zapowiadają kolejne, ponoć rewolucyjne, wyszukiwarki. Pierwsza, o której warto wspomnieć, to Hakia (http://www.hakia.com). Ma ona w założeniu twórców rozumieć zapytania wpisywane w naturalnym języku człowieka. W jej tworzenie zaangażowana jest polska firma Prokom. Czy Hakia będzie przełomem? Być może, choć na razie jej możliwości nie są oszałamiające. W każdym razie warto zdawać sobie sprawę z jej istnienia.

Inny typ wyszukiwarek opiera się na technologii tak zwanego clusteringu, czyli analizy skupień. Polega ona na dzieleniu zbioru elementów na dynamicznie generowane kategorie. Jeden z czołowych przykładów wykorzystania clusteringu to Clusty (http://www.clusty.com). Ta wyszukiwarka nie indeksuje treści samodzielnie, lecz korzysta z innych silników. Swoje działania skupia tylko i wyłącznie na dzieleniu wyników na kategorie.

Wyniki wyszukiwania dla słowa warszawa , podzielone na kategorie.

Czy takie podejście jest słuszne? Na pewno w różnych sytuacjach może ono zawęzić wyniki wyszukiwania do informacji najbardziej nas interesujących. Nie zdziwiłbym się, gdyby w przyszłości znaczenie takich wyszukiwarek miało wzrosnąć.

Inne projekty tego typu to np. polska wyszukiwarka Carrot 2 (http://www.carrot2.org) czy wyszukiwarka Mooter (http://www.mooter.com).

Grzebiemy w Usenecie

Spora ilość wiedzy znajduje się zaszyta głęboko w zasobach Usenetu. Dla niewtajemniczonych tłumaczę, że Usenet to tzw. grupy dyskusyjne lub grupy newsowe. Coś jakby fora, ale jeszcze sprzed epoki wszechobecnych stron WWW. Oczywiście Usenet istnieje do dzisiaj. Prowadzi się na nim dyskusje przy użyciu specjalnych programów. Odpowiednią funkcjonalność posiadają również programy pocztowe, np. Mozilla Thunderbird.

Google Groups

Więcej na temat korzystania z Usenetu możesz dowiedzieć się na stronie http://www.usenet.pl. Ja chciałbym zwrócić uwagę na możliwość łatwego przeglądania archiwum grup dyskusyjnych dzięki serwisowi Google Groups (http://www.groups.google.com).

REKLAMA

Wiedza zbierana społecznie

Pomocne w wyszukiwaniu informacji są często serwisy typu web 2.0, które zawierają treści generowane przez samych użytkowników. Mam tu na myśli szczególnie witryny będące zbiorami linków do najprzeróżniejszych stron. Oto lista najważniejszych z nich:

http://www.digg.com — serwis pozwalający publikować ciekawe linki i społecznie je oceniać,

http://www.reedit.com — strona konkurencyjna do powyższej,

http://www.wykop.pl — polska witryna tego typu,

http://www.gwar.pl — kolejny polski serwis,

http://del.icio.us — serwis innego typu pozwalający umieszczać w sieci swoje ulubione/zakładki i, choć anglojęzyczny, używany jest przez dużą liczbę Polaków oraz zawiera linki do sporej liczby polskich stron,

http://www.pytamy.pl – serwis typu „zadaj pytanie i czekaj na odpowiedź”, coraz bardziej rośnie w siłę

Powyższe strony to tylko niektóre przykłady nurtu, jaki w ostatnich latach opanował Internet. Nurtu, w którym sami użytkownicy przejmują rolę twórców, a właściciel strony dostarcza im tylko odpowiednie narzędzia.

Digg to największy fenomen anglojęzycznego Internetu ostatnich lat, tysiące linków dodawanych przez tysiące użytkowników.

A co z katalogami?

W dawnych czasach sporą popularnością cieszyły się katalogi stron internetowych. Dzisiaj są one raczej przeżytkiem, a to z uwagi na ogromną liczbę stron znajdujących się w sieci. Oczywiście można w nich znaleźć wartościowe witryny, ale nie pokładałbym w tym zbyt wielkiej nadziei.

Jeśli już zamierzasz korzystać z katalogów, to bierz pod uwagę tylko te znane i duże. Zapomnij o bardzo małych i nieprofesjonalnych. Jest ich naprawdę dużo, o czym świadczą różnego rodzaju spisy (np. http://www.katalogiseo.info/). Jednak takie katalogi tworzone przy pomocy gotowych narzędzi nie zawierają najczęściej niczego, co miałoby dla nas wartość. Służą one do pozycjonowania stron poprzez zwiększanie liczby prowadzących do nich linków. Wyszukiwarki widzą te linki i podwyższają pozycję takiej strony w swoich rankingach. Z punktu widzenia wyszukiwania informacji nie ma to jednak dla Ciebie większego znaczenia — po prostu korzystaj tylko z dużych, uznanych katalogów, jak np. http://katalog.onet.pl, http://start24.pl, http://webwweb.pl czy http://dmoz.org.

Ty mówić angielski?

Ogromną przewagę w korzystaniu z Internetu i wyszukiwaniu w nim informacji mają osoby znające język angielski. To podstawa i warto znać go chociażby w średnim stopniu. Dużo wiadomości nie jest i być może nigdy nie będzie dostępna po polsku. Dlatego posłuchaj dobrej rady: jeśli jeszcze nie uczysz się języka angielskiego, to najwyższa pora zacząć!

REKLAMA
Komentarze

O autorze
Bartłomiej Dymecki
Informatyk, publicysta. Jego artykuły można znaleźć w Magazynie INTERNET oraz Internet Makerze. Wydał także książkę Tajniki CSS.

Wszystkie teksty autora

Zamów newsletter

Zapisz się, aby otrzymywać przegląd najciekawszych tekstów prosto do skrzynki mailowej. Tylko wartościowe treści. Za darmo.
Zamawiając newsletter, wyrażasz zgodę na użycie adresu e-mail w celu świadczenia usługi. Usługę możesz w każdej chwili anulować, instrukcję znajdziesz w newsletterze.
© 2001-2023 Promohistoria. Wszelkie prawa zastrzeżone