Przewodnik po zakamarkach Internetu, gdzie Google nie sięga

07.01.2012
Przewodnik po zakamarkach Internetu, gdzie Google nie sięga

Przewodnik po zakamarkach Internetu, gdzie Google nie sięga

Wyszukiwarka = Google. Niektórzy pomyleńcy jeszcze próbują alternatywy w postaci Binga, co w Polsce wymaga… wyrozumiałości. Ale nawet Google nie wie wszystkiego, z uwagi na swoją generyczność. Czasami potrzebujemy informacji z bardzo konkretnej dziedziny. Na szczęście, są w Sieci inne, bardzo wyspecjalizowane wyszukiwarki.

Tak zwana “niewidzialna sieć” to strony internetowe, które nie są indeksowane przez internetowe wszukiwarki. Tak, są miejsca w Sieci, na które Google i Bing nie zagladają. Czasami nie mają jak: do witryny nie oprowadzi żadne łącze, czasami podstrona domaga się hasła, czasami witryny te operują w sieciach prywatnych, a czasem po prostu generowane są dyniamicznie, a zatem domyślnie ignorowane przez największe wyszukiwarki.

Dlatego też Google i Bing mogą poszczycić się wyszukiwaniem w czasie rzeczywistym, indeksowaniem PDF-ów, aplikacji flashowych, ale wciąż nie wiedzą wszystkiego o HTML-u i bazach danych. Według artykułu na Wikipedii, otwarta sieć to 167 terabajtów tekstowych danych. Niewidzialna sieć to… 91 tysięcy terabajtów danych! To wszystko jest do naszej dyspozycji. Tyle że nie każdy z nas o tym wie. Jak się do nich dobrać? Wynalazłem kilka narzędzi. Niestety, większość z nich dotyczy anglojęzycznych treści. Ale, z uwagi na to, że wiedza jakiej szukamy jest bardzo wyspecjalizowana, jestem pewien, że dla zainteresowanych nią osób nie będzie to bariera językowa.

Infomine

Infomine to wspólne dzieło grupy amerykańskich bibliotek, w tym tych należaych do wielu uniwersytetów. Wyszukiwarka wydobywa informacje z baz danych, elektronicznych publikacji, e-booków, biuletynów, forów, list mailingowych, katalogów bibliotecznych, naukowych i z wielu innych miejsc. Wystarczy wybrać kategorię zagadnienia, dostosować opcje wyszukiwania i wpisać zapytanie. Infomine, oprócz możliwości przeszukiwania Niewidzialnej Sieci, oferuje kilka innych fajnych narzędzi (patrz “Other Search Tools” i “General Reference” na dole witryny).

The WWW Virtual Library

Dawno, dawno temu, kiedy jeszcze twórcy Google’a zamiast kontrolować świat, płakali do mamy, że trzeba zmienić pieluchę, wyszukiwarki internetowe działały zupełnie inaczej, niż obecnie. Nazywały się one “Katalogami stron”, a ten tutaj uważany jest za pierwszy w historii. Stworzył go sam Tim Berners-Lee, twórca WWW. Co on tu robi? Jak się okazuje, jest wciąż przydatny. Znajdziemy w nim listę wielu zasobów na pokażną ilość tematów. Nawigacja jest bardzo oldschoolowa (drzewko kategorii i podkategorii), ale wyniki mogą nas zaskoczyć.

Intute

Intute indeksuje wyłącznie treści opublikowane w brytyjskiej sieci, szczególnie akademickie i naukowe. Można przeglądać katalog po kategoriach, można też w całości zdać się na wyszukiwarkę słów kluczowych. Zagadnień akademickich jest sporo, od rolnictwa po weterynarię. Na dodatek, Intute polega na moderatorach, którzy ulepszają automatyczne mechanizmy, odpowiednio dodając poszczególne zagadnienia do poszczególnych kategorii. Dodany jest też darmowy samouczek: 60 lekcji skutecznego wyszukiwania informacji w Internecie. Zacne!

Complete Planet

Complete Planet jest bardzo fajnie zaprojektowane, darmowe i łatwe w obsłudze. Indeksuje dynamiczne bazy danych, które są ukryte przed tradycyjnymi wyszukiwarkami. Jej twórcy chwalą się, że dzięki Complete Planet uzyskujemy dostęp do 70 tysięcy różnych baz danych, posegregowanych tematycznie. Treści, jakie znajdziemy, nie tylko tyczą się nauki i techniki. Pogoda, militaria, kulinaria – to wszystko i wiele więcej.

Infoplease

Infoplease to przegląd publikacji naukowych. Przede wszystkicm encyklopedii, almanachów i biografii. Dodatkowo, fajnym pomysłem jest podzielenie strony na wyspecjalizowane podserwisy. Przy Factomonster.com możemy posadzić nasze przemądrzałe dziecko, z kolei Biosearch koncentruje się wyłącznie na biografiach.

IncyWincy

IncyWincy to metawyszukiwarka niewidzialnej sieci. Wspomaga się istniejącymi wyszukiwarkami “konkurencji” i nakłada na nie własne filry. Umożliwia wyszukiwanie nie tylko treści tekstowych, ale również formularzy i zdjęć. Zaawansowane funkcje tego katalogu wymagają darmowej rejestracji.

DeepWebTech

DeepWebTech to najbardziej zaawansowana wyszukiwarka Niewidzialnej Sieci i, niestety, jest płatna i droga. Przyda się wam, jeżeli zarabiacie specjalistyczną wiedzą. Do napisania pracy zaliczeniowej na semestr na studiach raczeh chyba niewarta tak dużej ceny. Oferuje nie tylko webową aplikację, ale również masę wtyczek do przeglądarek, koncentrujących się na przeróżnych zagadnieniach (nauki ścisłe, medycyna, przedsiębiorczość, itd.). Na szczęście można się pobawić na koncie trial.

Scirus

Scirus to mój ulubieniec w tym zestawieniu, z uwagi na moje zainteresowania. Najlepszy jeśli chodzi o nauki ścisłe, ale już nie tak dobry, jeśli chodzi o całą resztę. Zasięg jego jest jednak imponujący: publikacje, dzienniki, witryny naukowców, kursy, a nawet pliki wydruków, wnioski patentowe czy materiały z wewnętrznych intranetów. Jeżeli piszesz dla magazynów naukowych, czy jesteś studentem (studentką? fakt, zdarzają się…) Politechniki, warto spróbować.

TechXtra

TechXtra to równie fajne narzędzie, co Scirius, na dodatek łatwiejsze w obsłudze. Koncentruje się na zagadnieniach matematycznych, inżynieryjnych i informatycznych. Oprócz samej wiedzy, oferuje przegląd newsów z “branży”, ogłoszeń o pracę i materiały dydaktyczne. Podobnie jak Scirius, nieocenione narzędzie dla “politechników.

Pamiętajmy o jednym: powyższe wyszukiwarki potrafią być tak samo upierdliwe w niepodawaniu tego, co szukamy, jak samo Google. Tu również szukamy igły w stogu siana. Tyle, że owa igła jest dużo większa. Mam nadzieję, że kilku doktorantom, magistrantom i dziennikarzom się przyda. Jeżeli znacie inne, dobre narzędzia tego typu, komentarze mile widziane.

* lista na podstawie: http://www.makeuseof.com/tag/10-search-engines-explore-deep-invisible-web/

Maciek Gajewski jest dziennikarzem, współprowadzi dział aktualności na Chip.pl, gdzie również prowadzi swojego autorskiego bloga.

Musisz przeczytać:

Dołącz do dyskusji

Advertisement