www.lucacattaneo.net

  Cercare e trovare nella Rete Internet 
LA SCELTA DI UN "MOTORE DI RICERCA"

La ricerca di informazioni sul Web passa attraverso l’utilizzo di software (motori di ricerca, webdirectories) che spesso permettono di trovare moltissimi suggerimenti alla vostra richiesta, piuttosto che nessuno, a seconda dell’impostazione che viene effettuata.

Se cerchiamo qualcosa – ad esempio in casa o in biblioteca – il primo passo da fare è chiedere consiglio a chi può sapere dove si trova ciò che si cerca, a un parente o al bibliotecario. Sul Web non abbiamo “qualcuno” che ci può instradare nella direzione giusta. Abbiamo i "motori di ricerca".

I "Motori di ricerca" sono servizi gratuiti costituiti da archivi che possono essere interrogati tramite una maschera in cui immettere una o più parole chiave. Gli archivi vengono aggiornati grazie ad alcuni software (detti spider) che automaticamente spazzolano la rete raccogliendo tutte le informazioni per la catalogazione delle pagine visitate. I "motori di ricerca" sono realizzati ed aggiornati secondo due procedure distinte.
La prima è di tipo automatico. Degli algoritmi specializzati (spider/agenti/robot) analizzano ogni URL (o meglio la relativa pagina) ed estraggono i termini più idonei (keyword) ad identificarne i contenuti (ogni pagina sarà indicizzata con alcune keywords, ogni keyword punta a svariate pagine). Il metodo è semplice, veloce ma poco preciso: un'interrogazione può restituire un gran numero di URL per la maggior parte poco significativi.
La seconda è di tipo manuale. La pagina viene osservata da una persona in carne ed ossa che valuta con quali keywords indicizzarla. In questo caso l'interrogazione produrrà URL molto attinenti. Purtroppo, dato il costo e la lentezza del metodo, questi database contengono relativamente pochi URL e si rischia di non trovare le pagine che più interessano.

I "Webdirectories" sono siti organizzati per categorie, classificati per analogia come le biblioteche. La ricerca infatti viene fatta a partire da una macro categoria che si assottiglia sempre più fino a trovare l’elenco dei siti di maggior interesse. Spesso presentano anch’essi la possibilità di effettuare una ricerca libera. Nella maggior parte dei casi, i "webdirectories" sono aggiornati secondo la procedura di tipo "manuale" sopra descritta.

Una volta scelto uno dei "motori" tra quelli più utilizzati, immessa la parola o le parole chiave dentro la maschera di ricerca proposta, per iniziare la nostra esplorazione possiamo seguire dei semplici consigli:

La risposta ad una nostra richiesta avviene presentandoci i risultati della ricerca (un insieme di indirizzi web e una breve descrizione) per grado di rilevanza, cioè quelli che il "motore" pensa siano i migliori per lui. Qualora non si riesca a trovare quanto ricercato tra i primi 30-60 risultati è probabile che non sia presente in rete oppure si deve cambiare "motore" ed impostare una ricerca più complessa.
Tutti i motori infatti permettono di effettuare una ricerca (con operatori booleani) in cui:

A potete chiedere al "motore" di visualizzare i risultati nei quali le parole chiave prescelte sono presenti contemporaneamente - ad esempio Egitto and Nilo;

B potete chiedere al "motore" di visualizzare i risultati nei quali compare almeno una delle parole chiave - ad esempio Egitto or Nilo;

C potete combinare i casi A e B utilizzando le parentesi secondo le regole dell’algebra - ad esempio "faraoni or (Nilo and Egitto)". In questo caso vengono ricercati tutti i documenti in cui compaiono simultaneamente (Nilo e Egitto) o solo faraoni.

Ricordate che ogni "motore di ricerca" ha la sua sintassi specifica per impostare al meglio questo tipo di ricerche (ricerca avanzata).

E... se non trovaste niente ??
Beh, da un certo punto di vista se non trovate niente… magari nessuno ha mai scritto nulla del genere in rete oppure state cercando qualcosa di veramente unico. In genere conviene:


Non tutti i "motori di ricerca" sono gestiti in modo uguale. Ogni "motore" ha proprie modalità per indicizzare il web. Alcuni "motori" indicizzano ogni parola di ogni pagina, alcuni le prime cento parole, altri indicizzano ogni parola e filtrano quelle irrilevanti (parole che prese da sole non hanno significato, come pronomi o verbi, e naturalmente possono variare da "motore" a "motore").
Un curioso esperimento con le parole così dette irrilevanti (noise words) consiste nel cercare con il "motore di ricerca" di Excite (http://www.excite.com) la seguente frase famosa in lingua inglese (chiusa tra virgolette per indicare appunto che si tratta dell'intera frase): "to be or not to be". Excite non troverà nessun documento in rete che corrisponde alla nostra richiesta, poichè questo "motore" considera tutte queste parole come noise words, ed Excite non indicizza tali parole. Se si ripete la ricerca della stessa frase con il "motore di ricerca" AltaVista (http://www.altavista.com), quest'ultimo propone come risultato più di 500 pagine trovate. Questo però non vuole dire che AltaVista sia il miglior "motore di ricerca" per tutte le ricerche, ma forse è il più comprensivo.

Bisogna anche analizzare la forma con cui si effettua la ricerca nel "motore", due differenti interrogazioni possono apparire la stessa cosa, ma i "motori" le interpretano in modo differente, producendo ovviamente risultati dissimilari.
Per esempio la ricerca (labor OR labour) AND union non è la stessa di "labor union" OR "labour union". Anche se le richieste sembrano chiedere la stessa cosa, i "motori" vedono differenze nella struttura delle due interrogazioni. La prima espressione troverà le pagine che contengono ogni parola, in qualsiasi parte del documento, come: [labor should organize into a union], [labor and management should realize that success depends on the union of their interests and aims], etc. La seconda espressione troverà solo quelle pagine in cui le parole labor e union o labour e union appaiono le une vicine alle altre, come: [a labor union is in the interest of workers], [a labour union is the best way to counter management]. Questa interrogazione non troverà [labor should organize into a union]. Da notare che la prima interrogazione troverà anche pagine come il secondo tipo di interrogazione, ma non il contrario.

Un ulteriore punto su cui soffermarsi è dato dalla diversità di interpretazione delle parole o delle frasi in lingue simili, come l'inglese o l'americano. Frasi o parole comuni in Nord America non necessariamente lo sono altrove. Cercando "corrugated steel" in Inghilterra probabilmente non ha senso, poichè è comunemente chiamato "corrugated iron".

Uno dei più flessibili criteri di interrogazione è dato dalla possibilità che molti "motori di ricerca" possono usare l'operatore asterisco,*, o wild card operator. Le interrogazioni con l'ausilio dell'* permettono di utilizzare parole incomplete, anche se i risultati che così si ottengono possono essere estremamente vari.

Se si devono cercare informazioni in una specifica nazione, è consigliabile utilizzare "motori di ricerca" che permettono di restringere la ricerca in URL appartenenti alla nazione stessa.

Qui di seguito sono presentati i principali e più affidabili "motori di ricerca" disponibili attraverso Internet. La prima parte contiene l'elenco dei "motori di ricerca" veri e propri, consultabili per ricerche di carattere generale; poi vi è l'elenco dei così detti "meta search engines", "motori di ricerca multipli", cioè "motori di ricerca" che non dispongono di propri database di dati, ma rispondono alle richieste interrogando contemporaneamente più "motori" singoli; da ultimo i "motori specializzati", che indicizzano solo pagine contenenti certi argomenti ben specifici (tipo i "News Engines" per ricerche all'interno dei messaggi nei Newsgroup di Usenet).
Nota: i vari approfondimenti dei servizi qui di seguito esposti sono aggiornati nell'ottobre 1999.


Arianna

http://www.arianna.it

Alcune caratteristiche:

Tipologia della ricerca Caratteristica
Semplice Permette di specificare una o più parole da utilizzare per la ricerca.
Internazionale Permette di specificare i termini della ricerca e di inviarli direttamente ad uno dei più conosciuti motori di ricerca che sono in grado di ricercare in rete.
Avanzata - Arianna mette a disposizione una serie di opzioni quali:
  scelta del tipo di ricerca con più parole tramite operatori booleani
  utilizzo delle estensioni linguistiche Le estensioni linguistiche italiane permettono di ricercare utilizzando non solo la parola data ma anche le sue estensioni (singolare-plurale, maschile-femminile, forme verbali etc.). Esempio: fornendo la parola "lupo" si effettueranno anche le ricerche per "lupi", "lupa", fornendo la parola "mangiare" si effettueranno ricerche per "mangiato", "mangiai" etc.
  limitazione della ricerca a specifiche porzioni di testo Arianna cerca i termini oggetto della ricerca su tutte le sezioni della pagina; utilizzando i bottoni previsti sulla ricerca avanzata è possibile limitare la zona in cui effettuare le ricerche al solo titolo.
  limitazione della ricerca ad un sito specificato E’ possibile indicare l’indirizzo di un sito sul quale effettuare le ricerche. Arianna in questo caso limita la ricerca alle sole pagine che appartengono al sito specificato.


AltaVista

http://www.altavista.com

Alcune caratteristiche:

Operatore Sintassi d’esempio Spiegazione
AND Piscina and pallanuoto Trova tutti i documenti contenenti la parola piscina e la parola nuoto.
OR Piscina or nuoto Trova tutti i documenti contenenti almeno una delle parole piscina o nuoto.
NOT Not pallanuoto Esclude dalla ricerca i documenti che contengono la parola o la frase seguenti il NOT.
Il NOT non può essere utilizzato da solo ma deve essere utilizzato con gli operatori AND o OR o in combinazioni di questi.
NEAR not pallanuoto near (sport and acquatici) Nel caso in cui non sia sufficiente che due termini appaiano in un documento è conveniente impostare la ricerca di parole o frasi vicine a quelle richieste fino a 10 parole di distanza.


Euroferret

http://www.euroferret.com

Alcune caratteristiche:


Excite

http://www.excite.com http://www.excite.it

Alcune caratteristiche:

Operatore Sintassi d’esempio Spiegazione
+ +legislazione+commercio Il segno +, posto davanti a una parola, abilita la ricerca in cui tutti i documenti trovati da Excite conterranno quella parola. Quindi, nel nostro caso +legislazione+commercio, i risultati faranno riferimento alle leggi di questo settore. Se si digitita solo leggi+commercio, tutti i documenti trovati conterranno la parola "commercio" ma non necessariamente la parola "legislazione".
- +legislazione-penale Il segno - posto davanti a una parola non segnalerà i documenti che contengono quella parola. Quindi, nell’esempio verranno risparmiati i documenti di legislazione penale.


GoTo!

http://www.goto.com

Alcune caratteristiche:


HotBot

http://www.hotbot.com

Alcune caratteristiche:


Il Trovatore

http://iltrovatore.webzone.it

Alcune caratteristiche:


Infoseek

http://www.infoseek.com http://italy.infoseek.com

Alcune caratteristiche:


LookSmart

http://www.looksmart.com

Alcune caratteristiche:


Lycos

http://english.lycos.com http://www.lycos.it

Alcune caratteristiche:

Operatore Sintassi di esempio Spiegazione
ADJ moto adj strada Trova sia moto strada che strada moto.
NEAR "Jordan" near basket I termini richiesti devono apparire nei documenti con una distanza massima di 25 parole. Nell’esempio quindi vengono ricercate non solo pagine che fanno riferimento a Jordan ma anche documenti nei quali appare Jordan e la parola basket con la clausola che questa parola non sia distante più di 25 parole da Jordan.
FAR Baggio far calcio E’ l’ opposto di near. Infatti troverà le pagine che contengono i termini indicati distanziati di almeno 25 termini.
BEFORE Wind before surf Simile all’operatore and, si differenzia da questa perché i termini devono apparire nell’ ordine specificato.


Mamma

http://www.mamma.com

Alcune caratteristiche:


Northernlight

http://www.northernlight.com

Alcune caratteristiche:


Ragno Italiano

http://ragno.plugit.net

Alcune caratteristiche:


Shinyseek

http://www.shinyseek.it

Alcune caratteristiche:


Virgilio

http://www.virgilio.it

Alcune caratteristiche:

Tipologia della ricerca Caratteristica
Semplice Permette di specificare una o più parole da utilizzare per la ricerca.
Con più termini Permette di specificare i termini della ricerca ed i termini da non cercare.
All’interno di un sito Alcuni siti sono molto grandi e complessi e pur sapendo che le informazioni da ricercare sono sicuramente all'interno di un determinato sito, può essere lungo e difficile ritrovarle.
Nel titolo di una pagina ll titolo di un pagina è spesso assai esplicativo. Viene quindi effettuata la ricerca limitandola al solo tag <Title> presente nelle pagine.
Nell'URL Per trovare pagine web anche limitando le ricerche all'interno del loro indirizzo o URL (Uniform Resource Locator). Ad esempio se cerco la parola "pippo" troverò risultati simili a questo: http://www.dnp.co.jp/gallery/info/pippo/pippo.html


WebCrawler

http://www.webcrawler.com

Alcune caratteristiche:


Yahoo!

http://www.yahoo.com http://www.yahoo.it

Alcune caratteristiche:


 


Il Motore

http://ilmotore.com

Alcune caratteristiche:


Internet Sleuth

http://www.isleuth.com

Alcune caratteristiche:

Argomento della ricerca Motori di ricerca usati
Finanza CNN Financial News, Business Wire, Hoover's Company Capsules, PR Newswire, APL Quote Service
News e headlines AP Headlines, News Tracker, Washington Post Headlines, Electronic Newsstand
Newsgroup in Usenet AltaVista Usenet News, Deja News, HotBot, Reference.com
Software Info-Mac, Shareware.com, Winsite Windows Software
Sport CNN/Sports Illustrated, Indy Car Racing Mag, Sport Quest, The Sporting News, USA Today


Metacrawler

http://www.metacrawler.com

Alcune caratteristiche:


Profusion

http://profusion.ittc.ukans.edu

Alcune caratteristiche:


 

 Tipologia della ricerca URL  "Motore di ricerca"
Software (Share e Free), files  http://www.filez.com/zhub.shtml  Filez
 http://ftpsearch.lycos.com  FTPSearch
 http://www.shareware.com  Shareware
 http://www.tucows.com  Tucows
 http://www.download.com  CNet Download
     
News Engines (per ricerche nei Newsgroup)  http://www.deja.com/home_ps.shtml  Dejanews
     
Web Forums  http://www.forumone.com  Forum One
     
Indirizzi di E-mail  http://www.bigfoot.com  BigFoot
 http://people.yahoo.com  Yahoo! People Search
 http://www.iaf.net  Internet Address Finder
 http://whowhere.lycos.com  WhoWhere
     
Nome del Dominio  http://www.ibc.wustl.edu/ibc/domain_form.html  Wustl
     
Internet Service Providers  http://www.thedirectory.org  The Directory
     
Mappe di città del mondo  http://www.mapquest.com  MapQuest
     
Immagini  http://image.altavista.com  AV Photofinder
 http://isurf.interpix.com/  ISurf
     
Erotismo  http://www.yahoosex.net  Yahoo!Sex
     
Numeri telefonici mondiali  http://www.wajens.no  Internat. White & Yellow Pages
     
File Audio e video  http://mp3.lycos.com  MP3 by Lycos
   http://www.whoopie.com  Whoopie!