![]()
|
Cercare
e trovare nella Rete Internet LA SCELTA DI UN "MOTORE DI RICERCA" |
La ricerca di informazioni sul Web passa attraverso lutilizzo di software (motori di ricerca, webdirectories) che spesso permettono di trovare moltissimi suggerimenti alla vostra richiesta, piuttosto che nessuno, a seconda dellimpostazione che viene effettuata.
Se cerchiamo qualcosa ad esempio in casa o in biblioteca il primo passo da fare è chiedere consiglio a chi può sapere dove si trova ciò che si cerca, a un parente o al bibliotecario. Sul Web non abbiamo qualcuno che ci può instradare nella direzione giusta. Abbiamo i "motori di ricerca".
I "Motori di ricerca" sono servizi
gratuiti costituiti da archivi che possono essere interrogati
tramite una maschera in cui immettere una o più parole
chiave. Gli archivi vengono aggiornati grazie ad alcuni software
(detti spider) che automaticamente spazzolano la rete raccogliendo
tutte le informazioni per la catalogazione delle pagine visitate.
I "motori di ricerca" sono realizzati ed aggiornati
secondo due procedure distinte.
La prima è di tipo automatico. Degli algoritmi specializzati
(spider/agenti/robot) analizzano ogni URL (o meglio la
relativa pagina) ed estraggono i termini più idonei (keyword)
ad identificarne i contenuti (ogni pagina sarà indicizzata
con alcune keywords, ogni keyword punta a svariate
pagine). Il metodo è semplice, veloce ma poco preciso:
un'interrogazione può restituire un gran numero di URL
per la maggior parte poco significativi.
La seconda è di tipo manuale. La pagina viene osservata
da una persona in carne ed ossa che valuta con quali keywords
indicizzarla. In questo caso l'interrogazione produrrà
URL molto attinenti. Purtroppo, dato il costo e la lentezza del
metodo, questi database contengono relativamente pochi URL e si
rischia di non trovare le pagine che più interessano.
I "Webdirectories" sono siti organizzati per categorie, classificati per analogia come le biblioteche. La ricerca infatti viene fatta a partire da una macro categoria che si assottiglia sempre più fino a trovare lelenco dei siti di maggior interesse. Spesso presentano anchessi la possibilità di effettuare una ricerca libera. Nella maggior parte dei casi, i "webdirectories" sono aggiornati secondo la procedura di tipo "manuale" sopra descritta.
Una volta scelto uno dei "motori" tra quelli più utilizzati, immessa la parola o le parole chiave dentro la maschera di ricerca proposta, per iniziare la nostra esplorazione possiamo seguire dei semplici consigli:
La risposta
ad una nostra richiesta avviene presentandoci i risultati della ricerca (un insieme di indirizzi web
e una breve descrizione) per grado di rilevanza, cioè quelli che il "motore"
pensa siano i migliori per lui. Qualora non si riesca a trovare
quanto ricercato tra i primi 30-60 risultati è probabile
che non sia presente in rete oppure si deve cambiare "motore"
ed impostare una ricerca più complessa.
Tutti i motori infatti permettono di effettuare una ricerca (con
operatori booleani) in cui:
A potete chiedere al "motore" di visualizzare i risultati nei quali le parole chiave prescelte sono presenti contemporaneamente - ad esempio Egitto and Nilo;
B potete chiedere al "motore" di visualizzare i risultati nei quali compare almeno una delle parole chiave - ad esempio Egitto or Nilo;
C potete combinare i casi A e B utilizzando le parentesi secondo le regole dellalgebra - ad esempio "faraoni or (Nilo and Egitto)". In questo caso vengono ricercati tutti i documenti in cui compaiono simultaneamente (Nilo e Egitto) o solo faraoni.
Ricordate che ogni "motore di ricerca" ha la sua sintassi specifica per impostare al meglio questo tipo di ricerche (ricerca avanzata).
E...
se non trovaste niente ??
Beh, da un certo
punto di vista se non trovate niente
magari nessuno ha mai
scritto nulla del genere in rete oppure state cercando qualcosa
di veramente unico. In genere conviene:
Non tutti i "motori
di ricerca" sono gestiti in modo uguale. Ogni "motore" ha proprie modalità
per indicizzare il web. Alcuni "motori" indicizzano
ogni parola di ogni pagina, alcuni le prime cento parole, altri
indicizzano ogni parola e filtrano quelle irrilevanti (parole
che prese da sole non hanno significato, come pronomi o verbi,
e naturalmente possono variare da "motore" a "motore").
Un curioso esperimento con le parole così dette irrilevanti
(noise words) consiste nel cercare con il "motore
di ricerca" di Excite (http://www.excite.com)
la seguente frase famosa in lingua inglese (chiusa tra virgolette
per indicare appunto che si tratta dell'intera frase): "to
be or not to be". Excite non troverà nessun
documento in rete che corrisponde alla nostra richiesta, poichè
questo "motore" considera tutte queste parole come noise
words, ed Excite non indicizza tali parole. Se si ripete la
ricerca della stessa frase con il "motore di ricerca"
AltaVista (http://www.altavista.com),
quest'ultimo propone come risultato più di 500 pagine trovate.
Questo però non vuole dire che AltaVista sia il miglior
"motore di ricerca" per tutte le ricerche, ma forse
è il più comprensivo.
Bisogna anche analizzare la forma con cui si effettua
la ricerca nel "motore",
due differenti interrogazioni possono apparire la stessa cosa,
ma i "motori" le interpretano in modo differente, producendo
ovviamente risultati dissimilari.
Per esempio la ricerca (labor OR labour) AND union non
è la stessa di "labor union" OR "labour
union". Anche se le richieste sembrano chiedere la stessa
cosa, i "motori" vedono differenze nella struttura delle
due interrogazioni. La prima espressione troverà le pagine
che contengono ogni parola, in qualsiasi parte del documento,
come: [labor should organize into a union], [labor and management
should realize that success depends on the union of their interests
and aims], etc. La seconda espressione troverà solo quelle
pagine in cui le parole labor e union o labour
e union appaiono le une vicine alle altre, come: [a labor
union is in the interest of workers], [a labour union is the best
way to counter management]. Questa interrogazione non troverà
[labor should organize into a union]. Da notare che la prima interrogazione
troverà anche pagine come il secondo tipo di interrogazione,
ma non il contrario.
Un ulteriore punto su cui soffermarsi è dato dalla diversità di interpretazione delle parole o delle frasi in lingue simili, come l'inglese o l'americano. Frasi o parole comuni in Nord America non necessariamente lo sono altrove. Cercando "corrugated steel" in Inghilterra probabilmente non ha senso, poichè è comunemente chiamato "corrugated iron".
Uno dei più flessibili criteri di interrogazione è dato dalla possibilità che molti "motori di ricerca" possono usare l'operatore asterisco,*, o wild card operator. Le interrogazioni con l'ausilio dell'* permettono di utilizzare parole incomplete, anche se i risultati che così si ottengono possono essere estremamente vari.
Se si devono cercare informazioni in una specifica nazione, è consigliabile utilizzare "motori di ricerca" che permettono di restringere la ricerca in URL appartenenti alla nazione stessa.
Qui di seguito sono presentati
i principali
e più affidabili "motori
di ricerca" disponibili attraverso Internet. La prima parte
contiene l'elenco dei "motori di ricerca" veri e propri,
consultabili per ricerche di carattere generale; poi vi è
l'elenco dei così detti "meta search engines", "motori di ricerca multipli",
cioè "motori di ricerca" che non dispongono di
propri database di dati, ma rispondono alle richieste interrogando
contemporaneamente più "motori" singoli; da ultimo
i "motori
specializzati", che indicizzano
solo pagine contenenti certi argomenti ben specifici (tipo i "News
Engines" per ricerche all'interno dei messaggi nei Newsgroup
di Usenet).
Nota: i vari approfondimenti dei servizi qui di
seguito esposti sono aggiornati nell'ottobre 1999.
Arianna
Alcune caratteristiche:
| Tipologia della ricerca | Caratteristica | |
| Semplice | Permette di specificare una o più parole da utilizzare per la ricerca. | |
| Internazionale | Permette di specificare i termini della ricerca e di inviarli direttamente ad uno dei più conosciuti motori di ricerca che sono in grado di ricercare in rete. | |
| Avanzata - Arianna mette a disposizione una serie di opzioni quali: | ||
| scelta del tipo di ricerca con più parole tramite operatori booleani | ||
| utilizzo delle estensioni linguistiche | Le estensioni linguistiche italiane permettono di ricercare utilizzando non solo la parola data ma anche le sue estensioni (singolare-plurale, maschile-femminile, forme verbali etc.). Esempio: fornendo la parola "lupo" si effettueranno anche le ricerche per "lupi", "lupa", fornendo la parola "mangiare" si effettueranno ricerche per "mangiato", "mangiai" etc. | |
| limitazione della ricerca a specifiche porzioni di testo | Arianna cerca i termini oggetto della ricerca su tutte le sezioni della pagina; utilizzando i bottoni previsti sulla ricerca avanzata è possibile limitare la zona in cui effettuare le ricerche al solo titolo. | |
| limitazione della ricerca ad un sito specificato | E possibile indicare lindirizzo di un sito sul quale effettuare le ricerche. Arianna in questo caso limita la ricerca alle sole pagine che appartengono al sito specificato. | |
AltaVista
Alcune caratteristiche:
| Operatore | Sintassi desempio | Spiegazione |
| AND | Piscina and pallanuoto | Trova tutti i documenti contenenti la parola piscina e la parola nuoto. |
| OR | Piscina or nuoto | Trova tutti i documenti contenenti almeno una delle parole piscina o nuoto. |
| NOT | Not pallanuoto |
Esclude dalla ricerca i documenti
che contengono la parola o la frase seguenti il NOT. Il NOT non può essere utilizzato da solo ma deve essere utilizzato con gli operatori AND o OR o in combinazioni di questi. |
| NEAR | not pallanuoto near (sport and acquatici) | Nel caso in cui non sia sufficiente che due termini appaiano in un documento è conveniente impostare la ricerca di parole o frasi vicine a quelle richieste fino a 10 parole di distanza. |
Euroferret
Alcune caratteristiche:
Excite
| http://www.excite.com | http://www.excite.it |
Alcune caratteristiche:
| Operatore | Sintassi desempio | Spiegazione |
| + | +legislazione+commercio | Il segno +, posto davanti a una parola, abilita la ricerca in cui tutti i documenti trovati da Excite conterranno quella parola. Quindi, nel nostro caso +legislazione+commercio, i risultati faranno riferimento alle leggi di questo settore. Se si digitita solo leggi+commercio, tutti i documenti trovati conterranno la parola "commercio" ma non necessariamente la parola "legislazione". |
| - | +legislazione-penale | Il segno - posto davanti a una parola non segnalerà i documenti che contengono quella parola. Quindi, nellesempio verranno risparmiati i documenti di legislazione penale. |
GoTo!
Alcune caratteristiche:
HotBot
Alcune caratteristiche:
Il Trovatore
Alcune caratteristiche:
Infoseek
| http://www.infoseek.com | http://italy.infoseek.com |
Alcune caratteristiche:
LookSmart
Alcune caratteristiche:
Lycos
| http://english.lycos.com | http://www.lycos.it |
Alcune caratteristiche:
| Operatore | Sintassi di esempio | Spiegazione |
| ADJ | moto adj strada | Trova sia moto strada che strada moto. |
| NEAR | "Jordan" near basket | I termini richiesti devono apparire nei documenti con una distanza massima di 25 parole. Nellesempio quindi vengono ricercate non solo pagine che fanno riferimento a Jordan ma anche documenti nei quali appare Jordan e la parola basket con la clausola che questa parola non sia distante più di 25 parole da Jordan. |
| FAR | Baggio far calcio | E l opposto di near. Infatti troverà le pagine che contengono i termini indicati distanziati di almeno 25 termini. |
| BEFORE | Wind before surf | Simile alloperatore and, si differenzia da questa perché i termini devono apparire nell ordine specificato. |
Mamma
Alcune caratteristiche:
Northernlight
Alcune caratteristiche:
Ragno Italiano
Alcune caratteristiche:
Shinyseek
Alcune caratteristiche:
Virgilio
Alcune caratteristiche:
| Tipologia della ricerca | Caratteristica | |
| Semplice | Permette di specificare una o più parole da utilizzare per la ricerca. | |
| Con più termini | Permette di specificare i termini della ricerca ed i termini da non cercare. | |
| Allinterno di un sito | Alcuni siti sono molto grandi e complessi e pur sapendo che le informazioni da ricercare sono sicuramente all'interno di un determinato sito, può essere lungo e difficile ritrovarle. | |
| Nel titolo di una pagina | ll titolo di un pagina è spesso assai esplicativo. Viene quindi effettuata la ricerca limitandola al solo tag <Title> presente nelle pagine. | |
| Nell'URL | Per trovare pagine web anche limitando le ricerche all'interno del loro indirizzo o URL (Uniform Resource Locator). Ad esempio se cerco la parola "pippo" troverò risultati simili a questo: http://www.dnp.co.jp/gallery/info/pippo/pippo.html | |
WebCrawler
Alcune caratteristiche:
Yahoo!
| http://www.yahoo.com | http://www.yahoo.it |
Alcune caratteristiche:
Il
Motore
Alcune caratteristiche:
Internet Sleuth
Alcune caratteristiche:
| Argomento della ricerca | Motori di ricerca usati | |
| Finanza | CNN Financial News, Business Wire, Hoover's Company Capsules, PR Newswire, APL Quote Service | |
| News e headlines | AP Headlines, News Tracker, Washington Post Headlines, Electronic Newsstand | |
| Newsgroup in Usenet | AltaVista Usenet News, Deja News, HotBot, Reference.com | |
| Software | Info-Mac, Shareware.com, Winsite Windows Software | |
| Sport | CNN/Sports Illustrated, Indy Car Racing Mag, Sport Quest, The Sporting News, USA Today | |
Metacrawler
Alcune caratteristiche:
Profusion
http://profusion.ittc.ukans.edu
Alcune caratteristiche:
| Tipologia della ricerca | URL | "Motore di ricerca" |
| Software (Share e Free), files | http://www.filez.com/zhub.shtml | Filez |
| http://ftpsearch.lycos.com | FTPSearch | |
| http://www.shareware.com | Shareware | |
| http://www.tucows.com | Tucows | |
| http://www.download.com | CNet Download | |
| News Engines (per ricerche nei Newsgroup) | http://www.deja.com/home_ps.shtml | Dejanews |
| Web Forums | http://www.forumone.com | Forum One |
| Indirizzi di E-mail | http://www.bigfoot.com | BigFoot |
| http://people.yahoo.com | Yahoo! People Search | |
| http://www.iaf.net | Internet Address Finder | |
| http://whowhere.lycos.com | WhoWhere | |
| Nome del Dominio | http://www.ibc.wustl.edu/ibc/domain_form.html | Wustl |
| Internet Service Providers | http://www.thedirectory.org | The Directory |
| Mappe di città del mondo | http://www.mapquest.com | MapQuest |
| Immagini | http://image.altavista.com | AV Photofinder |
| http://isurf.interpix.com/ | ISurf | |
| Erotismo | http://www.yahoosex.net | Yahoo!Sex |
| Numeri telefonici mondiali | http://www.wajens.no | Internat. White & Yellow Pages |
| File Audio e video | http://mp3.lycos.com | MP3 by Lycos |
| http://www.whoopie.com | Whoopie! |