Dal Boolen language al potente Google. Come cambia il modo di pensare, di parlare, e di cercare.

cambiamento linguaggio motori ricercaQuesto articolo è frutto di una ricerca iniziata più di qualche tempo fa (più di un anno) i cui risultati venivano controllati non continuativamente ma, per la natura stessa dell’oggetto di studio, ad un intervallo di tempo irregolare.

Un interesse per la linguistica, mi aveva portato a prestare attenzione a come il linguaggio delle persone cambia al cambiare delle abitudini, e a mutare di pari passo ogni qualvolta la società accetta dei cambiamenti più o meno importanti. Il modo di parlare, quindi, unito ai motori di ricerca, mia passione principale, è stato il binomio perfetto che ha costituito la base di questo approfondimento.

Cambia il modo di parlare, cambiano i motori di ricerca. Alla base di questa considerazione, come sappiamo bene, c’è il fatto che molti fattori della nostra vita cambiano costantemente, si evolvono, no sono più idonei al momento che stiamo percorrendo. Anche il linguaggio, quindi, cambia regolarmente. Come ogni cosa, i motori di ricerca, per sopravvivere ai cambiamenti, devono adattarsi e cambiare costantemente anche il loro modo di offrire i risultati.

Il modo più facile per comprendere questo, è partire un po’ da lontano e rendersi conto dei comportamenti che i motori ricerca adottavano quando offrivano i risultati delle ricerche.
Il modo in cui la gente oggi effettua ricerche su internet, è lontano anni luce da come interpretava i motori più di una quindicina di anni fa. Prendendo per esempio gli albori dei motori di ricerca (sarebbe più corretto dire “strumenti poi hanno dato il via allo studio dei motori di ricerca”) ovvero Archie, Gopher, Jughead e Veronica, per riuscire a trovare qualcosa dai loro indici bisognava digitare una stringa altamente specifica. Infatti, considerando i primissimi (Archie e Gopher) per trovare un file, bisognava conoscere esattamente dove questo era dislocato. Bisognava in sostanza, indicare recisamente una frase ch si trovava nel documento di testo che stavamo cercando. Con Jughead e Veronica (che lavoravano sostanzialmente con la stessa logica, ovvero rendendo gli utenti capaci di trovare documento attraverso la digitazione di keywords, ma che ancora non possiamo accostarlo a un motore di ricerca come lo pensiamo oggi, questo venne solamente con Wandex nei primi anni 90) venne fatto un passo in avanti, ma il criterio rimaneva ancora sostanzialmente rudimentale. Nonostante questi modelli che, a mano a mano, subirono avanzamenti, i criteri di ricerca dovevano attenersi comunque a delle linee guida rigide. Il linguaggio naturale con cui noi oggi affrontiamo una ricerca non avrebbe quindi prodotto niente in quel periodo. Gli utenti, dovevano specificare che cercavano “questo e non quello” o “esattamente questa frase”, utilizzavano quindi il linguaggio Boolean per trovare un determinato documento o file. In sostanza il metodo Boolean indicava una tecnica di ricerca che si basava sul restringimento di termini fino al punto di arrivare a far combaciare i risultati della ricerca con la query desiderata.

Facciamo un esempio. Negli indici di un motore, ci potevano essere 2000 pagine dedicate alla parola “lago” altre 2000 dedicate alle parole “acqua dolce”, con un criterio di ricerca “lago acqua dolce” sarebbero potute ritornare 4000 pagine invece, con questo metodo di ricerca, potevamo avere una frazione di queste 4000 pagine che rimandavano solamente ai risultati che avevano “lago acqua dolce” nel testo. Continuando la ricerca per farla diventare ancora più specifica potevamo aggiungere un altro elemento che poteva essere quello “non in Italia”, così avremmo eliminato ancora una fetta di risultati e avremmo avuto solamente i risultati che rimandavano ai laghi di acqua dolce non in Italia. Abbiamo implicitamente utilizzato tre operatori che venivano utilizzati nel criterio di ricerca Boolean “e” “o” oppure “no” rispettivamente con i segni “+”,” –“, “o” (questo qui veniva utilizzato di default e rimandava tutte le pagine con “lago” e “acqua dolce”). Un altro operatore utilizzato era quello delle parentesi, ovvero digitando “lago acqua dolce” dentro la parentesi, si eliminavano tutti quei risultati che non avevano queste parole vicine l’una con l’altra. Un antesignano delle virgolette che si usano ora. (Se si prova a fare questa ricerca ora, Google mostra anche i risultati tra parentesi).

Da allora come sappiamo le pagine sul web sono centuplicate e con esse, anche gi utenti che cercano su internet. Era anche ovvio che anche il modo in cui gli utenti cercano cambiasse. Oggi le persone digitano la query esattamente come loro si esprimono nel linguaggio parlato. Se stessimo cercando informazioni sulle camicie su misura a Milano digiteremmo sicuramente “camicie su misura a Milano”, cosi come ci passa per la mente, esattamente come lo diremmo a voce, e i motori di ricerca sono ben equipaggiati ed intelligenti da gestire questo linguaggio naturale. Digitando infatti “camicie su misura a Milano” Google suggerisce anche diversi risultati, che coincidono perfettamente con il più comune dei linguaggi come “camicie su misura Milano prezzi”, quindi, in sostanza, anticipa il nostro pensiero in base a ciò che la gente presuppone stia pensando. Questo perché si è evoluto in base ai modi di parlare delle persone utilizzando ancora oggi la logica del Boolean language.

Con l’aumento esponenziale delle pagine web e degli utenti, doveva necessariamente restituire i risultati in questo ordine di cose. I motori di ricerca oggi applicano automaticamente gli operatori del linguaggio Boolean e stabiliscono quali stop words non saranno considerate (per esempio gli articoli determinativi) usando invece le congiunzioni e gli operatori di vicinanza come “e” (and) e per stabilire la connessione e la prossimità delle parole e quindi la pertinenza del documento con ciò che abbiamo digitato nella stringa di ricerca, che incide, in ultima analisi, sul ranking. Solamente un anno fa Google non offriva alcuni termini del linguaggio parlato che offre ora, o anche alcune soluzioni. Frutto di una costante ricerca di avvicinarsi sempre di più al modo di pensare dell’uomo per dare soluzioni quasi esattamente coincidenti con quello che la gente pensa. I motori di ricerca saranno sempre più intuitivi.

C’è quindi bisogno che anche le keywords che scegliamo per i nostri siti, e i nostri contenuti, siano all’altezza della situazione.

Scritto da    |   gennaio 23rd, 2010   |   2 Commenti

2 Responses to Dal Boolen language al potente Google. Come cambia il modo di pensare, di parlare, e di cercare.

Rispondi a edmondantes Annulla risposta