|
GOOGLE SPERIMENTA IL TRUSTRANK
Google sperimenta l'evoluzione del Pagerank verso il Trustrank. La crescita smisurata delle informazioni sul web ha favorito l'ascesa dei motori di ricerca rispetto alle vecchie directory basate sulla recensione manuale. Dalla fine degli anni '90 gli spider dei search engine hanno scandagliato la giungla internet recensendo automaticamente gran parte dei siti web. Negli ultimi anni Google ha definitivamente vinto la "guerra dei motori" tramite il famoso algoritmo del Page Ranking in grado di associare automaticamente un valore qualitativo alle informazioni contenute su un sito web. La pagina web più linkata dall'esterno beneficia di un high page rank. Perlomeno in teoria, poiché nel tempo gli algoritmi sono stati continuamente perfezionati. Il page rank è stata la tecnica più utilizzata per attribuire un giudizio automatico di qualità alle informazioni.
Sempre più spesso questo sistema viene però messo a dura prova dalle attività di web spam. Abili webmaster analizzano continuamente le logiche dello spider costruendo pagine web ad hoc per essere ai primi posti sui motori di ricerca, anche se prive di valore informativo o fuorvianti. Finora la corsa tra l'inteligence dei laboratori di Google e gli spammers ha visto vincere il search engine con algoritmi negli spider sempre più perfezionati. Una corsa che non ha lasciato indietro gli spammers. Le tecniche di web spam utilizzate sono state costantemente perfezionate. Si va dalla creazione di pagine mirror all'inserimento di link nascosti verso siti equivoci dalle pagine buone (honey pot), la presenza siti cloni nelle directory internazionali, la creazione di directory aggiornate col risultato dei risultati dei motori di ricerca (cd spam engine), l'inserimento di link in chat e forum, link e parole chiave nascoste nel testo ecc. In breve, gli spammers non sono rimasti con le mani in mano.
Oggi però qualcosa sta cambiando e rumors di settore parlano dell'avvento del sistema TrustRank. Gli spider automatici manifestano una crescente difficoltà nello stabilire con precisione la presenza dello spam nelle pagine web. Il Google PR determina l'importanza di un sito web ma non il suo valore in termini di credibilità del contenuto.
Cosa è il TrustRank? Il limite degli algoritmi automatici basati sul PageRank potrebbe essere superato soltanto tramite un intervento umano in grado di giudicare la qualità delle informazioni e distinguere lo spam dalle attività d'informazione. Solo l’occhio umano riesce a stabilire una verità certa. Per ogni sito web un operatore umano attribuirà un valore di "spam status" pari a 0 (bad page) o 1 (good page) per distinguere lo spam. Un ritorno al passato delle directory? Non esattamente, l'intervento umano del Trust Rank scatta soltanto dopo una classificazione semi-automatica delle informazioni (Trust Rank). Il marchio TrustRank è stato registrato di recente da Google Inc presso la U.S. Patent and Trademark Office (marzo 2005) e tutto lascia intendere per un suo utilizzo futuro.
Il PageRank non scomparirà in futuro. Il TrustRank si presenta come un metodo complementare in grado di affinare e migliorare i risultati dello spider. L'intervento umano, anche se sostenuto dagli algoritmi semiautomtici di classificazione, implica un gran dispendio di tempo e di risorse che, in ottica puramente aziendale, nessun motore di ricerca vuole sostenere. D'altro canto, il peggioramento della qualità dei primi risultati nei search engine può comportare nel lungo periodo un serio problema di esistenza per Google.
Torna alla pagina degli articoli
|
|
|