PageRank
Da Wikipedia, l'enciclopedia libera.
Il PageRank è un algoritmo di analisi che assegna un peso numerico ad ogni elemento di un collegamento ipertestuale d'un insieme di documenti, come ad esempio il World Wide Web, con lo scopo di quantificare la sua importanza relativa all'interno della serie. L'algoritmo può essere applicato a tutte le collezioni di entità con reciproche citazioni e riferimenti. Il peso numerico che assegna ad un dato elemento E è chiamato anche il PageRank di E, contrassegnato da PR (E).
Il processo PageRank è stato brevettato (brevetto US 6285999) dalla Stanford University; è inoltre un termine ormai entrato di diritto nel lessico dei fruitori dei servizi offerti dai motori di ricerca. Il nome PageRank è trademark di Google.
Letteralmente traducibile come rango di una pagina web (ma anche un gioco di parole collegato al nome di uno dei suoi inventori, Page), il pagerank è facilmente riconducibile al concetto di popolarità tipico delle relazioni sociali umane, ed indica, o si ripromette di indicare, le pagine o i siti di maggiore rilevanza in relazione ai termini ricercati. Gli algoritmi che rendono possibile l'indicizzazione del materiale presente in rete utilizzano anche il grado di popolarità di una pagina web per definirne la posizione nei risultati di ricerca.
È bene tenere presente che il pagerank ha una valenza democratica nella quale il diritto al voto è permesso dalla semplice pubblicazione di una pagina web, e il voto viene espresso attraverso i collegamenti presenti nella suddetta pagina. Maggiore sarà il grado di popolarità di un sito, maggiore risulterà essere il valore dei voti (link) che quello stesso sito può esprimere.
L'interpretazione e la definizione della popolarità di un sito non sono però legate soltanto a queste votazioni democratiche, ma tengono presente anche della pertinenza del contenuto di una pagina, nonché delle pagine correlate, con i termini ed i criteri della ricerca effettuata. Questo permette, o perlomeno ha lo scopo, di attuare un controllo incrociato che garantisca la validità dei risultati di ricerca.
Indice |
[modifica] Visualizzazione del grado di popolarità di un sito
Ottenere informazioni riguardo la notorietà di una pagina web in Google è possibile attraverso l'installazione della Google Toolbar da affiancare ad un browser per la navigazione, oppure utilizzando servizi proposti da terze parti in grado di determinare tale informazione ed implementabili su siti internet.
[modifica] Formula semplificata
L'algoritmo completo per il calcolo del PageRank fa ricorso all'uso della teoria dei processi di Markov ed è classificato nella categoria degli algoritmi di Link Analysis Ranking. Dalla formula inizialmente sviluppata dai fondatori di Google, Sergey Brin e Larry Page, è possibile comprendere come il PageRank viene distribuito tra le pagine:
Dove:
- PR[A] è il valore di PageRank della pagina A che vogliamo calcolare
- T1...Tn sono le pagine che contengono almeno un link verso A
- PR[T1] ... PR[Tn] sono i valori di PageRank delle pagine T1 ... Tn
- C[T1] ... C[Tn] sono il numero complessivo di link contenuti nella pagina che offre il link
- d (damping factor) è un fattore deciso da Google e che nella documentazione originale assume valore 0,85. Può essere aggiustato da Google per decidere la percentuale di PageRank che deve transitare da una pagina all'altra e il valore di PageRank minimo attribuito ad ogni pagina in archivio.
[modifica] Voci correlate
- Googlebombing
- Metodo delle potenze: metodo iterativo per il calcolo di autovettori utilizzato nell'algoritmo Page rank
[modifica] Collegamenti esterni
- La guida, nel sito di Google, alle funzioni di ricerca con la descrizione del significato di PageRank
- (EN) Sergey Brin; Larry Page. inglese The Anatomy of a Large-Scale Hypertextual Web Search Engine. 1998. URL consultato il 09-03-2007.
Servizi e strumenti principali
Ricerche (PageRank): Alerts • Blogs • Books • Catalogs • Code • Finance • Images • News • Patents • Product • Scholar • Trends • Groups • Video • Web
Applicazioni Web: Bookmarks • Docs • Calendar • Gmail • iGoogle • Maps • Mars • Moon • Notebook • Reader • Translate • Web History
Applicazioni per Webmaster: AdSense • AdWords • Analytics • Apps • Checkout • DoubleClick • FeedBurner • Personalized Search • Webmaster Tools
Applicazioni Web 2.0: Base • Blogger • dodgeball • Groups • JotSpot • orkut • Page Creator • Picasa Web Albums • Video • YouTube
Applicazioni per Computer: Browser Sync • Desktop • Earth • Gears • Goobuntu • Hello • Pack • Picasa • SketchUp • Talk • Toolbar • Updater
Direzione aziendale
Chairman/CEO: Eric E. Schmidt • Direttore/Presidente Tecnologico: Sergey Brin
• Direttore/Presidente Prodotti: Larry Page • CFO: George Reyes
Altri Direttori: John Doerr • John L. Hennessy • Arthur D. Levinson • Ann Mather • Michael Moritz • Paul Otellini • Ram Shriram • Shirley M. Tilghman
Informazioni aziendali
Fondazione Google • Google.org
Borsa valori: (NASDAQ: GOOG, LSE: GGEA) • Fatturato (2006): 7.14 miliardi di US$
Dipendenti (2007): 12'238 • Slogan: Don't Be Evil • Sito web: www.google.com
Vedi anche
Acquisizioni • Comandi • Googlebombing • Googlebot • Googleplex • Googlewhack • Labs • Lunar X Prize • Sitemap • Zeitgeist