Google In Pillole

  • Uploaded by: Luca Dionisi
  • 0
  • 0
  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Google In Pillole as PDF for free.

More details

  • Words: 9,425
  • Pages: 23
Google in Pillole

Lo strano caso del Dr. Jekyll e Mr. Hyde.

di Luca Dionisi / aabb 2006/2007 Accademia di Belle Arti di Urbino [email protected]

Questo libro è distribuito sotto licenza Creative Commons 2.5 (Attribuzione, Non commerciale, Condividi allo stesso modo), puoi trovare una copia integrale della licenza all’indirizzo web http://www.creativecommons.org/licenses/by-nc-sa/2.5/it/legalcode/ Attribuzione - Non commerciale - Condividi allo stesso modo 2.5 Tu sei libero: di riprodurre, distribuire, comunicare al pubblico, esporre in pubblico, rappresentare, eseguire e recitare quest’opera, di modificare quest’opera. Alle seguenti condizioni: Attribuzione. Devi attribuire la paternità dell’opera nei modi indicati dall’autore o da chi ti ha dato l’opera in licenza e in modo tale da non suggerire che essi avallino te o il modo in cui tu usi l’opera. Non commerciale. Non puoi usare quest’opera per fini commerciali. Condividi allo stesso modo. Se alteri o trasformi quest’opera, o se la usi per crearne un’altra, puoi distribuire l’opera risultante solo con una licenza identica a questa. 12. Ogni volta che usi o distribuisci quest’opera, devi farlo secondo i termini di questa licenza, che va comunicata con chiarezza. 13. In ogni caso, puoi concordare col titolare dei diritti d’autore utilizzi di quest’opera non consentiti da questa licenza. Le utilizzazioni consentite dalla legge sul diritto d’autore e gli altri diritti non sono in alcun modo limitati da quanto sopra. . Questo libro può essere richiesto a [email protected]

Introduzione - Lo strano caso del Dr. Jekyll e Mr. Hyde

p. 4

cap. I - La nascita di Google - Le origini - Google Inc. - I servizi - L’entrata in borsa di Google

p. 5 p. 5 p. 6 p. 6

cap. II - Le Google Armi - Spider e Page Rank - L’interfaccia grafica e la pubblicità - Il Google Plex - Il Google Pensiero

p. 7 p. 8 p. 9 p. 10

cap. III - Google - OpenSource e Hacker Comunity - Piccole differenze tra FreeSoftware e Open-Source - Campagna “Summer of Code” - Assunzioni particolari - In sintesi

p. 13 p. 13 p. 14 p. 14

cap. IV - Google e Privacy - La strategia dell’accumulo - Privacy dell’utente - La normativa - Le opinioni della comunità di Ippolita - A proposito della Gmail: un esempio per tutti - La Google History - In sintesi

p. 15 p. 16 p. 17 p. 17 p. 18 p. 18 p. 19

cap. V- Altre maliziose funzionalità - Google Bombing - Google hacking

p. 20 p. 21

Conclusioni

p. 22

Riferimenti: - Bibliografia - Linkografia

p. 23 p. 23

Introduzione: Google: Lo strano caso del Dr. Jekyll e Mr. Hyde. Scopo della presente ricerca è quello di mettere in luce la doppia faccia della stessa medaglia di quello che oggi è il motore di ricerca per eccellenza: GOOGLE. Come per ogni giallo che si rispetti, la storia necessita di un “buono” e di un “cattivo”; ma siamo sicuri che essi debbano essere necessariamente due individui distinti? La storia dimostra che l’uomo ed ogni suo prodotto porti in sé entrambi gli elementi e, come verrà dimostrato nel corso della presente tesi, anche questo network di ricerca si presenterà, in momenti differenti della trattazione, sia come eroe conclamato sia come antagonista del cyberspazio. Ciò che si vuole perseguire non è ottenere un’assoluta condanna o assoluzione del fenomeno (“come assolvere il Dr. Jekyll e condannare a morte Mr. Hyde?” La pena o il premio dell’uno sarebbero consequenziali anche per l’altro!), ma ad analizzare criticamente una realtà a livello storico, dalle sue origini allo status quo, a livello tecnologico, economico e, conseguentemente, filosofico per potersi confrontare con essa e poter trarre personali fondate conclusioni. Google aspira ad essere il motore di ricerca perfetto, in grado di capire esattamente le richieste degli utenti e restituirgli esattamente quello che desiderano, per questo risulteranno evidenti grandi pregi e qualità del sistema per il singolo utente, ma altrettante potenziali minacce e difetti per la comunità cybernetica; si porranno dubbi e ipotesi sulle modalità di studio, investimento e lavoro dell’azienda Google Inc.; si presenteranno alcune tecniche di utilizzo non previste di questo sistema che forniranno nuovi spunti di riflessione sull’argomento ... che l’indagine abbia inizio! 4

cap. I - La nascita di Google: Le origini: La parola Google deriva da “Googol”, termine matematico che indica 1 seguito da 100 zeri: leggenda vuole che questo fosse il numero di pagine web che Lary Page e Sergey Brin sognavano di indicizzare per il loro nuovo strumento di ricerca. Larry Page e Sergey Brin si incontrano nel 1995 a Stanford, entrambi affascinati dalla crescita vertiginosa del Web e ai problemi connessi alla ricerca e all’indicizzazione delle informazioni; si dedicano al progetto “BackRub” il quale verrà ribattezzato “Google” nel 1997 quando verrà dotato di una pagina Web. Per tutto il primo anno e mezzo di vita il progetto Google viene testato per mezzo di software liberi messi a disposizione delle comunità Free Software e Open Source a partire dal sistema operativo GNU/Linux. A metà del 1998 Google serve circa 10.000 richieste di ricerca al giorno, non era altro che un sistema casalingo ammassato nella stanza affittata da Page e Brin. L’uscita dall’università viene attribuita all’incontro con Andy Bechtolsheim, fondatore della Sun, che stacca ai due ricercatori un primo assegno da centomila dollari e la sede di Google si trasferisce in un ufficio spartano all’interno di un garage, ma dotato di alcuni confort non indifferenti: una lavatrice, un essiccatore e un idromassaggio (fin dal principio, la filosofia aziendale di Google è all’insegna della soddisfazione dei lavoratori).

Primo logo di Google, 1998

Google Inc.: Nel gennaio del 1999 Google abbandona definitivamente il campus di Stanford, dichiarando: “Il progetto di ricerca Google è diventato Google Inc. Vogliamo dare al mondo ricerche di qualità superiori e migliori di quelle che ci sono ora. Abbiamo cominciato ad assumere altre persone e ad acquistare altri server per rendere il nostro sistema scalabile. Abbiamo anche cominciato a lanciare il nostro spinder più frequentemente, e i nostri risultato non solo sono rimasti veloci come prima, ma sono anche diventati più aggiornati. Stiamo assumendo persone di grande talento molto rapidamente e questo ci porta le migliori e ultime tecnologie per quanto concerne il web”, inoltre, dedicano qualche riga ai 10 buoni motivi per lavorare per Google, incluso tecnologie, azioni, snacks e bevande gratis, e la possibilità che milioni di persone “usino e apprezzino il vostro software”. Tra il 1998 e il 1999 mentre tutti i motori di ricerca e i siti più popolari del mondo sono affetti dalla sindrome da portale (una vera e propria mania per la costruzione di siti per trattenere i visitatori sulla propria pagina ad ogni costo, includendo sempre più servizi e pubblicità), Google rimane l’unico strumento privo di pubblicità e servizi aggiuntivi: solo motore di ricerca, per altro il migliore, il più veloce, e senza legami commerciali o sponsor. Il 7 giugno del 1999 Google può annunciare che la Sequoia Capital e la Kleiner Perkins Caufield & Byers gli hanno concesso un finanziamento da 25milioni di dollari. Agli inizi del 2000 Google serve 18 milioni di ricerche al giorno e il suo indice di documenti conta un miliardo di unità; sei mesi dopo le ricerche sono a 60 milioni, offre: diciassette tipologie di servizi di ricerca su database di immagini, blog, notizie, libri, mappe, video e molto altro. 5

I servizi: Nel 2001 Google lancia “Google Immagini”, un motore di ricerca per immagini che in poche settimane diventa una delle principali fonti di produzione fai-da-te e rappresenta uno dei più grandi database di immagini presenti sul web. Nell’aprile dello stesso anno nasce “Google Gruppi”, con un’interfaccia piuttosto semplice ed accattivante per seguire facilmente complessi argomenti di discussione. Dal 2001 in poi i servizi nascono a ripetizione. Senza nessuno scopo evidente ne ritorni economici immediati, come se Brin e Page si divertissero a mostrare che un datacenter sconfinato è in grado di elaborare quasi qualsiasi sogno tecnologico. L’esempio più eclatante è il potentissimo Google Maps, per la Terra, Marte, o per la Luna (2005-2006), un set di software messo a disposizione gratuitamente per visualizzare con immagini satellitari una ricostruzione dettagliata della superficie dei pianeti; nello stesso anno vedono la luce “Google News”, che mete a disposizione l’enorme database d’informazioni di Google al servizio della produzione giornalistica, e Gmail che offre un GB di spazio mail per ogni utente. Proprio l’enorme disponibilità di spazio incita a lasciare le proprie mail sui server di Google. Inoltre, poiché la propagazione del servizio avviene mediante inviti, vengono offerte a Google informazioni essenziali sui propri conoscenti e amici.

L’entrata di Google in borsa: Page e Brian avevano dilazionato la necessità di diventare una società quotata in borsa, temendo che un rendiconto pubblico dei propri guadagni avrebbe reso il loro lavoro molto più difficile, mettendo appunto Google in condizioni di essere monitorato più facilmente e quindi attaccato dai concorrenti sul mercato. Dopo il 2004 Google Inc. per questioni legali è costretto ad entrare in borsa, venendo meno all’affermazione fatta anni prima “Google non è un compagnia convenzionale, e non abbiamo nessuna intenzione di diventarlo”. In un solo Giorno di contrattazione sul mercato le azioni di Google passano dalla base di 85 dollari a 100 dollari, con un guadagno netto di 1 miliardo e mezzo di dollari. Un anno dopo le azioni raggiungono il valore di 400 dollari con un aumento di oltre il 300 percento. 6

cap. II - Le Google Armi Per capire a pieno come il gigante della ricerca online sia potuto diventare in pochi anni il “signore” della rete, occorre conoscere le “armi” e le strategie che Google utilizza per mantenere il monopolio dell’informazione. Google è un motore di ricerca per Internet che non si limita a catalogare il World Wide Web, ma si occupa anche di immagini, foto, newsgroup e notizie, oltre a mantenere una copia cache di tutte le pagine indicizzate. Con un indice che comprende più di otto miliardi di pagine Web, è riconosciuto come il più grande e affidabile tra i motori di ricerca, occupandosi dell’ 80% di tutte le ricerche effettuate su internet attraverso il suo sito e avendo clienti come AOL o Microsoft. La popolarità di Google è talmente grande che nella lingua inglese è nato il verbo “to google” col significato di “fare una ricerca sul web”. Il bagaglio tecnologico posseduto da tale network risulta costituito sia da strumenti standard essenziali per la creazione di un motore di ricerca, come lo Spider, ma anche da una serie di mezzi “esclusivi”, frutto di ricerche, politiche ed investimenti compiuti con strategie di marketing innovative che hanno permesso alla società in oggetto di distinguersi nel campo e di ottenere un tornaconto d’immagine sia rispetto all’utenza che al mercato vero e proprio. Tutto ciò rientra in un’ottica di sviluppo economico dell’azienda che, accrescendo l’indice di gradimento del proprio pubblico, potenzia il proprio valore economico in borsa.

Spider e Page Rank Gli strumenti base utilizzati dal motore di ricerca Google per allestire il suo database di informazioni sono essenzialmente due, lo Spider e il PageRank. Lo Spider è un applicativo che nella maggior parte di casi, viene sviluppato nei laboratori degli stessi motori di ricerca. Il suo scopo è quello di navigare saltando da un link all’altro sulle pagine del web raccogliendo informazioni: formati dei documenti, parole chiave, autori delle pagine, ulteriori link, etc. Al termine della sua esplorazione il software-spider consegna il tutto al database che archivierà le informazioni. Inoltre lo Spider deve preoccuparsi di captare le variazioni di ogni sito e quindi programmare una successiva visita per immagazzinare nuovi dati. Per dare un’idea della potenza di calcolo delle “macchine” sui quali risiedono gli Spider, vengono descritti computer capaci di convertire indirizzi Internet in sequenze univoche di byte utili come indici per il database in 0.5 microsecondi e capaci di eseguire 9000 spider in contemporanea; scendendo nel concreto, si tratta di sistemi in grado di analizzare e immagazzinare circa 50 milioni di nuove pagine al giorno. Il PageRank è l’algoritmo che permette a Google di assegnare un valore alle pagine indicizzate dallo spider. Letteralmente traducibile come “rango di una pagina web”, il pagerank è facilmente riconducibile al concetto di popolarità tipico delle relazioni sociali umane, ed indica, o si ripromette di indicare, le pagine o i siti di maggiore rilevanza in relazione ai termini ricercati. È bene tenere presente che il pagerank ha una valenza democratica nella quale il diritto al voto è permesso dalla semplice pubblicazione di una pagina web e il voto viene espresso attraverso i collegamenti presenti nella suddetta pagina. Maggiore sarà il grado di popolarità di un sito, maggiore risulterà essere il valore dei voti (link) che quello stesso sito può esprimere. L’algoritmo è stato sviluppato da Larry Page e Sergey Brin all’Università di Stanford, si fonda sulle scoperte matematico-statiche di Andrej Andreevic Markov, che nei primi anni del XX secolo analizzò i fenomeni statici sui sistemi chiusi. Questo algoritmo rappresenta un’esclusiva di Google, che gli permette di distinguersi rispetto ai propri concorrenti, fornendo un valore aggiunto alla propria azienda. 7

L’interfaccia Grafica e la Pubblicità: Mentre l’algoritmo e l’architettura della base di dati sono elementi del motore di ricerca che rimangono invisibili all’utente, l’interfaccia grafica di Google è progettata e gestita come immagine di Google stesso. Sulla pagina di Google ci troviamo di fronte un’interfaccia lineare composta da elementi essenziali, ciascuno con una funzione bene precisa. La disposizione di testi e immagini è minimale e si avvale dell’utilizzo di elementi grafici ricorrenti, ad esempio l’impiego di colori elementari, le immagini usate sono qualitativamente omogenee, ecc. Lo stile di progettazione dell’interfaccia è sobrio, quasi scarno, riempita da un unico elemento “vuoto”, il Blank Box, che rassicura l’utente e tende a indurre comportamenti attivi, invece di provocare smarrimento dato dall’assenza di punti di riferimento, o viceversa dalla presenza di input visivi sovrabbondanti, evitando in questo modo la confusione generata da pagine troppo piene. Da questa identificazione visiva immediata ne deriva una facilità d’uso nettamente superiore rispetto a quella dei concorrenti. La pulizia grafica delle pagine viene esaltata da un’ottima gestione visiva degli aspetti commerciali. Non è presente nessun link pubblicitario in homepage o nelle pagine di documentazione e informazione: la pubblicità in Google si trova solo tra i risultati delle ricerche, appositamente separata dai risultati proposti. Sicuramente alla base delle scelte grafiche ed estetiche dell’interfaccia, unico spazio che permette al sistema di mostrarsi visualmente all’utente, sono studi e ricerche approfonditi e mirati effettuati dall’azienda sia al fine di agevolare l’accesso e l’utilizzo da parte del pubblico (e in questo si può ancora notare l’eccellenza accademica del team di lavoro) che di ottenere indirettamente, grazie a tali agevolazioni tacitamente offerte, il suo consenso ed apprezzamento.

8

Il Google Plex: Fin dalla nascita di Google, Larry Page e Sergey Brin si sono dedicati prima di tutto alla soddisfazione dei loro dipendenti, capendo prima di molti altri come un azienda fatta di lavoratori soddisfatti del proprio lavoro produca molto di più rispetto ad una fatta da lavoratori frustrati, schiacciati da gerarchie soffocanti, legati a orari di lavoro fissi, regole rigide ed ambienti opprimenti. Il Google Plex non è altro che l’edificio che ospita gli attuali uffici Google a Mountain, in California. In questo ambiente è stata ricreata l’atmosfera del campus universitario americano, dove studio, impegno, sport e svago formano un tutt’uno, basandosi sulla precisa necessità di avere lavoratori felici di lavorare e di considerare prioritari gli obbiettivi aziendali. Al suo interno si possono trovare: palestre aziendali, piscine, cibo gratis nei 4 ristoranti (di cui uno vegetariano), drink e snack gratis ovunque, campi da pallavolo, campi da basket e spazi all’aria aperta per fare sport, monopattini a motore per spostarsi tra i vari edifici del campus-azienda, un asilo nido, un asilo, scuole elementari per i bimbi dei dipendenti, uno studio dentistico, completamente gratuiti (in un paese come gli USA in cui l’istituzione e la sanità sono un lusso per pochi, si tratta di opportunità ancora più incredibili). I dipendenti sono dotati di postazioni di lavoro all’avanguardia: monitor da LCD 21’’, schermi al plasma, giochi e giocattoli, lampade lava onnipresenti dai colori fluorescenti. Google Plex è un luogo da sogno, immerso nel verde dove gli orari di lavoro sono flessibili e dove tutto sembra possibile, questo per diffondere la filosofia dell’abbondanza di Google fra i dipendenti. Questa è la filosofia dell’azienda Google: mens sana in corpore sano! Tale politica non è una novità creata dall’azienda, essendo basata su studi sociologici e psicologici ormai collaudati, però va reso merito alla società che l’ha fatta propria ed applicata al suo interno ottenendo grandi risultati! Ma Google è un canale di comunicazione e come tale potrebbe veicolare tramite se stesso la propria immagine... Questo almeno è quanto risulta da una verosimile email che ha fatto il giro di tutte le caselle di posta di Microsoft, inoltrata da un exdipendente Google ora passato a Redmond. A riprenderla e diffonderla in rete è stato un blog (http://no2google.wordpress.com/2007/06/24/life-at-google-the-microsoftie-perspective/), fonte che però ha subito allontanato da sé la paternità del testo. I punti della mail sono in sostanza una confutazione e una contestualizzazione di molti miti che girano intorno alla vita al Googleplex e alle mille agevolazioni di cui si potrebbero avvantaggiare i dipendenti Google rispetto a quelli Microsoft. Solo per curiosità e imparzialità, al fine di ottenere un’immagine effettiva della realtà Google che si sta analizzando, si riportano i punti contenuti nella suddetta email, senza voler screditare l’efficacia e l’effettività di tale modello di lavoro adottato e da molti invidiato: - nonostante si entri al lavoro tra le 10 e le 18 quasi tutti sono disponibili 24 ore su 24 e 7 giorni su 7, quasi sempre lavorando da casa; - molti non dedicano il famoso 20% del tempo a progetti personali e i manager di certo non invitano a farne partire uno; - ci sono uffici con pareti di vetro, open space e in molti hanno la scrivania nei corridoi perché non c’è altro spazio; - è vero che chi viene dal college può lasciare che Google si occupi di tutto. A quel punto però è più difficile pensare di andarsene; - Google non dà valore alle precedenti esperienze di lavoro, ma ne dà molto ai titoli di studio specialmente a Stanford; - i salari di Google sono più bassi di quelli di Microsoft.

9

Il Google Pensiero: L’immagine è anche e soprattutto la “Filosofia” dell’azienda. On line si possono trovare dieci punti, i dieci comandamenti del buon Google. Si inizia con un cappello introduttivo, che enuncia lo stile: “Mai accontentarsi del meglio”; infatti, come afferma Larry Page, l’obiettivo ultimo è “Il motore di ricerca perfetto”, che “dovrebbe capire esattamente la richiesta dell’utente e restituire esattamente ciò che egli desidera”. Google vuole essere per tutti, soddisfare i desideri di tutti, portare la felicità nel mondo. Per farlo, segue quelle che definisce le sue “Dieci verità”: 1. Attenzione all’utente: tutto il resto viene dopo. La crescita di Google è stata frutto del passaparola, che ha attirato utenti estasiati dalle sue prestazioni, non di aggressive campagne pubblicitarie. La pubblicità non deve essere invasiva, ma solo utile all’utente. 2. È meglio dedicarsi veramente bene a una sola cosa. “Google si dedica alla ricerca. Con uno dei gruppi di ricerca tra i più grandi al mondo dedicato esclusivamente alla risoluzione dei problemi della ricerca, siamo consapevoli di ciò che facciamo bene e di come possiamo farlo meglio”. Abbiamo visto che Googleplex si configura appunto come un centro di ricerca universitario. I nuovi servizi aggiuntivi rispetto al semplice motore di ricerca sono visti come opportunità offerte agli utenti per orientarsi e reperire le informazioni che desiderano senza perdersi in masse sempre più enormi di dati. 3. Rapidità è meglio di lentezza. “Google crede nella gratificazione immediata. L’utente vuole delle risposte e le vuole subito. Chi siamo noi per non essere d’accordo? Google è probabilmente l’unica società al mondo il cui obiettivo dichiarato è fare in modo che i propri utenti abbandonino il sito Google al più presto”. Due sono le principali intuizioni e realizzazioni che hanno consentito a Google di ottenere “velocità”: la messa a punto e il perfezionamento continuo dell’algoritmo PageRank, che indicizza senza posa le reti; l’uso di piattaforme modulari fortemente scalabili collegate fra loro (cluster). Sulla velocità come panacea, tuttavia, sarebbe opportuno riflettere più approfonditamente: a volte, anche nell’ambito delle nuove tecnologie, la lentezza è una virtù.

10

4. La democrazia sul Web funziona. “Il successo di Google si basa sui milioni di individui che pubblicano siti Web, per determinare quali altri siti offrono contenuti validi.” Sappiamo già che Google usa PageRank per valutare i siti collegati a una pagina Web e assegnare loro un valore, basato in parte sui siti ad essi collegati. L’immagine di questa democrazia elettronica è idilliaca: il risultato del ranking di Google sarebbe un “indice di gradimento popolare” basato su un algoritmo/legge elettorale che consentirebbe agli utenti/cittadini della rete di esprimere le proprie preferenze/voti attraverso i link offerti e accettati da altre pagine, e trovarle puntualmente espresse nel posizionamento dei siti web votati. L’accostamento link/voto è quantomeno forzato e semplicistico, anche perché vengono introdotti continuamente “correttivi” per calcolare il ranking, “pesando” in maniera diversa i link/voti. Di certo il link/”voto” di un sito porno conterà meno del link/”voto” di un sito universitario. Eppure è discutibile che la cultura accademica sia più popolare della cultura pornografica... Di sicuro, con la crescita delle informazioni, questa “democrazia” è in continua espansione. 5. Non occorre essere alla propria scrivania per avere bisogno di informazioni. “La società attuale è sempre più mobile e meno disposta ad essere vincolata a un luogo fisso. O tramite i PDA, i telefoni wireless o le loro automobili, gli utenti desiderano che le informazioni vengano verso di loro.”. La flessibilità dei tempi e degli spazi è un obiettivo importante: la convergenza dei dispositivi elettronici (TV, radio, telefono, Internet...) in dispositivi mobili miniaturizzati è un’opportunità irrinunciabile per il maggior fornitore mondiale di soluzioni di ricerca. La penetrazione in questo mercato del futuro è strategica, l’abbiamo visto discutendo della “guerra tra gli standard”: tanto più per Google, che non produce dispositivi elettronici sui quali proporre/imporre i propri software (Microsoft, Apple), ma interfacce di ricerca. Ogni nuovo dispositivo è un territorio da conquistare. 6. È possibile guadagnare senza fare del male a nessuno. “Google è un’azienda. Le entrate generate dalla società derivano dall’offerta alle aziende della sua tecnologia di ricerca e dalla vendita di pubblicità visualizzata su Google e su altri siti Web.”. Ma le pubblicità sono testuali e poco invasive, i collegamenti sponsorizzati sono pertinenti alle ricerche fatte (AdWords); e gli utenti possono diventare inserzionisti in maniera semplice e self-service; e addirittura, se è un gestore di siti web, sfruttare la Rete di Google tramite AdSense, pubblicando annunci pertinenti con il contenuto dei propri siti. “Non essere cattivo”, “Non fare del male”, significa anche “non fare agli altri la pubblicità che non hanno fatto a te”, e naturalmente garantire che il PageRank non è oggetto di vendita. La fiducia degli utenti nella correttezza dei risultati è la principale forza di Google, e non può essere persa per guadagni a breve termine. Viene sfruttata per generare introiti indiretti, di secondo livello (generati dalla pubblicità). 7. Vi sono sempre più informazioni di quanto si immagini. “Dopo aver indicizzato più pagine HTML su Internet di qualsiasi altro servizio di ricerca, i tecnici Google hanno rivolto l’attenzione alle informazioni non immediatamente accessibili.”. Sì, Google accumula basi di dati eterogenee: immagini, messaggi dei newsgroup (Usenet), numeri di telefono e indirizzi, informazioni finanziarie. Per essere il principale mediatore di informazioni al mondo è necessario non porre limiti all’accumulo.

11

8. La necessità di informazioni oltrepassa ogni confine. “Nonostante la sede centrale di Google sia in California, abbiamo uffici in tutto il mondo e la nostra missione è facilitare l’accesso alle informazioni alle persone di tutto il mondo.”. Cultura americana, strettamente accademica, per tutti. Pensare in grande sempre e comunque: indicizzare tutte le informazioni, fornire accesso a tutto il mondo. Le traduzioni sono parte essenziale dell’universalismo di Google: dal coreano al gergo hacker al klingoniano di Star Trek, dall’hindy allo xhosa sudafricano fino al pig latin (ovvero l’alfabeto farfallino americano), dallo zulu all’interlingua e al Bork bork bork! (una specie di finto-russo molvano...) tutti devono poter accedere. Oltre cento lingue d’interfaccia. Domini locali di oltre cento stati. Lodevole, ma un po’ accentratore... operazione forse politicamente corretta e formalmente rispettosa delle minoranze, ma in realtà si tratta di un super-layer, un livello superiore, un’unica interfaccia che appiattisce, rende omogenee le differenze e diffonde lo stile di Mountain View. 9. È possibile essere seri anche senza giacca e cravatta. “I fondatori di Google hanno spesso dichiarato che la società è “seria” solo per quanto concerne la ricerca. Essi hanno costruito un’azienda basata sull’idea che il lavoro deve essere una sfida e che tale sfida deve essere divertente.”. In questo comandamento si compendia l’organizzazione di Googleplex come un campus universitario per massimizzare i rendimenti: esplicitamente, si afferma che “L’enfasi è sui risultati conseguiti dal team e sull’orgoglio dei risultati individuali che contribuiscono al successo globale della società”, e che “Questo ambiente estremamente comunicativo favorisce una produttività e un cameratismo alimentati dalla consapevolezza che milioni di persone confidano sui risultati di Google. Date gli strumenti giusti a un gruppo di persone che amano fare la differenza e loro la faranno”. Forse questo è il modo migliore per sfruttare i creativi, rendendoli contemporaneamente entusiasti sostenitori della “Esperienza Google”. 10. Eccellere non basta. “Dare sempre di più di quanto ci si aspetta. Google non accetta l’idea che essere i migliori sia l’obiettivo finale, ma ritiene che debba essere il punto di partenza. Tramite innovazione e iterazione, Google si dedica a migliorare qualcosa che già funziona bene per ottenere risultati inaspettati.”. Evidentemente, per soddisfare velocemente, sempre meglio, i desideri di tutti gli utenti del mondo, è necessario rimandare un po’, sempre un po’ più in là, la soddisfazione dei propri desideri. Desiderare di desiderare di essere i migliori. In questo contesto, arrivare secondi è peggio che non esistere. Per quanto ci riguarda, slogan per slogan, preferiamo “Fare schifo, in una società che obbliga all’eccellenza, è un preciso dovere morale”

12

cap III - Google – Open Source e Hacker Comunity: Come già detto Larry Page e Sergey Brin (fondatori della Google Inc.) utilizzarono sin dal principio (dalla nascita del progetto “BackRub”) software e sistemi operativi Open Source per porre le basi del loro motore di ricerca. Proprio a Stanford la cultura Hacker, da cui deriva in ultima analisi l’ Open Source, si respira come un’aria di famiglia: non è dunque un caso che Larry Page e Sergey Brin abbiano sempre manifestato una certa predilezione per lo sviluppo su piattaforma GNU/Linux. Va osservato anche come la stessa azienda Google Inc. (buona per motto “Don’t be Evil”) abbia utilizzato l’Open Source per ottenere i più svariati vantaggi. Non era più sufficiente offrire piccole risorse come i 350.000$ versati all’Oregon State University per migliorare la qualità dei progetti Open-Source o mettere a disposizione di tutti un’interfaccia grafica di Google in lingua h4x0r per accaparrarsi le simpatie dei giovani programmatori delle comunità Open Source, occorreva esplicitare la fiducia verso l’open-source con un iniziativa forte, che richiamasse a se l’attenzione del magma delle reti a produzione libera. Piccole differenze tra FreeSoftware e Open-Source: Free Software (Software Libero) e Open Source (Sorgente Aperto) per quanto descrivano oggetti spesso identici, rispecchiano prospettive radicalmente differenti. Free Software è un termine nato agli inizi degli anno Ottanta per iniziativa di Richerd Stallman. Si riferisce alla libertà dell’utente di usare e migliorare il software, può essere riassunto in 4 libertà fondamentali: 0) Libertà di eseguire il programma per qualsiasi scopo. 1) Libertà di modificare il programma secondo i propri bisogni. 2) Libertà di distribuire copie del programma gratuitamente o dietro compenso. 3) Libertà di distribuire versioni modificate del programma, così che la comunità possa fruire dei miglioramenti apportati. L’espressione Open Source, invece nasce alla fine degli anni Novanta, per iniziativa di Bruce Peres e Eric S. Raymound, si rifà a una serie di 10 punti pratici che definiscono quali criteri legali debba soddisfare una licenza per essere considerata effettivamente “libera”. É evidente quindi che da una parte il Free Software pone l’accento sulle libertà, (il Software libero è una questione di libertà, non di prezzo) e ha un senso che va ben oltre il mercato, pur non escludendolo a priori; l’Open Source esiste per adattare un modello preesistente al mercato. Si deve anche dire che attualmente l’Open Source per molte aziende è una delle poche possibilità per contrastare monopoli del mercato ormai consolidati, senza enormi investimenti, per limitare i costi di sviluppo e quindi diminuire “il prezzo” dei propri servizi. Campagna Summer of Code: La campagna “Summer of code” (l’estate del codice) è stata lanciata dal colosso di Mountain View nel 2005, mirava sia a presentarsi come un esplicita dichiarazione d’amore verso l’Open-Source, che ad attirare le simpatie dei giovani sviluppatori con un iniziativa di sostegno finanziario concreata al lavoro svolto. Ogni programmatore che avesse presentato un progetto Open Soure nuovo o apportato una miglioria degna di nota a un progetto già esistente entro l’arco dell’estate, avrebbe avuto un premio di 4500$. La campagna riscosse un notevole successo, oltre 400 tra i programmatori premiati (per lo più studenti) i quali si sono focalizzati principalmente nelle modifiche di codice già esistente ed appartenente a programmi come Apache, Fedora, Gaim, Lnkscape, Jabber, KDE, Mozzilla, OpenOffice, Pyton, Samba, Gnome, Ubuntu e lo stesso Google. Al progetto “Sumer of Code” parteciparono anche molti dipendenti Google, tutti i programmi realizzati dagli sviluppatori della società, vennero successivamente pubblicati come programmi di sviluppo, le “Google API”, librerie proprietarie che permettono a qualsiasi programmatore interessato di interfacciarsi e utilizzare i principali servizi di sviluppo del Colosso Mountain View. Strano sapere che proprio le Google API, siano state pubblicate con licenza proprietaria, nascondendo al programmatore che le utilizza il meccanismo del loro funzionamento. 13

Assunzioni particolari: Per avvicinarsi in maniera maggiore alle personalità di spicco delle comunità informatiche delle università americane e per accaparrarsi le loro simpatie, Google si è distinta più di ogni altra società anche per le sue trovate ingegnose in tema di assunzioni. Intorno al gennaio 2004, in alcune fermate della metropolitana della cittadina di Cambrige, e lungo l’autostrada 101 in California, sono apparsi enormi cartelli bianchi con la scritta: {first 10 digit prime in consecutive digits of e}.com ovvero: {primo numero primo di dieci cifre consecutive in e}.com Il logaritmo naturale richiesto è il numero 7427466391; all’indirizzo http://www.7427466391.com/ indicato dal cartellone ci ritroviamo su un indirizzo IP di Google che ci chiede di completare una sequenza di numeri; trovato il numero 5966290435, si seguono le istruzioni, usandolo come password per entrare in una sezione del sito http://www.linux.org (passaggio niente affatto scontato) e di qui veniamo rimbalzati ancora su Google, sul sito http://www.google.com/labjobs/ dove ci chiedono di inviare il nostro curriculum: se siamo riusciti a risolvere gli enigmi, potremmo essere un buon acquisto per Google. In sintesi: La Google Inc., che ha per slogan “Don’t be evil”, ha creato su quest’affermazione la sua immagine pubblica; in base a questo, rispetto alle più grandi multinazionali produttrici di software(come la Microsoft) non poteva mostrarsi insensibile alla filosofia e al movimento Open Source. Ma la Google è andata anche oltre: come si è visto, con iniziative e progetti diversi, ha anche messo a disposizione budget per la ricerca e l’innovazione. Come abbiamo visto in questo capitolo Google Inc. ha utilizzato nel corso degli anni numerose strategie pervasive morali e di marketing, per avvicinarsi alle comunità opensource, collaborare con esse, per dare un’immagine positiva di se, ma anche come, in realtà, tutto ciò sia servito puramente a rafforzare la propria immagine e ottenere parti di codice utilizzato per migliorare i propri servizi. Ad esempio, nessuna delle modifiche che i programmatori di Google hanno apportato agli strumenti aperti usati è mai stata resa pubblica. In particolare il loro Google Web Server (GWS) è una versione modificata di una versione di Apache, il server web Open Source più diffuso nella Rete. Questo significa senz’altro sfruttare le potenzialità e le realizzazioni del metodo di sviluppo aperto, senza però condividere le proprie implementazioni e miglioramenti. Google dovrebbe essere cosciente di confrontarsi con programmatori che, progettando programmi Open Source, sono legati ad un codice deontologico preciso e che potrebbero presto sentirsi traditi o semplicemente presi in giro da un’azienda che usa, per questioni morali ed economiche, codici Open Source, ma per questioni di sicurezza non rende pubbliche le modifiche apportate ai propri programmi, andando contro gli ideali della open comunity. Tutto ciò a lungo andare porterà, a mio parere, alla Google un divario tra la morale di apertura e benevolenza nei confronti della comunità e la reale motivazione che la spinge in questa direzione. 14

cap. IV - Google e privacy Nei capitoli precedenti sono state affrontate la nascita del più imponente motore di ricerca della storia del web, analizzandone gli strumenti e le strategie utilizzate nell’ascesa al potere telematico (spider, pagerank, interfaccia grafica, Google Plex, il Google pensiero); ci soffermeremo ora sul trattamento che Google fa dei dati catturati ogni giorno dal suo spider, sull’utopico concetto di privacy degli utenti e su alcune maliziose funzionalità non apertamente dichiarate ed elencate fra i servizi che Google mette a disposizione. La strategia dell’accumulo: Google ha accumulato strutture e dati per quantità semi-infinite. Prima di analizzare punto per punto tutto gli strumenti e le sue metodologie di impiego che gli servono per immagazzinare qualsiasi tipologia di materiale, è bene chiarire cosa si intende per “Strategia dell’accumulo”. Essa si basa sul concetto di ricerca, immagazzinamento, analisi e successiva selezione di tutti i dati che permettano di studiare e conoscere l’utente nelle sue preferenze e abitudini. Tutto ciò la porta ad accumulare ogni tipo di materiale nei seguenti settori: -

Dati Preferenze utenti Utenti Programmatori Società

I dati: Google, tramite il suo spider, non si limita ad acquisire link delle pagine, ma ne effettua una copia cache nel proprio date base in modo permanente; ciò comporta che, dopo la rimozione da parte dell’utente di una pagina web, essa continua a permanere nell’archivio dell’azienda, pur non essendo presente negli indici di ricerca. Preferenze degli utenti: non si conoscono le metodologie di acquisizione che Google attua per tale fine, ma va detto che esso acquisisce e cataloga una serie d informazioni sensibili dell’utente per restituirgli in futuro risultati di ricerca più consoni ai propri gusti e bisogni; tutto ciò perché, grazie alle acquisizioni delle preferenze effettuate, Google è poi in grado di sapere ciò che l’utente cerca, avendone analizzato realmente le sue abitudini e da questo deducendone il pensiero. Altro canale di accumulo di informazioni inerenti i gusti e i bisogni dell’utente sono le Gmail (posta elettronica), di cui Google effettua periodicamente scansioni sia dei contenuti che dei contatti ed indirizzi. Inizialmente, per ottenere una casella Gmail, era necessario un invito da parte di utenti già iscritti al servizio; questo serviva per poter effettuare statistiche sulle preferenze comuni agli utenti. Google fu la prima ad offrire sul web 1Gb di spazio per la posta elettronica allo scopo di consentire all’utente di conservare, per comodità, la posta ricevuta più a lungo sulla propria casella, che si trasformava in una fonte più ricca di informazioni. Successivamente il servizio è stato aperto a tutti coloro che desiderassero avere una casella sul motore di ricerca, ciò per acquisire più utenti, e quindi più informazioni, rispetto al periodo precedente. Altro materiale viene ricavato dall’utilizzo da parte degli utenti di programmi come Picasa (gestione di foto) o Google Toolbar. L’azienda inoltre mette a disposizione uno strumento di statistica diretta sulle proprie pagine per conoscere l’indice di gradimento dei nuovi servizi lanciati. Utenti: Google, oltre ad immagazzinare informazioni di ogni genere, cerca di accumulare le simpatie degli utenti offendo servizi e software gratuiti, una grafica minimale che permette un più agevole accesso alla ricerca, efficienza ed innovazione dei servizi offerti ed un rapido risultato di ricerca. Il tutto si rifà al Google pensiero. 15

Programmatori: come già precedentemente analizzato, la Google Inc., mediante il Google pensiero ed iniziative, quali la Summer of Code, mira ad accumulare i più grandi cervelli del settore, sia giovani e liberi programmatori delle comunità Open Source, sia veri e propri dirigenti delle aziende rivali: la tattica commerciale di rubare i segreti industriali, meccanismi di produzione e gestione delle risorse attraverso l’assunzione di elementi di spicco delle società concorrenti è sempre stata nelle corde della competizione industriale e la Google non è da meno. Un esempio tra tutti è l’assunzione di Kai-Fu Li, direttore esecutivo della Microsoft nonché l primo realizzatore del servizio Microsoft MSN Serch per la Cina. Società: come ogni azienda, anche Google investe sul mercato ed accumula società che acquista dopo aver rilevato il loro alto indice di gradimento nei confronti degli utenti di internet; è da sottolineare che la Google Inc. tende ad assorbire in se tutte le piccole imprese che lancino un servizio innovativo e potenzialmente concorrente ad uno di quelli da se posseduti. Un esempio calzante è quanto successo alla Yuotube (Google, anche dopo aver comprato l’azienda, ha lasciato inalterato il servizio sul web: il suo scopo non era quello di annientare la principale concorrente al suo servizio Google-Video, bensì acquistarla ed inserirla nel proprio circuito per implementare e mantenere sempre aggiornato il suo servizio di streaming video). Di seguito viene riportato un elenco di tutte le società acquistate solo negli ultimi anni, con il relativo settore di competenza ed il prezzo di mercato (dove conosciuto): - Youtube [Video Sharing] 1,65 miliardi di dollari - DoubleClick [Pubblicità online] 3,1 miliardi di dollari - Feedburner [RSS] 100 milioni di dollari - Keyhole [Mappe digitali terrestri] - Writely [Software Word Processor] - Greenborder [Sicurezza Online] - Peakstream [Software per processori] - Adscape [Pubblicità online] 23 milioni di dollari - Picasa [Software House] - Urchin [Stastiche online] 30 milioni di dollari - Jotspot [Software Wiki] - Android [Software Localizzazione] - Akwan [Software House] - Marratech [Videoconferenze] - Zenter [Presentazioni Online] - GrandCentral [Telefonia] 50 milioni di dollari - Postini [Sicurezza informatica] 625 milioni di dollari - ImageAmerica [Immagini Alta Risoluzione] - Tianya [Portale Social Network]. La Privacy dell’utente: Finora sono stati riportati ed analizzati pro e contro dei servizi realizzati e forniti dalla Google Inc. per portarne a conoscenza vantaggi e svantaggi; da questo momento in poi, affrontando l’argomento privacy, non si può non notare come il buon Dr. Jekyll nei meandri dell’informatica, oscuri alla gran parte del mondo, si trasformi nel malvagio Mr. Hyde. Numerose volte, in ambito specialistico ma non ufficiale, si è sentito parlare della potenziale violazione del diritto alla privacy dell’utente web, grazie a ricerche portate avanti dai Geek di turno. Ritengo necessario affrontare questo argomento, riportando tutte le notizie in merito (acquisite da articoli pubblicati su quotidiani on-line, blog e news group) ed analizzando la realtà in modo quanto più possibile veritiero ed oggettivo.

16

La normativa: L’intervento a tutela della privacy degli utenti, annunciato da Google con grande risonanza, non è altro che l’applicazione di un principio di legge. L’art. 3 del D. Lgs. 196/2003, c.d. codice privacy, stabilisce un criterio molto semplice, definito principio di necessità. La norma afferma: I sistemi informativi e i programmi informatici sono configurati riducendo al minimo l’utilizzazione di dati personali e di dati identificativi, in modo da escluderne il trattamento quando le finalità perseguite nei singoli casi possono essere realizzate mediante, rispettivamente, dati anonimi od opportune modalità che permettano di identificare l’interessato solo in caso di necessità. In estrema sintesi, nessuno può detenere informazioni di altri per un tempo e in un ambito spaziale non giustificati dalle specifiche finalità di trattamento, ovvero se non gli è necessario. Il Garante per la protezione dei dati personali si è già pronunciato in materia quando ha definito i tempi di conservazione delle informazioni acquisite dalle catene di grande distribuzione tramite le c.d. carte fedeltà. Il provvedimento del 24 febbraio 2005 ha segnato una tappa importante che ha inciso, e non poco, sulle consuetudini di gestione dei dati da parte dei grandi gruppi. Anche e non soltanto per motivi statistici e di marketing, i dati dei consumatori venivano trattati e trattenuti per un tempo indeterminato. Nel provvedimento il Garante afferma con chiarezza: Il principio da osservare è quello secondo cui i dati personali dei quali non è necessaria la conservazione in relazione agli scopi per i quali sono stati trattati devono essere cancellati o trasformati in forma anonima. Pertanto, nessun merito particolare da parte di Google, ma unicamente il rispetto della privacy dei suoi utenti1. Innanzitutto, contrattualmente, dire “Google” può non volere dire sempre la stessa cosa: a volte sarà Google inc. la casa madre americana, a volte Google Ireland, a volte la nostra Google Italia. Il che non è indifferente, perché non sempre e non con tutti si possono dare per scontate le regole di cui generalmente gode il consumatore. Ben si è reso conto di questo pubblico dettaglio lo stesso Garante Privacy, sensibilizzato da un utente che vedeva sempre emergere, come primo risultato di una ricerca a suo nome, la notizia di una sua vecchia condanna ormai altrimenti dimenticata. Ora, tutti noi godiamo di quello che è stato definito “diritto all’oblio”: abbiamo diritto, cioè, a pretendere che notizie che ci riguardano, non più attuali – o comunque prive di validi motivi per essere ancora conservate e conosciute – non siano più disponibili in rete, nemmeno nella memoria cache dei motori di ricerca. Peccato che, dinnanzi alla richiesta di provvedere del Garante, Google sia stata gentilissima, sì, ma per dire che non ci può fare granché (anche se naturalmente collaborerà in ogni modo...), perché i dati (e le memorie cache che li contengono) sono custoditi e controllati negli Stati Uniti, al di fuori della sfera di applicazione del Codice Privacy nostrano, o di qualunque direttiva europea2. Le opinioni della comunità di Ippolita: “Quello che nessun utente sa, o meglio non vuole sapere”, dicono i partecipanti alla comunità Ippolita, “è sotto gli occhi di tutti: i nostri dati, le email che usiamo, ciò che scriviamo, vengono archiviati ed elaborati da Google per ricavarne informazioni sui gusti, gli stili, le abitudini, per poi usarli per sé o rivenderli a terzi” e aggiungono “la cosa interessante e inquietante è che a Google non interessa associare le informazioni a una persona specifica. A lui non interessa che la tal cosa sia stata scritta dalla tal persona alla tal altra. Ma interessa cosa è stato scritto, e da quanti è stato scritto. Quante volte è stato usato quel tipo di email e non un altro: a lui interessa la quantità di volte che un elemento è ripetuto, non necessariamente la relazione che quell’elemento intrattiene con gli altri. In questo modo non viola legalmente alcuna privacy individuale, semmai quella collettiva, che però non è difesa da nessuna legge. Tanto più che ogni singolo utente accetta esplicitamente l’uso che Google farà dei suoi dati”3. La comunità di Ippolita è una delle voci più autorevoli degli ultimi anni in materia e il grido di rivolta al “Grande Fratello” di turno è ampiamente giustificato dall’analisi più approfondita di alcuni servizi forniti da Google, che risultano palesemente violare la privacy dell’utente. Si analizzano quindi di seguito due di questi servizi, con lo scopo di mostrare quanto sopra affermato. 17

1.A proposito della Gmail: un esempio per tutti Informazioni più interessanti si trovano nell’informativa privacy espressamente dedicata a Gmail, il servizio di posta elettronica di Google. Sotto il profilo privacy si rende noto che Google si riserva il diritto, non solo di eliminare o non distribuire “in qualsiasi momento qualsiasi contenuto”, ma, soprattutto, di aprire, leggere, conservare e divulgare qualsiasi informazione “ragionevolmente necessaria”, anche per “proteggere i diritti, la proprietà e la sicurezza di Google”, nonché verificare “potenziali violazioni”. Insomma, per verificare un sospetto, Google indagherà da sola, non scomodando le autorità. Elemento ribadito anche nel paragrafo dedicato alla privacy, in cui l’utente si impegna ad accettare che, anche per i motivi sopra citati, Google potrà monitorare, modificare o diffondere anche il contenuto delle mail. Inoltre, nelle condizioni contrattuali in generale del proprio account Gmail, Google non garantisce nulla circa la “disponibilità, puntualità, sicurezza o affidabilità del Servizio”. Non si tratta di toni o condizioni che, eguali o simili, non si trovino anche nelle cluausoline dei tanti altri servizi di posta gratuiti in rete, ma è in ingenuo pensare che Google non metta in atto certi meccanismi propri di ogni grande impresa, on-line o off-line che sia. Maggiori perplessità, piuttosto, lascia un’altra clausola delle condizioni di utilizzo: sottoscrivendo un account Gmail, l’utente si impegna già in quel momento a vincolarsi a modifiche eventualmente stabilite dai Google nel futuro. Il che sarebbe come firmare un contratto con alcune clausole in bianco, impegnandosi a qualcosa che non si può conoscere1. 2.La Google History: A conferma di tutti i nostri sospetti circa il reale controllo di Google sull’utente e sulle sue abitudini, l’azienda americana ha lanciato nel 2007 un nuovo servizio che consente di tenere traccia delle sessioni di navigazione degli utenti e dei loro spostamenti sul web. La Repubblica, in un articolo del 23 aprile 2007, così spiega il nuovo servizio offerto dalla Google Inc. “Ogni passo compiuto, nello stretto spazio delimitato da un browser, da oggi può diventare una traccia indelebile negli archivi del più grande motore di ricerca del mondo. Una specie di gigantesca cronologia. Per utilizzare il servizio, un’evoluzione del precedente Search History, si deve essere naturalmente in possesso di un account presso Google, avere scaricato la Google Toolbar e avere abilitato PageRank. Nella memoria di Web History verranno catalogati gli indirizzi dei siti e non il dettaglio dei contenuti delle singole pagine”. Il prezzo che pagano gli utenti per utilizzare Web History Google è la perdita del proprio anonimato, poiché al sito internet si associano dati dell’utente, e il fatto di diventare possibili vittime del mercato pubblicitario, in special modo quello controllato da Google. E se è vero che l’utente può revocare l’adesione a Web History in ogni momento, non si comprende se e in che modo Google davvero smetterà di tracciare l’utente nel momento in cui questo deciderà di abbandonare il programma.

18

In sintesi: Dopo aver analizzato i servizi offerti da Google e le innumerevoli voci alzate contro la violazione della privacy dell’utente che Google compie impunemente, favorita dalle differenti normative in materia, in vigore nelle varie parti del mondo, è necessario trarre le dovute conclusioni sull’argomento. Come esposto, Google è in grado di incrociare e analizzare i dati delle ricerche quotidiane fatte con il motore. Risultato: una ulteriore qualità di risposta, in quanto “solo chi cerca sa cosa cerca”, e, alla fine, chi meglio di noi sa cosa cerchi? Potremmo obiettare con una battuta che forse Google lo sa meglio di tutti, anche di noi stessi. Ma cosa riesce realmente Google a sapere dell’utente e dei suoi gusti e abitudini? Analizzando quanto precedentemente esposto, si può creare un elenco delle informazioni in suo possesso: - Tutto quello che si cerca usando Google - Tutte le pagine web con pubblicità Adsense che vengono visitate - Il paese di provenienza dell’utente - Tutte le pagine Blogger che vengono visitate Se poi si possiede un account GMail: - il mittente che manda e-mail - Il nome dell’utente (se si è fornito quello anagrafico) - Il destinatario dell’e-mail - I contenuti delle mail - I contenuti delle mailing list che vengono ricevute E anche se non si possiede un account GMail: - I contenuti delle mail che vengono mandate verso GMail - I contenuti delle mailing list a cui è iscritto un utente con account GMail Se si è membri di Orkut: - Il proprio network di contatti e di interessi su Orkut Se si è possessori di un account Adsense: - Nome, indirizzo e coordinate bancarie - Indirizzidi IP di chiunque visiti una pagina su cui è stata inserita pubblicità Adsense - Il numero di visitatori di tutte le pagine su cui è stata inserita pubblicità Adsense Importante è capire che la risposta alle ricerche cambi nel caso che sia un utente piuttosto che un altro a farle, magari entrambi seduti e loggati sullo stesso computer. In sostanza Google è in grado di sfruttare gusti preferenze, ricerche, abitudini di navigazione per aumentare il tasso di risposta.

19

cap. V – Altre maliziose funzionalità: Se “Chiedere è diritto e rispondere è cortesia…”, per Google non è così! La sua efficienza rende una regola il “Chiedi e ti sarà dato”! La maestosità del mondo Google, l’immensità delle informazioni accumulate dal motore di ricerca dal 1998 ad oggi, l’onnipresenza del suo spider nel web, la messa a disposizione del pubblico di programmi gratuiti di ogni genere in grado di catturare ed indicizzare molti dei dati personali dell’utente, ha permesso all’azienda di possedere quasi tutto lo scibile informatico. Se è vero che “Google sa” e che “se non si trova su Google non esiste”, si vuole dimostrare come esso possa diventare un pericoloso mezzo di ricerca ed uno mero strumento di telecrazia digitale e di democrazia reale. Si sono sviluppate nel corso degli anni, utilizzando gli stessi strumenti che Google fornisce, tecniche che permettono di utilizzare questo motore di ricerca con metodi non propriamente legali ed in un modo del tutto imprevisto dai suoi creatori. Queste tecniche sono il Google Bombing e il Google Hacking.

Google Bombing: Se il Pagerank rappresenta uno strumento di valenza democratica, in quanto il diritto al voto è permesso dalla semplice pubblicazione di una pagina web e permette realmente alle pagine di maggiore rilevanza di essere indicizzate per prime nei risultati di ricerca, il Google Bombing sfrutta la stessa tecnica per veicolare i risultati degli indici di ricerca. Il Google Bombing consiste nel “bombardare” una certa pagina web con un elevato numero di link provenienti dall’esterno in modo da far credere a Google che questa pagina sia ritenuta “popolare” o persino “autorevole” da molte persone e convincerlo quindi a presentarla tra i primi risultati nelle ricerche che gli utenti effettuano con il suo motore. Ad esempio, se volessimo fare in modo che la pagina principale di No1984 (http://www.no1984.org/) apparisse tra le prime 10 o 20 voci che Google restituisce quando l’utente effettua una ricerca per i termini “Trusted Computing”, dovremmo inserire un link a http://www.no1984.org/ in quanti più possibile siti web esterni, in modo da far capire a Google che No1984 viene ritenuto “autorevole” ed “importante” dai proprietari di quei siti. Questa tecnica può essere usata anche per ottenere degli effetti ironici o sarcastici. Ad esempio, un Google Bombing molto famoso ha fatto in modo che la ricerca di “miserable failure” (Miserabile fallimento) portasse alla pagina contenente la biografia del presidente George W. Bush. Normalmente, però, viene usata semplicemente per fare in modo che gli utenti interessati ad un certo argomento riescano a trovare una fonte di informazioni autorevole ed equilibrata e non le solite pagine di “comunicazione aziendale” create dalle imprese solo per mascherare un fenomeno sgradito. In molti casi, le pagine di “controinformazione” create dagli attivisti vengono seppellite così in basso nelle classifiche dei motori di ricerca da non essere più raggiungibili. Per controbattere questa “censura tecnologica”, molti siti “alternativi” devono mettere in atto delle tecniche di “promozione” delle proprie pagine e per farlo usano le stesse tecniche di Google Bombing usate dalle aziende. Solo spendono meno soldi e lo fanno in maniera più intelligente. Per funzionare correttamente, un buon Google Bombing deve rispettare alcune regole tecniche: 1.La pagina “bersaglio” deve contenere le parole significative (keyword) nel tag “title”. In altri termini, se vogliamo che http://www.no1984.org/ diventi visibile quando l’utente cerca “Trusted Computing” e “DRM”, queste parole devono essere presenti nel tag title della main page di http://www.no1984.org/. Il tag title è quello che dà origine al titolo che appare nella barra blu del browser e non ha niente a che fare con ciò che appare dentro la pagina. 20

1.La pagina bersaglio deve contenere le keyword anche all’interno del testo. Maggiore è la frequenza con cui appaiono queste parole nel testo, migliore sarà il “voto” (rank) che Google attribuirà alla pagina. 2.I link che provengono dalle pagine esterne devono essere tutti uguali. Se i link che provengono dall’esterno puntano a pagine diverse dello stesso sito od a sezioni diverse della stessa pagina, non si avrà quell’effetto di “accumulo” che permette alla pagina target di salire nella graduatoria di Google. Rispettando queste semplici regole si possono ottenere dei buoni risultati anche con soltanto qualche decina di link provenienti da siti esterni1. Google Hacking: Come ogni potente mezzo, anche Google può essere sfruttato per scavalcare la soglia della legalità mediante ricerche “intelligenti” e un po’ “alternative”. Lo spider di Google, come più volte ribadito, è l’elemento che permette al motore di ricerca di raccogliere ed indicizzare all’interno del suo database tutte le informazioni raccolte. Data la vastità del suo database, Google mette a disposizione alcuni operatori Booleani, attraverso i quali l’utente può filtrare a suo piacimento i risultati di ricerca e visualizzare tipologie specifiche di files o di siti internet. Di seguito è riportata la lista dei principali caratteri Booleani: - site: trova il termine ricercato soltanto nel sito specificato - filetype: trova soltanto documenti con l’estensione indicata - link: trova tutti i siti che hanno un link al termine ricercato - cache: visualizza la copia cache archiviata da Google della pagina ricercata - intitle: cerca tutte le pagine web che contengano nel titolo il termine ricercato - inurl: cerca all’interno dell’URL di una pagina - [sigla aeroporto]+airport trova un aeroporto - define: trova la definizione di una parola Incrociando tra loro questi operatori si è scoperto come sia possibile ottenere, dal motore di ricerca “buono” per antonomasia, informazioni sensibili riguardo gli amministratori e gli utenti dei network indicizzati da Google, numeri di carta di credito, password d’ogni sorta o conti correnti bancari. la tipologia della piattaforma server che ospita il network. La vulnerabilità di Google è la faccia nascosta della sua efficacia e della sua impagabile capacità di scandagliare Internet in cerca di dati e materiali. Il problema è che tutti questi materiali restano poi sospesi nel limbo di un deposito virtuale accessibile, in teoria, a chiunque. Se pertanto una pagina Web ha sofferto in passato di qualche problema di sicurezza, poi risolto con opportuni aggiornamenti, un malintenzionato potrebbe risalire con relativa semplicità alla versione più datata e non protetta della pagina, con tutte le conseguenze del caso2. Ma Google non si ferma solamente all’indicizzazione di documenti. Alcune stringhe possono riportare immagini di WebCam o di videocamere digitali che fotografano scene di vita da uffici, aziende, fabbriche. Altre consentono addirittura di visualizzare interi archivi di file MP3. Questa tecnica è chiamata Google Hacking. On-line è disponibile un database (http://johnny.ihackstuff.com/ghdb.php) pubblicato e gestito dall’hacker Johnny Long e chiamato Google Hacking Database (GHDB), contenente 847 stringhe di ricerca con cui esercitarsi nell’Hacking attraverso Google. Questa tecnica è stata recentemente utilizzata dal virus informatico Santy, che, per mezzo di interrogazioni automatizzate a Google, riusciva ad ottenere l’indirizzo internet di tutti i siti su cui era installato il Forum phpBB 2 per defacciarne l’homepage.

21

Conclusioni: Si è affermato all’inizio della trattazione che il presente studio non perseguiva lo scopo di ottenere un’assoluta condanna o assoluzione di Google, ma di evidenziare come esso possegga, come Dr. Jekyll e Mr. Hyde, una doppia personalità inscindibile l’una dall’altra. Se l’interfaccia grafica rilassante e minimale, insieme all’immagine di “buonismo” che Google Inc. ha voluto creare di se tramite l’offerta di programmi gratuiti, la collaborazione ed i finanziamenti concessi alle comunità Open Source, l’efficienza dei servizi e la stessa diffusione del Google Pensiero può essere paragonata al Dr. Jekyll, è pur vero che tutte queste caratteristiche risulterebbero nulle senza il reale potenziale dell’azienda, che si basa sull’acquisizione di un numero infinito di informazioni e dati che sfiorano l’illegalità e violano la privacy dell’utente, mostrando agli adepti anche il volto del “cattivo” Mr. Hyde. Si potrebbe sostenere che il Dr. Jekyll potrebbe esistere anche senza la sua personalità malvagia, che Google sarebbe realmente un motore di ricerca perfetto ed altruista nei confronti dell’utente se nei fatti non lo considerasse solo un numero da statistica indispensabile per la sua sopravvivenza. Sappiamo che così non è. Il Dr. Jekyll non sarebbe stato lo scienziato famoso che è divenuto se non avesse creato il suo alter ego, come Google non sarebbe divenuto “IL motore di ricerca” se non avesse potuto fornire all’utente qualsiasi dato richiesto e innumerevoli servizi innovativi ed efficaci, anche se per ottenere questo ha fagocitato in se aziende concorrenti ed informazioni sensibili. Tutto questo è Google!

22

Bibliografia: Ippolita, The Dark side of Google, (a.k.a. luci e ombre di google… - versione consegnata all’editore, gennaio 2007), Ippolita, copyleft 2007, Creative Commons 2.0 by-nc-sa www.ippolita.net [email protected] Linkografia: - http://privacy.blogosfere.it/ - http://hacksecure.noblogs.org/ - http://www.repubblica.it/ - http://laspinanelfianco.wordpress.com/ - http://www.ecplanet.com/ - http://www.it.wikipedia.org/ - http://www.google.it/

23

Related Documents


More Documents from "Dhananjay Kumar"