di Jennifer Golbeck – Quando nacque il web, era davvero un luogo diverso, statico. Fatto di pagine create o da chi aveva uno staff o da individui esperti di informatica, per quei tempi.
Con l’avvento dei social media, il web si è completamente trasformato. Ora gran parte dei contenuti è prodotto dagli stessi utenti. Ci sono video su YouTube, articoli sui vari blog, recensioni di prodotti o post sui social media. È un luogo interattivo, dove le persone interagiscono tra loro, commentano, condividono e non si limitano più a leggere. É un mondo bidirezionale.
Facebook non è l’unico luogo in cui si possono fare queste cose ma è il più grande, ed è utile per farsi un’idea in numeri. Facebook ha oggi più di 2 miliardi di utenti. La metà degli abitanti della Terra connessi a Internet usa Facebook.
Ma il punto è un altro. Su questi social le persone hanno immesso gratuitamente una quantità enorme di dati personali, tutti online. Ci sono dati sul comportamento, dati demografici e dati sulle preferenze di centinaia di milioni di persone. Tutto questo non ha precedenti nella storia.
In quanto esperta di informatica, ho creato modelli in grado di dedurre ogni tipo di informazione dai dati che la gente regala sui social.
Noi scienziati usiamo questi dati per semplificare il modo in cui le persone interagiscono online, ma esistono anche usi meno altruistici e il problema è che gli utenti non comprendono bene queste tecniche né il loro funzionamento, e se anche lo capiscono non ne hanno il controllo.
Oggi voglio parlarvi di alcune cose che siamo in grado di fare e poi voglio proporre qualche idea su come muoverci per riportare parte del controllo nelle mani degli utenti.
Target è una compagnia e ha inviato un volantino a una quindicenne con della pubblicità e dei coupon per biberon, pannolini e culle, due settimane prima che lei sapesse di essere incinta.
Come ha fatto Target a capire che questa liceale era incinta?
È venuto fuori che l’azienda ha la cronologia degli acquisti di centinaia di migliaia di clienti e calcola quello che chiamano un punteggio di gravidanza. Non rivela soltanto se una donna è incinta oppure no, ma anche la data prevista della nascita. Lo so è incredibile.
E questo lo calcolano non analizzando le cose ovvie, tipo: “sta comprando una culla o vestiti per bambini”, ma cose come “lei ha comprato più vitamine di quanto non faccia di solito”, oppure “ha comprato una borsa grande, non l’aveva mai fatto prima”, “ha prenotato un viaggio costoso o ha fatto preventivi su mete lontane e esotiche”, ecc.
Presi singolarmente, questi acquisti non sembrano poter rivelare granché, ma è un modello di comportamento che, se visto nel contesto di migliaia di altre persone, rivela molto. Questo è il tipo di lavoro che svolgiamo quando facciamo previsioni su di voi nei social media. Cerchiamo piccoli modelli di comportamento per scoprire tutta una serie di cose.
Nel mio laboratorio, insieme ai miei colleghi, abbiamo sviluppato dei modelli, con cui possiamo prevedere con precisione informazioni come le vostre preferenze politiche, il vostro tipo di personalità, il vostro genere, l’orientamento sessuale, la religione, l’età, l’intelligenza, insieme a cose come quanta fiducia avete nelle persone che conoscete e quanto sono forti le relazioni che avete con loro. Riusciamo a fare tutto questo molto bene.
E ripeto, non deriva da quelle cose che potreste considerare delle “informazioni ovvie”.
Ma cos’è che collega un contenuto totalmente irrilevante alla caratteristica che ne viene dedotta?
Per rispondere a questo dobbiamo considerare tutta una serie di teorie che ci illustrano perché si possa fare una cosa del genere. Una di queste è una teoria sociologica, si chiama “omofilia”.
Sostanzialmente dice che le persone fanno amicizia con chi è come loro o più simile a loro. É una naturale attrazione verso il simile. Per fare esempi molto semplici, se sei intelligente tenderai ad essere amico di gente intelligente e se sei giovane tenderai ad essere amico di gente giovane. È un meccanismo consolidato da centinaia di anni.
Un’altra teoria che utilizziamo è quella che descrive la diffusione delle informazioni. Cose come i video virali, i “Mi Piace” su Facebook o altre informazioni si diffondono nei social esattamente come le malattie. È una cosa che abbiamo studiato a lungo e abbiamo dei buoni modelli che lo illustrano.
Se si mettono tutte queste cose insieme, si comincerà a capire come possano accadere cose del genere.
È roba abbastanza complicata, vero? Non è facile mettersi lì a spiegarlo a un utente medio. E poi, anche sapendolo, l’utente medio cosa ci può fare?
Come fai a sapere che qualcosa che ti piace denota una tua caratteristica che non c’entra nulla con il contenuto di quella pagina che ti piace?
Gli utenti non hanno modo di controllare come venga usata questa informazione. E questo per me è un problema serio. Penso che dobbiamo ridare agli utenti un po’ di controllo sui loro dati, perché non sempre questi dati saranno utilizzati a loro vantaggio.
Una delle strade che potremmo seguire è quella di creare leggi e linee di condotta. Osservando il procedimento legislativo al giorno d’oggi penso che sia estremamente improbabile che un gruppo di rappresentanti si metta lì a studiare questo problema e metta in atto velocemente una serie di cambiamenti alle leggi sulla tutela della proprietà intellettuale, in modo da rendere gli utenti proprietari dei propri dati.
Ma allora che possiamo fare? Abbiamo fatto molti studi per sviluppare tutti questi meccanismi per interpretare i dati personali. Dovremmo fare lo stesso per sviluppare dei meccanismi che permettano di dire all’utente: “Ecco, questo è il rischio collegato all’azione che hai appena compiuto. Mettendo “Mi Piace” su quella pagina Facebook o condividendo queste informazioni personali, hai migliorato la mia capacità di capire se fai uso di stupefacenti o meno o se ti sai relazionare bene sul posto di lavoro”.
Penso che questo possa influenzare l’inclinazione personale a condividere un’informazione, inserirla mantenendola privata o addirittura non inserirla affatto.
Potremmo anche pensare a funzionalità che permettano agli utenti di criptare i dati che inseriscono, in modo che diventino invisibili e senza valore per siti come Facebook o servizi di terze parti che lo utilizzano.
Quando parlo di queste cose, spesso la gente mi dice che se gli utenti iniziassero a mantenere privata la loro vita, tutti questi metodi sviluppati per dedurre informazioni su di loro non funzionerebbero più.
Al che io rispondo che lo spero, che lo vedo come un successo. Come scienziato, il mio obiettivo non è desumere informazioni sugli utenti, bensì migliorare il modo in cui le persone interagiscono online. A volte questo implica dedurre informazioni su di loro, ma se gli utenti non vogliono che io utilizzi alcuni dati, penso che sia un loro diritto.
Incoraggiare questo tipo di scienza e supportare i ricercatori che vogliono restituire parte di quel controllo agli utenti, sottraendolo alle aziende di social media, vuol dire che andando avanti, avremo una base di utenti informata e responsabilizzata.
Penso che siamo tutti d’accordo sul fatto che questo sarebbe il modo ideale di procedere.