Leggi questo articolo, una tua amica lo ha trovato interessante. Un'introduzione alle opportunità e criticità dei recommender system per la ...
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
Leggi questo articolo, una tua amica lo ha trovato interessante. Un’introduzione alle opportunità e criticità dei recommender system per la personalizzazione dei contenuti audiovisivi. Paolo Casagranda, Sabino Metta Rai - Centro Ricerche e Innovazione Tecnologica 1. Cosa c’è stasera in TV? Quante volte, tornati a casa e magari in procinto di L’articolo presenta brevemente l’evoluzione del sederci a tavola, lo abbiamo domandato ai nostri panorama radiotelevisivo avvenuta negli ultimi familiari? E quante volte ci siamo messi a sfogliare anni e descrive il concetto di Recommender System (sì, su carta) la guida TV per cercare di trovare il e delle sue più importanti declinazioni tecnologiche, programma di nostro gradimento o che mettesse sottolineandone potenzialità, limiti e criticità. tutti d’accordo? Ecco. In un futuro neanche troppo L’avvento di internet e la proliferazione dei servizi lontano, questa semplice domanda potrebbe cam- digitali hanno determinato un radicale cambiamen- biare radicalmente significato. E potrebbe essere to della modalità di fruizione televisiva. La miriade formulata in maniera differente: “Cosa ci propone di prodotti, servizi e contenuti disponibili su Internet stasera la TV?” ha abituato i suoi utenti all’interattività, alla possibi- lità di ricercare e scegliere quando e quale contenu- In realtà, in molti casi questo scenario è già il pre- to multimediale fruire, trasformando il tradizionale sente. A proporci la migliore serie televisiva oppure ‘ascoltatore’ televisivo in un attivo ‘consumatore’ in grado di esprimere i propri gusti e le proprie il paio di scarpe di cui proprio non potevamo fare preferenze. Paradossalmente, la grande quantità a meno, ora ci pensa una macchina. Per essere di contenuti disponibili ha creato un sovraccarico precisi un Recommender System (RS), un Sistema di informativo e reso centrale il problema di trovare i Raccomandazione. Non si tratta di un replicante di più adatti all’utente. “Blade Runner” o dell’onnipresente “Grande Fratello” I Recommender System rappresentano la risposta di Orwell: il suggerimento arriva da un algoritmo che tecnologica alla domanda di rilevanza. In questo tenta di intercettare le nostre preferenze. contesto, il broadcaster ha l’opportunità di far evolvere il proprio paradigma comunicativo: oltre a I RS rappresentano una soluzione tecnologica di diffondere i propri contenuti, può proporre all’uten- cui molti di noi fanno quotidianamente esperienza te i più rilevanti. senza esserne consapevoli. Di più. I RS sono sem- pre più richiesti al fine di migliorare la qualità della nostra abituale fruizione di contenuti multimediali e di servizi digitali in genere. www.crit.rai.it Elettronica e Telecomunicazioni N° 2/2016 27
Recommender system Prima di trarne qualunque conclusione, cerchiamo varietà di contenuti disponibili, tra programmi di di capire meglio quale è il contesto in cui sono nati. cultura, serie televisive, rubriche, film è in continua Approfondiamo, senza entrare troppo nei dettagli, crescita. Tra milioni di siti Internet e migliaia di canali le loro principali caratteristiche. E cerchiamo di televisivi e stazioni radio, tra tutte le informazioni analizzare le loro potenzialità e criticità. ed i servizi disponibili ed accessibili, l’ascoltatore è sovraccaricato di informazioni e fa sempre più fatica ad orientarsi: il cosiddetto information overload. Di 2. Come è cambiata la televisione negli qui la necessità di restituire all’utente quanto sia per ultimi anni lui davvero rilevante. Facendo un salto indietro di qualche decennio, la Pertanto se da un lato è difficile pronosticare quale televisione nasce come un oggetto, costituito da sarà domani il ruolo della TV, dall’altro ciascun edi- uno schermo e degli altoparlanti, in grado di sinto- tore è posto con sempre più urgenza di fronte alla nizzarsi attraverso una antenna al segnale trasmesso sfida di accontentare in maniera puntuale i bisogni da un emittente televisivo, il broadcaster. Una volta dei suoi utenti. Oltre a proporre all’utente nuovi acquisiti i diritti, il broadcaster aveva ed ha tuttora il contenuti, l’editore è chiamato a mettere a punto compito di trasmettere via etere i programmi tele- un servizio di raccomandazione in grado di proporre visivi e radiofonici Nota 1: la radio e la TV lineare, così al singolo utente il contenuto giusto al momento come l’abbiamo sempre conosciuta. opportuno e di personalizzare così la sua esperienza di fruizione. È quindi chiaro che tali sistemi di racco- Oggi l’oggetto televisore appare decisamente diver- mandazione permettono la personalizzazione della so e più sfaccettato rispetto a quello di una volta. A singola esperienza di fruizione dell’utente. parte le caratteristiche estetiche, molti televisori in vendita sono ormai dotati di una funzionalità tipica Nel caso dei servizi di fornitura di contenuti multi- dei computer: la possibilità, cioè, di collegarsi ad mediali, quello che l’utente desidera ricevere non Internet. Ed è così che sorgono i servizi on-demand è, ad esempio, una serie televisiva scelta a caso. in grado di erogare contenuti audiovisivi mettendoli Ma esattamente quella che stava aspettando e a disposizione dell’utente, su richiesta: la cosiddetta che poi deciderà di guardare. Come fa il servizio TV non lineare. Al televisore tradizionale si aggiungo- di raccomandazione ad indovinare i gusti dell’u- no oggi altri dispositivi, come tablet e smartphone, tente? A proporgli proprio quella serie televisiva spesso utilizzati come televisore o come companion che stava aspettando e non un’altra per lui meno screen, cioè in aggiunta ad esso. interessante? Questa metamorfosi compiuta dalla televisione Proviamo in queste poche pagine a descrivere bre- porta con sé una prima importante conseguenza: vemente le funzionalità, complessità e criticità dei il palinsesto lineare viene potenzialmente ignora- Recommender System. to dall’utente che decide autonomamente quale contenuto selezionare. E questo avviene mentre la 3. Utenti e contenuti Nota 1 - non entreremo nei dettagli relativi agli Al fine di suggerire all’utente il contenuto per lui obblighi di legge per le emittenti tele- di maggiore rilevanza, i RS utilizzano informazioni visive (vedi ad esempio le fasce orarie di protezione dei minori, l’affollamen- sugli utenti e sui contenuti (metadati) e opportuni to pubblicitario, l’informazione sporti- algoritmi per elaborare tali informazioni. va). Per approfondimenti rimandiamo alle direttive ed alle regolamentazioni Per quanto riguarda i contenuti, la loro descrizione è dell’AGCOM e al Regolamento Gene- affidata ai cosiddetti metadati in grado di catturare rale sulla Protezione dei Dati (GDPR 2016/679) dell’Unione Europea. 28 Elettronica e Telecomunicazioni N° 2/2016 www.crit.rai.it
Recommender system le peculiarità del contenuto stesso ed in questo A produrre continuamente informazioni e dati non modo di renderlo il più possibile visibile all’utente ci sono solo gli utenti che ascoltano una canzone, particolarmente interessato. Nel caso ad esempio acquistano una lampadina su Amazon o esprimo- di un film, i metadati possono essere rappresentati no il loro stato d’animo su un social network. Ogni semplicemente dal genere (commedia, fantasy, giorno enormi quantità di dati vengono prodotti e documentario) oppure da rappresentazioni più condivisi anche dalle macchine, vedi ad esempio precise, come titolo, cast, regista, anno di uscita, i sensori che raccolgono informazioni climatiche, scenografia. La generazione di tali metadati rap- immagini satellitari, fotografie e video, segnali GPS. presenta per un editore una attività molto onerosa Molti di questi sensori risiedono nei dispositivi e tutt’altro che scontata. mobili e connessi di cui quotidianamente ciascun utente fa uso. E la mole di tali dati, sia pur prodotta La raccolta e l’analisi dei dati relativi agli utenti, al dalle macchine, contribuisce a fornire ulteriori in- loro contesto ed alle interazioni degli utenti con i formazioni sugli utenti. In particolare sul contesto contenuti, prende il nome di profilazione dell’utente in cui gli utenti vengono a trovarsi. ed ha lo scopo di descrivere, con un certo livello di affidabilità, il comportamento degli utenti in ge- Tutti questi dati vengono generati in maniera conti- nerale. Le pratiche di profilazione legate all’uso di nua da molteplici fonti, con formati diversi crescen- Internet, dello streaming musicale e della TV smart do a velocità impressionanti. Lo scenario appena possono essere estremamente sofisticate. Cerchia- descritto è quello che oggigiorno viene definito mo di approfondire meglio le ragioni. con il termine Big Data: dati che vengono prodotti velocemente, in grande quantità, da fonti eteroge- Oggigiorno la realtà in cui viviamo è assolutamente nee e difficili da trattare con tecniche tradizionali. iper-connessa. E per affermarlo non dobbiamo guar- dare cosa succedeva un secolo fa. Da quando sono La gestione dei Big Data rappresenta una sfida con- nati Internet ed il World Wide Web (quest’ultimo nel cettuale e tecnologica. In presenza di Big Data non 1991), il mondo sembra avere cambiato marcia. In è assolutamente conveniente fare affidamento sulle maniera rapida e fluida qualunque utente può fruire metodologie e tecnologie impiegate dalla cosiddet- un video musicale, creare un filmato e condividerlo, ta business intelligence che opera su insiemi di dati ascoltare una canzone, acquistare un prodotto (un limitati, puliti ed omogenei. I Big Data richiedono paio di scarpe, un divano), usufruire di un deter- l’utilizzo di strumenti matematici e statistici più minato servizio digitale (pagare con un bonifico sofisticati e complessi. Si passa da una statistica bancario, consultare le previsioni meteorologiche) descrittiva ad una inferenziale, da modelli lineari a o lasciare un commento su un social network. Qua- modelli non-lineari. lunque utente può creare informazioni, accedervi, salvarle e condividerle. Per trattare queste moli di dati, accanto alle tradi- zionali tecniche di machine-learning ne sono state È stato stimato che ogni giorno vengano scambiate messe a punto altre con l’obiettivo di analizzare 294 miliardi di e-mails e 20 miliardi di messaggi, flussi continui di dati [14]. Ai database tradizionali, mentre su Facebook vengano pubblicate 250 milioni quelli relazionali (RDBMS), vengono spesso preferiti di fotografie [15]. Secondo Cisco, la multinazionale quei sistemi software che non memorizzano i dati specializzata nella fornitura di apparati di rete, at- con campi uniformi (i cosiddetti DB NoSQL, tra cui tualmente il traffico dati globale su rete mobile si database a grafo, orientati al documento, etc.). Al aggira sui 10 exabyte Nota 2 mensili [16]. fine di gestire l’enorme mole di dati si passa ad elaborazioni in parallelo in grado di distribuire e poi recuperare correttamente le operazioni di cal- Nota 2 - Un exabyte equivale ad un miliardo di colo effettuate su un certo numero di nodi (unità di gigabyte, cioè 1018 byte elaborazione). www.crit.rai.it Elettronica e Telecomunicazioni N° 2/2016 29
Recommender system 4. P r i n c i p i d i f u n z i o n a m e n t o dei Collaborative: i suggerimenti per uno specifico Recommender Systems utente vengono generati sulla base di giudizi o valutazioni (ranking) che altri utenti, in passato, Cercando di riassumere quanto descritto finora, i hanno dato a determinati oggetti a disposizione. Recommender Systems (RS) comprendono tecniche Dopo avere rappresentato tali informazioni (utenti, e strumenti software in grado di suggerire all’utente oggetti, ranking) attraverso una matrice, è necessario gli oggetti più rilevanti tra i tanti a disposizione, e definire e quantificare una relazione di somiglianza sono stati creati con lo scopo di aiutare a ridurre il o distanza tra gli utenti o tra gli oggetti che verranno sovraccarico informativo[19]. In un RS, il contenuto raccomandati. Ad esempio, due oggetti O e O’ sono più rilevante per un determinato utente viene infe- definiti simili se sono stati scelti da molti utenti. rito sulla base dei dati a disposizione ed attraverso Allora la raccomandazione potrebbe essere quella l’implementazione di specifiche logiche. di suggerire O’ a chi precedentemente ha scelto O. Un approccio detto item-item. Oppure, due utenti U Nella sua forma più semplice un sistema di racco- e U’ sono definiti simili se ad esempio hanno scelto mandazione produce per ogni utente una lista di categorie di oggetti simili. In questo caso la racco- oggetti con relativa valutazione dell’utilità (ranking). mandazione potrebbe essere quella di suggerire ad Un oggetto, sia materiale sia intellettuale, rappre- U un oggetto che in passato è stato scelto da U’. Un senta un qualunque contenuto multimediale e/o approccio detto user-user. Un esempio di Collabora- servizio digitale che possa essere suggerito: ad tive Filtering più sofisticato basato su fattorizzazione esempio il prodotto di un supermercato, un video, matriciale è riportato in Appendice A. un programma radiofonico, una canzone, una no- tizia. Content-based: il RS suggerisce ad uno specifico utente una lista di oggetti i quali risultano essere I diversi sistemi di raccomandazione possono essere simili ad altri oggetti che quello stesso utente ha classificati sulla base della specifica logica e dello scelto in passato. In questa categoria, vengono con- specifico algoritmo attraverso i quali la lista finale frontati gli oggetti stessi o le loro descrizioni, senza di oggetti viene prodotta. Partendo dalla classifica- prendere in considerazione le azioni e/o il ranking zione proposta da Burke [1], possiamo raggruppare che altri utenti potrebbero avere dato. Questo i RS nelle sei seguenti categorie: Collaborative, approccio presuppone la definizione appropriata Content-based, Demographic, Knowledge-based, di similitudine o distanza tra due o più oggetti. Ad Community-based e Hybrid. Riportiamo qui di segui- esempio, assumendo una relazione di similitudine to una loro sommaria descrizione aggiungendo la tra i programmi “Report” e “Presa diretta” (entrambi categoria Editorial che rappresenta la tradizionale rappresentano programmi contenenti un giorna- raccomandazione fornita dall’editore. lismo di inchiesta), poiché l’utente in passato ha guardato “Report”, allora per l’utente potrebbe Editorial: i suggerimenti vengono scelti e creati essere rilevante ricevere la raccomandazione del dall’editore del canale televisivo manualmente programma “Presa diretta”. e valendosi della competenza di professionisti esperti. Chiaramente tale tipo di raccomandazione Demographic: il suggerimento del recommender dipende dalla cultura e dalla particolare lingua (o system si basa sulla caratterizzazione demografica dalle particolari lingue) adottate dal Paese di riferi- dell’utente, ad esempio l’età, il sesso, la residenza. Si mento. I media diffusivi lineari come la TV digitale basa sull’assunto che segmenti demografici diversi tradizionale si basano esclusivamente su questo richiedano prodotti diversi. tipo di raccomandazioni. 30 Elettronica e Telecomunicazioni N° 2/2016 www.crit.rai.it
Recommender system Knowledge-based: i suggerimenti si basano su rego- 5. Alcuni esempi: Netflix, Spotify, Amazon le derivate da una conoscenza esplicita dell’utente o degli oggetti. A titolo esemplificativo, proviamo a descrivere in questa sezione alcuni servizi basati su tecniche di Community-based o Social Recommender Systems: raccomandazione e di cui probabilmente ciascuno riassunto in [2], i suggerimenti tengono conto delle di noi ha già fatto esperienza: Netflix, per il video scelte e delle valutazioni degli amici dell’utente streaming, Spotify, per lo streaming di musica, Ama- sui social networks, partendo dall’evidenza che zon.com, per l’e-commerce. tendiamo a tenere in maggiore considerazione i suggerimenti degli amici rispetto a raccomanda- 5.1 Netflix zioni anonime. Netflix, il popolare servizio Internet di video strea- Hybrid: le tecniche descritte sopra vengono combi- ming, utilizza i dati sulle valutazioni degli utenti ma nate per ottenere suggerimenti più precisi cercando anche data e ora di visione, il luogo dove il video è di far fronte alle debolezze di ciascun metodo. Molti stato trovato nel sistema ed il dispositivo di visione RS commerciali sono di tipo ibrido. (smartphone? Smart-tv?). Circa l’80% delle ore di visione sono influenzate dall’implementazione degli Negli ultimi anni l’informazione relativa allo specifi- algoritmi di raccomandazione [4]. Il punto di accesso co contesto in cui si trova l’utente ha assunto sempre principale per l’utente, e quindi il principale luogo più importanza nella creazione del suggerimento. dove creare l’esperienza di raccomandazione, è la Per questa ragione, alle categorie sopra descritte si homepage del sito. Tale homepage è composta da è affiancata la categoria Context-Aware Recommen- molte sezioni (righe di video) e ciascuna beneficia di der Systems (CARS), vedi [3]. Il contesto è definito da algoritmi diversi: non esiste quindi un unico schema svariati fattori quali profilo, stato emotivo, attività, di raccomandazione dei contenuti. Esempi di sezioni posizione geografica, condizioni atmosferiche, e sono le righe di genere, che espongono suggerimenti qualsiasi altra cosa concorra alla definizione dello di video personalizzati per l’utente secondo un ge- stato dell’utente, dell’oggetto o dell’interazione tra nere (utilizzando un Personalized Video Ranker), i Top essi. Un esempio di fattore di contesto è il tempo: picks, che presentano le migliori raccomandazioni l’orario può influire sulla propensione di un dato indipendentemente dal genere (secondo un Top-N utente a fare attività sportiva, il giorno della setti- Video Ranker) e così via. mana può influire sulla sua scelta di fare una gita fuoriporta (più probabile nel weekend) e la stagione Netflix ha esplorato in maniera sistematica le tec- estiva sulla possibilità di acquistare un gelato. Altri niche di raccomandazione fin da quando il suo fattori importanti sono ad esempio l’attività dell’u- maggiore obiettivo era vendere DVD, arrivando a tente, la sua posizione, l’eventuale compagnia. mettere in palio nel 2006 un premio, il Netflix Prize, di un milione di dollari a chi avesse migliorato l’errore La personalizzazione dei contenuti non è però quadratico medio delle previsioni di almeno il 10% l’unico fattore da tenere in considerazione. Anche rispetto all’algoritmo allora in uso (competizione i ricercatori di Netflix ammettono che accanto ai vinta nel 2009 dal team BellKor’s Pragmatic Chaos). video raccomandati per il singolo utente, un criterio fondamentale è quello della popolarità dei video 5.2 Spotify proposti [4]: la personalizzazione quindi è comple- tata dalla presenza dei video più popolari, in modo L’azienda svedese Spotify ha lanciato nel 2008 un simile per tutti gli utenti. servizio streaming di musica divenuto negli anni molto popolare e arrivato a 100 milioni di utenti attivi nel 2016 (di cui 40 milioni a pagamento). Le playlist di canzoni suggerite dal servizio vengono www.crit.rai.it Elettronica e Telecomunicazioni N° 2/2016 31
Recommender system create con un RS basato principalmente su algoritmi organizza inoltre lo sviluppo e l’evoluzione di un di collaborative filtering. Il sistema è però in costante motore di raccomandazione reale, sviluppato par- evoluzione per migliorare l’esperienza degli utenti. tendo da componenti open source. 5.3 Amazon.com Attualmente, i servizi Radiotelevisivi pubblici euro- pei che partecipano all’iniziativa stanno seguendo Dalle informazioni presenti sul web si evince che lo stesso approccio del gruppo nello sviluppo di Amazon.com, uno dei più popolari servizi di com- soluzioni di raccomandazione: sviluppare all’interno mercio elettronico del mondo, utilizza un algoritmo dell’azienda il Recommender System che soddisfi i di raccomandazione basato sulla similarità item- requisiti voluti. item. Nelle raccomandazioni item-item, general- mente, si calcola prima la similarità tra ogni coppia Al fine di personalizzare l’esperienza di uno speci- di prodotti A e B, partendo dagli utenti che hanno fico utente è necessario innanzitutto riconoscere acquistato entrambi i prodotti. Se un utente acqui- in maniera univoca l’originalità dell’utente stesso. sta il prodotto A, gli vengono consigliati i prodotti A tal proposito l’autenticazione, o semplicemente B più simili ad A. il riconoscimento di sessioni con mezzi simili alle cookies dei browser web, rappresenta un punto chiave. Alcuni servizi permettono già di usare i co- 6. Iniziative europee siddetti social login, che semplificano le operazioni di autenticazione associando l’identità di un utente 6.1 EBU RecSys alle informazioni di base di un social network (ad es. Facebook o Twitter come avviene in Rai Play). La European Broadcasting Union (EBU) ha ricono- sciuto il ruolo chiave delle raccomandazioni nella Il riconoscimento dell’utente su dispositivi connessi personalizzazione dei contenuti radiotelevisivi, ed con input limitato, come le radio o le TV, è più labo- ha creato il gruppo EBU RecSys. Il gruppo si occupa rioso. Una possibile soluzione è rappresentata dallo di facilitare lo scambio di informazioni tra Media standard Cross-Platform Authentication [10] il quale Company pubbliche che utilizzano tecnologie di risulta essere compatibile con il protocollo OAuth 2.0 raccomandazione, condividendo linee guida e co- utilizzato dai principali social network per associare noscenza su aspetti tecnici e scientifici, legati alla in modo semplice un utente ad un dispositivo. normativa e alla standardizzazione. EBU RecSys Fig. 1 – Il gruppo EBU RecSys sviluppa anche un raccomandatore per test ed uso da parte dei collaboratori 32 Elettronica e Telecomunicazioni N° 2/2016 www.crit.rai.it
Recommender system 6.2 Un prototipo: la Hybrid Content Radio La Hybrid Content Radio (HCR) è un esempio di servizio audio personalizzato basato su raccoman- dazioni, ideato da Rai ed altri broadcaster pubblici della EBU [6]. HCR consiste nella personalizzazione del palinsesto di un servizio radio broadcast o streaming tradizionale, mediante la sostituzione di contenuti audio lineari con clip audio personalizzati, suggeriti in modo dipendente dal contesto. Il RS, for- nendo suggerimenti sui contenuti, permette in altre parole di personalizzare il servizio di radio lineare. Il prototipo realizzato consente di passare dall’a- scolto live ad una lista di podcast suggeriti, sia manualmente (tasto skip), sia automaticamente, in modo proattivo, quando le condizioni di contesto Fig. 2 – Hybrid Content Radio: la radio siano appropriate [7][8]. La possibilità di fornire rac- lineare viene personalizzata comandazioni in modo proattivo, quindi senza una con contenuti raccomandati, dipendenti dal contesto. richiesta esplicita dell’utente, è un ambito di ricerca aperto per i sistemi di raccomandazione. 7. Limiti dei Recommender Systems Discovery: una lista di prodotti suggeriti da un RS dovrebbe consentire all’utente di esplorare anche L’efficacia degli algoritmi nell’aiutare l’utente nella prodotti nuovi e diversi tra loro, secondo un concet- scelta di un oggetto o di un servizio è soggetta a to di discovery o scoperta. Una eccessiva somiglianza limitazioni che dipendono dal tipo di algoritmo, tra i prodotti è in questo caso poco utile e spesso dal contesto e dal tipo di suggerimento che si vuole l’utente desidera anche esplorare nuovi tipi di pro- ottenere. Non esiste un unico algoritmo che risolva dotto rispetto ai soliti. in modo ottimale ogni tipo di problema. Di seguito sono elencati alcuni limiti e sfide da superare. Filter Bubbles (bolle di filtraggio): è un concetto introdotto esaurientemente da Eli Pariser [9], che Cold Start: alcune tecniche di raccomandazione riguarda le informazioni che gli algoritmi lasciano necessitano di un insieme di dati iniziali per fornire arrivare all’utente. L’utente è come se fosse confina- suggerimenti validi. Ad esempio, perché un algo- to in una bolla immaginaria costruita dagli algoritmi, ritmo di Collaborative Filtering dia risultati sensati bolla che permette il passaggio di alcune informa- è necessario che un oggetto sia già stato valutato zioni soltanto. In questo modo l’utente rischia di da diversi utenti, e, analogamente, che un utente crearsi una visione molto parziale di molti fatti. Un abbia già valutato alcuni oggetti. Ad esempio, il esempio è il servizio social Facebook, che riordina, servizio social “GoodReads”, che si focalizza sui libri, filtra e consiglia le informazioni anche in base alla impone all’utente di valutare almeno 20 libri prima storia dell’utente. Oltre alla rilevanza, altri fattori di fornire un suggerimento. Un algoritmo Content- devono quindi essere tenuti in considerazione: ad based potrà, invece, fornire un suggerimento valido esempio l’importanza in contesti economici e sociali anche per un oggetto nuovo, a patto che a questo più ampi o la possibilità di dare voce ad altri punti siano associati metadati adeguati. di vista anche scomodi. www.crit.rai.it Elettronica e Telecomunicazioni N° 2/2016 33
Recommender system Privacy: il Recommender System fornisce suggeri- 8. Conclusioni menti rilevanti per l’utente estraendo così un ordine dal caos e dalla complessità delle informazioni a In questo articolo abbiamo cercato di dare un’idea disposizione. L’efficacia di questo processo dipende di cosa siano i Recommender System, descrivendo dalla quantità e dalla precisione dei dati personali brevemente il loro funzionamento e citando alcuni messi a disposizione dall’utente. Il problema fonda- esempi di aziende che adottano tali sistemi all’inter- mentale in questo caso è garantire la trasparenza no dei loro servizi. Abbiamo descritto la relazione delle informazioni raccolte, dando la possibilità tra RS e personalizzazione di un servizio, e come, in all’utente di accedere ad esse o di ritirarle. E poi, è un mondo in cui le informazioni e i prodotti si mol- assolutamente importante garantire la sicurezza di tiplicano, i sistemi di raccomandazione siano uno tali informazioni assicurando che esse non possano strumento necessario, capace di rendere più efficaci essere utilizzate da altri soggetti o per scopi diversi le ricerche ed ottenere prodotti più adatti a noi. da quelli consentiti. La creazione di meccanismi standard per la memorizzazione, lo scambio e l’ac- L’utilizzo appropriato dei RS deve tenere in ade- cesso alle informazioni dell’utente è un punto di guata considerazione la nostra privacy ed evitare grande interesse ancora aperto su cui anche MPEG la creazione di filter bubbles che ci confinino in un sta lavorando (si veda [11]). mondo chiuso, rendendoci troppo sicuri della com- pletezza dell’informazione che stiamo ricevendo. L’Unione Europea ha anche emanato nel 2016 una Per questo è importante che gli algoritmi imple- direttiva ed un regolamento sulla protezione dei mentati tengano in considerazione anche aspetti dati personali che avranno valore negli stati membri che vanno oltre la rilevanza personale, e in questo a partire dai prossimi anni (si vedano [12] e [13]) e il ruolo dell’editore è di primaria importanza. che richiedono trasparenza nel trattamento dei dati generati dagli utenti. Come molti altri prodotti dell’ingegno umano, anche i RS presentano grandi vantaggi ed enormi opportunità per il futuro, ma il buon senso e la trasparenza nella gestione delle informazioni sono Fig. 3 – I limiti dovuti alle filter fondamentali per mitigarne le criticità. bubbles descritte da Pariser sono una delle sfide che gli algoritmi di raccomandazione devono superare. (foto di Clint Mason, flikr, CC BY 2.0) 34 Elettronica e Telecomunicazioni N° 2/2016 www.crit.rai.it
Recommender system Appendice A matrice S è una matrice diagonale g x g (con g righe e g colonne) i cui elementi sono i valori singolari Un esempio di Collaborative Filtering ottenuto della matrice R e g è il suo rango. Possiamo ridurre con la Fattorizzazione Matriciale SVD la complessità usando solo gli f valori singolari di S più significativi, con f
Recommender system Bibliografia [1] R. Burke, Hybrid recommender systems: Survey and [10] ETSI TS 103 407 - V1.1.1 (2016-04), Cross Platform Experiments, in “User Modeling and User-Adapted Authentication for limited input hybrid consumer interaction” , vol. 12, Numero 4, Novembre 2002, equipment pp. 331-370. [11] S. Metta, P. Casagranda, A. Messina, M. Montagnuolo [2] F. Ricci, L. Rokach e B. Shapira, Recommender systems: e F. Russo, Leveraging MPEG-21 user description for introduction and challenges, in “Recommender Sys- interoperable recommender systems, in “Proceedings tems Handbook”, Springer US, 2015, pp. 1-34. of the 31st Annual ACM Symposium on Applied Computing (SAC’16)“, pp. 1072-1074, 2016. [3] G. Adomavicius, B. Mobasher, F. Ricci e A. Tuzhilin, Context-Aware Recommender Systems, in “AI Maga- [12] DIRETTIVA (UE) 2016/680 DEL PARLAMENTO EUROPEO zine”, vol. 32, Numero 3, Autunno 2011, pp. 67-80. E DEL CONSIGLIO del 27 aprile 2016 relativa alla protezi- one delle persone fisiche con riguardo al trattamento [4] C. A. Gomez-Uribe e N. Hunt, The Netflix dei dati personali da parte delle autorità competenti a Recommender System: Algorithms, Business Value, fini di prevenzione, indagine, accertamento e persegui- and Innovation, in “ACM Transaction on Management mento di reati o esecuzione di sanzioni penali, nonché Information Systems”, vol. 6, Numero 4, Gennaio alla libera circolazione di tali dati e che abroga la deci- 2016, Articolo 13. sione quadro 2008/977/GAI del Consiglio [5] B. Sarwar, G. Karypis, J. Konstan e J. Riedl, Application [13] REGOLAMENTO (UE) 2016/679 DEL PARLAMENTO of dimensionality reduction in recommender systems EUROPEO E DEL CONSIGLIO, 27 aprile 2016 relativo – a case study, ACM WebKDD-2000 Workshop, 2000 alla protezione delle persone fisiche con riguardo al trattamento dei dati personali, nonché alla libera cir- [6] P. Casagranda, A. Erk, S. O’Halpin, D. Born e W.Huijten, colazione di tali dati e che abroga la direttiva 95/46/ A Framework for a Context-Based Hybrid Content CE (regolamento generale sulla protezione dei dati) Radio, in “Proceedings of 2015 International Broad- casting Convention (IBC)”, 2015. [14] J. Leskovec, A. Rajaraman e J. Ullman, Mining of Massive Datasets, Cambridge University Press, 2014 [7] M. Braunhofer, F. Ricci, B. Lamche e W. Worndl, A context-aware model for proactive recommender [15] M. Rasetti, I Big Data: rivoluzione tra scienza e systems in the tourism domain, in “MobileHCI ‘15 conoscenza, in “Oxygen”, Numero 22, Febbraio 2014, Proceedings of the 17th International Conference on pp. 110-113 Human-Computer Interaction with Mobile Devices and Services Adjunct”, Agosto 2915, pp. 1070-1075 [16] Cloud and Mobile Network Traffic Forecast - VNI, Cisco, ultimo accesso 1 Febbraio 2017 [8] P. Casagranda, M. L. Sapino e K. S. Candan, Context- Aware Proactive Personalization of Linear Audio [17] Commissione Europea, Building a European Data Content, in “Proceedings of the 20th International Economy Conference on Extending Database Technology (EDBT)”, Marzo 2017, pp. 574-577 [18] Y. Koren, R. Bell e C. Volinsky, Matrix factorization tech- niques for recommender systems, in “IEEE Computer”, [9] E. Pariser, The filter bubble: What the Internet is hiding vol. 42, Numero 8, Agosto 2009, pp. 42-49 from you, Penguin UK, 2011. [19] F. Ricci, L. Rokach e B. Shapira, Recommender Systems Handbook, Springer, 2015. 36 Elettronica e Telecomunicazioni N° 2/2016 www.crit.rai.it
Recommender system www.crit.rai.it Elettronica e Telecomunicazioni N° 2/2016 37
Puoi anche leggere