Leggi questo articolo, una tua amica lo ha trovato interessante. Un'introduzione alle opportunità e criticità dei recommender system per la ...

Pagina creata da Jacopo Di Benedetto
 
CONTINUA A LEGGERE
Leggi questo articolo, una tua amica lo ha trovato interessante. Un'introduzione alle opportunità e criticità dei recommender system per la ...
Leggi questo articolo, una tua amica lo
         ha trovato interessante.
                  Un’introduzione alle opportunità e
                  criticità dei recommender system per
                  la personalizzazione dei contenuti
                  audiovisivi.
                                                                                                  Paolo Casagranda, Sabino Metta
                                                                                  Rai - Centro Ricerche e Innovazione Tecnologica

         1. Cosa c’è stasera in TV?
         Quante volte, tornati a casa e magari in procinto di              L’articolo presenta brevemente l’evoluzione del
         sederci a tavola, lo abbiamo domandato ai nostri                panorama radiotelevisivo avvenuta negli ultimi
         familiari? E quante volte ci siamo messi a sfogliare            anni e descrive il concetto di Recommender System
         (sì, su carta) la guida TV per cercare di trovare il            e delle sue più importanti declinazioni tecnologiche,
         programma di nostro gradimento o che mettesse                   sottolineandone potenzialità, limiti e criticità.
         tutti d’accordo? Ecco. In un futuro neanche troppo              L’avvento di internet e la proliferazione dei servizi
         lontano, questa semplice domanda potrebbe cam-                  digitali hanno determinato un radicale cambiamen-
         biare radicalmente significato. E potrebbe essere               to della modalità di fruizione televisiva. La miriade
         formulata in maniera differente: “Cosa ci propone               di prodotti, servizi e contenuti disponibili su Internet
         stasera la TV?”                                                 ha abituato i suoi utenti all’interattività, alla possibi-
                                                                         lità di ricercare e scegliere quando e quale contenu-
         In realtà, in molti casi questo scenario è già il pre-          to multimediale fruire, trasformando il tradizionale
         sente. A proporci la migliore serie televisiva oppure           ‘ascoltatore’ televisivo in un attivo ‘consumatore’
                                                                         in grado di esprimere i propri gusti e le proprie
         il paio di scarpe di cui proprio non potevamo fare
                                                                         preferenze. Paradossalmente, la grande quantità
         a meno, ora ci pensa una macchina. Per essere                   di contenuti disponibili ha creato un sovraccarico
         precisi un Recommender System (RS), un Sistema di               informativo e reso centrale il problema di trovare i
         Raccomandazione. Non si tratta di un replicante di              più adatti all’utente.
         “Blade Runner” o dell’onnipresente “Grande Fratello”
                                                                         I Recommender System rappresentano la risposta
         di Orwell: il suggerimento arriva da un algoritmo che           tecnologica alla domanda di rilevanza. In questo
         tenta di intercettare le nostre preferenze.                     contesto, il broadcaster ha l’opportunità di far
                                                                         evolvere il proprio paradigma comunicativo: oltre a
         I RS rappresentano una soluzione tecnologica di                 diffondere i propri contenuti, può proporre all’uten-
         cui molti di noi fanno quotidianamente esperienza               te i più rilevanti.
         senza esserne consapevoli. Di più. I RS sono sem-
         pre più richiesti al fine di migliorare la qualità della
         nostra abituale fruizione di contenuti multimediali
         e di servizi digitali in genere.

www.crit.rai.it                                Elettronica e Telecomunicazioni N° 2/2016                                              27
Leggi questo articolo, una tua amica lo ha trovato interessante. Un'introduzione alle opportunità e criticità dei recommender system per la ...
Recommender system

     Prima di trarne qualunque conclusione, cerchiamo              varietà di contenuti disponibili, tra programmi di
     di capire meglio quale è il contesto in cui sono nati.        cultura, serie televisive, rubriche, film è in continua
     Approfondiamo, senza entrare troppo nei dettagli,             crescita. Tra milioni di siti Internet e migliaia di canali
     le loro principali caratteristiche. E cerchiamo di            televisivi e stazioni radio, tra tutte le informazioni
     analizzare le loro potenzialità e criticità.                  ed i servizi disponibili ed accessibili, l’ascoltatore è
                                                                   sovraccaricato di informazioni e fa sempre più fatica
                                                                   ad orientarsi: il cosiddetto information overload. Di
     2. Come     è cambiata la televisione negli                   qui la necessità di restituire all’utente quanto sia per
          ultimi anni                                              lui davvero rilevante.

     Facendo un salto indietro di qualche decennio, la             Pertanto se da un lato è difficile pronosticare quale
     televisione nasce come un oggetto, costituito da              sarà domani il ruolo della TV, dall’altro ciascun edi-
     uno schermo e degli altoparlanti, in grado di sinto-          tore è posto con sempre più urgenza di fronte alla
     nizzarsi attraverso una antenna al segnale trasmesso          sfida di accontentare in maniera puntuale i bisogni
     da un emittente televisivo, il broadcaster. Una volta         dei suoi utenti. Oltre a proporre all’utente nuovi
     acquisiti i diritti, il broadcaster aveva ed ha tuttora il    contenuti, l’editore è chiamato a mettere a punto
     compito di trasmettere via etere i programmi tele-            un servizio di raccomandazione in grado di proporre
     visivi e radiofonici Nota 1: la radio e la TV lineare, così   al singolo utente il contenuto giusto al momento
     come l’abbiamo sempre conosciuta.                             opportuno e di personalizzare così la sua esperienza
                                                                   di fruizione. È quindi chiaro che tali sistemi di racco-
     Oggi l’oggetto televisore appare decisamente diver-           mandazione permettono la personalizzazione della
     so e più sfaccettato rispetto a quello di una volta. A        singola esperienza di fruizione dell’utente.
     parte le caratteristiche estetiche, molti televisori in
     vendita sono ormai dotati di una funzionalità tipica          Nel caso dei servizi di fornitura di contenuti multi-
     dei computer: la possibilità, cioè, di collegarsi ad          mediali, quello che l’utente desidera ricevere non
     Internet. Ed è così che sorgono i servizi on-demand           è, ad esempio, una serie televisiva scelta a caso.
     in grado di erogare contenuti audiovisivi mettendoli          Ma esattamente quella che stava aspettando e
     a disposizione dell’utente, su richiesta: la cosiddetta       che poi deciderà di guardare. Come fa il servizio
     TV non lineare. Al televisore tradizionale si aggiungo-       di raccomandazione ad indovinare i gusti dell’u-
     no oggi altri dispositivi, come tablet e smartphone,          tente? A proporgli proprio quella serie televisiva
     spesso utilizzati come televisore o come companion            che stava aspettando e non un’altra per lui meno
     screen, cioè in aggiunta ad esso.                             interessante?

     Questa metamorfosi compiuta dalla televisione                 Proviamo in queste poche pagine a descrivere bre-
     porta con sé una prima importante conseguenza:                vemente le funzionalità, complessità e criticità dei
     il palinsesto lineare viene potenzialmente ignora-            Recommender System.
     to dall’utente che decide autonomamente quale
     contenuto selezionare. E questo avviene mentre la
                                                                   3. Utenti e contenuti
             Nota 1 - non entreremo nei dettagli relativi agli     Al fine di suggerire all’utente il contenuto per lui
                      obblighi di legge per le emittenti tele-
                                                                   di maggiore rilevanza, i RS utilizzano informazioni
                      visive (vedi ad esempio le fasce orarie
                      di protezione dei minori, l’affollamen-
                                                                   sugli utenti e sui contenuti (metadati) e opportuni
                      to pubblicitario, l’informazione sporti-     algoritmi per elaborare tali informazioni.
                      va). Per approfondimenti rimandiamo
                      alle direttive ed alle regolamentazioni      Per quanto riguarda i contenuti, la loro descrizione è
                      dell’AGCOM e al Regolamento Gene-            affidata ai cosiddetti metadati in grado di catturare
                      rale sulla Protezione dei Dati (GDPR
                      2016/679) dell’Unione Europea.

28                                           Elettronica e Telecomunicazioni N° 2/2016                                    www.crit.rai.it
Leggi questo articolo, una tua amica lo ha trovato interessante. Un'introduzione alle opportunità e criticità dei recommender system per la ...
Recommender system

         le peculiarità del contenuto stesso ed in questo            A produrre continuamente informazioni e dati non
         modo di renderlo il più possibile visibile all’utente       ci sono solo gli utenti che ascoltano una canzone,
         particolarmente interessato. Nel caso ad esempio            acquistano una lampadina su Amazon o esprimo-
         di un film, i metadati possono essere rappresentati         no il loro stato d’animo su un social network. Ogni
         semplicemente dal genere (commedia, fantasy,                giorno enormi quantità di dati vengono prodotti e
         documentario) oppure da rappresentazioni più                condivisi anche dalle macchine, vedi ad esempio
         precise, come titolo, cast, regista, anno di uscita,        i sensori che raccolgono informazioni climatiche,
         scenografia. La generazione di tali metadati rap-           immagini satellitari, fotografie e video, segnali GPS.
         presenta per un editore una attività molto onerosa          Molti di questi sensori risiedono nei dispositivi
         e tutt’altro che scontata.                                  mobili e connessi di cui quotidianamente ciascun
                                                                     utente fa uso. E la mole di tali dati, sia pur prodotta
         La raccolta e l’analisi dei dati relativi agli utenti, al   dalle macchine, contribuisce a fornire ulteriori in-
         loro contesto ed alle interazioni degli utenti con i        formazioni sugli utenti. In particolare sul contesto
         contenuti, prende il nome di profilazione dell’utente       in cui gli utenti vengono a trovarsi.
         ed ha lo scopo di descrivere, con un certo livello di
         affidabilità, il comportamento degli utenti in ge-          Tutti questi dati vengono generati in maniera conti-
         nerale. Le pratiche di profilazione legate all’uso di       nua da molteplici fonti, con formati diversi crescen-
         Internet, dello streaming musicale e della TV smart         do a velocità impressionanti. Lo scenario appena
         possono essere estremamente sofisticate. Cerchia-           descritto è quello che oggigiorno viene definito
         mo di approfondire meglio le ragioni.                       con il termine Big Data: dati che vengono prodotti
                                                                     velocemente, in grande quantità, da fonti eteroge-
         Oggigiorno la realtà in cui viviamo è assolutamente         nee e difficili da trattare con tecniche tradizionali.
         iper-connessa. E per affermarlo non dobbiamo guar-
         dare cosa succedeva un secolo fa. Da quando sono            La gestione dei Big Data rappresenta una sfida con-
         nati Internet ed il World Wide Web (quest’ultimo nel        cettuale e tecnologica. In presenza di Big Data non
         1991), il mondo sembra avere cambiato marcia. In            è assolutamente conveniente fare affidamento sulle
         maniera rapida e fluida qualunque utente può fruire         metodologie e tecnologie impiegate dalla cosiddet-
         un video musicale, creare un filmato e condividerlo,        ta business intelligence che opera su insiemi di dati
         ascoltare una canzone, acquistare un prodotto (un           limitati, puliti ed omogenei. I Big Data richiedono
         paio di scarpe, un divano), usufruire di un deter-          l’utilizzo di strumenti matematici e statistici più
         minato servizio digitale (pagare con un bonifico            sofisticati e complessi. Si passa da una statistica
         bancario, consultare le previsioni meteorologiche)          descrittiva ad una inferenziale, da modelli lineari a
         o lasciare un commento su un social network. Qua-           modelli non-lineari.
         lunque utente può creare informazioni, accedervi,
         salvarle e condividerle.                                    Per trattare queste moli di dati, accanto alle tradi-
                                                                     zionali tecniche di machine-learning ne sono state
         È stato stimato che ogni giorno vengano scambiate           messe a punto altre con l’obiettivo di analizzare
         294 miliardi di e-mails e 20 miliardi di messaggi,          flussi continui di dati [14]. Ai database tradizionali,
         mentre su Facebook vengano pubblicate 250 milioni           quelli relazionali (RDBMS), vengono spesso preferiti
         di fotografie [15]. Secondo Cisco, la multinazionale        quei sistemi software che non memorizzano i dati
         specializzata nella fornitura di apparati di rete, at-      con campi uniformi (i cosiddetti DB NoSQL, tra cui
         tualmente il traffico dati globale su rete mobile si        database a grafo, orientati al documento, etc.). Al
         aggira sui 10 exabyte Nota 2 mensili [16].                  fine di gestire l’enorme mole di dati si passa ad
                                                                     elaborazioni in parallelo in grado di distribuire e
                                                                     poi recuperare correttamente le operazioni di cal-
                  Nota 2 - Un exabyte equivale ad un miliardo di     colo effettuate su un certo numero di nodi (unità di
                           gigabyte, cioè 1018 byte                  elaborazione).

www.crit.rai.it                                Elettronica e Telecomunicazioni N° 2/2016                                       29
Leggi questo articolo, una tua amica lo ha trovato interessante. Un'introduzione alle opportunità e criticità dei recommender system per la ...
Recommender system

     4. P r i n c i p i d i f u n z i o n a m e n t o    dei     Collaborative: i suggerimenti per uno specifico
        Recommender Systems                                      utente vengono generati sulla base di giudizi o
                                                                 valutazioni (ranking) che altri utenti, in passato,
     Cercando di riassumere quanto descritto finora, i           hanno dato a determinati oggetti a disposizione.
     Recommender Systems (RS) comprendono tecniche               Dopo avere rappresentato tali informazioni (utenti,
     e strumenti software in grado di suggerire all’utente       oggetti, ranking) attraverso una matrice, è necessario
     gli oggetti più rilevanti tra i tanti a disposizione, e     definire e quantificare una relazione di somiglianza
     sono stati creati con lo scopo di aiutare a ridurre il      o distanza tra gli utenti o tra gli oggetti che verranno
     sovraccarico informativo[19]. In un RS, il contenuto        raccomandati. Ad esempio, due oggetti O e O’ sono
     più rilevante per un determinato utente viene infe-         definiti simili se sono stati scelti da molti utenti.
     rito sulla base dei dati a disposizione ed attraverso       Allora la raccomandazione potrebbe essere quella
     l’implementazione di specifiche logiche.                    di suggerire O’ a chi precedentemente ha scelto O.
                                                                 Un approccio detto item-item. Oppure, due utenti U
     Nella sua forma più semplice un sistema di racco-           e U’ sono definiti simili se ad esempio hanno scelto
     mandazione produce per ogni utente una lista di             categorie di oggetti simili. In questo caso la racco-
     oggetti con relativa valutazione dell’utilità (ranking).    mandazione potrebbe essere quella di suggerire ad
     Un oggetto, sia materiale sia intellettuale, rappre-        U un oggetto che in passato è stato scelto da U’. Un
     senta un qualunque contenuto multimediale e/o               approccio detto user-user. Un esempio di Collabora-
     servizio digitale che possa essere suggerito: ad            tive Filtering più sofisticato basato su fattorizzazione
     esempio il prodotto di un supermercato, un video,           matriciale è riportato in Appendice A.
     un programma radiofonico, una canzone, una no-
     tizia.                                                      Content-based: il RS suggerisce ad uno specifico
                                                                 utente una lista di oggetti i quali risultano essere
     I diversi sistemi di raccomandazione possono essere         simili ad altri oggetti che quello stesso utente ha
     classificati sulla base della specifica logica e dello      scelto in passato. In questa categoria, vengono con-
     specifico algoritmo attraverso i quali la lista finale      frontati gli oggetti stessi o le loro descrizioni, senza
     di oggetti viene prodotta. Partendo dalla classifica-       prendere in considerazione le azioni e/o il ranking
     zione proposta da Burke [1], possiamo raggruppare           che altri utenti potrebbero avere dato. Questo
     i RS nelle sei seguenti categorie: Collaborative,           approccio presuppone la definizione appropriata
     Content-based, Demographic, Knowledge-based,                di similitudine o distanza tra due o più oggetti. Ad
     Community-based e Hybrid. Riportiamo qui di segui-          esempio, assumendo una relazione di similitudine
     to una loro sommaria descrizione aggiungendo la             tra i programmi “Report” e “Presa diretta” (entrambi
     categoria Editorial che rappresenta la tradizionale         rappresentano programmi contenenti un giorna-
     raccomandazione fornita dall’editore.                       lismo di inchiesta), poiché l’utente in passato ha
                                                                 guardato “Report”, allora per l’utente potrebbe
     Editorial: i suggerimenti vengono scelti e creati           essere rilevante ricevere la raccomandazione del
     dall’editore del canale televisivo manualmente              programma “Presa diretta”.
     e valendosi della competenza di professionisti
     esperti. Chiaramente tale tipo di raccomandazione           Demographic: il suggerimento del recommender
     dipende dalla cultura e dalla particolare lingua (o         system si basa sulla caratterizzazione demografica
     dalle particolari lingue) adottate dal Paese di riferi-     dell’utente, ad esempio l’età, il sesso, la residenza. Si
     mento. I media diffusivi lineari come la TV digitale        basa sull’assunto che segmenti demografici diversi
     tradizionale si basano esclusivamente su questo             richiedano prodotti diversi.
     tipo di raccomandazioni.

30                                         Elettronica e Telecomunicazioni N° 2/2016                                  www.crit.rai.it
Leggi questo articolo, una tua amica lo ha trovato interessante. Un'introduzione alle opportunità e criticità dei recommender system per la ...
Recommender system

         Knowledge-based: i suggerimenti si basano su rego-          5. Alcuni esempi: Netflix, Spotify, Amazon
         le derivate da una conoscenza esplicita dell’utente
         o degli oggetti.                                            A titolo esemplificativo, proviamo a descrivere in
                                                                     questa sezione alcuni servizi basati su tecniche di
         Community-based o Social Recommender Systems:               raccomandazione e di cui probabilmente ciascuno
         riassunto in [2], i suggerimenti tengono conto delle        di noi ha già fatto esperienza: Netflix, per il video
         scelte e delle valutazioni degli amici dell’utente          streaming, Spotify, per lo streaming di musica, Ama-
         sui social networks, partendo dall’evidenza che             zon.com, per l’e-commerce.
         tendiamo a tenere in maggiore considerazione i
         suggerimenti degli amici rispetto a raccomanda-             5.1 Netflix
         zioni anonime.
                                                                     Netflix, il popolare servizio Internet di video strea-
         Hybrid: le tecniche descritte sopra vengono combi-          ming, utilizza i dati sulle valutazioni degli utenti ma
         nate per ottenere suggerimenti più precisi cercando         anche data e ora di visione, il luogo dove il video è
         di far fronte alle debolezze di ciascun metodo. Molti       stato trovato nel sistema ed il dispositivo di visione
         RS commerciali sono di tipo ibrido.                         (smartphone? Smart-tv?). Circa l’80% delle ore di
                                                                     visione sono influenzate dall’implementazione degli
         Negli ultimi anni l’informazione relativa allo specifi-     algoritmi di raccomandazione [4]. Il punto di accesso
         co contesto in cui si trova l’utente ha assunto sempre      principale per l’utente, e quindi il principale luogo
         più importanza nella creazione del suggerimento.            dove creare l’esperienza di raccomandazione, è la
         Per questa ragione, alle categorie sopra descritte si       homepage del sito. Tale homepage è composta da
         è affiancata la categoria Context-Aware Recommen-           molte sezioni (righe di video) e ciascuna beneficia di
         der Systems (CARS), vedi [3]. Il contesto è definito da     algoritmi diversi: non esiste quindi un unico schema
         svariati fattori quali profilo, stato emotivo, attività,    di raccomandazione dei contenuti. Esempi di sezioni
         posizione geografica, condizioni atmosferiche, e            sono le righe di genere, che espongono suggerimenti
         qualsiasi altra cosa concorra alla definizione dello        di video personalizzati per l’utente secondo un ge-
         stato dell’utente, dell’oggetto o dell’interazione tra      nere (utilizzando un Personalized Video Ranker), i Top
         essi. Un esempio di fattore di contesto è il tempo:         picks, che presentano le migliori raccomandazioni
         l’orario può influire sulla propensione di un dato          indipendentemente dal genere (secondo un Top-N
         utente a fare attività sportiva, il giorno della setti-     Video Ranker) e così via.
         mana può influire sulla sua scelta di fare una gita
         fuoriporta (più probabile nel weekend) e la stagione        Netflix ha esplorato in maniera sistematica le tec-
         estiva sulla possibilità di acquistare un gelato. Altri     niche di raccomandazione fin da quando il suo
         fattori importanti sono ad esempio l’attività dell’u-       maggiore obiettivo era vendere DVD, arrivando a
         tente, la sua posizione, l’eventuale compagnia.             mettere in palio nel 2006 un premio, il Netflix Prize, di
                                                                     un milione di dollari a chi avesse migliorato l’errore
         La personalizzazione dei contenuti non è però               quadratico medio delle previsioni di almeno il 10%
         l’unico fattore da tenere in considerazione. Anche          rispetto all’algoritmo allora in uso (competizione
         i ricercatori di Netflix ammettono che accanto ai           vinta nel 2009 dal team BellKor’s Pragmatic Chaos).
         video raccomandati per il singolo utente, un criterio
         fondamentale è quello della popolarità dei video            5.2 Spotify
         proposti [4]: la personalizzazione quindi è comple-
         tata dalla presenza dei video più popolari, in modo         L’azienda svedese Spotify ha lanciato nel 2008 un
         simile per tutti gli utenti.                                servizio streaming di musica divenuto negli anni
                                                                     molto popolare e arrivato a 100 milioni di utenti
                                                                     attivi nel 2016 (di cui 40 milioni a pagamento). Le
                                                                     playlist di canzoni suggerite dal servizio vengono

www.crit.rai.it                                Elettronica e Telecomunicazioni N° 2/2016                                         31
Leggi questo articolo, una tua amica lo ha trovato interessante. Un'introduzione alle opportunità e criticità dei recommender system per la ...
Recommender system

     create con un RS basato principalmente su algoritmi         organizza inoltre lo sviluppo e l’evoluzione di un
     di collaborative filtering. Il sistema è però in costante   motore di raccomandazione reale, sviluppato par-
     evoluzione per migliorare l’esperienza degli utenti.        tendo da componenti open source.

     5.3 Amazon.com                                              Attualmente, i servizi Radiotelevisivi pubblici euro-
                                                                 pei che partecipano all’iniziativa stanno seguendo
     Dalle informazioni presenti sul web si evince che           lo stesso approccio del gruppo nello sviluppo di
     Amazon.com, uno dei più popolari servizi di com-            soluzioni di raccomandazione: sviluppare all’interno
     mercio elettronico del mondo, utilizza un algoritmo         dell’azienda il Recommender System che soddisfi i
     di raccomandazione basato sulla similarità item-            requisiti voluti.
     item. Nelle raccomandazioni item-item, general-
     mente, si calcola prima la similarità tra ogni coppia       Al fine di personalizzare l’esperienza di uno speci-
     di prodotti A e B, partendo dagli utenti che hanno          fico utente è necessario innanzitutto riconoscere
     acquistato entrambi i prodotti. Se un utente acqui-         in maniera univoca l’originalità dell’utente stesso.
     sta il prodotto A, gli vengono consigliati i prodotti       A tal proposito l’autenticazione, o semplicemente
     B più simili ad A.                                          il riconoscimento di sessioni con mezzi simili alle
                                                                 cookies dei browser web, rappresenta un punto
                                                                 chiave. Alcuni servizi permettono già di usare i co-
     6. Iniziative europee                                       siddetti social login, che semplificano le operazioni
                                                                 di autenticazione associando l’identità di un utente
     6.1 EBU RecSys                                              alle informazioni di base di un social network (ad es.
                                                                 Facebook o Twitter come avviene in Rai Play).
     La European Broadcasting Union (EBU) ha ricono-
     sciuto il ruolo chiave delle raccomandazioni nella          Il riconoscimento dell’utente su dispositivi connessi
     personalizzazione dei contenuti radiotelevisivi, ed         con input limitato, come le radio o le TV, è più labo-
     ha creato il gruppo EBU RecSys. Il gruppo si occupa         rioso. Una possibile soluzione è rappresentata dallo
     di facilitare lo scambio di informazioni tra Media          standard Cross-Platform Authentication [10] il quale
     Company pubbliche che utilizzano tecnologie di              risulta essere compatibile con il protocollo OAuth 2.0
     raccomandazione, condividendo linee guida e co-             utilizzato dai principali social network per associare
     noscenza su aspetti tecnici e scientifici, legati alla      in modo semplice un utente ad un dispositivo.
     normativa e alla standardizzazione. EBU RecSys

                                                                                       Fig. 1 – Il gruppo EBU RecSys sviluppa
                                                                                                anche un raccomandatore
                                                                                                per test ed uso da parte dei
                                                                                                collaboratori

32                                         Elettronica e Telecomunicazioni N° 2/2016                                www.crit.rai.it
Recommender system

         6.2 Un prototipo: la Hybrid Content Radio

         La Hybrid Content Radio (HCR) è un esempio di
         servizio audio personalizzato basato su raccoman-
         dazioni, ideato da Rai ed altri broadcaster pubblici
         della EBU [6]. HCR consiste nella personalizzazione
         del palinsesto di un servizio radio broadcast o
         streaming tradizionale, mediante la sostituzione di
         contenuti audio lineari con clip audio personalizzati,
         suggeriti in modo dipendente dal contesto. Il RS, for-
         nendo suggerimenti sui contenuti, permette in altre
         parole di personalizzare il servizio di radio lineare.

         Il prototipo realizzato consente di passare dall’a-
         scolto live ad una lista di podcast suggeriti, sia
         manualmente (tasto skip), sia automaticamente, in
         modo proattivo, quando le condizioni di contesto               Fig. 2 – Hybrid Content Radio: la radio
         siano appropriate [7][8]. La possibilità di fornire rac-                lineare viene personalizzata
         comandazioni in modo proattivo, quindi senza una                        con contenuti raccomandati,
                                                                                 dipendenti dal contesto.
         richiesta esplicita dell’utente, è un ambito di ricerca
         aperto per i sistemi di raccomandazione.

         7. Limiti dei Recommender Systems                           Discovery: una lista di prodotti suggeriti da un RS
                                                                     dovrebbe consentire all’utente di esplorare anche
         L’efficacia degli algoritmi nell’aiutare l’utente nella     prodotti nuovi e diversi tra loro, secondo un concet-
         scelta di un oggetto o di un servizio è soggetta a          to di discovery o scoperta. Una eccessiva somiglianza
         limitazioni che dipendono dal tipo di algoritmo,            tra i prodotti è in questo caso poco utile e spesso
         dal contesto e dal tipo di suggerimento che si vuole        l’utente desidera anche esplorare nuovi tipi di pro-
         ottenere. Non esiste un unico algoritmo che risolva         dotto rispetto ai soliti.
         in modo ottimale ogni tipo di problema. Di seguito
         sono elencati alcuni limiti e sfide da superare.            Filter Bubbles (bolle di filtraggio): è un concetto
                                                                     introdotto esaurientemente da Eli Pariser [9], che
         Cold Start: alcune tecniche di raccomandazione              riguarda le informazioni che gli algoritmi lasciano
         necessitano di un insieme di dati iniziali per fornire      arrivare all’utente. L’utente è come se fosse confina-
         suggerimenti validi. Ad esempio, perché un algo-            to in una bolla immaginaria costruita dagli algoritmi,
         ritmo di Collaborative Filtering dia risultati sensati      bolla che permette il passaggio di alcune informa-
         è necessario che un oggetto sia già stato valutato          zioni soltanto. In questo modo l’utente rischia di
         da diversi utenti, e, analogamente, che un utente           crearsi una visione molto parziale di molti fatti. Un
         abbia già valutato alcuni oggetti. Ad esempio, il           esempio è il servizio social Facebook, che riordina,
         servizio social “GoodReads”, che si focalizza sui libri,    filtra e consiglia le informazioni anche in base alla
         impone all’utente di valutare almeno 20 libri prima         storia dell’utente. Oltre alla rilevanza, altri fattori
         di fornire un suggerimento. Un algoritmo Content-           devono quindi essere tenuti in considerazione: ad
         based potrà, invece, fornire un suggerimento valido         esempio l’importanza in contesti economici e sociali
         anche per un oggetto nuovo, a patto che a questo            più ampi o la possibilità di dare voce ad altri punti
         siano associati metadati adeguati.                          di vista anche scomodi.

www.crit.rai.it                                Elettronica e Telecomunicazioni N° 2/2016                                       33
Recommender system

      Privacy: il Recommender System fornisce suggeri-             8. Conclusioni
      menti rilevanti per l’utente estraendo così un ordine
      dal caos e dalla complessità delle informazioni a            In questo articolo abbiamo cercato di dare un’idea
      disposizione. L’efficacia di questo processo dipende         di cosa siano i Recommender System, descrivendo
      dalla quantità e dalla precisione dei dati personali         brevemente il loro funzionamento e citando alcuni
      messi a disposizione dall’utente. Il problema fonda-         esempi di aziende che adottano tali sistemi all’inter-
      mentale in questo caso è garantire la trasparenza            no dei loro servizi. Abbiamo descritto la relazione
      delle informazioni raccolte, dando la possibilità            tra RS e personalizzazione di un servizio, e come, in
      all’utente di accedere ad esse o di ritirarle. E poi, è      un mondo in cui le informazioni e i prodotti si mol-
      assolutamente importante garantire la sicurezza di           tiplicano, i sistemi di raccomandazione siano uno
      tali informazioni assicurando che esse non possano           strumento necessario, capace di rendere più efficaci
      essere utilizzate da altri soggetti o per scopi diversi      le ricerche ed ottenere prodotti più adatti a noi.
      da quelli consentiti. La creazione di meccanismi
      standard per la memorizzazione, lo scambio e l’ac-           L’utilizzo appropriato dei RS deve tenere in ade-
      cesso alle informazioni dell’utente è un punto di            guata considerazione la nostra privacy ed evitare
      grande interesse ancora aperto su cui anche MPEG             la creazione di filter bubbles che ci confinino in un
      sta lavorando (si veda [11]).                                mondo chiuso, rendendoci troppo sicuri della com-
                                                                   pletezza dell’informazione che stiamo ricevendo.
      L’Unione Europea ha anche emanato nel 2016 una               Per questo è importante che gli algoritmi imple-
      direttiva ed un regolamento sulla protezione dei             mentati tengano in considerazione anche aspetti
      dati personali che avranno valore negli stati membri         che vanno oltre la rilevanza personale, e in questo
      a partire dai prossimi anni (si vedano [12] e [13]) e        il ruolo dell’editore è di primaria importanza.
      che richiedono trasparenza nel trattamento dei dati
      generati dagli utenti.                                       Come molti altri prodotti dell’ingegno umano,
                                                                   anche i RS presentano grandi vantaggi ed enormi
                                                                   opportunità per il futuro, ma il buon senso e la
                                                                   trasparenza nella gestione delle informazioni sono
     Fig. 3 – I limiti dovuti alle filter                          fondamentali per mitigarne le criticità.
              bubbles descritte da
              Pariser sono una delle
              sfide che gli algoritmi
              di raccomandazione
              devono superare.
              (foto di Clint Mason, flikr,
              CC BY 2.0)

34                                           Elettronica e Telecomunicazioni N° 2/2016                               www.crit.rai.it
Recommender system

         Appendice A                                                   matrice S è una matrice diagonale g x g (con g righe
                                                                       e g colonne) i cui elementi sono i valori singolari
         Un esempio di Collaborative Filtering ottenuto                della matrice R e g è il suo rango. Possiamo ridurre
         con la Fattorizzazione Matriciale SVD                         la complessità usando solo gli f valori singolari di S
                                                                       più significativi, con f
Recommender system

     Bibliografia
     [1] R. Burke, Hybrid recommender systems: Survey and             [10] ETSI TS 103 407 - V1.1.1 (2016-04), Cross Platform
         Experiments, in “User Modeling and User-Adapted                   Authentication for limited input hybrid consumer
         interaction” , vol. 12, Numero 4, Novembre 2002,                  equipment
         pp. 331-370.
                                                                      [11] S. Metta, P. Casagranda, A. Messina, M. Montagnuolo
     [2] F. Ricci, L. Rokach e B. Shapira, Recommender systems:            e F. Russo, Leveraging MPEG-21 user description for
         introduction and challenges, in “Recommender Sys-                 interoperable recommender systems, in “Proceedings
         tems Handbook”, Springer US, 2015, pp. 1-34.                      of the 31st Annual ACM Symposium on Applied
                                                                           Computing (SAC’16)“, pp. 1072-1074, 2016.
     [3] G. Adomavicius, B. Mobasher, F. Ricci e A. Tuzhilin,
         Context-Aware Recommender Systems, in “AI Maga-              [12] DIRETTIVA (UE) 2016/680 DEL PARLAMENTO EUROPEO
         zine”, vol. 32, Numero 3, Autunno 2011, pp. 67-80.                E DEL CONSIGLIO del 27 aprile 2016 relativa alla protezi-
                                                                           one delle persone fisiche con riguardo al trattamento
     [4] C. A. Gomez-Uribe e N. Hunt, The Netflix                          dei dati personali da parte delle autorità competenti a
         Recommender System: Algorithms, Business Value,                   fini di prevenzione, indagine, accertamento e persegui-
         and Innovation, in “ACM Transaction on Management                 mento di reati o esecuzione di sanzioni penali, nonché
         Information Systems”, vol. 6, Numero 4, Gennaio                   alla libera circolazione di tali dati e che abroga la deci-
         2016, Articolo 13.                                                sione quadro 2008/977/GAI del Consiglio

     [5] B. Sarwar, G. Karypis, J. Konstan e J. Riedl, Application    [13] REGOLAMENTO (UE) 2016/679 DEL PARLAMENTO
         of dimensionality reduction in recommender systems                EUROPEO E DEL CONSIGLIO, 27 aprile 2016 relativo
         – a case study, ACM WebKDD-2000 Workshop, 2000                    alla protezione delle persone fisiche con riguardo al
                                                                           trattamento dei dati personali, nonché alla libera cir-
     [6] P. Casagranda, A. Erk, S. O’Halpin, D. Born e W.Huijten,          colazione di tali dati e che abroga la direttiva 95/46/
         A Framework for a Context-Based Hybrid Content                    CE (regolamento generale sulla protezione dei dati)
         Radio, in “Proceedings of 2015 International Broad-
         casting Convention (IBC)”, 2015.                             [14] J. Leskovec, A. Rajaraman e J. Ullman, Mining of
                                                                           Massive Datasets, Cambridge University Press, 2014
     [7] M. Braunhofer, F. Ricci, B. Lamche e W. Worndl, A
         context-aware model for proactive recommender                [15] M. Rasetti, I Big Data: rivoluzione tra scienza e
         systems in the tourism domain, in “MobileHCI ‘15                  conoscenza, in “Oxygen”, Numero 22, Febbraio 2014,
         Proceedings of the 17th International Conference on               pp. 110-113
         Human-Computer Interaction with Mobile Devices
         and Services Adjunct”, Agosto 2915, pp. 1070-1075            [16] Cloud and Mobile Network Traffic Forecast - VNI, Cisco,
                                                                           ultimo accesso 1 Febbraio 2017
     [8] P. Casagranda, M. L. Sapino e K. S. Candan, Context-
         Aware Proactive Personalization of Linear Audio              [17] Commissione Europea, Building a European Data
         Content, in “Proceedings of the 20th International                Economy
         Conference on Extending Database Technology
         (EDBT)”, Marzo 2017, pp. 574-577                             [18] Y. Koren, R. Bell e C. Volinsky, Matrix factorization tech-
                                                                           niques for recommender systems, in “IEEE Computer”,
     [9] E. Pariser, The filter bubble: What the Internet is hiding        vol. 42, Numero 8, Agosto 2009, pp. 42-49
         from you, Penguin UK, 2011.
                                                                      [19] F. Ricci, L. Rokach e B. Shapira, Recommender Systems
                                                                           Handbook, Springer, 2015.

36                                             Elettronica e Telecomunicazioni N° 2/2016                                          www.crit.rai.it
Recommender system

www.crit.rai.it   Elettronica e Telecomunicazioni N° 2/2016                        37
Puoi anche leggere