Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
Modulo B Valutare i sistemi automatici di interazione linguistica 6. Dialogo testuale 14 marzo 2018 Linguistica italiana II Mirko Tavosanis A. a. 2017-2018
Traduzione del parlato Oggi possibile in tempo reale I risultati sono tutti da valutare Sono anche molto difficili da valutare, perché l’interazione ha senso tenendo conto delle competenze dell’interlocutore Ha poco senso, per esempio, trascrivere un dialogo reale tra italiani e farlo recitare da un italiano e da un giapponese per vedere quanto viene tradotto da Microsoft Skype Translator... O far ripetere lo stesso dialogo dalle stesse persone ”Foreigner talk” facilitato dalla tecnologia? Vediamo il contesto
Tradurre lo scritto e tradurre il parlato In astratto, sembrerebbero due varianti della stessa attività Storicamente sono spesso state considerate due attività molto diverse Traduzione (nell’Italia medievale: fatta da un volgarizzatore) Interpretariato (nella prima età moderna: fatto da un dragomanno) Le diversità sono evidenti: La traduzione opera su testi scritti e ha meno vincoli di tempo L’interpretariato opera su testi orali in tempo reale Per una sintesi: Georges Mounin, Teoria e storia della traduzione
Traduzione e interpretariato La traduzione ha avuto spesso un alto prestigio culturale; l’interpretariato è stato considerato spesso un’attività meccanica La capacità di comunicare a voce indipendentemente dalle barriere linguistiche è al centro del discorso di Ostler sulle lingue franche Nella narrativa e nei film si è spesso immaginato di risolvere i problemi di comunicazione in tempo reale attraverso sistemi intuitivi e istantanei
Traduzione e interpretariato Tipi di ”traduzione” fatta da interpreti: Simultanea: il discorso non viene interrotto Consecutiva: il discorso viene interrotto per lasciare spazio alla traduzione Anche in questo caso piccole modifiche di interfaccia possono fare la differenza Uno standard del passato: manuali di conversazione con frasi pronte all’uso
Traduzione automatica del parlato La differenza tra interprete e traduttore – e tra scritto e parlato – viene molto ridotta A monte, sembra che un unico sistema si occupi di entrambe le funzioni (come avviene per Google Traduttore e Microsoft Translator) Le differenze più importanti diventano: Prestazioni (capacità o meno di riconoscere anche il parlato, con tutte le caratteristiche che abbiamo visto nel modulo A) Interfaccia (adatta o meno a un lavoro in tempo reale)
Strumenti disponibili L’app Traduttore di Google sembra di gran lunga il miglior prodotto disponibile (permette anche di scaricare pacchetti di lingue per la traduzione offline) iTranslate viene spesso citato come seconda migliore alternativa Traduttore permette l’input a voce, digitando, disegnando o inquadrando immagini L’0utput è formato da testo o voce Una prova: https://youtu.be/kKLITKo8HM4
Testimonianze Si trovano pochissime testimonianze di uso reale, soprattutto da parte di italiani – una ricerca potrebbe essere molto utile Non mi sembra esistano ancora statistiche (Google Traduttore è stato a lungo bloccato in Cina e lo è probabilmente ancora adesso) Per il mobile, l’uso più documentato mi sembra la traduzione di scritte; molto meno la traduzione del parlato in tempo reale Viceversa, si trovano numerose testimonianze dell’uso di Google Traduttore per pagine web, e-mail e simili Molte testimonianze relative al mobile mostrano disagio e riluttanza a usare il sistema
Esempi Another essential for me was GOOGLE TRANSLATE because it allowed me not only to communicate with the voice option , but even to translate the kanji characters via the mobile phone camera, simply by framing the message that I wanted to translate.
Esempi Before I left, I downloaded the Android app and the Japanese language pack for offline translation. I anticipated using this any time someone wanted to talk to me. As it turns out, this was a terrible idea. Sticking a phone in someone’s face every time I had a question was not intuitive and probably offensive. However, I did use it as a phrasebook. I saved phrases like “Thank you”, “ Where is the bathroom?”, and “My hovercraft is full of eels” for quick reference. Eventually I was able to memorize them, but having them in an app was convenient. Of course, the usual disclaimers about accuracy still apply: for anything more complex than the absolute basics, be sure to double- check with either an actual phrase book or a native speaker. In my experience, though, if you could translate a phrase to Japanese, and then use the reverse translate feature on that translation and get the correct sentence back, it tended to be close enough for native speakers to understand.
Problema di interfaccia • Parlare a una persona presente usando un telefono è ancora ritenuto scortese • D’altra parte, ci siamo abituati rapidamente all’uso di smartphone (in meno di dieci anni) • Qualche innovazione, anche non connessa – per esempio, auricolari senza fili e comodi da usare, in grado di accettare una trasmissione dall’esterno – potrebbe rendere di colpo normale questa situazione • Un esempio di soluzione intermedia: ili (ancora non disponibile: pensato solo per inglese, cinese e giapponese senza bisogno di connessione Internet) • In ogni caso, non ci sono problemi a parlare via Skype usando un traduttore
Conversazione • La componente vocale è molto difficile da riprodurre • Se la conversazione è ridotta al solo testo, il problema è più ridotto • I sistemi di chat testuale con macchine esistono da decenni e sono stati tra i primi sistemi di interazione • Ciò che è cambiato: le loro funzioni e le loro potenzialità
Il test di Turing • Proposto per la prima volta da Alan Turing nel 1950 sulla rivista «Mind» • Nella formulazione originale è piuttosto ristretto, ma è stato interpretato come «un computer capace di far credere di essere un essere umano» • Turing l’ha reinterpretato in vario modo negli anni successivi • In realtà, è un test sorprendentemente limitato!
The new form of the problem can be described in terms of a game which we call the 'imitation game." It is played with three people, a man (A), a woman (B), and an interrogator (C) who may be of either sex. The interrogator stays in a room apart front the other two. The object of the game for the interrogator is to determine which of the other two is the man and which is the woman. He knows them by labels X and Y, and at the end of the game he says either "X is A and Y is B" or "X is B and Y is A." The interrogator is allowed to put questions to A and B thus: C: Will X please tell me the length of his or her hair? Now suppose X is actually A, then A must answer. It is A's object in the game to try and cause C to make the wrong identification. His answer might therefore be: "My hair is shingled, and the longest strands are about nine inches long." In order that tones of voice may not help the interrogator the answers should be written, or better still, typewritten. The ideal arrangement is to have a teleprinter communicating between the two rooms. Alternatively the question and answers can be repeated by an intermediary. The object of the game for the third player (B) is to help the interrogator. The best strategy for her is probably to give truthful answers. She can add such things as "I am the woman, don't listen to him!" to her answers, but it will avail nothing as the man can make similar remarks. We now ask the question, "What will happen when a machine takes the part of A in this game?" Will the interrogator decide wrongly as often when the game is played like this as he does when the game is played between a man and a woman? These questions replace our original, "Can machines think?"
Limiti del test • Il test dipende dalle capacità dell’interrogatore e da molti fattori • Un buon programma può essere ragionevolmente ingannevole anche se lontanissimo da una vera intelligenza artificiale • Inoltre, non è affatto detto che una simulazione ingannevole corrisponda a un’intelligenza e a una comprensione: è il problema della «stanza cinese» di Searle • Molto dipende dai giudici: in molte occasioni, fin dagli anni Sessanta, programmi di chat sono stati scambiati per esseri umani • Comunque dal 1990 esiste il Loebner Prize per valutare i migliori chatbot
Eliza • Eliza, scritto nel 1966 in MAD-SILP da Joseph Weizenbaum, è un programma che simula una conversazione • In pratica, il programma esamina le battute scritte da un interlocutore umano e prova a individuare parole chiave • Se le parole chiave sono trovate, il programma le rielabora secondo le sue regole • Se non sono trovate, vengono presentate risposte generiche interlocutorie oppure vengono riprese risposte già date • Uno script di successo, all’interno del programma, simula il comportamento di uno psicanalista rogersiano – che non contraddice mai il paziente e cerca di fare in modo che sia il paziente stesso a rispondere alla proprie domande • Anche se può passare il test di Turing, il programma è ovviamente del tutto privo di intelligenza • Un’implementazione di Eliza è inserita anche nel programma di scrittura EMACS – però funziona solo per l’inglese
PARRY • PARRY, sviluppato nel 1972 da Kenneth Colby, è un simulatore di comportamento paranoico e schizofrenico • Incontro tra Eliza e PARRY: • I am not sure I understand you fully. • *You keep asking me the same things, why not change the topic? • In what way? • *What do you mean? • Why are such questions on your mind? • *I thought I told you, people get on my nerves. • Your nerves? • *Well, I don't know. • Don't you really know? • *I would say so.
Applicazioni pratiche • Più che altro, oggi sono importanti le applicazioni pratiche della procedura inversa: distinguere gli esseri umani dalle macchine • I CAPTCHA (inventati nel 1997 come “Completely Automated Public Turing test to tell Computers and Humans Apart”) sono domande progettate per fare in modo che i computer non siano in grado di rispondere • Tuttavia, esiste anche l’interesse commerciale (anche se a volte non legale) per la simulazione classica: far credere agli esseri umani di avere a che fare con esseri umani • In questi casi, però, è molto difficile individuare le dimensioni del fenomeno
Il caso Ashley Madison • Servizio canadese di incontri per relazioni extraconiugali, fondato nel 2002 • Dopo furto dei dati utenti nel 2015, Annalee Lewitz ha analizzato i materiali pubblicati ed è arrivata alla conclusione che il sito usasse almeno 70.000 bot, in 31 lingue, con false identità femminili per trattenere i clienti maschi • Secondo una stima poi smentita gli utenti reali di sesso femminile erano solo una minima percentuale degli utenti… ma comunque i bot erano in pratica rivolti unicamente ai clienti maschi
Il dialogo umano • Ai tempi di Eliza, la conversazione in chat non era un’attività comune • Oggi la conversazione in chat è comune (in Italia la penetrazione di Whatsapp è probabilmente superiore al 40% della popolazione) • Esiste quindi un’ampia esperienza di dialogo umano via chat • Il linguaggio usato è prevalentemente informale e molto difficile da simulare
Due categorie • In molti casi la comunicazione elettronica ha messo in evidenza l’esistenza di una contrapposizione: • Uso di comunità, ludico, scherzoso • Uso professionale • Del resto, il linguaggio probabilmente nasce come strumento per vantaggi sociali – e solo in un secondo momento si adatta al trasferimento di informazioni • Per quanto riguarda i mezzi elettronici, danah boyd (It’s Complicated: The social lives of networked teens, New Haven e Londra, Yale University Press, 2014) distingue tre fasi: • Hanging out • Messing around • Geeking out
Contrapposizione • Lato mio, l’ho studiata soprattutto nei forum e nei blog (Tavosanis, L’italiano del web); i blog per esempio si distinguono nettamente, dal punto di vista linguistico, in: • Blog diario (oggi tendenzialmente diario letterario) • Blog tematici • Oggi è abbastanza evidente anche nella comunicazione condotta attraverso Facebook • Le mie osservazioni: Il linguaggio della comunicazione politica su Facebook, in L’italiano della politica e la politica per l’italiano. Atti del XI Convegno ASLI Associazione per la Storia della Lingua Italiana (Napoli, 20-22 novembre 2014), a cura di Rita Librandi e Rosa Piro, Firenze, Cesati, 2016, pp. 677-685 • Questa contrapposizione si incrocia con un’altra tendenza: ogni volta che si profila il dialogo, la comunicazione diventa meno formale • Anche nella lingua delle chat si individua questa contrapposizione, in relazione alle situazioni
Studi sulle chat • Il prototipo: chat ludiche e di gruppo, tra sconosciuti, solo testuali • Elena Pistolesi ha studiato la scrittura di IRC (Il parlar spedito. L’itailano di chat, e-mail e SMS, Padova, Esedra, 2004, cap. I) • In particolare, ha visto: • Le conversazioni dal punto di vista dell’analisi conversazionale • La «ricerca della voce» • La situazione si è sicuramente molto evoluta negli anni, ma non ci sono ancora studi sul modo in cui effettivamente si scrive su Whatsapp (o simili) • Come minimo, c’è la differenza data dal fatto che le persone qui si conoscono – v. pubblicazioni di chat Whatsapp su Facebook • Un’altra possibile differenza è data dall’integrazione di elementi multimediali, a cominciare dalle emoticon
Esempi di conversazione su Whatsapp • A: Sicura che ti piace? • B: Belina stai benissimo ! • A: Glassie • B: Cami ma te esci pomer? • A: No • A: Sto studiando geographic • B: Ah vabbe niente allora ahah • A: Sorry • B: Asp ho un idea • A: Dimmi (Masilla 2014)
Assistenti testuali • Un interlocutore capace di dialogare potrebbe essere divertente e utile • Google Assistant permette di interagire anche via chat, oltre che in formato testo • Negli ultimi anni c’è stata una vera «moda dei chatbot» • Tuttavia, non è chiaro quali vantaggi può avere questo sistema rispetto a una tradizionale interfaccia grafica di accesso alle informazioni
Chatbot • I sistemi di dialogo testuale vengono spesso chiamati chatbot (termine inventato da Michael Mauldin nel 1994) • Alternative: bot, chatterbot, eccetera • Vediamo un esempio da un prodotto in lingua italiana per la fornitura di informazioni sul riciclaggio, GETrid
Puoi anche leggere