Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica

Pagina creata da Salvatore Pagano
 
CONTINUA A LEGGERE
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Modulo B

Valutare i sistemi
automatici di
interazione
linguistica

6. Dialogo testuale

14 marzo 2018

                      Linguistica italiana II
                        Mirko Tavosanis
                         A. a. 2017-2018
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Traduzione del parlato
   Oggi possibile in tempo reale
   I risultati sono tutti da valutare
   Sono anche molto difficili da valutare, perché l’interazione
    ha senso tenendo conto delle competenze
    dell’interlocutore
   Ha poco senso, per esempio, trascrivere un dialogo reale
    tra italiani e farlo recitare da un italiano e da un
    giapponese per vedere quanto viene tradotto da Microsoft
    Skype Translator... O far ripetere lo stesso dialogo dalle
    stesse persone
   ”Foreigner talk” facilitato dalla tecnologia?
   Vediamo il contesto
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Tradurre lo scritto
                      e tradurre il parlato
   In astratto, sembrerebbero due varianti della stessa attività
   Storicamente sono spesso state considerate due attività molto
    diverse
       Traduzione (nell’Italia medievale: fatta da un volgarizzatore)
       Interpretariato (nella prima età moderna: fatto da un dragomanno)
   Le diversità sono evidenti:
       La traduzione opera su testi scritti e ha meno vincoli di tempo
       L’interpretariato opera su testi orali in tempo reale

   Per una sintesi: Georges Mounin, Teoria e storia della
    traduzione
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Traduzione e interpretariato
   La traduzione ha avuto spesso un alto prestigio culturale;
    l’interpretariato è stato considerato spesso un’attività
    meccanica
   La capacità di comunicare a voce indipendentemente dalle
    barriere linguistiche è al centro del discorso di Ostler sulle
    lingue franche
   Nella narrativa e nei
    film si è spesso
    immaginato di
    risolvere i problemi
    di comunicazione in
    tempo reale
    attraverso sistemi
    intuitivi e istantanei
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Traduzione e interpretariato
Tipi di ”traduzione” fatta da interpreti:
   Simultanea: il discorso non viene interrotto
   Consecutiva: il discorso viene interrotto per lasciare spazio alla
    traduzione
Anche in questo caso piccole modifiche di interfaccia possono
fare la differenza
Uno standard del passato: manuali di conversazione con frasi
pronte all’uso
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Monty Python – Il dizionario di ungherese (in: Adesso qualcosa di
                 completamente diverso, 1971)
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Traduzione automatica del parlato
   La differenza tra interprete e traduttore – e
    tra scritto e parlato – viene molto ridotta
   A monte, sembra che un unico sistema si
    occupi di entrambe le funzioni (come
    avviene per Google Traduttore e Microsoft
    Translator)
   Le differenze più importanti diventano:
       Prestazioni (capacità o meno di riconoscere
        anche il parlato, con tutte le caratteristiche che
        abbiamo visto nel modulo A)
       Interfaccia (adatta o meno a un lavoro in tempo
        reale)
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Strumenti disponibili
   L’app Traduttore di Google sembra di
    gran lunga il miglior prodotto disponibile
    (permette anche di scaricare pacchetti di
    lingue per la traduzione offline)
   iTranslate viene spesso citato come
    seconda migliore alternativa
   Traduttore permette l’input a voce,
    digitando, disegnando o inquadrando
    immagini
   L’0utput è formato da testo o voce
   Una prova:
    https://youtu.be/kKLITKo8HM4
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Testimonianze
   Si trovano pochissime testimonianze di uso reale, soprattutto
    da parte di italiani – una ricerca potrebbe essere molto utile
   Non mi sembra esistano ancora statistiche
   (Google Traduttore è stato a lungo bloccato in Cina e lo è
    probabilmente ancora adesso)
   Per il mobile, l’uso più documentato mi sembra la traduzione di
    scritte; molto meno la traduzione del parlato in tempo reale
   Viceversa, si trovano numerose testimonianze dell’uso di
    Google Traduttore per pagine web, e-mail e simili
   Molte testimonianze relative al mobile mostrano disagio e
    riluttanza a usare il sistema
Dialogo testuale Modulo B Valutare i sistemi automatici di interazione linguistica
Esempi
Another essential for me was GOOGLE TRANSLATE because it
allowed me not only to communicate with the voice option , but
even to translate the kanji characters via the mobile phone camera,
simply by framing the message that I wanted to translate.
Esempi
Before I left, I downloaded the Android app and the Japanese
language pack for offline translation. I anticipated using this any
time someone wanted to talk to me.
As it turns out, this was a terrible idea. Sticking a phone in
someone’s face every time I had a question was not intuitive and
probably offensive. However, I did use it as a phrasebook. I saved
phrases like “Thank you”, “ Where is the bathroom?”, and “My
hovercraft is full of eels” for quick reference. Eventually I was able
to memorize them, but having them in an app was convenient. Of
course, the usual disclaimers about accuracy still apply: for
anything more complex than the absolute basics, be sure to double-
check with either an actual phrase book or a native speaker. In my
experience, though, if you could translate a phrase to Japanese,
and then use the reverse translate feature on that translation and
get the correct sentence back, it tended to be close enough for
native speakers to understand.
Problema di interfaccia
• Parlare a una persona presente usando un telefono è ancora
  ritenuto scortese
• D’altra parte, ci siamo abituati rapidamente all’uso di
  smartphone (in meno di dieci anni)
• Qualche innovazione, anche non connessa – per esempio,
  auricolari senza fili e comodi da usare, in grado di accettare una
  trasmissione dall’esterno – potrebbe rendere di colpo normale
  questa situazione
• Un esempio di soluzione intermedia: ili (ancora non disponibile:
  pensato solo per inglese, cinese e giapponese senza bisogno di
  connessione Internet)
• In ogni caso, non ci sono problemi a parlare via Skype usando
  un traduttore
Conversazione
• La componente vocale è molto difficile da riprodurre
• Se la conversazione è ridotta al solo testo, il problema è
  più ridotto
• I sistemi di chat testuale con macchine esistono da
  decenni e sono stati tra i primi sistemi di interazione
• Ciò che è cambiato: le loro funzioni e le loro potenzialità
Il test di Turing
• Proposto per la prima volta da Alan Turing nel 1950 sulla rivista
  «Mind»
• Nella formulazione originale è piuttosto ristretto, ma è stato
  interpretato come «un computer capace di far credere di essere un
  essere umano»
• Turing l’ha reinterpretato in vario modo negli anni successivi
• In realtà, è un test sorprendentemente limitato!
The new form of the problem can be described in terms of a game which we call the
'imitation game." It is played with three people, a man (A), a woman (B), and an
interrogator (C) who may be of either sex. The interrogator stays in a room apart front the
other two. The object of the game for the interrogator is to determine which of the other
two is the man and which is the woman. He knows them by labels X and Y, and at the end
of the game he says either "X is A and Y is B" or "X is B and Y is A." The interrogator is
allowed to put questions to A and B thus:

C: Will X please tell me the length of his or her hair?

Now suppose X is actually A, then A must answer. It is A's object in the game to try and
cause C to make the wrong identification. His answer might therefore be:

"My hair is shingled, and the longest strands are about nine inches long."

In order that tones of voice may not help the interrogator the answers should be written,
or better still, typewritten. The ideal arrangement is to have a teleprinter communicating
between the two rooms. Alternatively the question and answers can be repeated by an
intermediary. The object of the game for the third player (B) is to help the interrogator.
The best strategy for her is probably to give truthful answers. She can add such things as "I
am the woman, don't listen to him!" to her answers, but it will avail nothing as the man
can make similar remarks.

We now ask the question, "What will happen when a machine takes the part of A in this
game?" Will the interrogator decide wrongly as often when the game is played like this as
he does when the game is played between a man and a woman? These questions replace
our original, "Can machines think?"
Limiti del test
• Il test dipende dalle capacità dell’interrogatore e da molti fattori
• Un buon programma può essere ragionevolmente ingannevole anche
  se lontanissimo da una vera intelligenza artificiale
   •   Inoltre, non è affatto detto che una simulazione ingannevole corrisponda a
       un’intelligenza e a una comprensione: è il problema della «stanza cinese» di
       Searle

• Molto dipende dai giudici: in molte occasioni, fin dagli anni Sessanta,
  programmi di chat sono stati scambiati per esseri umani
• Comunque dal 1990 esiste il Loebner Prize per valutare i migliori
  chatbot
Eliza
• Eliza, scritto nel 1966 in MAD-SILP da Joseph Weizenbaum, è un
  programma che simula una conversazione
• In pratica, il programma esamina le battute scritte da un
  interlocutore umano e prova a individuare parole chiave
   •   Se le parole chiave sono trovate, il programma le rielabora secondo le sue regole
   •   Se non sono trovate, vengono presentate risposte generiche interlocutorie
       oppure vengono riprese risposte già date

• Uno script di successo, all’interno del programma, simula il
  comportamento di uno psicanalista rogersiano – che non contraddice
  mai il paziente e cerca di fare in modo che sia il paziente stesso a
  rispondere alla proprie domande
• Anche se può passare il test di Turing, il programma è ovviamente
  del tutto privo di intelligenza
• Un’implementazione di Eliza è inserita anche nel programma di
  scrittura EMACS – però funziona solo per l’inglese
PARRY
• PARRY, sviluppato nel 1972 da Kenneth Colby, è un simulatore di
  comportamento paranoico e schizofrenico
• Incontro tra Eliza e PARRY:

•   I am not sure I understand you fully.

•   *You keep asking me the same things, why not change the topic?

•   In what way?

•   *What do you mean?

•   Why are such questions on your mind?

•   *I thought I told you, people get on my nerves.

•   Your nerves?

•   *Well, I don't know.

•   Don't you really know?

•   *I would say so.
Applicazioni pratiche
• Più che altro, oggi sono importanti le applicazioni pratiche della
  procedura inversa: distinguere gli esseri umani dalle macchine
• I CAPTCHA (inventati nel 1997 come “Completely Automated Public
  Turing test to tell Computers and Humans Apart”) sono domande
  progettate per fare in modo che i computer non siano in grado di
  rispondere

• Tuttavia, esiste anche l’interesse commerciale (anche se a volte non
  legale) per la simulazione classica: far credere agli esseri umani di
  avere a che fare con esseri umani
• In questi casi, però, è molto difficile individuare le dimensioni del
  fenomeno
Il caso Ashley Madison
• Servizio canadese di incontri per relazioni extraconiugali, fondato nel
  2002
• Dopo furto dei dati utenti nel 2015, Annalee Lewitz ha analizzato i
  materiali pubblicati ed è arrivata alla conclusione che il sito usasse
  almeno 70.000 bot, in 31 lingue, con false identità femminili per
  trattenere i clienti maschi
• Secondo una stima poi smentita gli utenti reali di sesso femminile
  erano solo una minima percentuale degli utenti… ma comunque i bot
  erano in pratica rivolti unicamente ai clienti maschi
Il dialogo umano
• Ai tempi di Eliza, la conversazione in chat non era un’attività comune
• Oggi la conversazione in chat è comune (in Italia la penetrazione di
  Whatsapp è probabilmente superiore al 40% della popolazione)
• Esiste quindi un’ampia esperienza di dialogo umano via chat
• Il linguaggio usato è prevalentemente informale e molto difficile da
  simulare
Due categorie
• In molti casi la comunicazione elettronica ha messo in evidenza
  l’esistenza di una contrapposizione:
   •   Uso di comunità, ludico, scherzoso
   •   Uso professionale

• Del resto, il linguaggio probabilmente nasce come strumento per
  vantaggi sociali – e solo in un secondo momento si adatta al
  trasferimento di informazioni
• Per quanto riguarda i mezzi elettronici, danah boyd (It’s
  Complicated: The social lives of networked teens, New Haven e
  Londra, Yale University Press, 2014) distingue tre fasi:
   •   Hanging out
   •   Messing around
   •   Geeking out
Contrapposizione
• Lato mio, l’ho studiata soprattutto nei forum e nei blog (Tavosanis,
  L’italiano del web); i blog per esempio si distinguono nettamente, dal
  punto di vista linguistico, in:
   •   Blog diario (oggi tendenzialmente diario letterario)
   •   Blog tematici

• Oggi è abbastanza evidente anche nella comunicazione condotta
  attraverso Facebook
   •   Le mie osservazioni: Il linguaggio della comunicazione politica su Facebook, in
       L’italiano della politica e la politica per l’italiano. Atti del XI Convegno ASLI
       Associazione per la Storia della Lingua Italiana (Napoli, 20-22 novembre
       2014), a cura di Rita Librandi e Rosa Piro, Firenze, Cesati, 2016, pp. 677-685

• Questa contrapposizione si incrocia con un’altra tendenza: ogni volta
  che si profila il dialogo, la comunicazione diventa meno formale
• Anche nella lingua delle chat si individua questa contrapposizione, in
  relazione alle situazioni
Studi sulle chat
• Il prototipo: chat ludiche e di gruppo, tra sconosciuti, solo testuali
• Elena Pistolesi ha studiato la scrittura di IRC (Il parlar spedito.
  L’itailano di chat, e-mail e SMS, Padova, Esedra, 2004, cap. I)
• In particolare, ha visto:
   •   Le conversazioni dal punto di vista dell’analisi conversazionale
   •   La «ricerca della voce»

• La situazione si è sicuramente molto evoluta negli anni, ma non ci
  sono ancora studi sul modo in cui effettivamente si scrive su
  Whatsapp (o simili)
• Come minimo, c’è la differenza data dal fatto che le persone qui si
  conoscono – v. pubblicazioni di chat Whatsapp su Facebook
• Un’altra possibile differenza è data dall’integrazione di elementi
  multimediali, a cominciare dalle emoticon
Esempi di conversazione su
              Whatsapp
• A: Sicura che ti piace?
• B: Belina stai benissimo !
• A: Glassie
• B: Cami ma te esci pomer?
• A: No
• A: Sto studiando geographic
• B: Ah vabbe niente allora ahah
• A: Sorry
• B: Asp ho un idea
• A: Dimmi
(Masilla 2014)
Assistenti testuali
• Un interlocutore capace di dialogare potrebbe essere divertente e
  utile
• Google Assistant permette di interagire anche via chat, oltre che in
  formato testo
• Negli ultimi anni c’è stata una vera «moda dei chatbot»
• Tuttavia, non è chiaro quali vantaggi può avere questo sistema
  rispetto a una tradizionale interfaccia grafica di accesso alle
  informazioni
Chatbot
• I sistemi di dialogo testuale vengono spesso chiamati chatbot
  (termine inventato da Michael Mauldin nel 1994)
• Alternative: bot, chatterbot, eccetera
• Vediamo un esempio da un prodotto in lingua italiana per la
  fornitura di informazioni sul riciclaggio, GETrid
Puoi anche leggere