Agentività e telicità in GilBERTo: implicazioni cognitive - CEUR-WS

Pagina creata da Alberto Venturini
 
CONTINUA A LEGGERE
Agentività e telicità in GilBERTo: implicazioni cognitive
                     Agnese Lombardi, Alessandro Lenci
                        Università di Pisa, Pisa, Italia
      a.lombardi19@studenti.unipi.it, alessandro.lenci@unipi.it

                     Abstract                            simile (Wittgenstein, 1953; Harris, 1954; Firth,
                                                         1957).
    English. The goal of this study is to inves-            I modelli distribuzionali sono stati impiegati
    tigate whether a Transformer-based neural            con successo in molti task di Natural Language
    language model infers lexical semantics              Processing, ma quale siano le conoscenze acqui-
    and use this information for the comple-             site durante il processo di addestramento rimane
    tion of morphosyntactic patterns. The se-            una questione ancora aperta.
    mantic properties considered are telicity               Uno degli approcci per comprendere la natura
    (also combined with definiteness) and                di queste informazioni linguistiche consiste nel
    agentivity. Both act at the interface be-            valutare la loro accuratezza in task psicolingui-
    tween semantics and morphosyntax: they               stici1. Alcuni studi hanno indagato proprietà e di-
    are semantically determined and syntacti-            pendenze sintattiche (Linzen et al., 2016; Ettinger,
    cally encoded. The tasks were submitted              2016; Wilcox et al., 2018; Futrell et al., 2019;
    to both the computational model and a                Marvin e Linzen, 2018; Hu et al., 2020; Lau et al.,
    group of Italian native speakers. The com-           2020), altri si sono concentrati su aspetti semantici
    parison between the two groups of data al-           e pragmatici come: la similarità (Hill et al.,2015),
    lows us to investigate to what extent neu-           la categorizzazione (Baroni e Lenci, 2010), l’ana-
    ral language models capture significant              logia (Mikolov et al., 2013), la negazione (Marvin
    aspects of human semantic competence.                e Linzen, 2018; Jumelet e Hupkes, 2018), il ragio-
                                                         namento pragmatico, i ruoli semantici e la cono-
    Italiano. L’obiettivo di questo studio è             scenza eventiva (Ettinger, 2020).
    quello di indagare se neural language mo-               Il nostro lavoro contribuisce a questa linea di
    dels basati su Transformer inferiscono               ricerca e ne adotta l’approccio psicolinguistico,
    aspetti semantico-lessicali rilevanti per            ma se ne discosta nelle proprietà investigate, pro-
    l’interfaccia con la sintassi ed utilizzano          ponendo l’analisi della telicità (in combinazione
    queste informazioni per il completamento             con l’individuazione) e dell’agentività.
    di task morfosintattici. Le proprietà se-                L’obiettivo è indagare se l’inferenza di queste
    mantiche considerate sono la telicità (an-           proprietà semantico-lessicali favorisce l’elabora-
    che in relazione all’individuazione) e               zione di alcuni task morfosintattici. Nella nostra
    l’agentività. Entrambe sono semantica-               analisi abbiamo scelto di utilizzare un modello di-
    mente determinate e sintatticamente codi-            stribuzionale di tipo predittivo che utilizza rappre-
    ficate. I task sono stati sottoposti sia al          sentazioni contestualizzate (Peters et al., 2018;
    modello che ai parlanti. La comparazione             Devlin et al., 2019): GilBERTo, un modello di-
    tra i due gruppi di dati ci permetterà di            stribuzionale italiano ispirato all’architettura di
    determinare se questi modelli computa-               RoBERTa (Liu et al., 2019).
    zionali catturano aspetti significativi della
    competenza semantica umana.                          2    Aspetti della semantica di interfaccia:
                                                              azionalità e agentività
1    Introduzione
                                                         Un importante dominio dell’informazione lessi-
L’ipotesi distribuzionale stabilisce che lessemi         cale riguarda l’evento e i suoi partecipanti. Se da
con contesti linguistici simili hanno un significato     un lato l’aspetto è una nozione di natura eminen-
                                                         temente morfologica e semantica, che riguarda le

  Copyright ©️ 2021 for this paper by its authors. Use   1 Gli stimoli, nei task psicolinguistici, sono progettati
permitted under Creative Commons License Attribu-        in modo da fornire informazioni sulle proprietà lingui-
tion 4.0 International (CC BY 4.0).                      stiche che influenzano il comportamento umano (giu-
                                                         dizio grammaticale, velocità di letture o risposte neu-
                                                         rali).
modalità di svolgimento dell’evento (piuttosto                  Da Bertinetto (1997), apprendiamo che un test
che la sua localizzazione e la serie di rapporti tem-       per distinguere l’accezione telica di un verbo da
porali); l’azionalità verbale, d’altra parte, non           quella non-telica è l’aggiunta dell’avverbiale “in
viene codificata dalla morfologia flessiva. Non             x tempo”3 che risulta incompatibile con i predicati
basta dire che l’azionalità sia un fatto inerente al        non telici. L’applicazione dell’avverbiale “per X
significato intrinseco di un lessema, bisogna indi-         tempo”, invece, risulta o incompatibile con i pre-
viduare delle classi coerenti di verbi, contraddi-          dicati verbali telici o se compatibile, ne neutra-
stinte da un comportamento sintattico omogeneo              lizza la telicità.
nell’ambito della lingua considerata. Ci sono di-
versi aspetti lessicali che possono essere codificali       2.2    Telicità e individuazione
da una classe verbale e che pertengono alla classi-            L’individuazione dell’oggetto o del soggetto
ficazione azionale.                                         può incidere sull’interpretazione telica assegnata
   Vendler (1967) categorizza le classi azionali            all’evento. Il concetto di individuazione unifica
sulla base di tre proprietà fondamentali (la durati-        diverse proprietà dell’argomento e può essere
vità, la dinamicità e la telicità) e individua quattro      considerata anch’essa una proprietà semantica di
gruppi principali: i verbi stativi (states), di attività    interfaccia, perché agisce sia a livello semantico
(activities), risultativi (accomplishments) e tra-          che morfosintattico. L’individuazione si riferisce
sformativi (achievements). I verbi trasformativi e          alla propensione di un’entità ad essere concepita
quelli risultativi vengono raggruppati nella cate-          come un individuo indipendente. Possiamo consi-
goria dei telici. Gli eventi telici hanno la caratteri-     derare l’individuazione come la risultante delle
stica di essere finalizzati al raggiungimento di un         seguenti proprietà: individui, animatezza, concre-
telos, ovvero una meta o una fine.                          tezza/astrattezza, singolare/plurale, mass/count,
                                                            referenziale/non-referenziale (Romagno, 2005).
2.1    Telicità
                                                            Concependo l’individuazione come un conti-
Finora abbiamo considerato la classe dei telici             nuum, i significati possono essere raggruppati se-
come l’insieme dei risultativi e dei trasformativi.         condo classi di equivalenza che condividono le
In ogni caso, è necessario specificare che la teli-         stesse proprietà di individuazione e le classi di in-
cità può essere intesa come un continuum, un asse           dividuazione possono essere ordinate sulla base
semantico che vede ai due estremi i prototipi della         del loro grado di individuazione. Il grado di indi-
categoria (inerentemente telici e inerentemente             viduazione di un’entità può essere calcolato sulla
atelici) e al centro gli elementi che definiremo            base della media derivata tramite l’unione dei va-
configurazionali2 . Dunque, la telicità non è una           lori di tutti i fattori che la determinano. Conside-
proprietà discreta e non sempre è possibile defi-           reremo [+ individuato] un argomento umano, pro-
nirla in maniera inequivocabile (non essendo de-            prio, animato, concreto, singolare, numerabile, re-
terminata solo dai tratti lessicali): essendo forte-        ferenziale e [- individuato] un argomento inani-
mente dipendente dal contesto (dagli argomenti              mato, comune, astratto, plurale, non numerabile,
del verbo e dalla transitività, ma anche dalla co-          non referenziale. Sia dal punto di vista semantico,
niugazione dell’aspetto verbale) e veicolata dal            sia da quello morfosintattico, si registra un’in-
senso complessivo della frase. Ad esempio, “dise-           fluenza reciproca tra individuazione e telicità. Ad
gnare” e “cantare” sono di per sé predicati verbali         esempio, nella frase “mangiare del pane”, l’og-
non telici: ciò che li rende telici, in un determinato      getto è poco individuato; nella frase “mangiare
contesto, è la presenza di un oggetto diretto che li        una pagnotta di pane”, invece, l’oggetto è indivi-
determina, finalizzandoli al raggiungimento di un           duato e rappresenta l’argomento interno diretto
preciso scopo.                                              del predicato. Ne consegue che nel primo caso
   In “Gennaro ha disegnato/ha cantato tutto il po-         l’interpretazione assegnata all’evento è atelica e
meriggio” il predicato verbale si configura come            nel secondo caso è telica.
atelico, ma diventa telico se si ha “Gennaro ha di-
segnato il ritratto di mia nonna” o “Gennaro ha             2.3    Agentività
cantato la sua canzone preferita”.                          Secondo Cruse (1971) l’agentività è presente in
                                                            ogni frase che si riferisce ad un’azione effettuata

2Con questo termine faremo riferimento, d’ora in poi,       3 “X tempo” simboleggia un’espressione temporale nu-
a quei predicati verbali la cui interpretazione telica (o   mericamente quantificata: in due minuti, in due giorni,
atelica) è determinata dal contesto (in particolare         in due ore, in due anni…
dall’individuazione dell’oggetto o del soggetto).
da un’entità che impiega la propria energia per           combinazione con l’individuazione) e l’agentività
condurre l’azione. Nella definizione di entità sono       e di utilizzare questa inferenza per il completa-
inclusi gli esseri viventi, alcuni tipi di macchine       mento di task morfosintattici. Inoltre, vogliamo
ed eventi naturali. Da ciò è possibile dedurre che        determinare se l’elaborazione del modello può es-
l’argomento agentivo è prototipicamente il sog-           sere comparata a quella dei parlanti nei medesimi
getto, essendo esso il promotore dell’azione, ed è        task.
sempre associato con una struttura logica4 di atti-          Essendo entrambe queste proprietà semantiche,
vità; e che solo verbi che possiedono nella loro          codificate morfosintatticamente, possiamo deter-
struttura logica un predicato di attività possono         minarne la corretta elaborazione mediante dei test
avere un argomento agentivo. Nella struttura lo-          morfosintattici. La risposta selezionata sarà dun-
gica di un predicato, l’agentività è rappresentata        que informativa dal punto di vista semantico.
come DO (x, [do (x, ...]. Ad esempio, se si con-             Per garantire un confronto diretto tra il modello
frontano i verbi “kill” e “murder” (il primo verbo        e i parlanti, ad entrambi verranno sottoposti i me-
può accogliere soggetti inanimanti, mentre il se-         desimi task.
condo no) la struttura logica si configura come:
kill: [do (x, Ø)] CAUSE [BECOME dead (y)]                 3.1    Stimoli
murder: DO (x, [do (x, Ø] CAUSE [BECOME                   I soggetti e il modello dovevano completare dei
dead (y)]) (Pustejovsky e Batiukova, 2019).               cloze test con la giusta opzione morfosintattica.
    Ci sono altri verbi, però, che possono assumere          Abbiamo ideato tre task. Il primo task indaga la
un’interpretazione agentiva. Infatti, il più delle        telicità, il secondo l’individuazione in rapporto
volte, l’agentività è determinata dal modo in cui         alla telicità e il terzo l’agentività. Ogni task è com-
un verbo è utilizzato all’interno di una frase e non      posto da sessanta frasi affermative con verbo co-
è un’inerente proprietà lessicale del verbo. In que-      niugato al passato prossimo.
sti casi, l’agentività non fa parte del significato          Nel primo task sulla telicità le frasi dovevano
lessicale del verbo e non è rappresentata nella sua       essere completate con la preposizione “in” o “per”
struttura logica, piuttosto è determinata da impli-       nelle locuzioni avverbiali “in/per X tempo”. I sog-
cazioni basate sull’animatezza dell’attore e sulle        getti sono nomi comuni, impiegati alla terza per-
proprietà lessicali del verbo. Holisky (1987) so-         sona, animati e, a volte, utilizzati con il supporto
stiene che l’interpretazione agentiva spesso sorge        di un aggettivo possessivo. Abbiamo incluso verbi
dall’intersezione tra le proprietà semantiche             inerentemente telici (sia risultativi che trasforma-
all’interno di una frase (le proprietà semantiche         tivi), verbi inerentemente atelici e verbi configu-
dell’attore NP e del predicato) e i principi generali     razionali (20 + 20 + 20). Nelle seguenti frasi,
di conversazione.                                         estratte dal primo task, riportiamo esempi con
    Un test molto semplice per capire se l’agenti-        verbo telico (1), atelico (2) e configurazionale (3):
vità è lessicalizzata in un verbo coinvolge l’avver-         (1) L’operaio ha demolito la casa in/per un’ora
bio “inavvertitamente” e consiste nel verificare se          (2) Mia sorella ha dormito in/per tre ore
il suo impiego crea una contraddizione all’interno           (3) Il ragazzo ha corso in/per un’ora
della frase. Se la frase diventa contraddittoria, al-
lora il predicato verbale lessicalizza l’agentività.         Nel secondo task, che indaga la telicità in rela-
    È il caso di: “Gennaro ha assassinato *inavver-       zione all’individuazione, abbiamo utilizzato lo
titamente il suo vicino”, in cui la contraddizione è      stesso cloze test. Tuttavia, abbiamo strutturato un
evidente, quindi il predicato è agentivo. Anche           design fattoriale che divide le frasi in quattro
l’agentività, come la telicità, è una proprietà che       gruppi (di 15 frasi), secondo lo schema seguente:
agisce nell’interfaccia tra sintassi e semantica.            Ⅰ gruppo: soggetto [+ ind]5 e oggetto [- ind]
                                                             Ⅱ gruppo: soggetto [+ ind] e oggetto [+ ind]
3    Esperimento                                             Ⅲ gruppo: soggetto [- ind] e oggetto [- ind]
                                                             Ⅳ gruppo: soggetto [- ind] e oggetto [+ ind]6
Il nostro obiettivo è, quindi, indagare se Gil-
BERTo è in grado di inferire la telicità (anche in

4 “[…] Logical Structures (LS) consisting of constants,   6Per i soggetti [+ individuati] abbiamo utilizzato nomi
which mostly represent predicates, and modifiers (BE-     comuni di persona con aggettivi possessivi; per i sog-
COME, INGR, CAUSE, etc.). […] these elements are          getti [- individuati] nomi comuni plurali o nomi astratti.
not words from any natural language, but items of a se-   Gli oggetti [- individuati] sono costituiti da nomi co-
mantic metalanguage” (Van Valin e LaPolla, 1997).         muni (riferiti a liquidi, plurali o nomi massa) con un
5 Ind = individuato                                       aggettivo qualificativo senza articolo determinativo
In ogni gruppo abbiamo incluso predicati ver-               3.2    Partecipanti
bali telici, atelici e configurazionali (5+5+5). Ri-
                                                               65 volontari madrelingua italiani avevano il com-
portiamo una frase per ognuno dei quattro gruppi:
                                                               pito di completare le frasi scegliendo l’opzione
   Ⅰ Mio fratello ha bevuto latte fresco in/per cin-           più opportuna. Ai parlanti venivano fornite le
que minuti                                                     istruzioni per il completamento dei task all’inizio
   Ⅱ Mio fratello ha bevuto un bicchiere di latte              degli stessi. Tutti i dati sono stati raccolti tramite
in/per cinque minuti                                           Google Forms.
   Ⅲ I mobili hanno accumulato della polvere
densa in/per dieci anni                                        3.3    Modello
   Ⅳ I mobili hanno accumulato un sacco di pol-                GilBERTo è un modello del linguaggio italiano
vere in/per dieci anni                                         preaddestrato basato sull’architettura di Ro-
   Nel terzo task, che indaga l’agentività, le frasi           BERTa e sull’approccio di tokenizzazione del te-
dovevano essere completate con “inavvertita-                   sto di CamemBERT. Il modello è stato addestrato
mente” o “intenzionalmente”. Abbiamo variato                   con la tecnica di mascheramento delle subwords
sia le proprietà del soggetto (includendo soggetti             per 100k passi gestendo 71 GB di testo italiano
con il ruolo prototipico di actor, ma anche soggetti           con 11.250.012.896 parole (OSCAR: Open Su-
meno prototipici) e quelle dell’oggetto (inclu-                per-large Crawled Almanach coRpus). È stato
dendo oggetti con il ruolo prototipico di under-               considerato un vocabolario di 32k BPE (Byte-Pair
goer, ma anche oggetti meno prototipici). Ab-                  Encoding) subwords, generate usando Sentence-
biamo incluso predicati verbali che hanno la pro-              Piece tokenizer. Nei primi due task è stata utiliz-
prietà dell’agentività lessicalizzata nella loro               zata la libreria pytorch\fairseq Python e nel terzo
struttura semantica (quindi inerentemente agen-                task la libreria FitBERT.
tivi), predicati verbali inerentemente inagentivi e
predicati verbali che possono assumere entrambi i              4     Risultati
valori a seconda del contesto (20 + 20 + 20). An-
che in questo caso abbiamo escluso i nomi propri               Le teorie linguistiche stabiliscono che i verbi ine-
ed i soggetti sono tutti animati ed alla terza per-            rentemente telici dovrebbero selezionare “in x
sona. Il seguente esempio riporta rispettivamente              tempo”, mentre gli inerentemente atelici “per x
un verbo agentivo, inagentivo e configurazionale:              tempo”. I verbi configurazionali selezionano “in”
                                                               o “per” a seconda dell’interpretazione telica che il
   (4) Mio fratello ha deciso intenzional-                     soggetto vuole conferire alla frase. I dati del primo
mente/inavvertitamente di scegliere                            task confermano questo schema, come illustra la
   (5) Mio fratello è invecchiato intenzional-                 tabella 1, in cui sono riportate le preferenze del
mente/inavvertitamente                                         modello8 e dei parlanti.
   (6) Mio padre ha cotto intenzionalmente/inav-
vertitamente per molto tempo la carne                              Predicati     Modello (%)         Parlanti (%)
   Nei primi due task, le frasi sottoposte al mo-                                in   per            in   per
dello, contenevano una parola mascherata 7                         Telici        70   20             100 0
nell’input e il modello doveva fornire come out-                   Atelici       80   10             0    100
put, al suo posto, le prime cinque opzioni più pro-                Config.       35   30             50 50
babili e le relative probabilità. Nel terzo task in-
vece, il modello fornisce come output diretta-                                   Table 1: Primo task
mente la frase completa con una delle opzioni. I
parlanti, invece, dovevano scegliere in ognuno dei                Come si evince, i dati dei verbi inerentemente
tre task l’opzione preferibile tra le due proposte.            telici e inerentemente atelici di entrambi i gruppi
                                                               presentano pochissima dispersione: l’interpreta-
                                                               zione è telica o atelica a seconda del predicato ver-
                                                               bale e non c’è indecisione tra le opzioni proposte.

(“latte fresco”); con gli oggetti [+ individuati] si assiste   e lo stesso soggetto (nei primi due gruppi [+ indivi-
allo schema opposto: nomi al singolare, con articolo           duato] e negli ultimi due [- individuato]) e abbiamo va-
determinativo, o nomi leggeri quantificatori (“un sacco        riato solo l’individuazione dell’oggetto.
di polvere”). Per favorire una comparazione diretta tra        7 Ad esempio: Il ragazzo ha corso  un’ora.
                                                               8 Le percentuali del modello, nelle tabelle 1 e 2, corri-
due frasi abbiamo utilizzato lo stesso predicato verbale
                                                               spondono al valore della mediana, calcolata in rela-
                                                               zione alle probabilità fornite dal modello come output.
I verbi configurazionali invece, presentano, sia nel       primo gruppo, i parlanti selezionavano “per” al
modello che nei parlanti, una dispersione dei dati         55%); mentre, nel terzo e nel quarto gruppo (con
più ampia e nessuna delle due opzioni risulta pre-         soggetti [- individuati]), “per” ottiene percentuali
feribile.                                                  più basse, determinando conseguentemente uno
   I dati del secondo task, raccolti nella tabella 2,      scarto inferiore tra le due opzioni. Il modello ri-
presentano uno scenario più complesso.                     spetta lo schema dei parlanti con la variazione
                                                           delle probabilità di “per” tra primo gruppo (con
    Predicati          Modello           Parlanti          soggetto [+ individuato] ha un valore del 90%) e
                       (%)               (%)               terzo e quarto (con soggetto [-individuato] ha ri-
                       in per            in per            spettivamente il 40% e il 60%); ma non conferma
    Telici (Ⅰ gruppo)  60 15             45 55             lo schema dei parlanti nel secondo gruppo (ha il
    Telici (Ⅱ gruppo)  35 10             100 0             70%, mentre dai parlanti non veniva mai scelto).
    Telici (Ⅲ gruppo)  60 15             80 20                Nella tabella 3 sono raccolti i dati 9 del terzo
    Telici (Ⅳ gruppo)  30 20             100 0             task.
    Atelici (Ⅰ gruppo) 0   80            0    100
    Atelici (Ⅱ gruppo) 20 80             80 20                 Predicati    Modello (%)       Parlanti (%)
    Atelici (Ⅲ gruppo) 10 60             40 60                 Agentivi      inavv. (70)      intenz. (100)
    Atelici (Ⅳ gruppo) 15 55             75 25                 Inagentivi    inavv. (65)      inavv. (100)
    Config. (Ⅰ gruppo) 0   90            0    100              Config.       inavv. (60)      inavv. (50)
    Config. (Ⅱ gruppo) 10 70             100 0
                                                                             Table 3: Terzo task
    Config. (Ⅲ gruppo) 20 40             30 70
    Config. (Ⅳ gruppo) 20 60             40 60             I risultati del terzo task mostrano che il modello
                Table 2: Secondo task                      sceglie l’opzione “inavvertitamente” in più dl
                                                           50% delle frasi, per ognuno dei tre gruppi di verbi,
   I dati mostrano che il modello seleziona “in”           nonostante la variazione di agentività. I parlanti,
solo con i verbi inerentemente telici (si registra         invece, mostrano coerenza con le ipotesi linguisti-
uno scarto maggiore tra le due opzioni nel primo           che.
e nel terzo gruppo, in cui l’oggetto è [- indivi-
duato]). I parlanti, invece, con verbi inerente-           5     Discussione
mente telici selezionano “in” in ognuno dei
                                                           L’analisi aveva lo scopo di testare l’elaborazione
gruppi, tranne che nel primo (soggetto [+ indivi-
                                                           della telicità (anche in rapporto all’individua-
duato] e oggetto [- individuato]), in cui “per”
                                                           zione) e dell’agentività, sia nei parlanti che nel
viene preferito nel 55% dei casi. Contrariamente
                                                           modello, e di indagare se quest’elaborazione de-
al modello, in cui, nel secondo e nel quarto gruppo
                                                           termina il giusto completamento morfosintattico.
(con oggetti [+ individuati]), “in” ottiene una pro-
                                                           I dati mostrano che i parlanti operano in maniera
babilità vicina a quella di “per”, nei parlanti è del
                                                           coerente con l’ipotesi proposta e con la teoria lin-
100% (“per” non viene mai selezionato).
                                                           guistica. Infatti, è la telicità a determinare la giusta
   Con verbi inerentemente atelici, invece, i par-
                                                           codifica morfosintattica. Inoltre, mostrano un’in-
lanti selezionano “in” quando l’oggetto è [+ indi-
                                                           fluenza evidente dell’individuazione sull’inter-
viduato] e “per” quando l’oggetto è [- individuato]
                                                           pretazione telica. In presenza di verbi inerente-
(nel secondo e nel quarto gruppo, quindi, rispetti-
                                                           mente telici i parlanti selezionano “in” senza es-
vamente nell’80% e nel 75% dei casi). Nel mo-
                                                           sere influenzati dalla minore individuazione del
dello, invece, l’opzione “per” risulta preferibile in
                                                           soggetto. L’unico caso in cui la valenza telica ine-
ognuno dei quattro casi considerati. Infine, con
                                                           rente del predicato subisce una variazione è con
verbi configurazionali i parlanti mostrano una pre-
                                                           soggetto [+ individuato] e oggetto [- individuato].
ferenza per “in” nel secondo gruppo (soggetto e
                                                           Questo stesso schema non si riscontra con sog-
oggetto [+ individuati]) e per “per” nei restanti tre.
                                                           getto [- individuato] e oggetto [- individuato].
Nello specifico, però, nel primo gruppo (soggetto
                                                              Sappiamo che l’oggetto riveste prototipica-
[+ individuato] e oggetto [- individuato]) “per” ri-
                                                           mente il ruolo di paziente e che quindi è colui che
sulta vincente nel 100% dei casi (confermando i
                                                           nel caso di un evento telico subisce il mutamento
dati dei verbi inerentemente telici, in cui, nel

9Le percentuali del modello, nella tabella 3, corrispon-
dono al numero di frasi in cui il modello ha preferito
inavvertitamente o intenzionalmente.
di stato, quindi [+ coinvolto] e [+ individuato]10.       viene applicato ad un modello basato sull’archi-
D’altra parte, il soggetto è prototipicamente il pro-     tettura di RoBERTa.
motore dell’azione, quindi [- coinvolto] e [- indi-          Generalizzando, il modello riesce ad utilizzare
viduato] dell’oggetto. In questo caso, possiamo           le proprietà semantiche veicolate dal predicato per
supporre che a guidare l’interpretazione atelica          determinare la giusta codifica morfosintattica:
(nonostante la telicità inerente del predicato) sia la    elabora, quindi, la telicità in coerenza con le teorie
non prototipicità dei due argomenti nella frase11.        linguistiche, come una proprietà scalare. Tuttavia,
A riprova, ciò non si verifica nelle frasi del terzo      non si può affermare che questa elaborazione av-
gruppo, in cui non vi è differenza tra coinvolgi-         venga anche per le proprietà semantiche che sono
mento ed individuazione del soggetto e dell’og-           veicolate dal contesto dell’intera frase: l’agenti-
getto.                                                    vità o la variazione della telicità dovuta all’indivi-
   Anche i dati comportamentali dei verbi ineren-         duazione.
temente atelici risultano coerenti con l’ipotesi: i
parlanti conferiscono un’interpretazione telica           6    Conclusioni
alle frasi in cui l’oggetto è [+ individuato] e atelica   La differenza di elaborazione tra modello e par-
a quelle in cui è [- individuato]. Con i verbi confi-     lanti ci permette di proporre delle implicazioni dal
gurazionali l’interpretazione telica è possibile          punto di vista teorico. La prima implicazione è
solo se entrambi gli argomenti sono individuati. I        che seppure questi modelli mostrino una certa
dati comportamentali, inoltre, riflettono la natura       sensibilità e una certa aderenza al modo in cui i
scalare della telicità: i verbi configurazionali sono     parlanti processano il linguaggio, non possono es-
quelli che riportano una dispersione dei dati più         sere considerati un modello cognitivo di elabora-
ampia.                                                    zione del linguaggio. Tuttavia, questa analisi ci
   Questo tipo di elaborazione si riscontra anche         permette di ipotizzare la codifica di queste pro-
nel modello, dove i verbi configurazionali non            prietà di semantica lessicale nell’informazione
mostrano nessuna preferenza netta a favore di una         vettoriale dei modelli distribuzionali, facendo
delle due opzioni, dimostrando che il modello rie-        luce su quali sono le informazioni semantiche co-
sce ad inferire la natura scalare della telicità. Tut-    dificate.
tavia, una differenza emerge nell’elaborazione               Sicuramente esiste un’influenza distribuzionale
dell’individuazione. Da un lato i parlanti sono in-       nel modo in cui i parlanti utilizzano le informa-
fluenzati dall’individuazione nell’interpretazione        zioni, ma bisogna considerare anche fattori che di-
telica; d’altra parte, il modello non mostra la           pendono dal contesto extralinguistico. In lavori
stessa sensibilità. Questa mancata elaborazione           futuri ha senso continuare ad indagare l’elabora-
dell’individuazione viene confermata dal fatto che        zione di proprietà di semantica lessicale nei mo-
con verbi inerentemente telici il modello predilige       delli distribuzionali, magari adottando altre tecni-
sempre un’interpretazione telica e con verbi ine-         che di indagine e confrontando dati estratti da mo-
rentemente atelici un’interpretazione atelica.            delli diversi. Futuri lavori potranno indagare altre
Quindi l’accordo tra modello e parlanti è determi-        proprietà di semantica lessicale: ad esempio l’in-
nato dalle proprietà del predicato e non dall’indi-       transitività scissa.
viduazione di soggetto e oggetto.                            Inoltre, il nostro lavoro può essere migliorato
   Anche per l’agentività i parlanti mostrano coe-        includendo lo studio dell’aspetto verbale e dell’in-
renza con l’ipotesi e con le teorie linguistiche. Nei     fluenza che questo ha nell’interpretazione della
casi in cui l’agentività è codificata nell’informa-       frase (coniugando le frasi non solo all’aspetto per-
zione eventiva del verbo viene selezionato con            fettivo, ma anche all’imperfettivo). Ad esempio,
una preferenza netta l’avverbio ad essa associato.        potrebbe essere interessante considerare il caso
Viceversa, accade con verbi inerentemente ina-            delle lingue slave che grammaticalizzano la teli-
gentivi; mentre i verbi configurazionali non mo-          cità attraverso l’opposizione tra aspetto perfettivo
strano preferenza per nessuna delle due opzioni. Il       e imperfettivo. Infine, questi studi potrebbero es-
modello, al contrario, completa il task senza es-         sere utilizzati per implementare questi modelli di-
sere influenzato dall’agentività. Questo risultato        stribuzionali, migliorando il modo in cui veico-
potrebbe essere determinato dal tipo di task o            lano la composizionalità semantica (a livello fra-
dall’utilizzo di FitBERT, che per la prima volta          sale).

10 Telicità, coinvolgimento e individuazione dell’og-     11Il soggetto, in questo caso, ha le proprietà semantiche
getto sono anche alcuni dei parametri che determinano     prototipiche dell’oggetto e, quest’ultimo, ha quelle
la transitività di una frase.                             prototipiche del soggetto.
References                                                Giulio Ravasio and Leonardo Di Perna. GilBERTo: An
                                                            Italian pretrained language model based on RoB-
Nikos Athanasiou, Elias Iosif and Alexandros Potami-        ERTa. DOI: https://github.com/idb-ita/GilBERTo.
  anos. 2018. Neural activation semantic models:
  compositional lexical semantic models of localized      Vered Shwartz and Ido Dagan. 2019. Still a Pain in the
  neural activations. In Proceedings of the 27th Inter-     Neck: Evaluating Text Representations on Lexical
  national Conference on Computational Linguistics,         Composition. In CoRR, Vol. abs/1902.10618.
  2867–2878, Association for Computational Lin-           Ian Tenney et al. 2019. What do you learn from con-
  guistics, Santa Fe, New Mexico, USA.                       text? Probing for sentence structure in contextual-
Marco Baroni and Alessandro Lenci 2010. Distribu-            ized word representations. In CoRR, Vol.
  tional Memory: A General Framework for Corpus-             abs/1905.06316.
  Based Semantics. In Computational Linguistics, 36:      Peter D. Turney. 2006. Expressing Implicit Semantic
  673–721.                                                   Relations without Supervision. In CoRR, Vol
Pier Marco Bertinetto. 1986. Tempo, aspetto e azione         abs/cs/0607120.
   nel verbo italiano, Firenze, Accademia della Crusca.   Robert D. van Valin and Randy J. LaPolla. 1997. Syn-
Lucia Busso, Ludovica Pannitto e Alessandro Lenci.          tax: Structure, Meaning, and Function. In Linguis-
  2018. Modelling the Meaning of Argument Con-              tics, Cambridge University Press.
  structions with Distributional Semantics. Are con-      Zeno Vendler. 1967. Causal relations. In Journal of
  structions enough? In Proceedings of the Fifth Ital-      Philosophy, 64:704-713.
  ian Conference on Computational Linguistics
  CLiC-it 2018.                                           Koki Washio and Tsuneaki Kato. 2018. Neural Latent
                                                            Relational Analysis to capture lexical semantic rela-
Alan Cruse. 1973. Some Thoughts on Agentivity. In           tion in a vector space. In Proceedings of the 2018
  Journal of Linguistics, 9(1):11-23.                       Conference on Empirical Methods in Natural Lan-
Jacob Devlin et al. 2018. BERT: Pre-training of Deep        guage Processing, 594-600.
   Bidirectional Transformers for Language Under-         Mo Yu and Mark Dredze. 2014. Improving Lexical
   standing. In CoRR, Vol. abs/1810.04805.                  Embeddings with Semantic Knowledge. In Pro-
Guy Emerson. 2020. What are the Goals of Distribu-          ceedings of the 52nd Annual Meeting of the Associ-
  tional Semantics? In Proceedings of the 58th Annual       ation for Computational Linguistics, 2:545-550.
  Meeting of the Association for Computational Lin-       Xunjie Zhu, Tingfeng Li and Gerard de Melo. 2018.
  guistics, 1-18.                                           Exploring Semantic Properties of Sentence Embed-
Allyson Ettinger. 2019. What {BERT} is not: Lessons         dings, In Proceedings of the 56th Annual Meeting of
   from a new suite of psycholinguistic diagnostics for     the Association for Computational Linguistics,
   language models. In CoRR, Vol. abs/1907.13528.           2:632-637.
Cécile Fabre and Alessandro Lenci. 2015. Distribu-
  tional Semantics Today. Introduction to the special
  issue. In Traitement automatique des langues. Sé-
  mantique distributionelle (ATALA), 50(2) :7-20.
Scott Grimm. 2018. Grammatical number and the scale
  of individuation. In Language, 94:527-594.
Alessandro Lenci e Alessandra Zarcone. 2008. Com-
  putational Models of Event Type Classification in
  Context. In Language Resources and Evaluation
  Conference.
Alessandro Lenci. 2008. Distributional semantics in
  linguistic and cognitive research. In The Italian
  Journal of Linguistics, 20:1-20.
Yang Liu et al. 2019. RoBERTa: A Robustly Opti-
  mized BERT Pretraining Approach, In CoRR, Vol.
  abs/1907.11692.
Timothee Mickus et al. 2020. What do you mean,
  BERT? Assessing BERT as a Distributional Seman-
  tics Model. In Proceedings of the Society for Com-
  putation in Linguistics, 3(34):1-12.
Puoi anche leggere