Agentività e telicità in GilBERTo: implicazioni cognitive - CEUR-WS
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
Agentività e telicità in GilBERTo: implicazioni cognitive Agnese Lombardi, Alessandro Lenci Università di Pisa, Pisa, Italia a.lombardi19@studenti.unipi.it, alessandro.lenci@unipi.it Abstract simile (Wittgenstein, 1953; Harris, 1954; Firth, 1957). English. The goal of this study is to inves- I modelli distribuzionali sono stati impiegati tigate whether a Transformer-based neural con successo in molti task di Natural Language language model infers lexical semantics Processing, ma quale siano le conoscenze acqui- and use this information for the comple- site durante il processo di addestramento rimane tion of morphosyntactic patterns. The se- una questione ancora aperta. mantic properties considered are telicity Uno degli approcci per comprendere la natura (also combined with definiteness) and di queste informazioni linguistiche consiste nel agentivity. Both act at the interface be- valutare la loro accuratezza in task psicolingui- tween semantics and morphosyntax: they stici1. Alcuni studi hanno indagato proprietà e di- are semantically determined and syntacti- pendenze sintattiche (Linzen et al., 2016; Ettinger, cally encoded. The tasks were submitted 2016; Wilcox et al., 2018; Futrell et al., 2019; to both the computational model and a Marvin e Linzen, 2018; Hu et al., 2020; Lau et al., group of Italian native speakers. The com- 2020), altri si sono concentrati su aspetti semantici parison between the two groups of data al- e pragmatici come: la similarità (Hill et al.,2015), lows us to investigate to what extent neu- la categorizzazione (Baroni e Lenci, 2010), l’ana- ral language models capture significant logia (Mikolov et al., 2013), la negazione (Marvin aspects of human semantic competence. e Linzen, 2018; Jumelet e Hupkes, 2018), il ragio- namento pragmatico, i ruoli semantici e la cono- Italiano. L’obiettivo di questo studio è scenza eventiva (Ettinger, 2020). quello di indagare se neural language mo- Il nostro lavoro contribuisce a questa linea di dels basati su Transformer inferiscono ricerca e ne adotta l’approccio psicolinguistico, aspetti semantico-lessicali rilevanti per ma se ne discosta nelle proprietà investigate, pro- l’interfaccia con la sintassi ed utilizzano ponendo l’analisi della telicità (in combinazione queste informazioni per il completamento con l’individuazione) e dell’agentività. di task morfosintattici. Le proprietà se- L’obiettivo è indagare se l’inferenza di queste mantiche considerate sono la telicità (an- proprietà semantico-lessicali favorisce l’elabora- che in relazione all’individuazione) e zione di alcuni task morfosintattici. Nella nostra l’agentività. Entrambe sono semantica- analisi abbiamo scelto di utilizzare un modello di- mente determinate e sintatticamente codi- stribuzionale di tipo predittivo che utilizza rappre- ficate. I task sono stati sottoposti sia al sentazioni contestualizzate (Peters et al., 2018; modello che ai parlanti. La comparazione Devlin et al., 2019): GilBERTo, un modello di- tra i due gruppi di dati ci permetterà di stribuzionale italiano ispirato all’architettura di determinare se questi modelli computa- RoBERTa (Liu et al., 2019). zionali catturano aspetti significativi della competenza semantica umana. 2 Aspetti della semantica di interfaccia: azionalità e agentività 1 Introduzione Un importante dominio dell’informazione lessi- L’ipotesi distribuzionale stabilisce che lessemi cale riguarda l’evento e i suoi partecipanti. Se da con contesti linguistici simili hanno un significato un lato l’aspetto è una nozione di natura eminen- temente morfologica e semantica, che riguarda le Copyright ©️ 2021 for this paper by its authors. Use 1 Gli stimoli, nei task psicolinguistici, sono progettati permitted under Creative Commons License Attribu- in modo da fornire informazioni sulle proprietà lingui- tion 4.0 International (CC BY 4.0). stiche che influenzano il comportamento umano (giu- dizio grammaticale, velocità di letture o risposte neu- rali).
modalità di svolgimento dell’evento (piuttosto Da Bertinetto (1997), apprendiamo che un test che la sua localizzazione e la serie di rapporti tem- per distinguere l’accezione telica di un verbo da porali); l’azionalità verbale, d’altra parte, non quella non-telica è l’aggiunta dell’avverbiale “in viene codificata dalla morfologia flessiva. Non x tempo”3 che risulta incompatibile con i predicati basta dire che l’azionalità sia un fatto inerente al non telici. L’applicazione dell’avverbiale “per X significato intrinseco di un lessema, bisogna indi- tempo”, invece, risulta o incompatibile con i pre- viduare delle classi coerenti di verbi, contraddi- dicati verbali telici o se compatibile, ne neutra- stinte da un comportamento sintattico omogeneo lizza la telicità. nell’ambito della lingua considerata. Ci sono di- versi aspetti lessicali che possono essere codificali 2.2 Telicità e individuazione da una classe verbale e che pertengono alla classi- L’individuazione dell’oggetto o del soggetto ficazione azionale. può incidere sull’interpretazione telica assegnata Vendler (1967) categorizza le classi azionali all’evento. Il concetto di individuazione unifica sulla base di tre proprietà fondamentali (la durati- diverse proprietà dell’argomento e può essere vità, la dinamicità e la telicità) e individua quattro considerata anch’essa una proprietà semantica di gruppi principali: i verbi stativi (states), di attività interfaccia, perché agisce sia a livello semantico (activities), risultativi (accomplishments) e tra- che morfosintattico. L’individuazione si riferisce sformativi (achievements). I verbi trasformativi e alla propensione di un’entità ad essere concepita quelli risultativi vengono raggruppati nella cate- come un individuo indipendente. Possiamo consi- goria dei telici. Gli eventi telici hanno la caratteri- derare l’individuazione come la risultante delle stica di essere finalizzati al raggiungimento di un seguenti proprietà: individui, animatezza, concre- telos, ovvero una meta o una fine. tezza/astrattezza, singolare/plurale, mass/count, referenziale/non-referenziale (Romagno, 2005). 2.1 Telicità Concependo l’individuazione come un conti- Finora abbiamo considerato la classe dei telici nuum, i significati possono essere raggruppati se- come l’insieme dei risultativi e dei trasformativi. condo classi di equivalenza che condividono le In ogni caso, è necessario specificare che la teli- stesse proprietà di individuazione e le classi di in- cità può essere intesa come un continuum, un asse dividuazione possono essere ordinate sulla base semantico che vede ai due estremi i prototipi della del loro grado di individuazione. Il grado di indi- categoria (inerentemente telici e inerentemente viduazione di un’entità può essere calcolato sulla atelici) e al centro gli elementi che definiremo base della media derivata tramite l’unione dei va- configurazionali2 . Dunque, la telicità non è una lori di tutti i fattori che la determinano. Conside- proprietà discreta e non sempre è possibile defi- reremo [+ individuato] un argomento umano, pro- nirla in maniera inequivocabile (non essendo de- prio, animato, concreto, singolare, numerabile, re- terminata solo dai tratti lessicali): essendo forte- ferenziale e [- individuato] un argomento inani- mente dipendente dal contesto (dagli argomenti mato, comune, astratto, plurale, non numerabile, del verbo e dalla transitività, ma anche dalla co- non referenziale. Sia dal punto di vista semantico, niugazione dell’aspetto verbale) e veicolata dal sia da quello morfosintattico, si registra un’in- senso complessivo della frase. Ad esempio, “dise- fluenza reciproca tra individuazione e telicità. Ad gnare” e “cantare” sono di per sé predicati verbali esempio, nella frase “mangiare del pane”, l’og- non telici: ciò che li rende telici, in un determinato getto è poco individuato; nella frase “mangiare contesto, è la presenza di un oggetto diretto che li una pagnotta di pane”, invece, l’oggetto è indivi- determina, finalizzandoli al raggiungimento di un duato e rappresenta l’argomento interno diretto preciso scopo. del predicato. Ne consegue che nel primo caso In “Gennaro ha disegnato/ha cantato tutto il po- l’interpretazione assegnata all’evento è atelica e meriggio” il predicato verbale si configura come nel secondo caso è telica. atelico, ma diventa telico se si ha “Gennaro ha di- segnato il ritratto di mia nonna” o “Gennaro ha 2.3 Agentività cantato la sua canzone preferita”. Secondo Cruse (1971) l’agentività è presente in ogni frase che si riferisce ad un’azione effettuata 2Con questo termine faremo riferimento, d’ora in poi, 3 “X tempo” simboleggia un’espressione temporale nu- a quei predicati verbali la cui interpretazione telica (o mericamente quantificata: in due minuti, in due giorni, atelica) è determinata dal contesto (in particolare in due ore, in due anni… dall’individuazione dell’oggetto o del soggetto).
da un’entità che impiega la propria energia per combinazione con l’individuazione) e l’agentività condurre l’azione. Nella definizione di entità sono e di utilizzare questa inferenza per il completa- inclusi gli esseri viventi, alcuni tipi di macchine mento di task morfosintattici. Inoltre, vogliamo ed eventi naturali. Da ciò è possibile dedurre che determinare se l’elaborazione del modello può es- l’argomento agentivo è prototipicamente il sog- sere comparata a quella dei parlanti nei medesimi getto, essendo esso il promotore dell’azione, ed è task. sempre associato con una struttura logica4 di atti- Essendo entrambe queste proprietà semantiche, vità; e che solo verbi che possiedono nella loro codificate morfosintatticamente, possiamo deter- struttura logica un predicato di attività possono minarne la corretta elaborazione mediante dei test avere un argomento agentivo. Nella struttura lo- morfosintattici. La risposta selezionata sarà dun- gica di un predicato, l’agentività è rappresentata que informativa dal punto di vista semantico. come DO (x, [do (x, ...]. Ad esempio, se si con- Per garantire un confronto diretto tra il modello frontano i verbi “kill” e “murder” (il primo verbo e i parlanti, ad entrambi verranno sottoposti i me- può accogliere soggetti inanimanti, mentre il se- desimi task. condo no) la struttura logica si configura come: kill: [do (x, Ø)] CAUSE [BECOME dead (y)] 3.1 Stimoli murder: DO (x, [do (x, Ø] CAUSE [BECOME I soggetti e il modello dovevano completare dei dead (y)]) (Pustejovsky e Batiukova, 2019). cloze test con la giusta opzione morfosintattica. Ci sono altri verbi, però, che possono assumere Abbiamo ideato tre task. Il primo task indaga la un’interpretazione agentiva. Infatti, il più delle telicità, il secondo l’individuazione in rapporto volte, l’agentività è determinata dal modo in cui alla telicità e il terzo l’agentività. Ogni task è com- un verbo è utilizzato all’interno di una frase e non posto da sessanta frasi affermative con verbo co- è un’inerente proprietà lessicale del verbo. In que- niugato al passato prossimo. sti casi, l’agentività non fa parte del significato Nel primo task sulla telicità le frasi dovevano lessicale del verbo e non è rappresentata nella sua essere completate con la preposizione “in” o “per” struttura logica, piuttosto è determinata da impli- nelle locuzioni avverbiali “in/per X tempo”. I sog- cazioni basate sull’animatezza dell’attore e sulle getti sono nomi comuni, impiegati alla terza per- proprietà lessicali del verbo. Holisky (1987) so- sona, animati e, a volte, utilizzati con il supporto stiene che l’interpretazione agentiva spesso sorge di un aggettivo possessivo. Abbiamo incluso verbi dall’intersezione tra le proprietà semantiche inerentemente telici (sia risultativi che trasforma- all’interno di una frase (le proprietà semantiche tivi), verbi inerentemente atelici e verbi configu- dell’attore NP e del predicato) e i principi generali razionali (20 + 20 + 20). Nelle seguenti frasi, di conversazione. estratte dal primo task, riportiamo esempi con Un test molto semplice per capire se l’agenti- verbo telico (1), atelico (2) e configurazionale (3): vità è lessicalizzata in un verbo coinvolge l’avver- (1) L’operaio ha demolito la casa in/per un’ora bio “inavvertitamente” e consiste nel verificare se (2) Mia sorella ha dormito in/per tre ore il suo impiego crea una contraddizione all’interno (3) Il ragazzo ha corso in/per un’ora della frase. Se la frase diventa contraddittoria, al- lora il predicato verbale lessicalizza l’agentività. Nel secondo task, che indaga la telicità in rela- È il caso di: “Gennaro ha assassinato *inavver- zione all’individuazione, abbiamo utilizzato lo titamente il suo vicino”, in cui la contraddizione è stesso cloze test. Tuttavia, abbiamo strutturato un evidente, quindi il predicato è agentivo. Anche design fattoriale che divide le frasi in quattro l’agentività, come la telicità, è una proprietà che gruppi (di 15 frasi), secondo lo schema seguente: agisce nell’interfaccia tra sintassi e semantica. Ⅰ gruppo: soggetto [+ ind]5 e oggetto [- ind] Ⅱ gruppo: soggetto [+ ind] e oggetto [+ ind] 3 Esperimento Ⅲ gruppo: soggetto [- ind] e oggetto [- ind] Ⅳ gruppo: soggetto [- ind] e oggetto [+ ind]6 Il nostro obiettivo è, quindi, indagare se Gil- BERTo è in grado di inferire la telicità (anche in 4 “[…] Logical Structures (LS) consisting of constants, 6Per i soggetti [+ individuati] abbiamo utilizzato nomi which mostly represent predicates, and modifiers (BE- comuni di persona con aggettivi possessivi; per i sog- COME, INGR, CAUSE, etc.). […] these elements are getti [- individuati] nomi comuni plurali o nomi astratti. not words from any natural language, but items of a se- Gli oggetti [- individuati] sono costituiti da nomi co- mantic metalanguage” (Van Valin e LaPolla, 1997). muni (riferiti a liquidi, plurali o nomi massa) con un 5 Ind = individuato aggettivo qualificativo senza articolo determinativo
In ogni gruppo abbiamo incluso predicati ver- 3.2 Partecipanti bali telici, atelici e configurazionali (5+5+5). Ri- 65 volontari madrelingua italiani avevano il com- portiamo una frase per ognuno dei quattro gruppi: pito di completare le frasi scegliendo l’opzione Ⅰ Mio fratello ha bevuto latte fresco in/per cin- più opportuna. Ai parlanti venivano fornite le que minuti istruzioni per il completamento dei task all’inizio Ⅱ Mio fratello ha bevuto un bicchiere di latte degli stessi. Tutti i dati sono stati raccolti tramite in/per cinque minuti Google Forms. Ⅲ I mobili hanno accumulato della polvere densa in/per dieci anni 3.3 Modello Ⅳ I mobili hanno accumulato un sacco di pol- GilBERTo è un modello del linguaggio italiano vere in/per dieci anni preaddestrato basato sull’architettura di Ro- Nel terzo task, che indaga l’agentività, le frasi BERTa e sull’approccio di tokenizzazione del te- dovevano essere completate con “inavvertita- sto di CamemBERT. Il modello è stato addestrato mente” o “intenzionalmente”. Abbiamo variato con la tecnica di mascheramento delle subwords sia le proprietà del soggetto (includendo soggetti per 100k passi gestendo 71 GB di testo italiano con il ruolo prototipico di actor, ma anche soggetti con 11.250.012.896 parole (OSCAR: Open Su- meno prototipici) e quelle dell’oggetto (inclu- per-large Crawled Almanach coRpus). È stato dendo oggetti con il ruolo prototipico di under- considerato un vocabolario di 32k BPE (Byte-Pair goer, ma anche oggetti meno prototipici). Ab- Encoding) subwords, generate usando Sentence- biamo incluso predicati verbali che hanno la pro- Piece tokenizer. Nei primi due task è stata utiliz- prietà dell’agentività lessicalizzata nella loro zata la libreria pytorch\fairseq Python e nel terzo struttura semantica (quindi inerentemente agen- task la libreria FitBERT. tivi), predicati verbali inerentemente inagentivi e predicati verbali che possono assumere entrambi i 4 Risultati valori a seconda del contesto (20 + 20 + 20). An- che in questo caso abbiamo escluso i nomi propri Le teorie linguistiche stabiliscono che i verbi ine- ed i soggetti sono tutti animati ed alla terza per- rentemente telici dovrebbero selezionare “in x sona. Il seguente esempio riporta rispettivamente tempo”, mentre gli inerentemente atelici “per x un verbo agentivo, inagentivo e configurazionale: tempo”. I verbi configurazionali selezionano “in” o “per” a seconda dell’interpretazione telica che il (4) Mio fratello ha deciso intenzional- soggetto vuole conferire alla frase. I dati del primo mente/inavvertitamente di scegliere task confermano questo schema, come illustra la (5) Mio fratello è invecchiato intenzional- tabella 1, in cui sono riportate le preferenze del mente/inavvertitamente modello8 e dei parlanti. (6) Mio padre ha cotto intenzionalmente/inav- vertitamente per molto tempo la carne Predicati Modello (%) Parlanti (%) Nei primi due task, le frasi sottoposte al mo- in per in per dello, contenevano una parola mascherata 7 Telici 70 20 100 0 nell’input e il modello doveva fornire come out- Atelici 80 10 0 100 put, al suo posto, le prime cinque opzioni più pro- Config. 35 30 50 50 babili e le relative probabilità. Nel terzo task in- vece, il modello fornisce come output diretta- Table 1: Primo task mente la frase completa con una delle opzioni. I parlanti, invece, dovevano scegliere in ognuno dei Come si evince, i dati dei verbi inerentemente tre task l’opzione preferibile tra le due proposte. telici e inerentemente atelici di entrambi i gruppi presentano pochissima dispersione: l’interpreta- zione è telica o atelica a seconda del predicato ver- bale e non c’è indecisione tra le opzioni proposte. (“latte fresco”); con gli oggetti [+ individuati] si assiste e lo stesso soggetto (nei primi due gruppi [+ indivi- allo schema opposto: nomi al singolare, con articolo duato] e negli ultimi due [- individuato]) e abbiamo va- determinativo, o nomi leggeri quantificatori (“un sacco riato solo l’individuazione dell’oggetto. di polvere”). Per favorire una comparazione diretta tra 7 Ad esempio: Il ragazzo ha corso un’ora. 8 Le percentuali del modello, nelle tabelle 1 e 2, corri- due frasi abbiamo utilizzato lo stesso predicato verbale spondono al valore della mediana, calcolata in rela- zione alle probabilità fornite dal modello come output.
I verbi configurazionali invece, presentano, sia nel primo gruppo, i parlanti selezionavano “per” al modello che nei parlanti, una dispersione dei dati 55%); mentre, nel terzo e nel quarto gruppo (con più ampia e nessuna delle due opzioni risulta pre- soggetti [- individuati]), “per” ottiene percentuali feribile. più basse, determinando conseguentemente uno I dati del secondo task, raccolti nella tabella 2, scarto inferiore tra le due opzioni. Il modello ri- presentano uno scenario più complesso. spetta lo schema dei parlanti con la variazione delle probabilità di “per” tra primo gruppo (con Predicati Modello Parlanti soggetto [+ individuato] ha un valore del 90%) e (%) (%) terzo e quarto (con soggetto [-individuato] ha ri- in per in per spettivamente il 40% e il 60%); ma non conferma Telici (Ⅰ gruppo) 60 15 45 55 lo schema dei parlanti nel secondo gruppo (ha il Telici (Ⅱ gruppo) 35 10 100 0 70%, mentre dai parlanti non veniva mai scelto). Telici (Ⅲ gruppo) 60 15 80 20 Nella tabella 3 sono raccolti i dati 9 del terzo Telici (Ⅳ gruppo) 30 20 100 0 task. Atelici (Ⅰ gruppo) 0 80 0 100 Atelici (Ⅱ gruppo) 20 80 80 20 Predicati Modello (%) Parlanti (%) Atelici (Ⅲ gruppo) 10 60 40 60 Agentivi inavv. (70) intenz. (100) Atelici (Ⅳ gruppo) 15 55 75 25 Inagentivi inavv. (65) inavv. (100) Config. (Ⅰ gruppo) 0 90 0 100 Config. inavv. (60) inavv. (50) Config. (Ⅱ gruppo) 10 70 100 0 Table 3: Terzo task Config. (Ⅲ gruppo) 20 40 30 70 Config. (Ⅳ gruppo) 20 60 40 60 I risultati del terzo task mostrano che il modello Table 2: Secondo task sceglie l’opzione “inavvertitamente” in più dl 50% delle frasi, per ognuno dei tre gruppi di verbi, I dati mostrano che il modello seleziona “in” nonostante la variazione di agentività. I parlanti, solo con i verbi inerentemente telici (si registra invece, mostrano coerenza con le ipotesi linguisti- uno scarto maggiore tra le due opzioni nel primo che. e nel terzo gruppo, in cui l’oggetto è [- indivi- duato]). I parlanti, invece, con verbi inerente- 5 Discussione mente telici selezionano “in” in ognuno dei L’analisi aveva lo scopo di testare l’elaborazione gruppi, tranne che nel primo (soggetto [+ indivi- della telicità (anche in rapporto all’individua- duato] e oggetto [- individuato]), in cui “per” zione) e dell’agentività, sia nei parlanti che nel viene preferito nel 55% dei casi. Contrariamente modello, e di indagare se quest’elaborazione de- al modello, in cui, nel secondo e nel quarto gruppo termina il giusto completamento morfosintattico. (con oggetti [+ individuati]), “in” ottiene una pro- I dati mostrano che i parlanti operano in maniera babilità vicina a quella di “per”, nei parlanti è del coerente con l’ipotesi proposta e con la teoria lin- 100% (“per” non viene mai selezionato). guistica. Infatti, è la telicità a determinare la giusta Con verbi inerentemente atelici, invece, i par- codifica morfosintattica. Inoltre, mostrano un’in- lanti selezionano “in” quando l’oggetto è [+ indi- fluenza evidente dell’individuazione sull’inter- viduato] e “per” quando l’oggetto è [- individuato] pretazione telica. In presenza di verbi inerente- (nel secondo e nel quarto gruppo, quindi, rispetti- mente telici i parlanti selezionano “in” senza es- vamente nell’80% e nel 75% dei casi). Nel mo- sere influenzati dalla minore individuazione del dello, invece, l’opzione “per” risulta preferibile in soggetto. L’unico caso in cui la valenza telica ine- ognuno dei quattro casi considerati. Infine, con rente del predicato subisce una variazione è con verbi configurazionali i parlanti mostrano una pre- soggetto [+ individuato] e oggetto [- individuato]. ferenza per “in” nel secondo gruppo (soggetto e Questo stesso schema non si riscontra con sog- oggetto [+ individuati]) e per “per” nei restanti tre. getto [- individuato] e oggetto [- individuato]. Nello specifico, però, nel primo gruppo (soggetto Sappiamo che l’oggetto riveste prototipica- [+ individuato] e oggetto [- individuato]) “per” ri- mente il ruolo di paziente e che quindi è colui che sulta vincente nel 100% dei casi (confermando i nel caso di un evento telico subisce il mutamento dati dei verbi inerentemente telici, in cui, nel 9Le percentuali del modello, nella tabella 3, corrispon- dono al numero di frasi in cui il modello ha preferito inavvertitamente o intenzionalmente.
di stato, quindi [+ coinvolto] e [+ individuato]10. viene applicato ad un modello basato sull’archi- D’altra parte, il soggetto è prototipicamente il pro- tettura di RoBERTa. motore dell’azione, quindi [- coinvolto] e [- indi- Generalizzando, il modello riesce ad utilizzare viduato] dell’oggetto. In questo caso, possiamo le proprietà semantiche veicolate dal predicato per supporre che a guidare l’interpretazione atelica determinare la giusta codifica morfosintattica: (nonostante la telicità inerente del predicato) sia la elabora, quindi, la telicità in coerenza con le teorie non prototipicità dei due argomenti nella frase11. linguistiche, come una proprietà scalare. Tuttavia, A riprova, ciò non si verifica nelle frasi del terzo non si può affermare che questa elaborazione av- gruppo, in cui non vi è differenza tra coinvolgi- venga anche per le proprietà semantiche che sono mento ed individuazione del soggetto e dell’og- veicolate dal contesto dell’intera frase: l’agenti- getto. vità o la variazione della telicità dovuta all’indivi- Anche i dati comportamentali dei verbi ineren- duazione. temente atelici risultano coerenti con l’ipotesi: i parlanti conferiscono un’interpretazione telica 6 Conclusioni alle frasi in cui l’oggetto è [+ individuato] e atelica La differenza di elaborazione tra modello e par- a quelle in cui è [- individuato]. Con i verbi confi- lanti ci permette di proporre delle implicazioni dal gurazionali l’interpretazione telica è possibile punto di vista teorico. La prima implicazione è solo se entrambi gli argomenti sono individuati. I che seppure questi modelli mostrino una certa dati comportamentali, inoltre, riflettono la natura sensibilità e una certa aderenza al modo in cui i scalare della telicità: i verbi configurazionali sono parlanti processano il linguaggio, non possono es- quelli che riportano una dispersione dei dati più sere considerati un modello cognitivo di elabora- ampia. zione del linguaggio. Tuttavia, questa analisi ci Questo tipo di elaborazione si riscontra anche permette di ipotizzare la codifica di queste pro- nel modello, dove i verbi configurazionali non prietà di semantica lessicale nell’informazione mostrano nessuna preferenza netta a favore di una vettoriale dei modelli distribuzionali, facendo delle due opzioni, dimostrando che il modello rie- luce su quali sono le informazioni semantiche co- sce ad inferire la natura scalare della telicità. Tut- dificate. tavia, una differenza emerge nell’elaborazione Sicuramente esiste un’influenza distribuzionale dell’individuazione. Da un lato i parlanti sono in- nel modo in cui i parlanti utilizzano le informa- fluenzati dall’individuazione nell’interpretazione zioni, ma bisogna considerare anche fattori che di- telica; d’altra parte, il modello non mostra la pendono dal contesto extralinguistico. In lavori stessa sensibilità. Questa mancata elaborazione futuri ha senso continuare ad indagare l’elabora- dell’individuazione viene confermata dal fatto che zione di proprietà di semantica lessicale nei mo- con verbi inerentemente telici il modello predilige delli distribuzionali, magari adottando altre tecni- sempre un’interpretazione telica e con verbi ine- che di indagine e confrontando dati estratti da mo- rentemente atelici un’interpretazione atelica. delli diversi. Futuri lavori potranno indagare altre Quindi l’accordo tra modello e parlanti è determi- proprietà di semantica lessicale: ad esempio l’in- nato dalle proprietà del predicato e non dall’indi- transitività scissa. viduazione di soggetto e oggetto. Inoltre, il nostro lavoro può essere migliorato Anche per l’agentività i parlanti mostrano coe- includendo lo studio dell’aspetto verbale e dell’in- renza con l’ipotesi e con le teorie linguistiche. Nei fluenza che questo ha nell’interpretazione della casi in cui l’agentività è codificata nell’informa- frase (coniugando le frasi non solo all’aspetto per- zione eventiva del verbo viene selezionato con fettivo, ma anche all’imperfettivo). Ad esempio, una preferenza netta l’avverbio ad essa associato. potrebbe essere interessante considerare il caso Viceversa, accade con verbi inerentemente ina- delle lingue slave che grammaticalizzano la teli- gentivi; mentre i verbi configurazionali non mo- cità attraverso l’opposizione tra aspetto perfettivo strano preferenza per nessuna delle due opzioni. Il e imperfettivo. Infine, questi studi potrebbero es- modello, al contrario, completa il task senza es- sere utilizzati per implementare questi modelli di- sere influenzato dall’agentività. Questo risultato stribuzionali, migliorando il modo in cui veico- potrebbe essere determinato dal tipo di task o lano la composizionalità semantica (a livello fra- dall’utilizzo di FitBERT, che per la prima volta sale). 10 Telicità, coinvolgimento e individuazione dell’og- 11Il soggetto, in questo caso, ha le proprietà semantiche getto sono anche alcuni dei parametri che determinano prototipiche dell’oggetto e, quest’ultimo, ha quelle la transitività di una frase. prototipiche del soggetto.
References Giulio Ravasio and Leonardo Di Perna. GilBERTo: An Italian pretrained language model based on RoB- Nikos Athanasiou, Elias Iosif and Alexandros Potami- ERTa. DOI: https://github.com/idb-ita/GilBERTo. anos. 2018. Neural activation semantic models: compositional lexical semantic models of localized Vered Shwartz and Ido Dagan. 2019. Still a Pain in the neural activations. In Proceedings of the 27th Inter- Neck: Evaluating Text Representations on Lexical national Conference on Computational Linguistics, Composition. In CoRR, Vol. abs/1902.10618. 2867–2878, Association for Computational Lin- Ian Tenney et al. 2019. What do you learn from con- guistics, Santa Fe, New Mexico, USA. text? Probing for sentence structure in contextual- Marco Baroni and Alessandro Lenci 2010. Distribu- ized word representations. In CoRR, Vol. tional Memory: A General Framework for Corpus- abs/1905.06316. Based Semantics. In Computational Linguistics, 36: Peter D. Turney. 2006. Expressing Implicit Semantic 673–721. Relations without Supervision. In CoRR, Vol Pier Marco Bertinetto. 1986. Tempo, aspetto e azione abs/cs/0607120. nel verbo italiano, Firenze, Accademia della Crusca. Robert D. van Valin and Randy J. LaPolla. 1997. Syn- Lucia Busso, Ludovica Pannitto e Alessandro Lenci. tax: Structure, Meaning, and Function. In Linguis- 2018. Modelling the Meaning of Argument Con- tics, Cambridge University Press. structions with Distributional Semantics. Are con- Zeno Vendler. 1967. Causal relations. In Journal of structions enough? In Proceedings of the Fifth Ital- Philosophy, 64:704-713. ian Conference on Computational Linguistics CLiC-it 2018. Koki Washio and Tsuneaki Kato. 2018. Neural Latent Relational Analysis to capture lexical semantic rela- Alan Cruse. 1973. Some Thoughts on Agentivity. In tion in a vector space. In Proceedings of the 2018 Journal of Linguistics, 9(1):11-23. Conference on Empirical Methods in Natural Lan- Jacob Devlin et al. 2018. BERT: Pre-training of Deep guage Processing, 594-600. Bidirectional Transformers for Language Under- Mo Yu and Mark Dredze. 2014. Improving Lexical standing. In CoRR, Vol. abs/1810.04805. Embeddings with Semantic Knowledge. In Pro- Guy Emerson. 2020. What are the Goals of Distribu- ceedings of the 52nd Annual Meeting of the Associ- tional Semantics? In Proceedings of the 58th Annual ation for Computational Linguistics, 2:545-550. Meeting of the Association for Computational Lin- Xunjie Zhu, Tingfeng Li and Gerard de Melo. 2018. guistics, 1-18. Exploring Semantic Properties of Sentence Embed- Allyson Ettinger. 2019. What {BERT} is not: Lessons dings, In Proceedings of the 56th Annual Meeting of from a new suite of psycholinguistic diagnostics for the Association for Computational Linguistics, language models. In CoRR, Vol. abs/1907.13528. 2:632-637. Cécile Fabre and Alessandro Lenci. 2015. Distribu- tional Semantics Today. Introduction to the special issue. In Traitement automatique des langues. Sé- mantique distributionelle (ATALA), 50(2) :7-20. Scott Grimm. 2018. Grammatical number and the scale of individuation. In Language, 94:527-594. Alessandro Lenci e Alessandra Zarcone. 2008. Com- putational Models of Event Type Classification in Context. In Language Resources and Evaluation Conference. Alessandro Lenci. 2008. Distributional semantics in linguistic and cognitive research. In The Italian Journal of Linguistics, 20:1-20. Yang Liu et al. 2019. RoBERTa: A Robustly Opti- mized BERT Pretraining Approach, In CoRR, Vol. abs/1907.11692. Timothee Mickus et al. 2020. What do you mean, BERT? Assessing BERT as a Distributional Seman- tics Model. In Proceedings of the Society for Com- putation in Linguistics, 3(34):1-12.
Puoi anche leggere