Coreferenza e nuclei tematici nelle interviste del corpus IS

  • Carolina Flinz Università di Milano
  • Josef Ruppenhofer FernUniversität Hagen
Parole chiave: Israelkorpus, coreferenza, entità, nuclei tematici, coesione

Abstract

Obiettivo del contributo è di identificare coreferenze e nuclei tematici nel corpus Emigrantendeutsch in Israel (IS), utilizzando strumenti di analisi di corpora e annotazione manuale.  Ci concentriamo sull'intervista a Paul Avraham e Betti Alsberg (IS_00002) e sull'intervista a Clara Bartnitzki (IS_00008) (cfr. 2.1). Punto di partenza delle nostre considerazioni è l’ipotesi che nelle interviste alcuni referenti, come gli intervistati, compaiano indipendentemente dal rispettivo nucleo tematico, mentre altri referenti (e quindi membri di catene di coreferenza), compaiano raggruppati in segmenti dedicati a nuclei tematici specifici.  In primo luogo, riteniamo infatti che il poter creare automaticamente catene di coreferenza nelle interviste narrative sia importante per poter identificare ed estrarre più facilmente i segmenti di testo in cui sono menzionate determinate entità o persone. Come già mostrato in Flinz/Ruppenhofer (2021), i sistemi di Named Entity Recognition (NER) possono identificare nomi di persone o organizzazioni. Tuttavia, di solito non associano tali menzioni a menzioni coreferenziali che hanno la forma di sostantivi o pronomi ordinari (cfr. Li et al. 2020; Nadeau/Sekine 2007). Solo un’annotazione aggiuntiva può generare catene coreferenziali. In secondo luogo, la coreferenza può essere collegata alla segmentazione delle interviste per nuclei tematici. Poiché essa contribuisce alla coesione del testo (cfr. Halliday/Hasan 1976), possiamo ipotizzare che il modo in cui sono distribuiti gli elementi delle catene coreferenziali possa fornire indizi sulla segmentazione tematica. A tal fine, esaminiamo anche se le strutture coreferenziali delle interviste possano evidenziare nuove sfaccettature altrimenti non facilmente individuabili.

Biografia dell'Autore

Josef Ruppenhofer, FernUniversität Hagen

-

Pubblicato
2024-01-31
Come citare
FlinzC. e RuppenhoferJ. (2024) Coreferenza e nuclei tematici nelle interviste del corpus IS, ANNALI. SEZIONE GERMANICA. Rivista del Dipartimento di Studi Letterari, Linguistici e Comparati dell’Università degli studi di Napoli L’Orientale, (33), pagg. 383-414. doi: 10.6093/germanica.v0i33.10752.