Coreferenza e nuclei tematici nelle interviste del corpus IS
Abstract
Obiettivo del contributo è di identificare coreferenze e nuclei tematici nel corpus Emigrantendeutsch in Israel (IS), utilizzando strumenti di analisi di corpora e annotazione manuale. Ci concentriamo sull'intervista a Paul Avraham e Betti Alsberg (IS_00002) e sull'intervista a Clara Bartnitzki (IS_00008) (cfr. 2.1). Punto di partenza delle nostre considerazioni è l’ipotesi che nelle interviste alcuni referenti, come gli intervistati, compaiano indipendentemente dal rispettivo nucleo tematico, mentre altri referenti (e quindi membri di catene di coreferenza), compaiano raggruppati in segmenti dedicati a nuclei tematici specifici. In primo luogo, riteniamo infatti che il poter creare automaticamente catene di coreferenza nelle interviste narrative sia importante per poter identificare ed estrarre più facilmente i segmenti di testo in cui sono menzionate determinate entità o persone. Come già mostrato in Flinz/Ruppenhofer (2021), i sistemi di Named Entity Recognition (NER) possono identificare nomi di persone o organizzazioni. Tuttavia, di solito non associano tali menzioni a menzioni coreferenziali che hanno la forma di sostantivi o pronomi ordinari (cfr. Li et al. 2020; Nadeau/Sekine 2007). Solo un’annotazione aggiuntiva può generare catene coreferenziali. In secondo luogo, la coreferenza può essere collegata alla segmentazione delle interviste per nuclei tematici. Poiché essa contribuisce alla coesione del testo (cfr. Halliday/Hasan 1976), possiamo ipotizzare che il modo in cui sono distribuiti gli elementi delle catene coreferenziali possa fornire indizi sulla segmentazione tematica. A tal fine, esaminiamo anche se le strutture coreferenziali delle interviste possano evidenziare nuove sfaccettature altrimenti non facilmente individuabili.
Copyright (c) 2024 Carolina Flinz
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Gli autori che pubblicano su questa rivista accettano le seguenti condizioni:
- Gli autori mantengono i diritti sulla loro opera e cedono alla rivista il diritto di prima pubblicazione dell'opera, contemporaneamente licenziata sotto una Licenza Creative Commons che permette ad altri di condividere l'opera indicando la paternità intellettuale e la prima pubblicazione su questa rivista.
- Gli autori possono aderire ad altri accordi di licenza non esclusiva per la distribuzione della versione dell'opera pubblicata (es. depositarla in un archivio istituzionale o pubblicarla in una monografia), a patto di indicare che la prima pubblicazione è avvenuta su questa rivista.
- Gli autori possono diffondere la loro opera online (es. in repository istituzionali o nel loro sito web) prima e durante il processo di submission, poiché può portare a scambi produttivi e aumentare le citazioni dell'opera pubblicata (Vedi The Effect of Open Access).