La creazione di Arbor è stato un progetto lungo circa un anno e costellato di tante sfide, prima fra tutte la scarsità di dati. In breve, il progetto ha coinvolto le seguenti fasi: raccolta dei dati tramite Corpus Arbëresh, sviluppo degli strumenti (correttore, coniugatore, generatore di numerali...) e sviluppo e design del sito. Il tutto assicurando standard qualitativi più alti possibili. Come è stato possibile realizzare tutto ciò? Un paper di Giulio Cusenza e del Prof. Çağrı Çöltekin sulla creazione di Arbor verrà presentato a SIGUL 2024, il terzo incontro annuale del Gruppo di Interesse Speciale sulle Lingue povere di risorse, un workshop satellite di LREC-COLING 2024, Conferenza Internazionale sulla Linguistica Computazionale e le Risorse Linguistiche, che quest'anno si terrà a Torino a fine maggio. L'articolo, in inglese, sarà pubblicato tra gli atti del workshop e sarà possibile per chiunque sia interessato consultarlo liberamente.
L'articolo si concentra sulla raccolta dei dati e sullo sviluppo
dietro le quinte
degli strumenti. Non viene affrontato nel
dettaglio lo sviluppo del sito e della sua interfaccia, non rientrando
questo nell'interesse della conferenza. Verrà presentato lunedì 20
maggio al Centro Conferenze del Lingotto, a Torino. Un poster sarà
presente il 25 maggio anche a
EURALI 2024, altro
workshop satellite sulle
Risorse e Tecnologie per le Lingue Eurasiatiche indigene, in
pericolo d'estinzione e povere di risorse, con gli autori disponibili per rispondere a eventuali domande. Se
sei curioso o curiosa di saperne di più, o hai domande sulla creazione
di Arbor, non esitare a contattarmi!