|
Els criteris de transcripció que presentem s’ajusten als objectius del corpus Parlars (projecte CorDiVal, Ref. GV/2017/094, finançat per la Generalitat Valenciana; https://www.uv.es/corvalc/), és a dir, un corpus oral, col·loquial i dialectal del català del País Valencià. El corpus Parlars tindrà dues transcripcions: una transcripció fonoortogràfica que provarà de reflectir al màxim possible les característiques lingüístiques del discurs i una transcripció ortogràfica estandarditzada que ha de facilitar les tasques d’anotació. Aquest model serà possible perquè optem per una estratègia d’anotació multicapes (stand-off) que combina la superposició de diversos nivells de transcripció i anotació alineats amb el document audiovisual original. La font primària del corpus és l’arxiu de so (o vídeo) dividit en segments breus que faciliten la cerca d’elements lingüístics transcrits i el fragment corresponent del document multimèdia on hi apareixen. La transcripció es realitza amb la ferramenta ELAN (Brugman & Russel 2014).
|