Korpus govorenog istromletačkog/fijumanskog i hrvatskog (C-ORAL-IC)
Ključne riječi:
jezično uzorkivanje; govoreni korpusi; kodno preključivanje; dvojezični diskursSažetak
Dvojezični konverzacijski korpusi od neprocjenjive su važnosti za proučavanje autentičnih jezičnih kontakata u spontanom dvojezičnom govoru. Ovaj rad predstavlja Korpus govornog istromletačkog/fijumanskog i hrvatskog jezika (C-ORAL-IC), prvi korpus koji dokumentira spontane razgovore na istromletačkom i fijumanskom dijalektu dvojezičnih osoba iz istarskog i kvarnerskog područja Hrvatske. Regija ima dugu povijest kulturne i jezične interakcije hrvatskog i talijanskog jezika, što je oblikovalo složen sociolingvistički sustav s obilježjima diglosije i poliglosije.
Korpus C-ORAL-IC obuhvaća podatke 87 dvojezičnih i višejezičnih govornika, s više od 85.000 pojavnica i 27.000 različitih riječi (obličnica). Dostupan je na platformi TalkBank, u podsekciji BilingBank (https://talkbank.org, https://biling.talkbank.org/ access/C-ORAL-IC.html). Sadrži transkribirane, fonološki prilagođene, kodirane, segmentirane i morfološki označene transkripte uparene sa snimkama. Dostupni su i do-datni podaci o jeziku i upotrebi jezika sudionika.
C-ORAL-IC predstavlja bogat izvor za proučavanje spontanoga dvojezičnog govora te nudi uvid u konverzacijska obilježja, strukturu i sinkrone promjene u istromletačkom i fijumanskom.