Apie laidų išrašus
Tekstyną sudarantys laidų išrašai buvo parengti programa CLAN, kuri skirta automatinei šnekos analizei.Šie išrašai nėra įprastinis rašytinis tekstas, bet tam tikras sakytinės kalbos perteikimas raštu, išlaikant ją kaip įmanoma autentišką. Autentiškas perteikimas reiškia, kad išrašant palikti žodžių ar skiemenų pakartojimai, nebaigti žodžiai, įvairūs garsiniai pertarai (mmm, aaa, eee ir kt.), iliustruoti pritarimo (mh), kostelėjimo (hm) ar kiti garsai. Netaisyti spontaniškam kalbėjimui būdingi linksnio ar žodžio formos neatitikimai, nestandartinis tarimas, kalbos riktai.
Nors moksliniuose sakytinės kalbos išrašuose paprastai nenaudojama rašytinio teksto skyryba, kad būtų lengviau bazės vartotojui, rašytinei kalbai įprasčiausiose vietose ir žymint ilgesnę pauzę sudėti kableliai. Išrašinėtojų studentų komanda buvo nemaža, todėl gali pasitaikyti nedidelių nevienodumų.
Kalbėtojai nurodomi individualiais kodais. Jį toliau pateikta tvarka sudaro:
- kalbėtojo vaidmenį nurodančios raidės (žr. žemiau);
- lytį nurodančios raidės M arba V;
- unikalus skaitmuo.
- VV01, VM01 - pokalbių laidos vedėjas
- BV01, BM01 - diktorius, balsas už kadro, korespondentas - BV01, BM01
- IV01, IM01 - įžymybė
- EVE01, EM01 - ekspertas; XV01, XM01 - ekspertais, teikiantis komentarą telefonu;
- HV01, HM01 - herojus
- GV01, GM01 - vox populi
Išrašuose naudojami simboliai ar kodai:
+... – nebaigta mintis
xxx – nesuprantamas, negirdimas ir todėl neišrašytas žodis ar frazė
+< - persidengimas (du ar daugiau kalbėtojų kalba vienu metu)
%sit: $ – prieš ir po šiuo ženklu einančios kalbos persidengimas, kalbėjimas vienu metu
%com arba komentaras – išrašinėtojo pastabos apie pokalbio situaciją (juoką, telefono skambutį, kitų asmenų intarpus ir pan.).
Jei pastebėsite netikslumų ar turėsite pastabų, rašykite mums į info@sociolingvistika.lt arba naudokite skiltį „Komentaras“. Ačiū!