Rozšířená textová koreference a asociační anafora

a najít nejvýhodnější cenu za celou objednávku
Knihu Rozšířená textová koreference a asociační anafora aktuálně nelze zakoupit v žádném z porovnávaných e-shopů...

Krátký popis
V této práci představujeme jeden z možných modelů zpracovaní rozšířené textové koreference a asociační anafory na velkém korpusu textů, který dále používáme pro anotaci daných vztahů v textech Pražského závislostního korpusu. Na základě literatury z oblasti teorie reference, diskurzu a některých dalších poznatků teoretické lingvistiky na jedné straně a s použitím existujících anotačních metodik na straně druhé jsme vytvořili detailní klasifikaci textově koreferenčních vztahů a typů vztahů asociační anafory. V rámci textové koreference rozlišujeme dva typy textově koreferenčních vztahů - koreferenční vztah mezi jmennými frázemi se specifickou referencí a koreferenční vztah mezi jmennými frázemi s nespecifickou, především generickou referencí. Pro asociační anaforu jsme stanovili šest typů vztahů: vztah PART mezi částí a celkem, vztah SUBSET mezi množinou a podmnožinou/prvkem množiny, vztah FUNCT mezi entitou a určitým objektem, který má vzhledem k této entitě jedinečnou funkci, vztah CONTRAST vyjadřující sémantický a kontextový protiklad, vztah ANAF označující anaforické odkazování mezi nekoreferenčními entitami a vztah REST pro jiné případy asociační anafory. Jedním z úkolů výzkumu bylo vytvořit systém teoretických principů, které je nutno dodržovat při anotaci koreferenčních vztahů a asociační anafory. V rámci tohoto systému byl zaveden například princip důslednosti anotace, princip dodržování maximálního koreferenčního řetězce, princip kooperace se syntaktickou strukturou tektogramatické roviny, princip preference koreferenčního vztahu před asociační anaforou a další. Vypracovanou klasifikaci jsme aplikovali na koreferenční a anaforické vztahy v Pražském závislostním korpusu (Prague Dependency Treebank, PDT). Anotace těchto vztahů byla provedena na polovině korpusu PDT (cca 25 tis. vět). Srovnání shody mezi anotátory při navazování vztahů a určování typů těchto vztahů ukázalo, že použitá klasifikace při daném rozsahu materiálu je spolehlivá zejména pro účely teoretického výzkumu; pro počítačové aplikační účely (strojový překlad, automatické učení atd.) je nutné rozšíření materiálové základny.

Zobrazit všechny knihy vydavatele Ústav formální a aplikované lingvistiky
Naše tipy


Nevracej se pro mě
Co když jediný člověk, na kterého se může spolehnout, je právě ten, koho by měla nenávidět?Nell Gallowsová je poslední přeživší tajné elitní jednotky Riøt, která před dvěma lety čelila devastujícímu útoku. Teď je dosazena do jiné speciální jednotky. Malum je tým, který se vydává tam, kam se nikdo jiný neodváží nebo kam nikdo jiný nemůže. Jenže zabijáci z Malum obviňují jednotku Riøt z úmrtí jednoho ze svých členů během neúspěšné mise v Patagonii. Nell je přesvědčena, že s otevřenou náručí na ni nikdo nečeká.Když se ocitne na palubě letadla směřujícího do Kalifornie, kde má potkat nové kolegy, nic už ji netrápí. Během poslední noci svobody se nechá unést žhavým románkem s neznámým mužem. Netuší ale, že tajemný Bradshaw je nejen člen Malum, ale také její největší noční můra – ten nejobávanější démon na bojišti. Bones.Už během výcviku zažívá Nell peklo na zemi. Bones je krutý a dává jí najevo své pohrdání. Chce ji donutit, aby to vzdala. A i když jejich mise končí opakovaným fiaskem, rozhodne se Nell zůstat po jeho boku do poslední chvíle. Je to jediná věc, kterou může udělat, když už není komu věřit. Dojít až tam, kde končí její zdravý rozum. Kde mají jen jeden druhého.