Koreference neboli referenční identita je vztah mezi jmény - složkami výpovědi, ve kterých jména odkazují na stejný objekt (situaci) mimojazykové reality ( referent ) [1] .
Díky koreference může být text koherentní, často, ale ne nutně, ve formě anaforického vztahu (zájmenné slovo nebo určitý význam - zájmeno ).
Anaforický vztah „zájmenné slovo – zájmeno“: „ Kniha je na stole. Je těžká."
Anaforický vztah „význam jistoty je zájmeno“: „ Kniha je na stole. Tom je těžký."
Metonymie : " Spisovatel přiměl veřejnost číst sám ." (zde sám - díla spisovatele)
Jméno v informačních systémech s tabulkovou formou prezentace informací ( databáze , webové stránky , tabulky atd.) je reprezentováno atributem nebo sadou atributů n-tice (u jmenných frází). Znak po symbolu různá jména v takových systémech mohou být koreferenční a atributy, které je obsahují, mohou být sémanticky ekvivalentní . Například název "čisticí prostředek" odpovídá názvu "čisticí prostředek" . [2]
Nepochybně při absenci zvláštních pravidel budou koreferenční názvy provozovateli různých informačních systémů zadávat znak po znaku odlišně. Obvykle je problém určení sémantické ekvivalence symbolických atributů považován za algoritmicky neřešitelný. Na úrovni jednotlivých softwarových řešení státy i světová komunita jako celek využívají technologie, které umožňují implicitně přenést funkci porovnávání názvů na operátora počítače a prezentovat výsledek ve formě kódu, nebo v jiném algoritmicky vhodném formulář.
Pokroky v počítačové analýze přirozených jazyků umožňují vytvářet informační systémy pro řešení takových problémů, kde není možné zavést kódová označení nebo standardy pojmenování. Systém Price.ru pro vyhledávání informací o zboží lze v Runetu považovat za průkopníka pro automatické porovnávání sémantiky jmen . Využívá metod systémů vyhledávání informací, což umožňuje stanovit sémantickou toleranci různých jmen.
Většina výzkumů a publikací souvisí s automatizací vytváření koreferenčních vztahů v textu v přirozeném jazyce. Použití doménově specifických sémantických modelů umožňuje efektivně provádět sémantické porovnávání názvů znak po znaku v databázích pro různé aplikované účely.