Reprezentace znalostí

Reprezentace znalostí  je problém, který vyvstává v kognitologii (vědě o myšlení) a informatice , stejně jako při studiu problémů souvisejících s umělou inteligencí . V kognitivní vědě se zabývá tím, jak lidé ukládají a zpracovávají informace. V informatice - s výběrem reprezentací konkrétních a zobecněných znalostí , informací a faktů pro akumulaci a zpracování informací v počítači . Hlavním úkolem umělé inteligence (AI) je naučit se ukládat znalosti tak, aby je programy mohly smysluplně zpracovat a dosáhnout něčeho podobného jako lidská inteligence .

Termín „reprezentace znalostí“ nejčastěji označuje metody reprezentace znalostí orientované na automatické zpracování moderními počítači , a zejména reprezentace sestávající z explicitních objektů („třída všech slonů“, „Clyde je jednotlivec“) a úsudků . nebo prohlášení o nich („Clyde je slon“, „všichni sloni jsou šedí“). Reprezentace znalostí v této explicitní formě umožňuje počítačům vyvodit deduktivní závěry z dříve uložených znalostí („Clyde je šedý“).

Reprezentace znalostí v AI

Výzkumníci AI používají teorie reprezentace znalostí z kognitivní vědy. Techniky, jako jsou rámce , pravidla pro odvození a sémantické sítě , přišly do umělé inteligence z teorií lidského zpracování informací. Vzhledem k tomu, že znalosti se používají k dosažení inteligentního chování, základním cílem disciplíny reprezentace znalostí je najít způsoby reprezentace, které umožňují proces inference, tedy vytváření znalostí ze znalostí.

Některé otázky, které vyvstávají při reprezentaci znalostí z pohledu AI, jsou:

O otázkách reprezentace znalostí se vedla velmi málo rigorózní diskuse shora dolů a výzkum v této oblasti v posledních letech ve skutečnosti nepokročil. Známé jsou problémy jako „rozšíření aktivace“ (úkol navigace v síti uzlů), kategorizace (to je způsobeno selektivní dědičností; např. terénní vůz lze považovat za specializaci (zvláštní případ) auto, ale dědí jen některé vlastnosti) a klasifikaci . Například rajče lze považovat za bobule i zeleninu.

Řešení složitých problémů lze často zjednodušit správnou volbou metody reprezentace znalostí. Určitá metoda může učinit jakoukoli oblast znalostí snadno reprezentovatelnou. Například diagnostický expertní systém MYCIN používal schéma reprezentace znalostí založené na pravidlech. Špatná volba způsobu prezentace ztěžuje zpracování. Jako analogii lze vzít výpočty v indoarabské nebo římské notaci. Podélné dělení je v prvním případě jednodušší a ve druhém obtížnější. Stejně tak neexistuje způsob prezentace, který by se dal použít ve všech úkolech nebo aby byly všechny úkoly stejně jednoduché.

Historie

Pro strukturování informací, stejně jako organizování znalostních bází a expertních systémů, bylo navrženo několik způsobů reprezentace znalostí. Jedním z nich je prezentace dat a informací v rámci logického modelu znalostních bází.

V 60. a na počátku 80. let byly navrženy a s různým stupněm úspěchu vyzkoušeny četné metody reprezentace znalostí, jako jsou heuristické systémy otázka-odpověď , neuronové sítě , dokazování teorémů a expertní systémy . Jejich hlavními oblastmi použití v té době byla lékařská diagnostika ( MYCIN ) a hry (např. šachy ).

V 80. letech se objevily formální počítačové jazyky pro reprezentaci znalostí. Hlavní projekty té doby se snažily zakódovat (vložit do svých znalostních bází) obrovské pole univerzálních znalostí. Například v projektu Cyc byla zpracována velká encyklopedie a nebyly zakódovány informace v ní uložené samotné, ale znalosti, které by čtenář potřeboval k pochopení této encyklopedie: naivní fyzika, pojmy času, kauzalita a motivace, typické objekty a jejich třídy. Projekt Cyc vyvíjí společnost Cycorp, Inc. ; většina (ale ne všechny) jejich databáze je volně dostupná.

Tato práce vedla k přesnějšímu posouzení složitosti úlohy reprezentace znalostí. Zároveň se v matematické lingvistice vytvořily mnohem větší základny lingvistických informací , které spolu s obrovským nárůstem rychlosti a paměti počítačů učinily hlubší reprezentaci znalostí reálnější.

Bylo také vyvinuto několik programovacích jazyků , které se zaměřují na reprezentaci znalostí. Prolog (vyvinutý v roce 1972, [1] ale získal popularitu mnohem později) popisuje návrhy a základní logiku a může vyvozovat ze známých premis. Jazyk KL-ONE (80. léta) je ještě více zaměřen na reprezentaci znalostí .

V oblasti elektronických dokumentů byly vyvinuty jazyky, které explicitně vyjadřují strukturu uložených dokumentů, jako je SGML (a později XML ). Usnadnily úkoly vyhledávání a získávání informací , které jsou v poslední době stále více spojovány s úkolem reprezentace znalostí. Velký zájem je o technologii sémantického webu , ve které se jazyky reprezentace znalostí založené na XML, jako je RDF , Topic Map a další, používají ke zvýšení dostupnosti informací uložených na webu pro počítačové systémy.

Spojení a struktury

Hypertextové odkazy jsou dnes široce používány , ale úzce související koncept sémantického odkazu ( en:sémantický odkaz ) se dosud široce nepoužíval. Matematické tabulky se používaly již od dob Babylonu . Později byly tyto tabulky použity k reprezentaci výsledků logických operací, například pravdivostní tabulky byly použity ke studiu a modelování booleovské logiky . Tabulkové procesory jsou také příkladem tabulkové reprezentace znalostí. Stromy jsou další metodou reprezentace znalostí , kterou lze použít k zobrazení vztahů mezi základními pojmy a jejich odvozeninami.

Relativně novým přístupem ke správě znalostí jsou vizuální reprezentace, jako jsou ty, které vyvinula společnost TheBrain Technologies Corp. "plex". Poskytují uživateli způsob, jak si představit, jak myšlenka nebo nápad souvisí s jinými myšlenkami, což mu umožňuje přecházet od jedné myšlenky k druhé při hledání požadovaných informací. Tento přístup vyvíjí několik společností. Další nástroje pro vizuální vyhledávání jsou od Convera , Entopia , Inc. , Epeople Inc. a Inxight Software Inc.

Uchovávání a zpracování znalostí

Jednou z výzev v reprezentaci znalostí je, jak formálním způsobem ukládat a zpracovávat znalosti v informačních systémech tak, aby je mohly stroje využít k dosažení svých cílů. Příklady aplikací jsou expertní systémy , strojový překlad , počítačová údržba a systémy vyhledávání a vyhledávání informací (včetně databázových uživatelských rozhraní).

Sémantické sítě

K reprezentaci znalostí lze použít sémantické sítě. Každý uzel v takové síti představuje koncept a k definování vztahů mezi koncepty se používají oblouky .

Jedním z nejvýraznějších a nejpodrobnějších paradigmat reprezentace znalostí založených na sémantických sítích je MultiNet (zkratka pro Multilayered Extended Semantic Networks ) . 

Rámečky

Začátek v 60-tých letech , ponětí o rámci znalostí, nebo jednoduše rámec , byl používán . Každý snímek má svůj vlastní název a sadu atributů nebo slotů , které obsahují hodnoty; například rám domu může obsahovat štěrbiny pro barvu , počet pater a tak dále.

Použití rámců v expertních systémech je příkladem objektově orientovaného programování s dědičností vlastností , která je popsána vztahem "is-a" ("je"). Existuje však mnoho kontroverzí v použití odkazu „je-a“ : Ronald Brachman napsal článek s názvem „Co je a není IS-A“, ve kterém bylo 29 různých sémantik odkazu „je-a“. nalezené v projektech, jejichž schémata reprezentace znalostí zahrnovala spojení „je-a“. Mezi další spojení patří například " has-part " ("má svou část").

Rámcové struktury se dobře hodí pro reprezentaci znalostí ve formě schémat a stereotypních kognitivních vzorců. Prvky takových vzorů mají různé váhy, přičemž vyšší váhy jsou přiřazeny těm prvkům, které odpovídají aktuálnímu kognitivnímu schématu ( schema ). Vzor se aktivuje za určitých podmínek: pokud člověk vidí velkého ptáka, za předpokladu, že jeho „mořské schéma“ je aktuálně aktivní, ale jeho „pozemské schéma“ není, klasifikuje jej spíše jako mořského orla než jako zemského zlatého. orel.

Reprezentace rámců jsou zaměřeny na objekt ve stejném smyslu jako sémantický web : všechna fakta a vlastnosti spojené s jedním konceptem jsou umístěny na jednom místě, takže není třeba utrácet zdroje prohledáváním databáze.

Skript  je typ rámce, který popisuje sled událostí v průběhu času; typickým příkladem je popis návštěvy restaurace . Události zde zahrnují čekání na místo, čtení jídelního lístku, vytvoření objednávky a tak dále.

Různá řešení v závislosti na jejich sémantické expresivitě lze uspořádat do tzv . sémantického spektra . 

Jazyk a notace

Někteří lidé se domnívají, že je nejlepší představovat znalosti tak, jak jsou v lidské mysli , která je dosud jedinou fungující myslí , nebo představovat znalosti ve formě přirozeného jazyka . Dr. Richard Ballard například vyvinul " sémantický systém založený na teorii ", který je nezávislý na jazyce, který odvozuje účel a uvažování ve stejných konceptech a teoriích jako lidé. Vzorec, který je základem této sémantiky, je: Knowledge=Theory+Information. Většina běžných aplikací a databázových systémů je založena na jazycích. Bohužel nevíme, jak jsou znalosti reprezentovány v lidské mysli, nebo jak manipulovat s přirozenými jazyky stejným způsobem jako lidé. Jedním vodítkem je, že primáti vědí, jak používat uživatelská rozhraní typu point-and-click ; tak se zdá, že gestické rozhraní je součástí našeho kognitivního aparátu, modalitou , která není vázána na mluvenou řeč a která existuje u jiných zvířat než u lidí .

Proto byly navrženy různé umělé jazyky a zápisy , které reprezentují znalosti . Obvykle jsou založeny na logice a matematice a mají snadno čitelnou gramatiku pro usnadnění strojového zpracování . Obvykle spadají do široké domény ontologií .

Notace

Nejnovější módou v jazycích reprezentujících znalosti je použití XML jako syntaxe nízké úrovně. To má za následek, že stroje jsou schopny snadno analyzovat a vydávat tyto jazyky reprezentace znalostí na úkor lidské čitelnosti.

Logika prvního řádu a jazyk Prolog jsou široce používány jako matematický základ pro tyto systémy, aby se zabránilo nadměrné složitosti. Nicméně i jednoduché systémy založené na této jednoduché logice mohou být použity k reprezentaci dat, která výrazně převyšují možnosti zpracování současných počítačových systémů: důvody jsou odhaleny v teorii vyčíslitelnosti .

Příklady zápisů:

  • DATR je příkladem reprezentace lexikálních znalostí
  • RDF je jednoduchý zápis pro reprezentaci vztahů mezi objekty a mezi nimi.
Jazyky

Jazyky se dělí na umělé a přirozené.

Přirozené jazyky byly tvořeny a utvářeny národními nebo profesními společenstvími lidí. Znalosti se přenášejí z jedné osoby na druhou po jejich překladu do jazyka, kterému rozumí osoba, která je zdrojem znalostí, a osoba, která je příjemcem znalostí.

Umělé jazyky byly a jsou vytvářeny, aby spojovaly lidi se stroji.

Příklady umělých jazyků , které se převážně používají k reprezentaci znalostí:

  • CyklusL
  • IKL
  • KIF
  • TKALCOVSKÝ STAV
  • SOVA
  • KM  : Knowledge Machine (  rámcový jazyk používaný pro úlohy reprezentace znalostí)
  • jazykový prolog

Metody a formalismy

Metody a formalismus reprezentace znalostí je  název oddílu I.2.4 v ACM Computing Classification System . 

Tato sekce se nachází pod:

  • Nejvyšší kategorie, I Výpočtové metodiky a
  • Kategorie druhé úrovně, I.2 Umělá inteligence .

Zahrnuje následující témata:

  1. rámce a skripty
  2. modální logika
  3. Logika prvního řádu
  4. Relační systémy
  5. Jazyky prezentace
  6. Zobrazení (procedurální a založená na pravidlech)
  7. Sémantické sítě
  8. Temporální logika
  9. jazykový prolog
  10. Logické programování
  11. Znalostní základna
  12. Expertní systémy
  13. Kognitivní modelování
  14. Konvergované řízení

Viz také

Poznámky

  1. Témata AI . Získáno 13. dubna 2007. Archivováno z originálu 29. ledna 2007.

Literatura

  • Joseph Giarratano, Gary Riley. Kapitola 2. Reprezentace znalostí (v PDF) // Expertní systémy: Principy vývoje a programování = Expertní systémy: Principy a programování. - 4. vyd. - M. : "Williams" , 2006. - S. 1152. - ISBN 978-5-8459-1156-8 .
  • Amaravadi, CS, "Knowledge Management for Administrative Knowledge," Expert Systems, 25(2), str. 53-61, květen 2005.
  • Ronald J. Brachman ; Co JE-A je a co není. Analýza taxonomických vazeb v sémantických sítích; IEEE Computer, 16(10); října 1983 [1]
  • Jean-Luc Hainaut, Jean-Marc Hick, Vincent Englebert, Jean Henrard, Didier Roland: Pochopení implementace vztahů IS-A. ER 1996: 42-57 [2]
  • Hermann Helbig: Reprezentace znalostí a sémantika přirozeného jazyka , Springer, Berlín, Heidelberg, New York 2006
  • Arthur B. Markman: Zastoupení znalostí Lawrence Erlbaum Associates, 1998
  • Michael Negnevitsky: Umělá inteligence, Průvodce inteligentními systémy , Pearson Education Limited, 2002
  • John F. Sowa: Reprezentace znalostí : Logické, filozofické a výpočetní základy. Brooks/Cole: New York, 2000
  • Adrian Walker, Michael McCord, John F. Sowa a Walter G. Wilson: Knowledge Systems and Prolog , druhé vydání, Addison-Wesley, 1990
  • Subbotin S. O. Zpracování dat znalostí v systémech kusové inteligence a vylepšení řešení: Manuál. - Zaporizhzhya: ZNTU, 2008. - 341 s.

Odkazy