Cyc

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 26. srpna 2018; kontroly vyžadují 12 úprav .
Cyc
Typ znalostní báze , inferenční stroj , počítačový program , vyšší ontologie a výzkumný projekt [d]
Vývojář Lenate, Douglas
Zapsáno v Lisp , CycL [d] a SubL [d]
První vydání 1984
webová stránka cyc.com

Cyc ( napsáno latinsky, vyslovováno Cyc ) je projekt na vytvoření rozsáhlé ontologické znalostní báze , která umožňuje programům řešit složité problémy z oblasti umělé inteligence na základě logického vyvozování a použití zdravého rozumu .

Přehled

Projekt zahájil Douglas Lenat v roce 1984 ve společnosti Microelectronics and Computer Technology Corporation . Název „Cyc“ (odvozený z anglické  encyklopedie : „cyc“) je registrovaná ochranná známka společnosti Cycorp, Inc v Austinu , provozovaná společností Lenat a vytvořená za účelem vývoje Cyc. Znalostní báze je majetkem společnosti, ale malá část báze, určená k vytvoření společného slovníku pro programy automatického uvažování, byla vydána jako OpenCyc pod otevřenou licencí. Cyc byl později zpřístupněn výzkumníkům AI na základě speciální výzkumné licence od ResearchCyc .

Typické příklady znalostí v databázi jsou: „Každý strom je rostlina“ a „Rostliny jsou smrtelné“. Pokud se zeptáte "umírají stromy?", inferenční stroj může vyvodit zřejmý závěr a dát správnou odpověď. Znalostní báze ( anglicky  Knowledge Base nebo KB) obsahuje více než milion prohlášení, pravidel a běžně používaných nápadů, které tam lidé zadávají. Jsou formulovány v jazyce CycL , který je založen na predikátovém počtu a má syntaxi podobnou Lisp . Anglicky mluvící uživatelé vtipkují, že jsou „cyklisté“ (z anglického cyklista  – cyklista).  

Většina dnešní práce v projektu Cyc je stále o znalostním inženýrství  – ručním popisu faktů o světě kolem nás a implementaci účinných mechanismů odvození založených na těchto znalostech. Pracuje se však na tom, aby systém Cyc mohl nezávisle komunikovat s uživateli v přirozeném jazyce a na urychlení procesu doplňování základny pomocí strojového učení .

Popis znalostní báze, terminologie

Pojmy v Cyc se nazývají konstanty . Názvy konstant začínají nepovinnými znaky "#$" a rozlišují velká a malá písmena. Existují konstanty pro:

Nejdůležitější predikáty jsou #$isa a #$genls. Prvním je prohlášení, že prvek je instancí kolekce, a druhým, že kolekce je podkolekcí jiné kolekce. Fakta o konceptech jsou deklarována pomocí speciálních příkazů CycL . Predikáty se píší v závorkách před jejich argumenty:

(#$isa #$BillClinton #$UnitedStatesPresident)

znamená, že „Bill Clinton je jedním z prezidentů Spojených států“ a prohlášení

(#$genls #$Strom-ThePlant #$Plant)

zní "Všechny stromy jsou rostliny."

(#$capitalCity #$Francie #$Paříž)

znamená „Paříž je hlavní město Francie“.

Příkazy mohou také obsahovat proměnné, řádky začínající "?". Tato prohlášení se nazývají „pravidla“. Jedno z nejdůležitějších pravidel týkajících se predikátu #$isa zní:

(#$ znamená (#$a (#$isa ?OBJ ?SUBSET) (#$genls ?SUBSET ?SUPERSET)) (#$isa ?OBJ ?SUPERSET))

což znamená "pokud je OBJ instancí kolekce SUBSET a SUBSET je zase podkolekcí SUPERSET, pak OBJ je také instancí kolekce SUPERSET." Další typický příklad:

(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)

což znamená, že jakákoli instance kolekce #$ChordataPhylum (tj. jakýkoli strunatec ) je spojena se zvířecí samicí (instance #$FemaleAnimal), která je její matkou (jak je popsáno predikátem #$BiologicalMother).

Znalostní báze Cyc je rozdělena na mikroteorie (Mt), sbírky pojmů a faktů patřících do jedné konkrétní oblasti znalostí. Na rozdíl od úplné znalostní báze musí být jakákoli mikroteorie bez rozporů. Každá mikroteorie má jméno, které je obyčejnou konstantou; podle konvence obsahují konstanty mikroteorie řetězec "Mt". Příkladem je #$MathMt, mikroteorie obsahující matematické znalosti. Mikroteorie mohou být zděděny jedna od druhé a jsou organizovány v hierarchii: jednou ze specializací #$MathMt je #$GeometryGMt - mikroteorie o geometrii.

opencyc

Nejnovější verze OpenCyc, 1.0, byla vydána v červenci 2006. OpenCyc 1.0 obsahuje kompletní Cyc ontologii obsahující statisíce výrazů, miliony výrazů, které mezi sebou spojují výrazy. Znalostní báze obsahuje 47 000 konceptů a 306 000 faktů a lze si ji prohlédnout na webu OpenCyc. První verze OpenCyc byla vydána v květnu 2001 s pouhými 6 000 koncepty a 60 000 fakty. Znalostní báze je vydána pod licencí Apache . Cycorp má v úmyslu uvolnit OpenCyc pod paralelními, méně omezujícími licencemi, aby vyhovoval potřebám svých uživatelů. Interpret CycL a SubL (program, který umožňuje prohlížet a upravovat databázi a vyvozovat závěry) je uvolněn zdarma, ale pouze v binární podobě, bez zdrojového kódu. Běží jak pod GNU/Linux , tak pod Microsoft Windows .

ResearchCyc

V červenci 2006 vydala společnost Cycorp ResearchCyc 1.0, bezplatnou (ale uzavřenou zdrojovou) verzi Cyc zaměřenou na výzkumnou komunitu. (ResearchCyc byl v průběhu roku 2004 ve verzi beta a do beta testování byl vydán v únoru 2005.) Kromě taxonomických informací z OpenCyc obsahuje ResearchCyc výrazně více sémantických znalostí (tj. dalších faktů) o konceptech ve své znalostní bázi a zahrnuje velký lexikon, nástroje pro analýzu a generování angličtiny , napsaný v rozhraních Java pro editaci znalostí a vytváření dotazů do databáze.

Cycorp veřejně vyjádřil svůj záměr uvolnit všechny termíny a taxonomické vztahy obsažené v ResearchCyc jako součást OpenCyc, a to bylo provedeno ve verzi 1.0. Jedním z uvedených cílů je vytvořit zcela volný a neomezený sémantický slovník pro použití na sémantickém webu . Taxonomie OpenCyc je k dispozici ve formátu Owl na webu projektu OpenCyc.

Kritika projektu Cyc

Cyc byl popsán jako „jeden z nejkontroverznějších počinů v historii umělé inteligence“ (Bertino et al., str. 275), takže se nevyhnutelně dočkal spravedlivé části kritiky.

O těchto otázkách se od zahájení projektu diskutovalo na různých místech. Doug Lenat a další publikovali mnoho argumentů na obranu svého projektu.

Viz také

Bibliografie

Poznámky

  1. Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Sémantická Wikipedie Archivováno 31. prosince 2019 na Wayback Machine . In Sborník příspěvků z 15. mezinárodní konference o World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Skotsko, 23.-26. května 2006. - str. 585-594

Odkazy