WordNet je anglická lexikální databáze vyvinutá na Princetonské univerzitě a vydaná s doprovodným softwarem pod bezplatnou licencí bez copyleftu . Jedná se o elektronický slovník - tezaurus a soubor sémantických sítí pro anglický jazyk.
Slovník se skládá ze čtyř sítí pro hlavní významné slovní druhy: podstatná jména, slovesa, přídavná jména a příslovce. Základní jednotkou slovní zásoby ve WordNet není jedno slovo, ale synonymní řada, tzv. " synset " , která spojuje slova sítě s podobným významem do uzlu sémantické sítě. Pro usnadnění používání slovníku osobou je každý synset doplněn definicí a příklady použití slov v kontextu. Slovo nebo fráze se může objevit ve více než jedné synsetě a může mít více než jednu kategorii slovních druhů . Každý synset obsahuje seznam synonym nebo synonymních frází a ukazatelů popisujících vztah mezi ním a jinými synsety. Slova, která mají několik významů, jsou zahrnuta v několika synsetech a lze je přiřadit do různých syntaktických a lexikálních tříd.
Synsety ve WordNet jsou propojeny různými sémantickými vztahy:
WordNet také popisuje další typy odkazů. Mezi nimi hraje zvláštní roli hyponymie: umožňuje organizovat synsety ve formě sémantických sítí. Pro různé slovní druhy mohou mít druhové vztahy další charakteristiky a mohou se lišit rozsahem.
WordNet je zdarma k použití pro komerční a vědecké účely. Pro práci s ním existuje několik programů, mnoho rozhraní a API implementovaných ve většině možných jazyků a také pomocí protokolu DICT , programu GoldenDict a dalších. Balíčky WordNet jsou také přítomny v některých softwarových úložištích pro GNU a Linux a jejich distribuce.