Rámec popisu zdrojů

Rámec popisu zdrojů (RDF, „resource description framework“ [1] ) je model vyvinutý World Wide Web Consortium pro reprezentaci dat, konkrétně metadat [2] . RDF představuje nároky na zdroje ve strojově čitelné podobě. RDF je součástí konceptu sémantického webu .

Zdrojem v RDF může být jakákoli entita, ať už informační (například webová stránka nebo obrázek) nebo neinformační (například osoba, město nebo nějaký abstraktní pojem). Výrok o zdroji má tvar „subjekt – predikát – objekt“ a nazývá se triplet [1] . Výrok „nebe je modré“ v terminologii RDF lze znázornit takto: subjekt je „nebe“, predikát je „má barvu“, objekt je „modrý“. RDF používá URI k odkazování na předměty, vztahy a objekty .

Sada příkazů RDF tvoří řízený graf , ve kterém jsou vrcholy subjekty a objekty a hrany představují vztahy.

RDF sám o sobě není formát souboru , ale pouze abstraktní model [2] dat, to znamená, že popisuje navrženou strukturu, způsoby zpracování a interpretace dat. Existuje řada formátů záznamů pro ukládání a přenos informací zabalených do modelu RDF.

Pro zpracování dat RDF se navrhuje implementovat dotazovací jazyky: SPARQL ( standard W3C ), RQL , RDQL .

Historie

Historie RDF sahá až do roku 1990 , kdy Tim Berners-Lee navrhl označování typů odkazů mezi dokumenty pro usnadnění automatického zpracování. Typy odkazů však nebyly zahrnuty do první specifikace HTML , ale nápad byl vyzvednut v systému popisu metadat MCF . Obecná reprezentace metadat se odrazila v doporučení W3C o RDF z roku 1999 . Od té doby se standardy RDF vyvíjely a objevily se nové nástroje pro práci s RDF [3] .

Soubor norem

Od 10. února 2004 je RDF standardem W3C. Od 25. února 2014 byl přijat standard RDF 1.1.

Seznam norem souvisejících s RDF (viz http://www.w3.org/TR/ ):

Existuje také mnoho konceptů a poznámek, mezi nimiž je i Linked Data Glossary  (anglicky)  – glosář všech pojmů souvisejících s RDF.

Formáty prezentace

K zápisu a přenosu RDF se používá několik formátů, včetně:

Sémantika

RDF poskytuje nástroje pro vytváření informačních modelů, ale nezabývá se sémantikou toho, co je popisováno. Vzato izolovaně, RDF graf lze chápat pouze jako graf. Interpretace významu závisí na schopnosti uživatelů RDF interpretovat jednotlivé URI, řetězcové literály a grafové struktury a odtud interpretovat další URI a sémantiku dat.

Pro vyjádření sémantiky jsou vyžadovány slovníky ,  taxonomie a ontologie a přítomnost vazeb s nimi v uvažovaném grafu .  

Většina slovníků pro popisované předměty obsahuje nejen predikáty a objekty, ale také pro ně implikuje tu či onu sémantickou zátěž, která zpravidla nezapadá do skutečné RDF reprezentace slovníku. Mohou to být způsoby využití určitých specifických předmětů, pravidla, omezení, doporučení, zdůvodnění potřeby jejich použití atd. Zpravidla je to popsáno v průvodní dokumentaci ke slovníku.

Schéma RDF

RDF Schema poskytuje slovník pro RDF, který se používá především při popisu jiných slovníků. Schéma RDF:

Popis dodatečné sémantické zátěže tohoto slovníku se nachází ve všech třech hlavních standardech RDF - v popisu pojmů RDF  (anglicky) , v popisu samotného slovníku  (anglicky) a v popisu sémantiky RDF  (anglicky) .

Zejména popis sémantiky RDF říká, že slovníky mohou pouze implikovat, ale ne explicitně obsahovat, triplety, které lze získat ze zbývajících tripletů slovníku provedením souboru formálních pravidel definovaných pro slovník, vyplývajících ze sémantiky pojmy používané ve slovníku. A zde je seznam pravidel implikovaných slovníkem RDF Schema.

SOVA

Pro zaznamenání složitějších logických vztahů popisovaných zdrojů různých tematických oblastí v ontologiích se používá jazyk OWL [5] .

RDF repozitáře

K ukládání dat RDF se používají dva hlavní typy úložiště: specializované (nativní, "nativní", "nativní") a nespecializované (nenativní). Specializovaná úložiště umožňují větší míru optimalizace, ale jejich návrh je časově náročnější, protože jsou vytvořeny speciálně pro práci s RDF. Zbytek úložišť je designově jednodušší (například díky použití relačních mechanismů DBMS nebo řešení NoSQL ), ale jsou méně optimalizované pro práci s RDF. Specializovaná úložiště se dělí podle schopnosti pracovat s daty, která jsou pouze celá v RAM (in-memory) nebo schopná využívat externí paměť (například pevný disk) [6] .

Systémy RDF jsou vyvíjeny jak pro výzkumné, tak pro výrobní využití. Mezi hlavní specializovaná úložiště vhodná pro produkční použití patří [6] :

Aplikace

Vytváření znalostních bází nebo prezentace jejich dat v rámci různých projektů v různých ústavech, univerzitách a dalších organizacích. Hlavně pro výzkumné účely.

Vyhledávače doporučují webmasterům používat RDF a podobné značkovací jazyky stránek ke zvýšení viditelnosti odkazu zpět na jejich stránky ve výsledcích vyhledávání.

Sociální sítě na návrh Facebooku (opengraph) nabízejí webmasterům použití RDF k popisu vlastností stránky, což jim také umožní krásně na ni odkazovat v příspěvku uživatele sociální sítě.

Ve formě RSS 1.0 je formát RDF široce používán pro stručný seznam nových záznamů na pravidelně aktualizovaných stránkách, jako jsou blogy, zpravodajské kanály nebo online časopisy.

Kromě výše uvedeného představuje formát RDF data pro analýzu a/nebo integraci v podnikových informačních systémech , což umožňuje jejich zkoumání pomocí SPARQL (například projekt D2RQ), a když je založeno na průmyslovém standardu, například ISO . 15926 umožňuje sjednotit výměnu dat různých podniků na úrovni odvětví.

Použití RDF se zvýšilo s příchodem reprezentace RDF JSON-LD a rozšířením Linked Data . Google například zohledňuje sémantický popis stránky v některém z formátů RDF (a pomocí slovníku Schema.org ) a používá jej k podrobnějšímu popisu výsledků vyhledávání [7] .

Formáty

Projekty

Nástroje

Poznámky

  1. 1 2 Rámec popisu zdrojů (RDF): Koncepty a abstraktní syntaxe . Získáno 11. srpna 2012. Archivováno z originálu dne 2. března 2014.
  2. 1 2 RDF Primer  (anglicky)  (odkaz není k dispozici) . World Wide Web Consortium (10. února 2004). — Doporučení W3C, informativní úvod do RDF. Získáno 22. listopadu 2009. Archivováno z originálu 2. června 2012.
  3. Segaran, Evans, Taylor, 2009 , pp. 63-64.
  4. Sean Palmer. Notation3: A Rough Guide to N3  (anglicky)  (nedostupný odkaz) . — Úvod do notace3. Získáno 22. listopadu 2009. Archivováno z originálu 2. června 2012.
  5. Hebeler, Fisher, Blace, Perez-Lopez, 2009 , pp. 98-100.
  6. 1 2 Curé, Blin, 2014 , kapitola V.
  7. Značení událostí: Oficiální stránky účinkujících . Získáno 28. května 2015. Archivováno z originálu 28. května 2015.

Literatura

Odkazy