Tag Cloud

Tag cloud ( word cloud nebo vážený seznam , vizuálně prezentovaný ) je vizuální reprezentace seznamu kategorií (nebo tagů, také nazývaných tagy, štítky, klíčová slova atd.) [1] Obvykle se používá k popisu tagů (metadat) na webových stránkách nebo reprezentovat prostý text. Klíčová slova jsou nejčastěji jednotlivá slova a důležitost každého klíčového slova je označena velikostí písma nebo barvou . Tato reprezentace je vhodná pro rychlé vnímání nejznámějších termínů a pro vzájemné rozdělení termínů podle oblíbenosti . Když jsou klíčová slova použita pro snazší navigaci na webových stránkách, jsou výrazy hypertextově propojeny s pojmy, které jsou těmito klíčovými slovy míněny. Cloud však nemůže být jediným prvkem navigace a použití textového vyhledávání je pro vyhledávání pohodlnější, pokud existují konkrétnější informace o tom, co hledáte [2] .

Historie

V žargonu vizuálního designu je tag cloud (nebo word cloud) typ „váženého seznamu“, který se běžně používá na geografických mapách k zobrazení relativní velikosti měst pomocí velikostí písma. Jedním z prvních příkladů váženého seznamu anglických klíčových slov je seznam „podprahových počítačových souborů“ v románu Slaves of Microsoft od Douglase Copelanda (1995). Seznam německých slov se objevil v roce 1992 [3] .

Specifická vizuální reprezentace a šíření pojmu „tag cloud“ začalo v první dekádě 21. století. Jako funkce webů a blogů z éry Webu 2.0 se používal hlavně k vizualizaci distribuce frekvence klíčových slov metadat, která popisují obsah webové stránky a pomáhají při navigaci.

První tag clouds na prominentních webových stránkách se objevil na Flickru , webu pro ukládání a distribuci digitálních fotografií . Tag clouds vytvořil spoluzakladatel a designér Flickru Stuart Butterfield v roce 2004. Tato implementace vycházela z knihy Jamese Flanagana Search Referral Zeitgeist [4] , která popisuje vizualizaci odkazů na webové stránky. Přibližně ve stejnou dobu pomohly webové stránky Delicious a Technorati rozšířit tag cloud .

Přemíra tag cloudů a ambivalence ohledně jejich užitečnosti jako webových navigačních pomůcek vedly k výraznému poklesu jejich používání na průkopnických webech [5] . (Tvůrci Flickru se následně „omluvili“ webové komunitě ve svém projevu k udílení cen Webby , kde jednoduše řekli „omlouvám se za mraky tagů“ [6] .)

Druhá generace vývoje softwaru odhalila širokou škálu aplikací pro tag cloud jako hlavní metody pro vizualizaci textových dat. Byla také navržena některá rozšíření těchto navigačních prvků. Například paralelní tag clouds [7] , sparkClouds [8] a prefix tag clouds [9] .

Tag cloud v tuto chvíli nemá takovou popularitu a v některých případech dokonce negativně ovlivňuje propagaci webu ve vyhledávačích . Pokud tedy děláte cloud, pak pro nějaký konkrétní účel, aby nesl sémantickou zátěž pro uživatele internetového zdroje.

Aplikační typy tagů

Existují tři hlavní použití cloudů značek v sociálním softwaru , které se liší spíše účelem než vzhledem:

V prvním typu shluku značek je velikost počet, kolikrát byla značka aplikována na prvek [10] . To je užitečné jako způsob zobrazení metadat o položce, která byla několikrát „hlasována“, a když nejsou poskytnuta přesná data. Příkladem tohoto použití je Last.fm (pro určení žánru hudby kapely) a LibraryThing (pro určení klíčových slov knihy).

U druhého typu velikost odpovídá počtu položek, na které byl štítek aplikován, což ukazuje na oblíbenost štítku. Příklady tohoto typu tag cloudu lze nalézt na webu pro ukládání a distribuci digitálních fotografií Flickr , RSS agregátor Technorati a zadáním DeeperWeb do vyhledávacího dotazu Google .

Kategorizace vytvořením shluku značek

Třetí typ používá tagy jako způsob kategorizace položek. Štítky jsou prezentovány v cloudu, kde velké štítky představují počet položek v dané kategorii.

Existuje několik přístupů k sestavení clusteru značek namísto cloudu značek, jako je použití značek společného výskytu v dokumentech [11] .

Obecněji lze stejnou vizuální reprezentaci použít k zobrazení netagů [12] , jako je tag cloud nebo datové cloudy.

Termín klíčové slovo cloud se někdy používá jako marketingový termín pro vyhledávače , kde se vztahuje na skupiny klíčových slov souvisejících s webem. V posledních letech se cloudy tagů staly populárními díky jejich důležitosti v marketingu webových stránek ve vyhledávačích spolu s tím, že uživatelům pomáhají efektivně procházet weby [13] . Tag clouds jako prostředek navigace umožňuje blíže propojit zdroje webu [14] , obcházení takových zdrojů vyhledávacím robotem může zlepšit pozici webu ve výsledcích vyhledávače [15] . Z pohledu uživatelského rozhraní se cloudy značek často používají k tomu, aby pomohly uživateli rychleji najít informace o konkrétním systému pomocí shrnutí výsledků vyhledávání [16] .

Vizuální reprezentace

Oblaky značek jsou obvykle prezentovány jako vložené prvky HTML . Tagy lze třídit abecedně, náhodně, podle váhy atd. Někdy se kromě velikosti písma mění i další vizuální vlastnosti, jako je barva, jas nebo šířka [17] . Nejběžnější zobrazení je ve formě obdélníku, ve kterém jsou značky seřazeny podle abecedy a zobrazeny po řádcích. Volba umístění značky v řádcích vyhovuje cílům uživatele. Někdy se dává přednost sémantickému shlukování značek (značky podobného významu se zobrazí vedle sebe) [18] [19] [20] . Heuristiku lze použít ke zmenšení velikosti cloudu značek bez ohledu na to, zda se shlukování provádí nebo ne.

Datový cloud

Datový mrak  jsou data, která k reprezentaci číselných dat používají jinou barvu a/nebo velikost písma [21] . Datové mraky jsou podobné tag cloudům [22] , ale místo počítání slov se zobrazují data jako hustota obyvatelstva nebo ceny na burze .

Text cloud

Textový mrak nebo slovní mrak  je vizualizace četnosti slov v textu jako vážený seznam [24] . V poslední době se tato technika používá k vizualizaci tematického obsahu politických projevů [25] .

Mraky frází

Rozvíjení principů textových mraků, slovní mračna dávají textu nebo sazbě cílenější pohled . Místo celého textu se fráze cloud zaměřuje na použití jednotlivých slov. Výsledný oblak obsahuje slova, která se často používají v kombinaci s původním slovem. Tyto fráze představují frekvenci zvýrazněnou velikostí písma spolu se silou odkazu zvýrazněnou jasem. To vám umožňuje interaktivně se učit jazyk [26] .

Zvláštnosti vnímání tag clouds

Tag cloudy byly studovány v několika studiích z hlediska jejich použitelnosti. Následující seznam je založen na výzkumu Lohmann et al.:

Vytvoření tag cloudu

Obecně je velikost písma tagu v tag cloudu určena prevalencí tagu. U slovního shluku, jako jsou kategorie blogů, frekvence odpovídá počtu blogových příspěvků přiřazených k dané kategorii. Pro menší frekvence můžete určit velikosti písma přímo, od jedné po maximální použitou velikost písma. Pro vyšší frekvence je nutné škálování . Například pomocí lineární transformace je váha tagu škálována na stupnici multiplikátorů od 1 do f , kde a určit rozsah povolených vah.

pro ; v opačném případě

Vzhledem k tomu, že počet počítaných prvků na značku je obvykle distribuován podle exponenciálního distribučního zákona [29] , má proto pro velké rozsahy hodnot smysl použít logaritmickou reprezentaci [30] .

Implementace cloudu značek také zahrnuje analýzu a filtrování nepotřebných značek, jako jsou předložky, zájmena, čísla a interpunkce.

Existují také webové stránky, které vytvářejí umělé nebo náhodně distribuované cloudy značek pro reklamní nebo humorné účely.

Viz také

Poznámky

  1. Martin Halvey a Mark T. Keane, An Assessment of Tag Presentation Techniques .
  2. Sinclair, Cardew-Hall, 2008 .
  3. Deleuze, Guattari, 1992 .
  4. Kopie webu Jim Flanagan's Search Referral Zeitgeis .
  5. Tag Cloud RIP? .
  6. Vítejte na Webby Awards .
  7. Parallel Tag Clouds to Explore and Analyse Faceted Text Corpora, 2009 .
  8. IEEE Transactions on Visualization and Computer Graphics, 2010 .
  9. Sborník příspěvků ze 17. mezinárodní konference o vizualizaci informací, 2013 .
  10. Diplomová práce předložena do programu Digitální média, 2005 .
  11. Sborník příspěvků ze 43. výroční havajské mezinárodní konference o systémových vědách, 2010 .
  12. Kolaborativní OLAP s Tag Clouds .
  13. Jsou tag Cloud užitečné pro navigaci, 2011 .
  14. Propojení souvisejícího obsahu ve webových encyklopediích s cloudy tagů vyhledávacích dotazů, 2011 .
  15. Bezplatný skript generátoru tag cloud pro webové stránky PHP .
  16. Hodnocení přístupu k informacím založeným na značkách v kolekcích obrázků, 2012 .
  17. Porovnání rozložení Tag Cloud: Výkon související s úkoly a vizuální průzkum, 2009 .
  18. Improving Tag-Clouds as Visual Information Retrieval Interfaces, 2006 .
  19. Tag-Cloud Drawing: Algoritmy pro cloudovou vizualizaci .
  20. Samoorganizující se cloudy tagů založené na mapách – Vytváření prostorově smysluplných reprezentací dat tagování, 2007 .
  21. Vizualizace a komentář ManyEyes .
  22. ManyEyes Visualization: Ad cloud .
  23. Vizualizace TagCrowd: Stav Unie .
  24. Text Clouds: Nová forma Tag Cloud? .
  25. Projevy amerického prezidenta Tag Cloud .
  26. Uspořádat cloud .
  27. Měsíční wiki stránka Hits for en.wikipedia .
  28. WikipediaTop1000VitalArticleHits .
  29. Voss, 2006 .
  30. Kentbyte .

Literatura

Odkazy