Textový generátor

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 13. srpna 2018; ověření vyžaduje 21 úprav .

Textový generátor  je počítačový program , který generuje texty (slangově pro holčičku ), správné z hlediska většiny jazykových norem , ale zpravidla bezvýznamové ( v souvislosti s nimiž se takové programy někdy nazývají „klamné generátory“, „generátory schizofázie “).

Někdy si čtenář vygeneruje takový programový text (například pomocí Markovova řetězce ), že může vyvolat dojem, že tento text má smysl, zvláště pokud má téma, které čtenář nezná. Někteří lidé například nerozumí filozofii a považují jakýkoli filozofický text obsahující velké množství konkrétních termínů za nesmysl , takže nemohou určit umělou povahu pseudofilozofického textu napsaného programem.

Existují různé typy textových generátorů, které se liší svými schopnostmi (některé z nich například mohou tvořit nová slova samy).

Jonathan Swift v Gulliver's Travels při parodování Ars magna Raymonda Lulla satiricky popsal stroj z Lagada , který generoval texty.

Typy generátorů

Generování textu skládáním ze zcela náhodných slov dává nesmyslný výsledek: pro člověka bezvýznamný a snadno rozpoznatelný textovými analyzátory, a proto se nepoužívá. Obvykle je generování založeno na ručně psaných šablonových frázích.

V případech, kdy význam vygenerovaného textu není důležitý, je složen z „kaše“ vět z různých zdrojových textů, případně z částí vět. Tato metoda se spolu se šablonami a synonymizací používá u chatovacích botů a komentářových botů na sociálních sítích a blozích. Takoví roboti kopírují do partnera fráze zaznamenané z jiných chatů nebo stránek. Pokročilejší chatboti třídí fráze podle klíčových slov , takže jejich reakce je blíže tématu dialogu.

Synonymizéry a generování frází ze šablon

Textové generátory jsou často kombinovány se synonymizačními programy, které automaticky mění slova na synonyma za účelem přepsání a vytvoření jedinečných frází. Slova, která je třeba v šabloně nahradit synonymy, jsou nahrazena makry .

Čím delší text, tím znatelnější nepřirozenost v autonavrhovaných synonymech. Proto v textech „vyrobených pro lidi“ ( MDL ) lze synonymizéry použít pouze k vytvoření jedinečných krátkých textů: nadpisy a kotvy s klíčovými slovy , komentáře a odstavce. Synonymizátory se úspěšněji používají v angličtině, která má na rozdíl od ruštiny jednoduchou morfologii .

Typy synonymizace:

"Meshanka" textu z různých zdrojů

Dveře rychle „vylétají“ z výsledků vyhledávání kvůli špatné kvalitě jejich textů. Dveřní pracovníci se proto snaží generovat text na minimum. V různých prvcích stránky jsou náhodně generovány pouze malé fráze, které mají vhodný význam. Odstavce textu jsou analyzovány jako celek z jiných stránek stejného tématu a případně jsou synonymizovány nebo je použito „rmut“.

"Inteligentní" generátory

Řada společností vyvíjí sofistikovanější technologie. Syntaktické struktury jsou tvořeny slovními druhy a členy ve větách, slova ve slovnících jsou kategorizována podle sémantiky s jejich dalším automatickým nahrazováním do vět. Vzhledem k extrémní složitosti a objemu práce, autorským právům k tomuto vývoji a obchodním tajemstvím (takové systémy v zásadě umožňují vytvářet velmi ziskové komerční projekty) však stěží můžeme očekávat výskyt komunikujících robotů a překladatelských robotů. v příštích letech.

Aplikace

Na této úrovni rozvoje výpočetní techniky neexistují volně dostupné textové generátory s relativně smysluplným textem. Generátory s nesmyslnou sadou slov nebo vzorových frází mají úzký rozsah.

Jeden z textových generátorů lze nazvat poslední novinkou Yandexu - Balaboba, která dokáže danou frázi doplnit kvalitními a čitelnými frázemi a dokonce i celými texty.

Mnoho stránek podrobně vysvětluje, jak tato služba funguje.

Vývoj a optimalizace webových stránek

Textové generátory jsou široce používány při vývoji a optimalizaci stránek pro vyhledávače : ke generování názvů, popisů a obsahu celých stránek pomocí dorgens ( generátory dveří ).

Na reklamě vydělávají velké anglicky psané weby, na které veškerý obsah nepíší novináři, ale boti – články se automaticky přepisují z jiných zdrojů. Příklady takových stránek: Demand Media a Associated Content [1] . Ruský jazyk má na rozdíl od angličtiny složitou morfologii, takže vzhled takových přepisovacích robotů v Runetu je velmi komplikovaný.

Materiály vytvořené pomocí textového generátoru a používané pro optimalizaci pro vyhledávače vyžadují povinný pečlivý výběr podle kritéria jedinečnosti.[ upřesnit ] Tento výběr se provádí pomocí specializovaného softwaru, který má jiný ověřovací algoritmus.

Virtuální partneři

Virtuální partneři ( chatboti) jsou programy určené k napodobování komunikace v chatovacích místnostech . Jsou široce používány k rozesílání spamu na sociální sítě (spam boti), stejně jako automatické odpovědi, které mohou reagovat na mnoho klíčových slov v různých scénářích.

Vzhledem k tomu, že osoba zároveň nevidí svého partnera, může nabýt dojmu, že si dopisuje s živou osobou. Žádný chatbot však zatím úspěšně neprošel Turingovým testem a programy využívající textové generátory to mají ještě složitější.

Masová propaganda a trollování v sociálních sítích

V souvislosti s rozvojem internetové propagandy a „kybernetických válek“ jsou na sociálních sítích využíváni boti k masivnímu napodobování veřejného mínění. Při vytváření botů se automaticky generují jejich jména a internetové adresy, a když odpoví, text komentářů, obvykle provokativního, propagandistického nebo urážlivého obsahu.

Poměrně široce známý na ruskojazyčném internetu byl textový generátor Rareguest, navržený ve formě php skriptu . Nějakou dobu byl používán jako součást satirického internetového projektu „Gavgav Center“ a poté se rozšířil jako robot pro živé časopisy, blogy atd. Zde jsou příklady sekvenčního generování zpráv stejného typu tímto robotem:

Všechny vaše příspěvky jsou typickým klišé falešných narážek, které se snaží zdiskreditovat a zesměšnit každého, kdo začne jasně vidět a otevřeně mluvit o zločinech zločineckého režimu. Pravda o jejich nelidskosti a fašistické podstatě krvavého kremelského režimu píchá oči krvavým ghúlům z Kremlu! Zajímavostí tohoto fóra je, že putinisté se zabývají hlavně záplavami nebo diskusí o osobnostech a témat o podstatě ruských problémů, jako je tato, se bojí jako čert. Ve lháři je dost místa, kde mohou trávit čas fašisté NKVD jako vy, aniž by byli zatěžováni pravdou a analýzou stalinsko- putinismu . Proto si myslím, že vy putinisté jste morální degeneráti. Koneckonců, tento druh „účastníků diskuse“ se neobjevuje na „čečenských“ lhářských stránkách kontrolovaných Kremlem a Yastrzhembským. Za všechno se zodpoví Puti-Put a jeho krvežízniví nádeníci.

Tyto příklady ukazují, že i čtenář obeznámený s diskutovanou problematikou může přijímat zprávy od robota za zprávy od skutečného živého člověka, byť poněkud povýšeného. Robot v těchto zprávách je dán pouze typickou strukturou pro stavbu vět a jejich kombinování.

Kontrola kvality vzájemného hodnocení vydavatelů

Existují případy, kdy byly textové generátory úspěšně použity k odhalení nízké kvality (a někdy i úplného nedostatku) recenzního řízení ve vědeckých časopisech . V tomto ohledu je známý zejména program SCIgen .

Poznámky

  1. Generátory obsahu klíčových slov . Habrahabr (8. července 2010). Získáno 2. července 2015. Archivováno z originálu dne 3. července 2015.

Odkazy