Žebříčkový trénink

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 2. srpna 2019; kontroly vyžadují 4 úpravy .

Learning to rank ( learning to rank or machine-learned ranking, MLR ) [1] je třída úloh  strojového učení  pod dohledem , které spočívají v automatickém výběru hodnotícího modelu z trénovací sady sestávající ze sady seznamů a daných dílčích objednávek prvků. v každém seznamu. Částečné pořadí je obvykle specifikováno určením skóre pro každou položku (např. „relevantní“ nebo „nepodstatné“; jsou možné více než dvě gradace). Cílem hodnotícího modelu je co nejlépe (v určitém smyslu) aproximovat a zobecnit metodu hodnocení v trénovací sadě na nová data.

Ranking learning je stále poměrně mladá, rychle se rozvíjející oblast výzkumu, která vznikla v roce 2000 se vznikem zájmu o oblast vyhledávání informací při aplikaci metod strojového učení na problémy s hodnocením.

Aplikace při vyhledávání informací

Ve vztahu k vyhledávačům je každý seznam souborem dokumentů, které splňují nějaký vyhledávací dotaz.

Tréninkový vzorek se skládá ze vzorku vyhledávacích dotazů, podmnožiny dokumentů, které jim odpovídají, a odhadů relevance každého dokumentu k dotazu. Mohou být připraveny jak ručně, speciálně vyškolenými lidmi (hodnotiteli kvality vyhledávání nebo hodnotitelé ), nebo automaticky, na základě analýzy kliknutí uživatelů [2] nebo nástrojů vyhledávače, jako je systém SearchWiki vyhledávače Google .

Funkce hodnocení

Během trénování hodnotícího modelu a během jeho provozu je každý pár dokument-žádost přeložen do číselného vektoru hodnotících prvků (také nazývaných hodnotící faktory nebo signály), které charakterizují vlastnosti dokumentu, dotaz a jejich vztah. Tyto znaky lze rozdělit do tří skupin:

Níže jsou uvedeny některé příklady hodnotících funkcí používaných ve známém datovém souboru LETOR v této oblasti výzkumu : [5]

Hodnocení metriky kvality

Existuje několik metrik, které vyhodnocují a porovnávají výkon hodnotících algoritmů na vzorku s partnerskými recenzemi. Parametry hodnotícího modelu mají často tendenci být upraveny tak, aby se maximalizovala hodnota jedné z těchto metrik.

Příklady metrik:

Klasifikace algoritmů

Tai-Yan Liu z Microsoft Research Asia ve svém článku „Learning to Rank for Information Retrieval“ [1] a prezentacích na tematických konferencích analyzoval metody, které jsou v současné době k dispozici pro řešení problému učení se hodnotit, a navrhl jejich klasifikaci do tří přístupů v závislosti na na reprezentaci použitých vstupních dat a penalizační funkci:

Bodový přístup

V bodovém přístupu se předpokládá  , že každému páru dotaz-dokument je přiřazeno číselné skóre. Úkol naučit se hodnotit je redukován na vytváření regrese : pro každý jednotlivý pár dotaz-dokument je nutné předpovědět jeho skóre.

V rámci tohoto přístupu lze na regresní problémy použít mnoho algoritmů strojového učení. Když skóre může nabývat pouze několika hodnot, lze také použít algoritmy pro ordinální regresi a klasifikaci.

Párový přístup

V párovém přístupu spočívá učení  se řazení na vytvoření binárního klasifikátoru, který obdrží dva dokumenty odpovídající stejnému dotazu jako vstup a je nutné určit, který z nich je lepší.

Příklady algoritmů: [1] RankNet, FRank, RankBoost, RankSVM, IR-SVM.

Přístup k seznamu

Seznamový přístup spočívá v sestavení modelu, jehož vstupem jsou okamžitě všechny dokumenty, které odpovídají dotazu, a výstupem je jejich  permutace . Přizpůsobení parametrů modelu se provádí za účelem přímé maximalizace jedné z výše uvedených hodnoticích metrik. To je ale často obtížné, protože hodnotící metriky obvykle nejsou spojité a nediferencovatelné s ohledem na parametry hodnotícího modelu, takže se uchylují k maximalizaci některých svých aproximací nebo nižších odhadů.

Příklady algoritmů: [1] SoftRank, SVM mapa , AdaRank, RankGP, ListNet, ListMLE.

Praktická aplikace

Ve velkých vyhledávačích

Vyhledávače mnoha moderních internetových vyhledávačů, včetně Yandex , Yahoo [7] a Bing , používají modely hodnocení vytvořené metodami strojového učení. Vyhledávání Bingu používá algoritmus RankNet . [8] Nejnovější hodnotící algoritmus strojového učení vyvinutý a používaný ve vyhledávači Yandex se nazývá MatrixNet; [9] Samotný Yandex sponzoroval soutěž Internet Mathematics 2009 [10] s cílem vytvořit hodnotící algoritmus na základě vlastního souboru dat.

V rozhovoru na začátku roku 2008 Peter Norvig , ředitel výzkumu ve společnosti Google , řekl, že jejich vyhledávač ještě není připravený zcela svěřit hodnocení algoritmům strojového učení, a uvedl skutečnost, že za prvé, automaticky generované modely se mohou chovat nepředvídatelně na nových třídy dotazů, které nejsou podobné dotazům z trénovacího vzorku ve srovnání s modely vytvořenými lidskými experty. Za druhé, tvůrci současného algoritmu hodnocení Google jsou přesvědčeni, že jejich model je také schopen řešit problémy efektivněji než strojové učení. [11] První důvod je pro nás mnohem významnější, protože se nejen vrací k tak známému problému v induktivní logice, který formuloval německý matematik C.G. Hempel a v rozporu s intuicí (výrok „všichni havrani jsou černí“ je logicky ekvivalentní „všechny nečerné předměty nejsou havrani“), ale zároveň nás nutí vracet se k řadě nevyřešených problémů F. Rosenblatta, který vytvořil svět první neuronová síť schopná vnímání a tvorby odpovědi na vnímaný podnět - jednovrstvý perceptron. [12] Na základě kritiky Rosenblattova elementárního perceptronu můžeme porozumět celé zranitelnosti tohoto hodnotícího modelu, o kterém nám říkají experti Google: jsou umělé systémy schopny zobecnit svou individuální zkušenost na širokou třídu situací, na které byla reakce nebyl jim sdělen předem? Ne, individuální zkušenost s umělými systémy v praxi je vždy omezená a nikdy úplná. Tak či onak vám nástroje strojového učení umožňují vyřešit problém spamdexingu s poměrně vysokou mírou účinnosti. [13]

Poznámky

  1. 1 2 3 4 Tie-Yan Liu (2009), Learning to Rank for Information Retrieval , Foundations and Trends in Information Retrieval: Vol. 3: Ne 3, str. 225-331, ISBN 978-1-60198-244-5 , DOI 10.1561/1500000016  . Dostupné snímky Archivováno 31. března 2010. z projevu T. Lewa na konferenci WWW 2009.
  2. Optimalizace vyhledávačů pomocí údajů o prokliku . Získáno 18. listopadu 2009. Archivováno z originálu 29. prosince 2009.
  3. Statické skóre kvality a řazení . Získáno 18. listopadu 2009. Archivováno z originálu 7. července 2009.
  4. Richardson, M.; Prakash, A. a Brill, E. (2006). „Beyond PageRank: Machine Learning for Static Ranking“ (PDF) . Sborník příspěvků z 15. mezinárodní konference World Wide Web . str. 707–715. Archivováno (PDF) z originálu dne 2009-08-15. Použitý zastaralý parametr |deadlink=( nápověda )
  5. LETOR 3.0. Sbírka srovnávacích testů pro výuku hodnocení pro získávání informací . Získáno 18. listopadu 2009. Archivováno z originálu 16. února 2012.
  6. Gulin A., Karpovich P., Raskovalov D., Segalovich I. Yandex na ROMIP'2009. Optimalizace hodnotících algoritmů metodami strojového učení. Archivováno 22. listopadu 2009 na Wayback Machine
  7. Yahoo spouští největší světovou aplikaci pro produkci Hadoop Archivováno 21. prosince 2009 na Wayback Machine 
  8. Bing Search Blog: Uživatelské potřeby, funkce a věda za Bingem Archivováno 25. listopadu 2009 na Wayback Machine 
  9. Roem.ru: Yandex spustil nový vzorec Snezhinsk, nyní existuje tisíc proměnných místo 250. . Získáno 20. listopadu 2009. Archivováno z originálu 13. listopadu 2009.
  10. Internetová matematika 2009 (nepřístupný odkaz) . Získáno 20. listopadu 2009. Archivováno z originálu 15. listopadu 2009. 
  11. Jsou strojově naučené modely náchylné ke katastrofickým chybám? Archivováno z originálu 18. září 2010.  (Angličtina)
  12. Perceptrons: An Associative Learning Network Archived 9. srpna 2011 na Wayback Machine 
  13. Detekce spamu ve vyhledávačích. Část 15: Aplikace umělých neuronových sítí Archivováno 10. března 2013 na Wayback Machine  (ruština)