Žebříčkový trénink

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 2. srpna 2019; kontroly vyžadují 4 úpravy .

Learning to rank ( learning to rank or machine-learned ranking, MLR ) [1] je třída úloh strojového učení pod dohledem , které spočívají v automatickém výběru hodnotícího modelu z trénovací sady sestávající ze sady seznamů a daných dílčích objednávek prvků. v každém seznamu. Částečné pořadí je obvykle specifikováno určením skóre pro každou položku (např. „relevantní“ nebo „nepodstatné“; jsou možné více než dvě gradace). Cílem hodnotícího modelu je co nejlépe (v určitém smyslu) aproximovat a zobecnit metodu hodnocení v trénovací sadě na nová data.

Ranking learning je stále poměrně mladá, rychle se rozvíjející oblast výzkumu, která vznikla v roce 2000 se vznikem zájmu o oblast vyhledávání informací při aplikaci metod strojového učení na problémy s hodnocením.

Aplikace při vyhledávání informací

Ve vztahu k vyhledávačům je každý seznam souborem dokumentů, které splňují nějaký vyhledávací dotaz.

Tréninkový vzorek se skládá ze vzorku vyhledávacích dotazů, podmnožiny dokumentů, které jim odpovídají, a odhadů relevance každého dokumentu k dotazu. Mohou být připraveny jak ručně, speciálně vyškolenými lidmi (hodnotiteli kvality vyhledávání nebo hodnotitelé ), nebo automaticky, na základě analýzy kliknutí uživatelů [2] nebo nástrojů vyhledávače, jako je systém SearchWiki vyhledávače Google .

Funkce hodnocení

Během trénování hodnotícího modelu a během jeho provozu je každý pár dokument-žádost přeložen do číselného vektoru hodnotících prvků (také nazývaných hodnotící faktory nebo signály), které charakterizují vlastnosti dokumentu, dotaz a jejich vztah. Tyto znaky lze rozdělit do tří skupin:

Funkce nezávislé na dotazu nebo statické funkce – závislé pouze na dokumentu, nikoli však na požadavku. Například PageRank nebo délka dokumentu. Takové funkce se obvykle vypočítávají ve fázi indexování dokumentů a často se používají ke konstrukci statického skóre kvality dokumentu, které se používá ke zlepšení výkonu vyhledávačů. [3] [4]
Funkce, které závisí pouze na požadavku. Například "žádost o porno nebo ne."
Funkce závislé na dotazu nebo dynamické funkce – závislé jak na dokumentu, tak na požadavku. Například TF-IDF měření souladu dokumentu s dotazem.

Níže jsou uvedeny některé příklady hodnotících funkcí používaných ve známém datovém souboru LETOR v této oblasti výzkumu : [5]

Hodnoty míry TF, TF-IDF , BM25 a jazykový model vyhovující požadavku různých zón dokumentu (název, URL , hlavní text, text odkazu);
Délky a IDF - součty zón dokumentu;
Hodnocení dokumentů získané pomocí různých variant algoritmů hodnocení odkazů , jako je PageRank a HITS .

Hodnocení metriky kvality

Existuje několik metrik, které vyhodnocují a porovnávají výkon hodnotících algoritmů na vzorku s partnerskými recenzemi. Parametry hodnotícího modelu mají často tendenci být upraveny tak, aby se maximalizovala hodnota jedné z těchto metrik.

Příklady metrik:

DCG a NDCG _
Přesnost @ n , NDCG @ n ( @ n znamená, že metrická hodnota je brána v úvahu pouze pro n nejlepších emisních dokumentů);
MAP ;
střední inverzní pořadí ;
pfound je vyvinut společností Yandex . [6]

Klasifikace algoritmů

Tai-Yan Liu z Microsoft Research Asia ve svém článku „Learning to Rank for Information Retrieval“ [1] a prezentacích na tematických konferencích analyzoval metody, které jsou v současné době k dispozici pro řešení problému učení se hodnotit, a navrhl jejich klasifikaci do tří přístupů v závislosti na na reprezentaci použitých vstupních dat a penalizační funkci:

Bodový přístup

V bodovém přístupu se předpokládá , že každému páru dotaz-dokument je přiřazeno číselné skóre. Úkol naučit se hodnotit je redukován na vytváření regrese : pro každý jednotlivý pár dotaz-dokument je nutné předpovědět jeho skóre.

V rámci tohoto přístupu lze na regresní problémy použít mnoho algoritmů strojového učení. Když skóre může nabývat pouze několika hodnot, lze také použít algoritmy pro ordinální regresi a klasifikaci.

Párový přístup

V párovém přístupu spočívá učení se řazení na vytvoření binárního klasifikátoru, který obdrží dva dokumenty odpovídající stejnému dotazu jako vstup a je nutné určit, který z nich je lepší.

Příklady algoritmů: [1] RankNet, FRank, RankBoost, RankSVM, IR-SVM.

Přístup k seznamu

Seznamový přístup spočívá v sestavení modelu, jehož vstupem jsou okamžitě všechny dokumenty, které odpovídají dotazu, a výstupem je jejich permutace . Přizpůsobení parametrů modelu se provádí za účelem přímé maximalizace jedné z výše uvedených hodnoticích metrik. To je ale často obtížné, protože hodnotící metriky obvykle nejsou spojité a nediferencovatelné s ohledem na parametry hodnotícího modelu, takže se uchylují k maximalizaci některých svých aproximací nebo nižších odhadů.

Příklady algoritmů: [1] SoftRank, SVM mapa , AdaRank, RankGP, ListNet, ListMLE.

Praktická aplikace

Ve velkých vyhledávačích

Vyhledávače mnoha moderních internetových vyhledávačů, včetně Yandex , Yahoo [7] a Bing , používají modely hodnocení vytvořené metodami strojového učení. Vyhledávání Bingu používá algoritmus RankNet . [8] Nejnovější hodnotící algoritmus strojového učení vyvinutý a používaný ve vyhledávači Yandex se nazývá MatrixNet; [9] Samotný Yandex sponzoroval soutěž Internet Mathematics 2009 [10] s cílem vytvořit hodnotící algoritmus na základě vlastního souboru dat.

V rozhovoru na začátku roku 2008 Peter Norvig , ředitel výzkumu ve společnosti Google , řekl, že jejich vyhledávač ještě není připravený zcela svěřit hodnocení algoritmům strojového učení, a uvedl skutečnost, že za prvé, automaticky generované modely se mohou chovat nepředvídatelně na nových třídy dotazů, které nejsou podobné dotazům z trénovacího vzorku ve srovnání s modely vytvořenými lidskými experty. Za druhé, tvůrci současného algoritmu hodnocení Google jsou přesvědčeni, že jejich model je také schopen řešit problémy efektivněji než strojové učení. [11] První důvod je pro nás mnohem významnější, protože se nejen vrací k tak známému problému v induktivní logice, který formuloval německý matematik C.G. Hempel a v rozporu s intuicí (výrok „všichni havrani jsou černí“ je logicky ekvivalentní „všechny nečerné předměty nejsou havrani“), ale zároveň nás nutí vracet se k řadě nevyřešených problémů F. Rosenblatta, který vytvořil svět první neuronová síť schopná vnímání a tvorby odpovědi na vnímaný podnět - jednovrstvý perceptron. [12] Na základě kritiky Rosenblattova elementárního perceptronu můžeme porozumět celé zranitelnosti tohoto hodnotícího modelu, o kterém nám říkají experti Google: jsou umělé systémy schopny zobecnit svou individuální zkušenost na širokou třídu situací, na které byla reakce nebyl jim sdělen předem? Ne, individuální zkušenost s umělými systémy v praxi je vždy omezená a nikdy úplná. Tak či onak vám nástroje strojového učení umožňují vyřešit problém spamdexingu s poměrně vysokou mírou účinnosti. [13]

Poznámky

↑ 1 2 3 4 Tie-Yan Liu (2009), Learning to Rank for Information Retrieval , Foundations and Trends in Information Retrieval: Vol. 3: Ne 3, str. 225-331, ISBN 978-1-60198-244-5 , DOI 10.1561/1500000016 . Dostupné snímky Archivováno 31. března 2010. z projevu T. Lewa na konferenci WWW 2009.
↑ Optimalizace vyhledávačů pomocí údajů o prokliku . Získáno 18. listopadu 2009. Archivováno z originálu 29. prosince 2009. (neurčitý)
↑ Statické skóre kvality a řazení . Získáno 18. listopadu 2009. Archivováno z originálu 7. července 2009. (neurčitý)
↑ Richardson, M.; Prakash, A. a Brill, E. (2006). „Beyond PageRank: Machine Learning for Static Ranking“ (PDF) . Sborník příspěvků z 15. mezinárodní konference World Wide Web . str. 707–715. Archivováno (PDF) z originálu dne 2009-08-15. Použitý zastaralý parametr |deadlink=( nápověda )
↑ LETOR 3.0. Sbírka srovnávacích testů pro výuku hodnocení pro získávání informací . Získáno 18. listopadu 2009. Archivováno z originálu 16. února 2012. (neurčitý)
↑ Gulin A., Karpovich P., Raskovalov D., Segalovich I. Yandex na ROMIP'2009. Optimalizace hodnotících algoritmů metodami strojového učení. Archivováno 22. listopadu 2009 na Wayback Machine
↑ Yahoo spouští největší světovou aplikaci pro produkci Hadoop Archivováno 21. prosince 2009 na Wayback Machine
↑ Bing Search Blog: Uživatelské potřeby, funkce a věda za Bingem Archivováno 25. listopadu 2009 na Wayback Machine
↑ Roem.ru: Yandex spustil nový vzorec Snezhinsk, nyní existuje tisíc proměnných místo 250. . Získáno 20. listopadu 2009. Archivováno z originálu 13. listopadu 2009. (neurčitý)
↑ Internetová matematika 2009 (nepřístupný odkaz) . Získáno 20. listopadu 2009. Archivováno z originálu 15. listopadu 2009. (neurčitý)
↑ Jsou strojově naučené modely náchylné ke katastrofickým chybám? Archivováno z originálu 18. září 2010. (Angličtina)
↑ Perceptrons: An Associative Learning Network Archived 9. srpna 2011 na Wayback Machine
↑ Detekce spamu ve vyhledávačích. Část 15: Aplikace umělých neuronových sítí Archivováno 10. března 2013 na Wayback Machine (ruština)

Strojové učení a dolování dat
Úkoly	Klasifikační problém Učení bez učitele Učení za pomoci učitele Regresní analýza AutoML Pravidla asociace Extrakce funkcí Trénink vlastností Žebříčkový trénink Gramatické odvozování Online učení
Učení s učitelem	metoda k-nejbližšího souseda Naivní Bayesův klasifikátor rozhodovací strom Podpora vektorového stroje Lineární regrese Logistická regrese perceptron Soubory modelů Pytlování posilování náhodný les Relevantní vektorová metoda
shluková analýza	metoda k-means Metoda fuzzy shlukování Hierarchické shlukování EM algoritmus BŘÍZA LÉK DBSCAN OPTIKA Střední posun
Redukce rozměrů	Faktorová analýza Metoda hlavní součásti CCA ICA LDA Nezáporná expanze matice t-SNE
Strukturální prognózy	Graf pravděpodobnosti modelu Bayesovská síť Skrytý Markovův model CRF
Detekce anomálií	metoda k-nejbližšího souseda Místní úroveň emisí
Grafové pravděpodobnostní modely	Bayesovská síť Markovská síť Skrytý Markovův model
Neuronové sítě	Limitovaný Boltzmannův stroj samoorganizující se mapa Aktivační funkce Sigmoid softmax Radiální základní funkce Metoda zpětného šíření Hluboké učení Vícevrstvý perceptron Rekurentní neuronová síť dlouhodobá krátkodobá paměť Řízený rekurentní blok Konvoluční neuronová síť U-síť Autokodér
Posílení učení	Markovský proces Bellmanova rovnice Chamtivý algoritmus Q-learning SARSA Časový rozdíl (TD)
Teorie	Vapnik-Chervonenkis teorie Dilema zkreslení Teorie počítačového učení Empirická minimalizace rizika Occam se učí PAC učení Statistická teorie učení
Časopisy a konference	NeurIPS ICML ML JMLR ArXiv:cs.LG