Q -learning je metoda používaná v umělé inteligenci s přístupem založeným na agentech . Odkazuje na experimenty s učením se zesílením . Agent na základě obdržené odměny od okolí formuje užitkovou funkci Q, která mu následně dává možnost nevolit náhodně strategii chování, ale zohlednit zkušenosti z předchozí interakce s okolím. Jednou z výhod Q-learningu je, že je schopen porovnávat očekávanou užitečnost dostupných aktivit bez nutnosti modelování prostředí. Platí pro situace, které lze znázornit jako Markovův rozhodovací proces .
Strojové učení a dolování dat | |
---|---|
Úkoly | |
Učení s učitelem | |
shluková analýza | |
Redukce rozměrů | |
Strukturální prognózy | |
Detekce anomálií | |
Grafové pravděpodobnostní modely | |
Neuronové sítě | |
Posílení učení |
|
Teorie | |
Časopisy a konference |
|