Funkce radiální báze ( RBF ) je funkce ze sady radiálních funkcí stejného typu, které se používají jako aktivační funkce v jedné vrstvě umělé neuronové sítě nebo jinak, v závislosti na kontextu. Radiální funkce je jakákoli reálná funkce , jejíž hodnota závisí pouze na vzdálenosti k počátku nebo na vzdálenosti mezi nějakým jiným bodem , který se nazývá střed : . Normou je obvykle euklidovská vzdálenost , i když lze použít i jiné metriky .
K aproximaci dané funkce lze také použít lineární kombinace radiálních základních funkcí . Aproximaci lze interpretovat jako nejjednodušší druh neuronové sítě ; právě v tomto kontextu byly funkce radiální báze poprvé definovány Davidem Broomheadem a Davidem Lowem v roce 1988 [1] [2] , na základě klíčové práce Michaela Powella z roku 1977 [3] [4] [5] .
Radiální základní funkce se také používají jako jádro v podpůrných vektorových strojích . [6]
Mezi běžně používané radiální základní funkce patří ( ):
Pro aproximaci funkcí pomocí radiálních bázových funkcí se obvykle používá jejich lineární kombinace tvaru:
,kde součet radiálních bázových funkcí se středy v bodech a koeficienty se bere jako aproximační funkce . Koeficienty lze vypočítat pomocí metody nejmenších čtverců , protože funkce přizpůsobení je lineární s ohledem na koeficienty .
Obzvláště užitečná jsou aproximační schémata tohoto druhu. v předpovídání časových řad , řízení nelineárních systémů , které vykazují poměrně jednoduché chaotické chování, a 3D modelování v počítačové grafice .
Lineární kombinace:
lze také interpretovat jako nejjednodušší umělou neuronovou síť s jednou vrstvou, nazývanou síť radiálních bázových funkcí , ve které radiální bázová funkce hraje roli aktivační funkce. Lze ukázat, že libovolnou spojitou funkci na kompaktním intervalu lze v zásadě interpolovat s libovolnou přesností pro dostatečně velké .
Aproximace je diferencovatelná s ohledem na . Koeficienty lze vypočítat pomocí libovolné standardní iterační metody pro neuronové sítě.
Radiální bazické funkce tedy poskytují flexibilní interpolační nástroj za předpokladu, že množina středů víceméně rovnoměrně pokrývá doménu požadované funkce (v ideálním případě by středy měly být stejně vzdálené od svých nejbližších sousedů). Zpravidla však v mezilehlých bodech dosahuje aproximace vysoké přesnosti pouze tehdy, je-li množina radiálních bázových funkcí doplněna o polynom ortogonální ke každému z RBF.
Strojové učení a dolování dat | |
---|---|
Úkoly | |
Učení s učitelem | |
shluková analýza | |
Redukce rozměrů | |
Strukturální prognózy | |
Detekce anomálií | |
Grafové pravděpodobnostní modely | |
Neuronové sítě | |
Posílení učení |
|
Teorie | |
Časopisy a konference |
|