Radiální základní funkce

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 2. června 2021; ověření vyžaduje 1 úpravu .

Funkce radiální báze ( RBF ) je funkce ze sady radiálních funkcí stejného typu, které se používají jako aktivační funkce v jedné vrstvě umělé neuronové sítě nebo jinak, v závislosti na kontextu. Radiální funkce  je jakákoli reálná funkce , jejíž hodnota závisí pouze na vzdálenosti k počátku nebo na vzdálenosti mezi nějakým jiným bodem , který se nazývá střed : . Normou je obvykle euklidovská vzdálenost , i když lze použít i jiné metriky .

K aproximaci dané funkce lze také použít lineární kombinace radiálních základních funkcí . Aproximaci lze interpretovat jako nejjednodušší druh neuronové sítě ; právě v tomto kontextu byly funkce radiální báze poprvé definovány Davidem Broomheadem a Davidem Lowem v roce 1988 [1] [2] , na základě klíčové práce Michaela Powella z roku 1977 [3] [4] [5] .

Radiální základní funkce se také používají jako jádro v podpůrných vektorových strojích . [6]

Druh

Mezi běžně používané radiální základní funkce patří ( ):

Aproximace

Pro aproximaci funkcí pomocí radiálních bázových funkcí se obvykle používá jejich lineární kombinace tvaru:

,

kde součet radiálních bázových funkcí se středy v bodech a koeficienty se bere jako aproximační funkce . Koeficienty lze vypočítat pomocí metody nejmenších čtverců , protože funkce přizpůsobení je lineární s ohledem na koeficienty .

Obzvláště užitečná jsou aproximační schémata tohoto druhu. v předpovídání časových řad , řízení nelineárních systémů , které vykazují poměrně jednoduché chaotické chování, a 3D modelování v počítačové grafice .

Neuronové sítě založené na RBF

Lineární kombinace:

lze také interpretovat jako nejjednodušší umělou neuronovou síť s jednou vrstvou, nazývanou síť radiálních bázových funkcí , ve které radiální bázová funkce hraje roli aktivační funkce. Lze ukázat, že libovolnou spojitou funkci na kompaktním intervalu lze v zásadě interpolovat s libovolnou přesností pro dostatečně velké .

Aproximace je diferencovatelná s ohledem na . Koeficienty lze vypočítat pomocí libovolné standardní iterační metody pro neuronové sítě.

Radiální bazické funkce tedy poskytují flexibilní interpolační nástroj za předpokladu, že množina středů víceméně rovnoměrně pokrývá doménu požadované funkce (v ideálním případě by středy měly být stejně vzdálené od svých nejbližších sousedů). Zpravidla však v mezilehlých bodech dosahuje aproximace vysoké přesnosti pouze tehdy, je-li množina radiálních bázových funkcí doplněna o polynom ortogonální ke každému z RBF.

Poznámky

  1. Radiální základní funkční sítě Archivováno 23. dubna 2014.
  2. Broomhead, Lowe, 1988 , s. 321–355
  3. Michael J. D. Powell; Michael JD Powell. Restartujte procedury pro metodu konjugovaného gradientu  // Matematické  programování : deník. - Springer, 1977. - Sv. 12 . - str. 241-254 . - doi : 10.1007/bf01593790 .
  4. Sahin, Ferat (1997). Radiální základní funkční přístup k problému klasifikace barevného obrazu v průmyslové aplikaci v reálném čase (PDF) (M.Sc.). Virginia Tech . p. 26. Archivováno z originálu (PDF) dne 26. 10. 2015 . Staženo 2018-06-02 . Radiální bázové funkce byly poprvé představeny Powellem k vyřešení skutečného problému vícerozměrné interpolace. Použitý zastaralý parametr |deadlink=( nápověda )
  5. Broomhead, Lowe, 1988 , s. 347: "Rádi bychom poděkovali profesoru MJD Powellovi na katedře aplikované matematiky a teoretické fyziky Cambridgeské univerzity za poskytnutí počátečního podnětu pro tuto práci."
  6. VanderPlas, Jake Úvod do podpory vektorových strojů (odkaz není k dispozici) . [O'Reilly] (6. května 2015). Získáno 14. 5. 2015. Archivováno z originálu 5. 9. 2015. 

Literatura