K-mediánová metoda

Metoda -medián $k$ [1] [2] je variací metody -averages používané ve statistice a strojovém učení pro problémy s klastrováním , kde se k určení těžiště klastru počítá místo průměru medián . Tento přístup odpovídá minimalizaci chyby ve všech shlucích v metrice s 1 normou namísto metriky se 2 normami používané v metodě standardních průměrů. $k$ $k$

Úkolem stanovení -mediánů je najít taková centra, aby jimi tvořené shluky byly co nej "kompaktnější". Formálně, dané datové body , středy by měly být zvoleny tak, aby se minimalizoval součet vzdáleností od každého k nejbližšímu . $k$ $k$ $x_{i}$ $k$ ${\displaystyle c_{j))$ $x_{i}$ ${\displaystyle c_{j))$

Metoda někdy funguje lépe než metoda -means, kde je součet čtverců vzdáleností minimalizován. Kritérium součtu vzdáleností je široce používáno pro dopravní problémy [3] . $k$

Další alternativou je metoda -medoids , ve které se hledá optimální medoid a nikoli medián shluku (medián je jedním z datových bodů, zatímco mediány být nemusí).

Odkazy

↑ A. K. Jain a R. C. Dubes, Algorithms for Clustering Data: Prentice-Hall, 1981.
↑ PS Bradley, OL Mangasarian a WN Street, "Clustering via Concave Minimization," v Advances in Neural Information Processing Systems, sv. 9, MC Mozer, MI Jordan a T. Petsche, Eds. Cambridge, MA: MIT Press, 1997, pp. 368-374.
↑ Archivovaná kopie . Získáno 24. října 2010. Archivováno z originálu dne 3. dubna 2022. (neurčitý)

Znamenat
Matematika	Střední mocnina ( vážená ) harmonický průměr vážený geometrický průměr vážený Průměrný vážený střední kvadratická Průměrný krychlový klouzavý průměr Aritmecko-geometrický průměr Funkce Průměr Kolmogorov znamená
Geometrie	geometrický střed Barycentrum
Teorie pravděpodobnosti a matematická statistika	Winsorized průměr průměr vzorku Očekávaná hodnota Medián Móda standardní odchylka Zkrácený průměr Podmíněné očekávání
Informační technologie	Medoid k-mediánová metoda
Věty	První střední věta Druhá střední věta Nerovnost o aritmetickém, geometrickém a harmonickém průměru
jiný	Metriky distribučního centra

Strojové učení a dolování dat
Úkoly	Klasifikační problém Učení bez učitele Učení za pomoci učitele Regresní analýza AutoML Pravidla asociace Extrakce funkcí Trénink vlastností Žebříčkový trénink Gramatické odvozování Online učení
Učení s učitelem	metoda k-nejbližšího souseda Naivní Bayesův klasifikátor rozhodovací strom Podpora vektorového stroje Lineární regrese Logistická regrese perceptron Soubory modelů Pytlování posilování náhodný les Relevantní vektorová metoda
shluková analýza	metoda k-means Metoda fuzzy shlukování Hierarchické shlukování EM algoritmus BŘÍZA LÉK DBSCAN OPTIKA Střední posun
Redukce rozměrů	Faktorová analýza Metoda hlavní součásti CCA ICA LDA Nezáporná expanze matice t-SNE
Strukturální prognózy	Graf pravděpodobnosti modelu Bayesovská síť Skrytý Markovův model CRF
Detekce anomálií	metoda k-nejbližšího souseda Místní úroveň emisí
Grafové pravděpodobnostní modely	Bayesovská síť Markovská síť Skrytý Markovův model
Neuronové sítě	Limitovaný Boltzmannův stroj samoorganizující se mapa Aktivační funkce Sigmoid softmax Radiální základní funkce Metoda zpětného šíření Hluboké učení Vícevrstvý perceptron Rekurentní neuronová síť dlouhodobá krátkodobá paměť Řízený rekurentní blok Konvoluční neuronová síť U-síť Autokodér
Posílení učení	Markovský proces Bellmanova rovnice Chamtivý algoritmus Q-learning SARSA Časový rozdíl (TD)
Teorie	Vapnik-Chervonenkis teorie Dilema zkreslení Teorie počítačového učení Empirická minimalizace rizika Occam se učí PAC učení Statistická teorie učení
Časopisy a konference	NeurIPS ICML ML JMLR ArXiv:cs.LG