V počítačovém vidění je segmentace procesem dělení digitálního obrazu na více segmentů ( soubor pixelů , nazývaných také superpixely). Účelem segmentace je zjednodušit a/nebo změnit reprezentaci obrázku tak, aby byl jednodušší a snadněji analyzovatelný. [1] Segmentace obrazu se běžně používá pro zvýraznění objektů a hranic (čáry, křivky atd.) na snímcích. Přesněji řečeno, segmentace obrazu je proces přiřazování štítků ke každému pixelu v obrázku tak, že pixely se stejným štítkem sdílejí vizuální charakteristiky.
Výsledkem segmentace obrazu je sada segmentů, které dohromady pokrývají celý obraz, nebo sada kontur extrahovaných z obrazu (viz Extrakce okrajů ). Všechny pixely v segmentu jsou podobné v nějaké charakteristické nebo vypočítané vlastnosti, jako je barva , jas nebo textura . Sousední segmenty se v této charakteristice výrazně liší. [jeden]
Některé praktické aplikace segmentace obrazu jsou:
Pro segmentaci obrazu bylo vyvinuto několik univerzálních algoritmů a metod. Vzhledem k tomu, že neexistuje obecné řešení problému segmentace obrazu, je často nutné tyto metody kombinovat se znalostmi z dané oblasti, aby bylo možné tento problém v dané oblasti efektivně vyřešit.
k-means je iterativní metoda, která se používá k rozdělení obrazu do K shluků. Základní algoritmus je uveden níže:
Zde se jako vzdálenost obvykle bere součet čtverců nebo absolutní hodnoty rozdílů mezi pixelem a středem shluku . Rozdíl je obvykle založen na barvě, jasu, struktuře a umístění pixelů nebo na váženém součtu těchto faktorů. K lze vybrat ručně, náhodně nebo heuristicky.
Je zaručeno, že tento algoritmus bude konvergovat, ale nemusí vést k optimálnímu řešení. Kvalita řešení závisí na počáteční sadě shluků a hodnotě K .
Metody histogramu jsou velmi účinné ve srovnání s jinými metodami segmentace obrazu, protože vyžadují pouze jeden průchod pixelem. Při této metodě se histogram vypočítá ze všech pixelů v obrázku a jeho minima a maxima se použijí k nalezení shluků v obrázku. [1] Pro srovnání lze použít barvu nebo jas .
Zlepšením této metody je rekurzivní aplikace na shluky v obrázku, aby se rozdělily na menší shluky. Proces se opakuje s menšími a menšími shluky, dokud se neobjeví žádné další shluky. [1] [4]
Jednou nevýhodou této metody je, že může být obtížné najít v obrázku významná minima a maxima. V této metodě klasifikace snímků jsou metrika vzdálenosti a shoda integrované oblasti podobné.
Přístupy založené na histogramu lze také rychle přizpůsobit více snímkům při zachování jejich výhody rychlosti jednoho průchodu. Histogram lze sestavit několika způsoby, pokud se uvažuje o více snímcích. Stejný přístup, který se používá pro jeden snímek, lze aplikovat na více snímků, a jakmile se výsledky zkombinují, stanou se viditelnější minima a výšky, které bylo těžké vybrat. Histogram lze také použít na bázi pixelů, kde se informace používají k určení nejčastější barvy pro danou pozici pixelu. Tento přístup využívá segmentaci založenou na pohybujících se objektech a nehybných prostředích, což poskytuje jiný druh segmentace užitečný při sledování videa .
Extrakce okrajů je dobře prostudovaná oblast zpracování obrazu. Hranice a okraje oblastí jsou silně propojeny, protože na hranicích oblastí je často velký rozdíl v jasu. Proto se metody detekce hran používají jako základ pro další metodu segmentace.
Nalezené okraje jsou často potrhané. Ale aby bylo možné vybrat objekt na obrázku, je zapotřebí ohraničení uzavřené oblasti.
První byla metoda pěstování ploch ze semen. Tato metoda bere jako vstup obrázky a sadu semen. Semena označují objekty, které mají být vybrány. Oblasti progresivně rostou a porovnávají všechny neobsazené sousední pixely s oblastí. Rozdíl mezi jasem pixelu a průměrným jasem oblasti se používá jako míra podobnosti. Pixel s nejmenším takovým rozdílem je přidán do odpovídající oblasti. Proces pokračuje, dokud nejsou všechny pixely přidány do jedné z oblastí.
Způsob pěstování ploch ze semen vyžaduje další vstup. Výsledek segmentace závisí na výběru semen. Šum v obraze může způsobit špatné umístění semen. Metoda pěstování v oblasti bez semen je upravený algoritmus, který nevyžaduje explicitní semena. Začíná to jednou oblastí – zde zvolený pixel má malý vliv na výslednou segmentaci. Při každé iteraci zohledňuje sousední pixely stejným způsobem jako metoda pěstování regionu pomocí semen. Liší se však tím, že pokud je minimum menší než zadaný práh , přidá se k odpovídající oblasti . Jinak je pixel považován za velmi odlišný od všech aktuálních oblastí a vytvoří se nová oblast obsahující tento pixel.
Jedna varianta této metody navržená Haralikem a Shapirem (1985) [1] je založena na použití jasu pixelů . Průměr a rozptyl plochy a jasu kandidátského pixelu se používají k vytvoření testovací statistiky. Pokud je statistika testu dostatečně malá, pak se k ploše přidá pixel a přepočítá se průměr plochy a rozptyl. Jinak je pixel ignorován a použit k vytvoření nové oblasti.
Techniky dělení grafů lze efektivně aplikovat na segmentaci obrazu. V těchto metodách je obraz reprezentován jako vážený neorientovaný graf. Typicky je pixel nebo skupina pixelů spojena s vrcholem a váhy hran určují (ne)podobnost sousedních pixelů. Poté se graf (obrázek) ořízne podle kritéria vytvořeného pro získání "dobrých" shluků. Každá část vrcholů (pixelů) získaná těmito algoritmy je považována za objekt v obrázku. Některé populární algoritmy v této kategorii jsou normalizované řezy grafu [5] , náhodná procházka [6] , minimální řez [7] , izoperimetrické dělení [8] a minimální segmentace kostry [9] .
Segmentace povodí považuje absolutní hodnotu gradientu obrazu za topografický povrch. Pixely, které mají největší absolutní hodnotu gradientu jasu, odpovídají čarám rozvodí, které představují hranice oblastí. Voda umístěná na libovolném pixelu v rámci společného povodí stéká na běžné místní minimum jasu. Pixely, ze kterých voda odtéká na společné minimum, tvoří povodí, která představuje segment.
Základním předpokladem tohoto přístupu je, že zájmové struktury nebo orgány mají opakující se geometrické tvary. Proto je možné najít pravděpodobnostní model pro vysvětlení změn tvaru orgánu a poté segmentací obrazu uložit omezení pomocí tohoto modelu jako a priori. Takový úkol zahrnuje (i) uvedení trénovacích příkladů do společné pozice, (ii) pravděpodobnostní znázornění změn v daných vzorcích a (iii) statistickou inferenci pro model a obrázek. Současné metody v literatuře pro segmentaci založenou na znalostech zahrnují aktivní modely tvaru a vzhledu, aktivní obrysy, deformovatelné vzory a metody vyrovnávání.
Segmentace obrazu se provádí v různých měřítcích v měřítku a někdy sahá od malých po velká měřítka.
Segmentační kritérium může být libovolně složité a může brát v úvahu jak lokální, tak globální kritéria. Obecným požadavkem je, že každá oblast musí být nějakým způsobem propojena.
Witkinova klíčová práce [10] [11] o škálovém prostoru obsahovala myšlenku, že jednorozměrný signál lze jedinečně segmentovat do oblastí pomocí jediného parametru, který řídí škálování segmentace.