Optický tok je zobrazení (na vizuálním grafu nebo ve formě matematického modelu) zdánlivého pohybu předmětů, povrchů nebo okrajů scény, vyplývající z pohybu pozorovatele (očí nebo kamery) vzhledem ke scéně. Algoritmy založené na optickém toku , jako je detekce pohybu, segmentace objektů, kódování pohybu a počítání stereo disparit, využívají tento pohyb objektů, povrchů a hran.
Sekvence uspořádaných obrázků umožňují odhadnout pohyb buď jako okamžitou rychlost obrazu nebo jako diskrétní posunutí [1] Fleet a Weiss sestavili návod na gradientovou metodu odhadu optického toku [2] .
Analýzu metod pro výpočet optického toku provedli John L. Barron, David J. Fleet a Steven Beauchemin. Metody uvažují jak z hlediska přesnosti, tak z hlediska hustoty výsledného vektorového pole. [3]
Metody založené na optickém toku počítají pohyb mezi dvěma snímky pořízenými v čase a v každém pixelu . Tyto metody se nazývají diferenciální, protože jsou založeny na aproximaci signálu segmentem Taylorovy řady ; tedy používají parciální derivace s ohledem na časové a prostorové souřadnice.
V případě rozměru 2D+ t (případy vyšších rozměrů jsou podobné) se pixel na pozici s intenzitou na snímek posune o , a a lze napsat následující rovnici:
Za předpokladu, že posun je malý, a pomocí Taylorovy řady dostaneme:
.Z těchto rovností vyplývá:
nebo
proto se ukazuje, že
kde
Takto:
nebo
Výsledná rovnice obsahuje dvě neznámé a nelze ji jednoznačně vyřešit. Tato okolnost je známá jako problém s aperturou . Problém je vyřešen zavedením dalších omezení – regularizací .
Výzkum optického toku se rozsáhle provádí v oblasti komprese videa a analýzy pohybu. Algoritmy optického toku nejen určují pole toku, ale využívají také optický tok při analýze trojrozměrné podstaty a struktury scény a také 3D pohybu objektů a pozorovatele vzhledem ke scéně.
Optický tok se používá v robotice pro rozpoznávání objektů, sledování objektů, detekci pohybu a navigaci robotů.
Kromě toho se optický tok používá ke studiu struktury objektů. Jelikož detekce pohybu a tvorba map struktury prostředí jsou nedílnou součástí zvířecího (lidského) vidění, je implementace této vrozené schopnosti pomocí počítače nedílnou součástí počítačového vidění.
Představte si pětisnímkové video, ve kterém se míč pohybuje zleva dole doprava. Metody pro nalezení pohybu mohou určit, že na dvourozměrné rovině se míč pohybuje nahoru a doprava, a vektory popisující tento pohyb lze získat ze sekvence snímků. V kompresi videa je to správný popis sekvence snímků. V oblasti počítačového vidění však bez dalších informací nelze říci, zda se míč pohybuje doprava a pozorovatel stojí na místě, nebo je míč v klidu a pozorovatel se pohybuje doleva.
James Gibson považoval modely optického toku (optické invarianty) za stimul vyššího řádu. Modely optického toku v Gibsonově teorii jsou komplexní konfigurace optických informací zaznamenaných vizuálními receptory. Optický tok obsahuje všechny informace potřebné pro naše vnímání světa kolem nás, dějů v něm probíhajících, včetně informací o pohybu (včetně pohybové paralaxy a gradientu optické expanze). Optický tok tedy vylučuje z psychologie vnímání nutnost použití jakékoli jiné vnější informace [6] .
Myšlenka využít optický tok k vysvětlení procesu utváření vjemového obrazu přišla Gibsona během druhé světové války při práci na vytvoření speciálních simulátorů a cvičného filmu pro výcvik pilotů amerického letectva.