Automatická anotace obrázku (známá také jako automatické označování obrázků nebo lingvistické indexování ) je proces, při kterém počítačový systém automaticky přiřazuje digitálnímu obrázku metadata ve formě titulků nebo klíčových slov . Tato aplikace technik počítačového vidění se používá v systémech pro vyhledávání snímků k organizaci a získávání snímků z databáze zájmu.
Na tuto metodu lze nahlížet jako na typ vícetřídní klasifikace obrázků s velmi velkým počtem tříd – velikost je srovnatelná se slovní zásobou. Analýzu obrazu ve formě extrahovaných příznakových vektorů a trénovacích slov anotací obvykle používají techniky strojového učení, aby se pokusily automaticky aplikovat anotace na nové obrázky. První metody studovaly korelace mezi rysy obrázků a trénovacími anotacemi, poté byly vyvinuty metody využívající strojový překlad, aby se pokusily přeložit textový slovník s „vizuální slovní zásobou“ nebo shlukovanými oblastmi známými jako blob. Práce navazující na tyto snahy zahrnovaly klasifikační přístupy, modely relevance a tak dále.
Výhodou automatické anotace obrázků oproti vyhledávání obrázků podle obsahu (CBIR) je, že dotazy může uživatel přirozeněji specifikovat. [1] CBIR obvykle (aktuálně) vyžaduje, aby uživatelé hledali koncepty obrázků, jako je barva a textura, nebo našli vzorové dotazy. Některé funkce obrázků ve vzorových obrázcích mohou přepsat koncept, na který se uživatel ve skutečnosti soustředí. Tradiční metody vyhledávání obrázků se spoléhají na ručně označené obrázky, což je nákladný a časově náročný proces, zejména s ohledem na existující rozsáhlé a stále rostoucí databáze obrázků.
K internetu je připojeno několik enginů, včetně značkovacího enginu v reálném čase [2] vyvinutého výzkumníky z Pennsylvania State University a Behold. Společnosti jako Playment, Edgecase.ai, Microsoft VOTT.ai a dataloop.ai vytvořily vestavěné automatické nástroje pro anotaci videa. Společnosti jako Alegion.com, Infolks, DataPure.co, Scaleapi.com, Diffgram.com, Figure-eight.com nabízejí kombinaci automatické anotace obrázku s kombinací ruční kontroly, když automatizace selže.