Vyhledávač

Vyhledávač ( search engine ) je sada programů určených k vyhledávání informací. Obvykle součást vyhledávače .

Hlavními kritérii kvality vyhledávače jsou relevance (stupeň korespondence mezi dotazem a nalezeným, to znamená relevance výsledku), úplnost indexu s přihlédnutím k morfologii jazyka .

Klasifikace

Podle oblasti hledání (podmíněně)

Místní

Navrženo pro vyhledávání informací v jakékoli části World Wide Web, například na jedné nebo více stránkách nebo v místní síti . Takové vyhledávače se obvykle používají v soukromých (firemních) sítích nebo v systémech pro elektronický obchod ( internetové obchody ). Proto jsou také často označovány jako „firemní“. Mezi oblíbené firemní vyhledávače patří: Apache Solr , Endeca , Sphinx , Elasticsearch .

Osobní

Používá se k vyhledávání mezi soubory na osobních počítačích nebo malých lokálních sítích.

Globální

Určeno pro vyhledávání informací na celém internetu nebo na jeho významné části. Vlastníky takových vyhledávačů jsou vyhledávače Google , Yandex atd. Vyhledávače vyhledávají různé typy informací, jako jsou texty, videa, obrázky, geografické objekty, osobní údaje atd. Zároveň soubory, které vyhledávač umí pracovat může být textový formát (např. .html, .htm, .txt, .doc, .rtf…), grafický (.gif, .png, .svg…) nebo multimediální (video a zvuk). Zatím nejčastější je vyhledávání textových dokumentů.

Hledaný výraz

Výchozí informací pro vyhledávání je vyhledávací dotaz .

Funkce

Vyhledávače plní několik funkcí:

Hledání odkazu

Vyhledávejte odkazy na stránky a další dokumenty webu.

Automaticky

Vyhledávač hledá odkazy z webových stránek.

Manuální režim

Sami uživatelé přidávají odkazy na stránky svých webů do databáze vyhledávačů

Indexování dokumentů webu

Extrahování informací relevantních pro vyhledávač z dokumentů, převod těchto informací do formátu vhodného pro vyhledávač a ukládání těchto informací do databáze vyhledávače

Prohledávání databáze indexovaných dokumentů

Může se skládat z několika fází

Hledání dokumentů odpovídajících vyhledávacímu dotazu Seřazení dokumentů podle jejich relevance k vyhledávacím dotazům Shlukování dokumentů

Viz také