Metasearch engine

Metavyhledávač ( metasearch engine ) je vyhledávač , který na rozdíl od klasických vyhledávačů nemá vlastní databázi a svůj vlastní index vyhledávání , ale generuje výsledky hledání smícháním a přeřazením výsledků hledání z jiných vyhledávačů.

Příklady: AskNet , Excite , Ixquick , Nigma . Mezi historické metavyhledávače patří Dogpile, MetaCrawler, SUSI a Inference Find [1] .

Principy činnosti

Metavyhledávač shromažďuje hodnocené výsledky vyhledávání pro konkrétní dotaz z několika vyhledávačů, používá spojovací algoritmus k odstranění duplicitních výsledků a vytváří nový hodnocený seznam, který je poskytován uživateli prostřednictvím centralizovaného rozhraní [2] .

Při řazení výsledků obdržených od jednotlivých vyhledávačů může metavyhledávač využít již vytvořené hodnocení takových systémů na základě kvality výsledků, které od nich obdržel v předchozích dotazech [3] . Algoritmy agregace hodnocení fungují bez zohlednění indexů relevance, ve kterých je každý vyhledávač považován za voliče ve volbách a každá pozice ve výsledcích vyhledávání je považována za kandidáta v těchto volbách. Mezi takové algoritmy patří Bordova metoda , která každé pozici přiřadí určitý počet bodů a následně sečte body od všech voličů pro každého kandidáta, a Condorcetova metoda , která přiděluje body za jednociferné „výhry“ v každé dvojici kandidátů. Condorcetova metoda poskytuje objektivnější výsledky, zatímco Bordova metoda je mnohem jednodušší na algoritmizaci. Další metoda, vážený algoritmus HITS , je variantou algoritmu HITS, ve kterém je každý vyhledávač považován za hlavní stránku a každá internetová stránka nalezená ve vyhledávání je považována za stránku autority [4] .

Metavyhledávací stroje nové generace kromě zpracování konkrétního dotazu zvýrazňují klíčová slova nebo témata s ním spojená a vytvářejí tag cloud nebo poskytují sadu souvisejících klíčových dotazů k tématu, což umožňuje uživateli upřesnit vyhledávání [5 ] .

Výhody a nevýhody

Odeslání více dotazů do více dalších vyhledávačů rozšiřuje pokrytí dostupných dat o tématu a umožňuje vám najít více informací. Metasearch využívá indexy sestavené jinými vyhledávači, které agregují a často zpřesňují výsledky svým vlastním jedinečným způsobem. Metavyhledávač má výhodu oproti jedinému vyhledávači, protože uživatel získá více výsledků za stejné úsilí. To snižuje množství práce, když uživatelé zadávají dotazy do různých systémů samostatně, aby našli zdroje [6] . Z tohoto pohledu jsou metavyhledávače nejužitečnější pro začínající uživatele a méně zajímají zkušené uživatele [1] .

Vzhledem k nedostatku vlastního rozsáhlého indexovacího mechanismu zabírají metavyhledávače relativně malé množství místa na disku. V některých případech lze takové systémy nainstalovat přímo na počítač uživatele a dále zajistit výraznou personalizaci vyhledávání [3] .

Údajné výhody metavyhledávače také souvisí s efektem „ celek je větší než součet částí “. Různé vyhledávací algoritmy jsou v různé míře účinné v závislosti na kontextu, což znamená, že agregované výsledky několika vyhledávačů mohou být kvalitnější než prostý součet výsledků. Přitom ve skutečnosti řada vyhledávačů metavyhledávacím strojům zakazuje používat jejich výsledky zdarma. Výsledkem bylo uzavření dohod mezi metavyhledávači a předními vyhledávači, které zpravidla znamenaly umístění placené reklamy těchto vyhledávačů na stránky metavyhledávačů [2] . Některé metavyhledávače navíc nemají svůj vlastní vyvinutý hodnotící algoritmus, který se spoléhá na indexy relevance získané z každého vyhledávače zvlášť [3] .

Historické metavyhledávače

V roce 1995 začalo na internetu pracovat několik metavyhledávačů najednou a pokračovalo ve své práci během příštího desetiletí a půl. První metasearch engine komerčně používaný na internetu byl MetaCrawler , vyvinutý na University of Washington . Prokázala životaschopnost metasearch a v prvním roce své existence zpracovala 100 000 dotazů denně a do roku 2000 2 miliony dotazů denně. Program byl komerčně licencován společností Go2Net v roce 1996 [7] .

Ve stejném roce se objevil metasearch engine SavvySearch vyvinutý na University of Colorado . Algoritmus provozu tohoto stroje zahrnoval posouzení efektivity každého ze zapojených vyhledávačů v konkrétních kontextech na základě metaindexu obsahujícího historii předchozích interakcí. V roce 1999 systém získal CNET [7] .

Ještě později, v roce 1995, byl vytvořen metasearch engine ProFusion, vyvinutý na University of Kansas . Systém používal hodnocení důvěry, které zahrnovalo skóre přidělené jednotlivým vyhledávačům formulováním školicích dotazů, z nichž každý byl zahrnut do řady tematických kategorií. Stroj byl zakoupen v roce 2000 společností Intelliseek (od roku 2006 součástí BuzzMetrics) a později byl vyřazen [7] .

V roce 1996 byl spuštěn komerčně úspěšný metasearch engine Dogpile . Byl vyvinut právním výzkumníkem Aaronem Flynnem a v roce 1999 získal Go2Net. Mezi platící partnery systému patří Google , Yahoo a Ask Jeeves a prezentuje výsledky dle výběru uživatele seřazené podle relevance nebo vyhledávačů. Do roku 2000, stejně jako MetaCrawler, zpracovával Dogpile 2 miliony požadavků denně [8] .

Viz také

Poznámky

  1. 1 2 Stuart Ferguson, Rodney Hebels. Metavyhledávače // Počítače pro knihovníky  . - Třetí edice. - Woodhead Publishing, 2003. - ISBN 978-1-876938-60-4 .
  2. 12 Mark Levene . Metasearch // Úvod do vyhledávačů a webové navigace . - John Wiley & Sons, 2010. - S.  168-177 . ISBN 978-0-470-52684-2 .  
  3. 1 2 3 Levene, 2010 , str. 169.
  4. Levene, 2010 , str. 170.
  5. Cheat sheet pro metasearch engine . Internetové věci (2016). Získáno 1. ledna 2022. Archivováno z originálu 1. ledna 2022.
  6. Architektura metavyhledávače, která podporuje informační potřeby uživatelů (1999).
  7. 1 2 3 Levene, 2010 , str. 171.
  8. Levene, 2010 , pp. 170-171.