Hledat spam
Spam ve vyhledávačích ( spamdexing [1] , otrava vyhledávačem nebo webový spam ) - stránky a stránky na internetu vytvořené s cílem manipulovat s výsledky vyhledávačů - v konečném důsledku oklamat uživatele.
Hlavní typy
- Nesouvisí s obsahem stránky, ale oblíbená ve vyhledávacích dotazech, slova ve značkách „meta keywords“, „description“, například „ sex “, „ freebie “. Výsledkem bylo, že vyhledávače začaly analyzovat nejen speciální značky, ale také text samotného webu.
- "Napumpování" textu klíčovými slovy - umělé zvýšení frekvence klíčového slova nebo výrazu v textu a (nebo) použití HTML značkovacích prvků (h1-3, strong, b, em, i) k umělému zvýšení váhy klíčového slova.
- "Neviditelný text" - text, který je pro návštěvníka stránky neviditelný, ale je indexován vyhledávačem. Použije barvu textu odpovídající barvě pozadí, 1 pixel text, bloky textu, se stylem "zobrazit: žádné".
- Odkazový spam – odkazy, které „navíjejí“ parametr „oblíbenost odkazu“ a PageRank webu. Vzhledem k tomu, že vyhledávače se při odpovědi na požadavek řídí počtem odkazů dostupných na jiných stránkách na tento zdroj, přišel nápad nějak zvýšit počet takových odkazů:
- Vytvářejte malé stránky na bezplatném hostingu, registrujte je do velkého množství tematických adresářů a odkazujte z nich na ten hlavní.
- Zúčastněte se výměny odkazů.
- Kupte si odkazy za peníze.
- Propojte spam z návštěvních knih, blogů, wiki atd.
Vyhledávače se s tím vypořádávají tak, že vytvářejí filtry, které zahrnují stránky, jejichž odkazy se při hodnocení neberou v úvahu.
- Dveře jsou přechodné stránky vytvořené ke zvýšení váhy stránky v hodnocení odkazů nebo k uspořádání bomby Google . V souladu s technologií dveří by měla být ve vyhledávacím indexu propagována speciální stránka dveří. A již z této stránky přesměrujte na reklamu. Jeden inzerát může mít neomezený počet dveří. Vyhledávače reagují odstraněním stránek ze své databáze, které mají automatické přesměrování. Spammeři na to reagují jednoduchým trikem: požádají návštěvníka, aby klikl na tlačítko „Přihlásit se na web“ nebo něco podobného.
- Maskování neboli „maskování“ – analýza proměnných dotazu, při které je vyhledávači dán obsah webu, který je odlišný od toho, co vidí uživatel.
- Přepisování užitečných článků z jiných webů. Na první pohled se výsledky vyhledávání ukáží jako mnoho originálních článků na různých webech, ale ve skutečnosti se jedná o stejný text, pouze každá věta na každém webu je parafrázována svým vlastním způsobem.
Důsledky používání spamu ve vyhledávačích
- Hlavním problémem generovaným spamem ve vyhledávání je to, že generuje mnoho nevyžádaného obsahu, což ztěžuje efektivní práci vyhledávačů, narušuje objektivní hodnocení internetových zdrojů a relevanci výsledků vyhledávání. Ve výsledku to do značné míry znehodnocuje internet jako zdroj objektivních informací.
- Pokud by rané vyhledávače mohly důvěřovat klíčovým slovům, indikacím frekvence aktualizací, pak v důsledku aktivního používání těchto metod k „klamání“ vyhledávačů byly pozdější verze vyhledávačů nuceny tyto náznaky téměř úplně ignorovat a kriticky odkazovat na každou stránek webu, což ztěžovalo hledání „slušných“ stránek se vzácným obsahem a předepsanými klíčovými slovy. Například stránka s textem středověké písně a klíčovými slovy „Středověk, poezie, Východní Evropa“, která nemá velké množství odkazů z jiných stránek, neobsahuje slovo „Středověk, poezie“ v text, je nepravděpodobné, že jej tato klíčová slova najdou.
Protiopatření
- Stránky podezřelé ze spamu jsou někdy vyhledávačem vyloučeny z výsledků vyhledávání.
- Uživatelé mohou k filtrování použít vyhledávací operátory. Pro Google klíčové slovo, kterému předchází "-" (mínus), vyloučí z výsledků vyhledávání weby obsahující toto klíčové slovo na svých stránkách nebo v adresách URL stránek. Například vyhledávání „-<nežádoucí web>“ odstraní weby, které na svých stránkách obsahují slovo „<nežádoucí web>“ a stránky, jejichž adresa URL obsahuje „<nežádoucí web>“.
Poznámky
- ↑ SearchEngineLand , video vysvětlení Dannyho Sullivana ke spamu ve vyhledávači, říjen 2008 Archivováno 17. prosince 2008 na Wayback Machine . Získáno 2008-11-13.