Content filter neboli program pro omezení obsahu webu ( angl. Content-control software nebo web filtering software ) - zařízení nebo software pro filtrování stránek podle jejich obsahu, který neumožňuje přístup k určitým stránkám nebo internetovým službám . Systém umožňuje blokovat webové stránky s obsahem, který není určen k prohlížení.
Filtr obsahu funguje na statistickém principu, to znamená, že počítá předdefinovaná slova textu a určuje kategorii, do které obsah webu patří. Účelem takových zařízení nebo programů je omezit přístup k internetu školám, podnikům, náboženským organizacím apod. Nejčastěji se obsahové filtry používají k omezení přístupu dětí a dospívajících ve vzdělávacích institucích, knihovnách a na pracovištích v různých institucích, rovněž herní kluby a internetové kavárny .
Filtrování často probíhá na úrovni požadavků HTTP . Za tímto účelem je adresa URL požadovaného webu porovnána s černou listinou pomocí regulárních výrazů . Takové seznamy je třeba pravidelně aktualizovat, ochrana s jejich pomocí je považována za neúčinnou. Pokročilejší jsou metody rozpoznávání vzorů a zpracování přirozeného jazyka . Aby bylo možné stránky klasifikovat podle různých kritérií (například „pornografie / nepornografie“, „ katalog warez / freeware “ atd.), je text požadované stránky analyzován na několik různých klíčových slov (např. ““, „stáhnout“ atd.). d.). Tyto a další vlastnosti textu se používají k výpočtu pravděpodobnosti spadání do nebezpečné kategorie. Pokud tato pravděpodobnost překročí danou úroveň (například 95 %), přístup na stránku je zablokován.
Nejjednodušší programy umožňují zadávat slova, která bude systém hledat ručně. Nejsložitější zařízení již mají velkou slovní zásobu a vyžadují hotovou referenční základnu, která je již klasifikována. Výrobci zpravidla poskytují pravidelnou aktualizaci linkové základny pro složitá zařízení. Webové stránky, které nebyly automaticky rozpoznány, si prohlíží osoba a ručně jim přiřadí kategorii webu.
Zřejmým požadavkem na programy omezující přístup je rychlost klasifikace.
Někdy chyba při posuzování nebezpečnosti stránky vede k omezení přístupu k neškodným informacím.