Captcha

Captcha [ 1] (z CAPTCHA  - anglicky  C ompletely Automated Public Turing test to tell C computers and Humans A part -  plně automatizovaný veřejný Turingův test k rozlišení mezi počítači a lidmi ) je počítačový test používaný ke zjištění , zda uživatel systému je člověk nebo počítač.

Termín „Captcha“ se objevil v roce 2000. Hlavní myšlenkou testu je nabídnout uživateli úkol, který člověk snadno vyřeší, ale pro počítač extrémně obtížný a časově náročný. Od roku 2013 uživatelé na celé planetě zadávají každý den přibližně 320 milionů captcha [2] .

CAPTCHA  je ochranná známka Carnegie Mellon University , která tento test vyvinula.

Možnosti implementace

V nejběžnější verzi captcha uživatel zadává znaky zobrazené na obrázku (často s přidáním šumu nebo průsvitnosti), ale tak, že strojové rozpoznání textu je velmi obtížné. Podle obecně uznávaných standardů dostupnosti internetu pro osoby se zrakovým postižením by taková captcha měla být doplněna o variantu založenou na rozpoznávání řeči (audio captcha). Existují také captcha, kde je potřeba vybrat správný obrázek ze seznamu [3] .

Lze použít i jiné špatně algoritmické úlohy: například zjistit, co je na obrázku, označit všechny obrázky s kočkami nebo odpovědět na otázku související se znalostmi nebo mentalitou lidí (například hádanka: „Hruška visí , nemůžete to jíst“). Přesto se právě rozpoznávání znaků stalo standardem: není vázáno na žádnou kulturu (hlavní překážkou je špatný zrak), funguje i na mobilních prohlížečích a zkušený uživatel rychle rozpozná obrázek jako captcha. Možné jsou i kombinované captcha.

Nedostatky

Nevýhodou captcha je, že ne vždy je možné jej analyzovat. Z tohoto důvodu někdy musíte zadat captcha několikrát.

Metody pro předávání captcha robotem

Využití zranitelností

Chyba zabezpečení v CAPTCHA

Předpokládejme, že obrázek s čísly 1234 se nazývá kód:

< img src = "/captcha.php?code=1234" />

Místo předání captcha stroj přečte URL a zadá odpověď 1234 .

S nedostatečnou kvalifikací webového programátora může bot vydat odpověď, aniž by prošel testem. Například podle některých informací obsažených na stránce je počítač sám bez lidského zásahu schopen správně odpovědět na otázku, na kterou by pravděpodobně mohl odpovědět pouze člověk. Nebo člověk jednou projde testem a počítač vymyslí mnoho požadavků se stejnou odpovědí.

hádání

Používá se především pro „netradiční“ captcha s malým počtem možností odpovědí (1000 a méně). Robot „hádá“ odesláním náhodných odpovědí a některé z nich se ukáží jako správné.

Použití databází

Tento přístup je účinný, když otázky připravuje správce a negeneruje je stroj. Pomocí databází můžete projít mnoho netradičních možností captcha: například označit všechny obrázky s kočkami.

Automatické rozpoznávání

Velmi slabé captcha (jako příklad používám phpBB ) Oříznutí jasu se použije na horní obrázek (vše, co je tmavší než nějaká prahová hodnota, se stane černým, zbytek je bílý). Jsou určeny hranice postav a každá z nich je porovnána s charakterovou základnou. K analýze takové CAPTCHA není potřeba ani optické rozpoznávání znaků , protože má několik slabin najednou:
  • Snadné oddělení znaků od pozadí pomocí barevného klíče,
  • snadné oddělování postav od sebe navzájem,
  • Pevné a nezkreslené písmo.

Po cutoffu se na písmenech vytvoří náhodný vzor, ​​takže neexistuje 100% záruka, že budou rozpoznány všechny znaky (v PWNtcha je hodnocení tohoto CAPTCH 99%). Zbylé jedno procento je ale zcela irelevantní.

Nové vlákno fóra phpBB (3.xx) používá jako výchozí vylepšený CAPTCHA pomocí GD Graphics Library .

Existují programy (například: PWNtcha), které rozpoznávají konkrétní implementace captcha. Kromě toho je možné připojit moduly z univerzálních programů pro rozpoznávání textu (například: FineReader , OmniPage ) s programy třetích stran pro rozpoznávání obrázků captcha.

V souvislosti s automatizovaným rozpoznáváním existují pojmy „slabá captcha“ a „silná captcha“. Mezi „slabé stránky“ patří pevné písmo, pevná pozice znaků, žádné zkreslení, oddělení znaků od pozadí pomocí barevného klíče nebo Gaussova rozostření , snadné oddělování znaků od sebe atd. Někdy se však stane, že silná captcha je pro člověka těžko rozpoznatelná, což je již nepřijatelný extrém. Občas se objeví captcha, která je snadno čitelná počítačem a člověkem s velkými obtížemi (např. u málo kontrastního obrázku), taková captcha vůbec neodpovídá účelu captchy jako takové.

Pokud se vygenerovaný obrázek ukáže jako nečitelný, uživatel má zpravidla možnost získat nový. Silný captcha by měl vrátit obrázek s jinou odpovědí [4] .

Mnoho netradičních variant captcha se také ukázalo jako slabé – „neodolné vůči robotům“ [5] [6] .

Uznání prostřednictvím proxy

Existuje metoda „rozpoznávání“, která využívá lidské zdroje z vysoce navštěvovaných stránek. Robot si stáhne captcha z požadované internetové služby a předloží jej návštěvníkovi webu. Na oplátku získá návštěvník webu přístup ke zdroji a robot rozpozná kód zobrazený na obrázku a zadá jej na „zatíženou“ stránku. Návštěvník webu možná ani netuší, že každé zhlédnuté video se promění v registraci nové schránky pro rozesílání spamu.

Pro ochranu (ne úplně) před tímto způsobem obcházení captcha web automaticky mění captcha-obrázek, pokud odpověď na něj nebyla zadána okamžitě (během krátké doby), pravidelně pokaždé po určité době, popř. při pokusu o zahájení opožděné odpovědi.

Existují také specializované stránky pro výměnu nebo prodej captcha.

Užitečnost captcha proti spamu

Captcha samotná nemůže zastavit spammery . Na druhou stranu může tento způsob ochrany způsobit lidem velké nepříjemnosti.

Captcha je navíc zneužívána např. filehostingem , který přináší služby pro rozpoznávání captcha masám a činí jej ještě neefektivnějším [7] .

Známé služby CAPTCHA

reCAPTCHA je projekt, který používá nečitelné slovo pro OCR , což je jeden z mnoha zkreslených fragmentů naskenovaných knih, kromě počítačem generovaného slova, jako pracovní prvek pro reakce uživatelů na požadavek captchaTato služba zohledňuje způsoby použití a možnosti programů pro digitalizaci knižních textů . Pro spolehlivost je stejné slovo nabízeno několika uživatelům různých stránek. Když různí uživatelé dají stejnou odpověď na požadavek CAPTCHA, předpokládá se, že zadali správné slovo.

viz také

Poznámky

  1. Ekaterina Nikolaevna Shagalova  - Slovník nejnovějších cizích slov: konec 20.-začátek 21. století; AST, 2009; str. 576; ISBN 5-17-061402-0 , ISBN 978-5-17-061402-8
  2. Louis von Ahn: Massive Online Collaboration Archived 6. června 2012 na Wayback Machine // konferenci TED , 2011
  3. Basec Captcha . Získáno 4. dubna 2015. Archivováno z originálu 4. prosince 2017.
  4. Ověřovací algoritmus  . CAPTCHA.com. Získáno 4. prosince 2011. Archivováno z originálu 16. dubna 2013.
  5. Řešení MintEye CAPTCHA ve 23 řádcích kódu / Habrahabr . Datum přístupu: 21. ledna 2013. Archivováno z originálu 2. února 2013.
  6. Algoritmus rozpoznávání KeyCaptcha . Archivováno z originálu 17. října 2012.
  7. Captcha FAQ - Komunita JD . Staženo 3. května 2020. Archivováno z originálu dne 19. ledna 2021.

Odkazy