Stemmer Porter

Porter Stemmer je odvozený  algoritmus publikovaný Martinem Porterem v roce 1980 . Původní verze stemmeru byla pro angličtinu a byla napsána v BCPL . Následně Martin vytvořil projekt Snowball a pomocí základní myšlenky algoritmu napsal stemmery pro běžné indoevropské jazyky , včetně ruštiny [1] .

Algoritmus nepoužívá základy slovních kmenů , ale pouze pomocí řady pravidel v posloupnosti ořezává konce a přípony , na základě vlastností jazyka, a proto funguje rychle, ale ne vždy správně.

Algoritmus byl velmi populární a replikovaný, často byl měněn různými vývojáři a ne vždy úspěšný. Kolem roku 2000 se Porter rozhodl projekt „zmrazit“ a napříště distribuovat jedinou implementaci algoritmu (v několika oblíbených programovacích jazycích ) ze svých webových stránek.

Poznámky

  1. Porter's stemming for Russian: Russian Stemming algorithm Archived 28. března 2012 na Wayback Machine  

Odkazy