Koncept molekulární podobnosti (neboli chemická podobnost , chemická podobnost ) je jedním z klíčových pojmů chemoinformatiky [1] [2] . Hraje důležitou roli v moderních přístupech k predikci vlastností chemických sloučenin , navrhování nových sloučenin s předem určenými vlastnostmi a zejména při hledání nových léků prověřováním rozsáhlých databází dostupných (nebo potenciálně dostupných) chemických sloučenin. Takové hledání je založeno na principu podobnosti vlastností formulovaných Johnsonem a Maggiorou: podobné chemické sloučeniny mají podobné vlastnosti [1] .
Míra molekulární podobnosti se často popisuje jako převrácená hodnota vzdálenosti nebo jako konstantní mínus vzdálenost v prostoru deskriptorů.
Virtuální screening založený na podobnosti (obměna virtuálního screeningu na bázi ligandu) je založen na předpokladu, že všechny sloučeniny v databázi, které jsou podobné dané sloučenině, mají podobnou biologickou aktivitu. Ačkoli tato hypotéza není vždy pravdivá [3] , často se ukáže, že soubor chemických struktur vybraných v průběhu takového screeningu je významně obohacen o sloučeniny, které mají požadovaný typ biologické aktivity [4] . Pro dosažení větší účinnosti ve virtuálním screeningu založeném na podobnosti jsou chemické struktury obvykle popsány pomocí molekulárních obrazovek ( strukturální klíče ) nebo molekulárních otisků pevné nebo proměnné velikosti. Ačkoli molekulární obrazovky a molekulární otisky mohou být generovány jak z čistě topologických (2D) informací o molekulární konektivitě, tak z (3D) informací o prostorové struktuře molekul, v této oblasti dominují topologické otisky, které jsou formou deskriptorů binárních fragmentů. Zatímco strukturální klíče, jako jsou klíče MDL [5] , jsou docela vhodné pro práci s chemickými databázemi malé a střední velikosti , pak pro efektivní práci s velkými databázemi je vhodnější používat molekulární otisky prstů s vyšší hustotou informací. Příkladem jsou molekulární otisky založené na fragmentech z Daylight [6] , BCI [7] a Tripos [8] . Nejběžnějším měřítkem podobnosti struktur reprezentovaných molekulárními otisky prstů je Tanimotův (Jakara) koeficient T . Dvě chemické struktury jsou obvykle považovány za podobné if (pro molekulární otisky Daylight).