DNA hybridizace , hybridizace nukleových kyselin - in vitro kombinace komplementárních jednovláknových nukleových kyselin do jedné molekuly. Při úplné komplementaritě je kombinace snadná a rychlá a v případě částečné nekomplementarity se zpomaluje slučování řetězců, což umožňuje posoudit míru komplementarity. Je možná hybridizace DNA-DNA a DNA-RNA.
Analýza rychlosti nasedání (=hybridizace) jednořetězcové DNA umožňuje vyhodnotit podobnosti a rozdíly v sekvencích DNA mezi druhy nebo jedinci stejného druhu.
Sekundární struktura DNA hraje důležitou roli v biologii, genetické diagnostice a dalších metodách molekulární biologie a nanotechnologií. Přesné stanovení teploty tání molekul DNA nebo RNA proto hraje velmi důležitou roli ve všech molekulárně biologických metodách, například při výběru vzorků nebo oligonukleotidů pro mikročipy nebo při výběru primerů pro PCR . Existuje několik jednoduchých vzorců pro výpočet bodu tání pro krátké oligonukleotidy. Hrubý výpočet teploty tání (T m ) krátkého oligonukleotidu (<20 nukleotidů ) se provádí přímým počítáním počtu nukleotidů (G + C je součet všech guaninů a cytosinů , L je délka oligonukleotid):
, [1]
Průměrný vzorec pro výpočet Tm pro krátký oligonukleotid (a pro dlouhé fragmenty DNA) s přihlédnutím ke koncentraci K + iontů a DMSO :
, [2]
Tyto rovnice však neberou v úvahu iniciaci vazby během oligonukleotidové hybridizace, neberou v úvahu rysy samotné sekvence a konečný efekt charakteristický pro oligonukleotidové duplexy. Proto je tento vzorec vhodnější tam, kde je sekvence DNA zprůměrována a délka duplexů je přes 40 nukleotidů.
Nejběžnější metoda, která se dnes používá k výpočtu teploty tání dvouvláknové nebo jednovláknové DNA, je založena na dvoukrokovém termodynamickém modelu. Dvě komplementární molekuly DNA A a B jsou buď vzájemně vázány, nebo jsou volné v roztoku (“random coil state”). Obvykle se předpokládá, že molekuly A a B jsou zcela komplementární, takže jejich hybridizace je zřejmá a je povolena jedna nebo více chyb komplementarity v duplexu, včetně nekomplementárních párů GG, GT a GA ( wobble pairs ). V případě pouze jedné molekuly se předpokládá, že je zabalena do smyčkové struktury. Proces hybridizace na duplex je popsán vzorcem:
kde A a B jsou různé řetězce v roztoku („stav náhodné cívky“) a AB je vytvořený duplex. Tato reakce je reverzibilní. Rovnovážná konstanta kpro tuto reakci je definována jako: .
Rovnovážná konstanta závisí na koncentraci řetězce, teplotě, koncentraci soli, pH a dalších složkách v reakci (např . glycerol nebo DMSO ). Konstanta k se mění v reakci na změnu koncentrace jednoho nebo obou řetězců ([At] a/nebo [Bt]), na změny pak reaguje celý systém a následně jednotlivé koncentrace [A], [B] a [AB] se také změní. Například, pokud je v systému více řetězce A, pak se koncentrace [AB] zvýší. Předpokládejme, že rovnovážná konstanta je 1,81×10 6 a koncentrace řetězců je [At] = [Bt] = 10 −5 M:
Pro výpočet dosadíme složky ve vzorcích k:
Po přeskupení dostaneme:
kde .
Například, když se do tohoto vzorce dosadí [AB] = 7,91x10 −6 M, koncentrace řetězců bude [A] = [B] = 2,09x10 −6 M. To znamená, že pouze 79 % řetězců [At ] bude připojen v duplexu [AB ].
Je možné určit rovnovážné konstanty se změnou teploty? To nás přivádí k pochopení důležitých termodynamických parametrů, jako je volná energie (dG), entalpie (dH) a entropie (dS). Ke změnám volné energie, entalpie a entropie dochází při přechodu z „hybridizační teploty T“ do neuspořádaného, náhodného stavu. Tyto vztahy jsou definovány vzorcem dG = dH – TdS, (pro koncentraci řetězce [A] = [B] = [AB] = 1M), pak ideální vzorec pro výpočet Gibbsovy volné energie je:
kde Tteplota je v Kelvinech, dH° (cal/mol) a dS° (cal/mol K).
Existuje užitečný vztah týkající se změny Gibbsovy volné energie během chemické reakce k její rovnovážné konstantě:
kde R je univerzální plynová konstanta (1,987 cal/mol K).
Spojením obou vzorců dostaneme:
Teplota tání (T m ) se určuje v rovnováze, kdy je polovina řetězců navzájem spojena a druhá polovina je ve volném stavu, tedy k=1:
Teplota tání pro jednoduchou smyčku se vypočítá jako . U duplexu DNA je nutné vzít v úvahu koncentraci každého vlákna (v molech, M). Pokud jsou tedy [A] a [B] koncentrace molekul A a B, pak se celková koncentrace řetězců C rovná jejich součtu [A] + [B].
Předpokládá se, že koncentrace obou řetězců je stejná [A] = [B] = C/2. V tomto případě
kde f = 4. Pro autokomplementární oligonukleotid [A 0 ] = C a pak f = 1. Tato teplota tání je určena pouze tehdy, když je polovina molekul navázána na sebe.
Pro samokomplementární oligonukleotid k = 1/[At] tedy:
Pro nekomplementární duplex, když [At] ≥ [Bt], k = 1/([At] - [Bt]/2), se Tm vypočítá následovně:
kde [At] je molární koncentrace dominantního řetězce (obvykle primeru PCR) a [Bt] je molární koncentrace vlákna s nízkou koncentrací (genomové DNA).
Přírůstky ΔG, ΔH a ΔS termodynamických parametrů G, H a S jsou vypočteny na základě modelu nejbližšího souseda. Přesná predikce sekundární struktury DNA během hybridizace pomocí algoritmů dynamického programování vyžaduje databázi všech možných termodynamických parametrů pro každý komplementární pár bází, stejně jako pro všechny varianty v nukleotidových neshodách, pro volné konce, vlásenky a smyčky. Termodynamický vzorec pro výpočet krátkého oligonukleotidu je založen na termodynamických parametrech - entropii S a entalpii H, pro každou z 10 kombinací čtyř nukleotidů (tabulka 1). Tabulka 1 ukazuje termodynamické parametry pro nejbližší sousedy (NN) pro nukleotidové páry při koncentraci 1M NaCl.
Pro výpočet Tm (°С) se všechny Gibbsovy hodnoty volné energie pro každý pár sečtou v přírůstcích jednoho nukleotidu:
ΔG celkem = ΔG počáteční + ΔG symetrie + ∑ΔG + ΔG AT konec
5'-CGTTGA-3' | = ΔG počáteční + ΔG symetrie + | CG+GT+TT+TG+GA+AT konec |
3'-GCAACT-5' | GC CA AA AC CT |
ΔG teoretické = 1,96 + 0 - 2,17 - 1,44 - 1,44 - 1,00 - 1,45 - 1,30 + 0,05
AG teoretický = -5,35 kcal/mol
Přírůstky entropie (ΔH = -43,5 kcal/mol) a entalpie (ΔS = -122,5) se vypočítají podobně:
Mnoho duplexů DNA má konkurenční jednovláknové struktury. Tím se posouvá rovnováha systému a v důsledku toho je hodnota T m nižší než hodnota předpovězená vzorcem.
Obecný vzorec pro výpočet Tm s korekcí na sůl v roztoku je:
kde L je délka oligonukleotidu, R je plynová konstanta (1,987 cal/K mol), c je koncentrace oligonukleotidu v (obvykle 2x10 −7 M), [K + ] je koncentrace draselných iontů v molech (obvykle 5x10 -2 M).
Posloupnost párů (5'-3'/3'-5') |
° kcal/mol |
° cal/(mol K) |
° 37 kcal/mol |
---|---|---|---|
AA/TT | -7.6 | -21.3 | -1,00 |
AT/TA | -7.2 | -20.4 | -0,88 |
TA/AT | -7.2 | -20.3 | -0,58 |
CA/GT | -8.5 | -22.7 | -1,45 |
GT/CA | -8.4 | -22.4 | -1,44 |
CT/GA | -7.8 | -21.0 | -1,28 |
GA/CT | -8.2 | -22.2 | -1,30 |
CG/GC | -10.6 | -27.2 | -2.17 |
GC/CG | -9.8 | -24.4 | -2,24 |
GG/CC | -8,0 | -19.9 | -1,84 |
zahájení | +0,2 | -5.7 | +1,96 |
koncový pár AT | +2,2 | +6,9 | +0,05 |
korekce symetrie | 0,0 | -1.4 | +0,43 |
Model nejbližšího souseda pro komplementární nukleotidové páry může být rozšířen na páry, které zahrnují nekomplementární nukleotidy. Ukázalo se, že existuje trend snižovat stabilitu nekomplementárních párů bází v sestupném pořadí:
GC > AT > G G > G T ≥ G A > T T ≥ A A > T C ≥ A C ≥ C C
Guanidin G je nejpromiskuitnější báze, protože tvoří jak nejsilnější páry bází, tak stabilní páry s nekomplementárními bázemi (G·G, G·T a G·A). Na druhé straně je cytosin C nejvíce diskriminační bází, protože tvoří nejstabilnější komplementární páry a nestabilní páry s nekomplementárními bázemi (T·C ≥ A·C ≥ C·C) [5] , [6] .