Дезоксирибонуклеїнова кислота

біомакромолекула, що полімерізується з дезоксирибонуклеотидів
(Перенаправлено з ДНК)

Дезоксирибонуклеї́нова кислота́ (ДНК) — один із двох типів природних нуклеїнових кислот, яка забезпечує зберігання, передавання від покоління до покоління і впровадження генетичної програми розвитку й діяльності живих організмів. Основне призначення ДНК в клітинах — довготривале зберігання відомостей про структуру РНК і білків.

Структура частини подвійної спіралі ДНК. Дві нитки ДНК, обвивають одна одну, перебувають у протилежних напрямках одна відносно одноі, отже, є антипаралельними.

У клітинах еукаріотів (наприклад, тварин, рослин або грибів) ДНК міститься в ядрі клітини в складі хромосом, а також в деяких клітинних органелах (мітохондріях і пластидах). У клітинах прокаріотів (бактерій і архей) кільцева або лінійна молекула ДНК, так званий нуклеоїд, міститься в цитоплазмі й прикріплена зсередини до клітинної мембрани. У них і у нижчих еукаріотів (наприклад дріжджів) трапляються також невеликі автономні кільцеві молекули ДНК, так звані плазміди. Крім того, одно- або дволанцюгові молекули ДНК можуть утворювати геном ДНК-вірусів.

З хімічної точки зору ДНК — це довга полімерна молекула, що складається з послідовності блоків — нуклеотидів. Кожний нуклеотид складається з азотистої основи, цукру (дезоксирибози) і фосфатної групи. Зв'язки між нуклеотидами в ланцюгу, утворюються дезоксирибозою й фосфатною групою. У переважній більшості випадків (окрім деяких вірусів, що містять одноланцюгові ДНК) макромолекула ДНК складається з двох ланцюгів, орієнтованих азотистими основами один проти одного. Ця дволанцюгова молекула утворює спіраль. У цілому структура молекули ДНК отримала назву «подвійної спіралі».

У ДНК зустрічається чотири види азотистих основ (аденін, гуанін, тимін і цитозин). Азотисті основи одного з ланцюгів сполучені з азотистими основами іншого ланцюга водневими зв'язками згідно з принципом комплементарності: аденін з'єднується тільки з тиміном, гуанін — тільки з цитозином.

Послідовність нуклеотидів дозволяє «кодувати» інформацію про різні типи РНК, найважливішими з яких є матричні (мРНК), рибосомні (рРНК) і транспортні (тРНК) та інші некодуючі РНК. Всі ці типи РНК синтезуються у процесі транскрипції на матриці ДНК, тобто шляхом копіювання послідовності ДНК у послідовність макромолекули РНК, за допомогою принципу комплементарності. Деякі види РНК, такі як мРНК, тРНК, рРНК за допомогою малих ядерних РНК беруть участь у біосинтезі білків (процесах транскрипції, сплайсингу і трансляції). Крім кодуючих послідовностей, ДНК клітини містить некодуючі послідовності, що виконують регуляторні та структурні завдання, або не виконують ніяких функцій.[1] Ділянки кодуючих послідовностей разом із регуляторними ділянками, називаються генами. Сукупність всіх генів, регуляторних послідовностей, некодуючих послідовностей, тобто вся нуклеотидна послідовність ДНК, незалежно від її функцій, утворює геном організму.

У геномах еукаріотів містяться також довгі послідовності без очевидної функції (некодуючі послідовності). Також у складі геному досить поширені генетичні паразити — транспозони та вірусні, або схожі на них, послідовності. Проте організм може використовувати транспозони для виконання певних завдань, також транспозони можуть впливати на еволюцію генів.[2]

Розшифровка структури ДНК, виконана в 1953 році, стала одною з поворотних віх в історії біології. За видатний внесок у це відкриття Френсісу Кріку, Джеймсу Ватсону і Морісу Вілкінсу була присуджена Нобелівська премія з фізіології або медицини 1962 року.

Хімічний склад ДНК

ДНК є полімерною молекулою, що складається з великої кількості мономерів — нуклеотидів. Так в одній молекулі ДНК хромосоми 1 людини знаходиться близько 248.96 мільйонів пар нуклеотидів[3]

Нуклеотиди

Докладніше: нуклеотиди
АденінГуанінТимінЦитозиндАМФ
Структури гетероциклічних основ і дезоксиаденозинмонофосфату (дАМФ), як прикладу нуклеотиду.

Замість залишку аденіну може бути інша азотиста основа

Дезоксирибонуклеїнова кислота є біополімером (поліаніоном), мономерами якого є нуклеотиди[4][5]. Кожен нуклеотид складається із залишку фосфорної кислоти, приєднаного за 5'-положенням до цукру дезоксирибози, до якого також через глікозидний зв'язок (C—N) за 1'-положенням приєднана одна з чотирьох азотистих основ. Саме наявність характерного цукру і складає одну з головних відмінностей між ДНК і РНК, зафіксовану в назвах цих нуклеїнових кислот (до складу РНК входить цукор рибоза)[6]. На малюнку показано чотири основи та один із нуклеотидів — дезоксаденозинмонофосфат, утворений приєднанням аденіну до дезоксирибози й фосфату.

Рибозне кільце у C2′-ендо та C3′-ендо конформаціях. Дезоксирибоза ДНК перебуває переважно у C2′-ендо конформації

Дезоксирибоза, що входить до складу молекули ДНК, знаходиться переважно в С2'-ендо конформації, на відміну від С3'-ендо конформації рибози в молекулах РНК: відсутність OH-групи у 2 положенні дезоксирибози робить С2'-ендо конформацію можливою. Це надає ДНК структурної міцності й ригідності, на відміну від молекули РНК.[7]

За структурою молекул азотисті основи, що входять до складу нуклеотидів, розділяють на дві групи: пуринові (аденін [A] і гуанін [G]), утворені сполученими п'яти- і шестичленним гетероциклами та піримідинові (цитозин [C] і тимін [T]) — утворені одним шестичленним гетероциклом[8].

Як виняток, наприклад, у бактеріофага PBS1, в ДНК зустрічається п'ятий тип основ — урацил (U), піримідинова основа, що зазвичай входить до складу РНК замість тиміну і відрізняється від тиміну відсутністю метильної групи на кільці[9]. Слід зазначити, що тимін і урацил не так строго пов'язані з ДНК і РНК відповідно, як це вважалося раніше. Так, після синтезу деяких молекул РНК значне число урацилів у цих молекулах метилюєтся за допомогою спеціальних ферментів, перетворюючись на тимін. Це відбувається в транспортних і рибосомних РНК[10].

Цукрофосфатний остов

Цукрофосфатний остов молекули ДНК з чотирьох нуклеотидів: C, G, A, T. Фосфатні групи позначені блакитно-зеленим, дезоксирибоза — сірим

Нуклеотиди поєднанні між собою фосфатними групами. Фосфатні групи формують фосфодіестерні зв'язки між третім і п'ятим атомами вуглецю сусідніх молекул дезоксирибози, в результаті взаємодії між 3-гідроксильною групою (3-ОН) однієї молекули дезоксирибози та 5-фосфатною групою (5-РО3) іншої. Фосфатна група разом з залишком дезоксирибози формує так званий цукрофосфатний остов молекули. Від цього остову відходять залишки азотистих основ убік.

Асиметричні кінці ланцюга ДНК називаються 3' (читається три-штрих) і 5' (п'ять-штрих). Полярність ланцюга грає важливу роль при синтезі ДНК (подовження ланцюга можливе тільки шляхом приєднання нових нуклеотидів до вільного 3'-кінцю).

Хімічні модифікації ДНК

Метилювання ДНК

Докладніше: Метилювання ДНК
Цитозин5-метилцитозинтимін
Структура цитозину без 5-метильної групи та з нею. Після дезамінування 5-метилцитозин має таку ж саме структуру, як і тимін

За певних умов основи ДНК піддаються хімічним модифікаціям, які можуть бути успадковані без заміни послідовності ДНК, і, таким чином, є частиною епігенетичного коду. Найпоширенішим і найкраще описаним механізмом хімічних модифікацій є метилювання основ ДНК, цитозину в еукаріотів і цитозину та аденіну у бактерій.

Метилювання ДНК виявлене у всіх клітинах еукаріотів, проте середній рівень метилювання відрізняється у різних організмів, так у нематоди Caenorhabditis elegans метилювання цитозину майже не спостерігається, а у хребетних виявлений високий рівень метилювання — до 1%[11]. Відомо, що рівень метилювання цитозину впливає на експресію генів: ділянки гетерохроматину (що характеризуються відсутністю або низьким рівнем транскрипції) корелюють із рівнем метилювання. Наприклад, метилювання цитозину з утворенням 5-Метилцитозину важливе для інактивації X-хромосоми[12]. Попри біологічну роль, 5-метилцитозин може спонтанно дезамінуватися, перетворюючись на тимін, тому метильований цитозин є джерелом підвищеного числа мутацій[13].

Крім контролю експресії генів та, в результаті, контролю клітинного циклу[14], бактерії використовують метилювання аденіну і цитозину для захисту проти патогенів у складі рестрикційно-модифікаційної системи.

Іншим добре описаним типом модифікацій основ є глікозилювання урацилу з утворенням «J-основи» в кінетопластидах[15].

Топологічна структура ДНК

Подвійна спіраль

Основний принцип формування двох спіралей ДНК. Фосфатний остов молекули тримає спіраль, тоді як азотисті основи за принципом комплементарності з'єднують водневими зв'язками два ланцюги спіралі. При цьому ланцюги розміщуються антипаралельно: 3'-кінець молекули з одного боку розміщується поруч з 5'-кінцем іншого ланцюга
Докладніше: Подвійна спіраль

Полімер ДНК має досить складну структуру. Нуклеотиди ковалентно сполучені між собою в довгі полінуклеотидні ланцюги. Ці ланцюги в переважній більшості випадків (окрім деяких вірусів, що мають одноланцюговий ДНК-геном), у свою чергу, попарно об'єднуються за допомогою водневих зв'язків у структуру, що отримала назву подвійної спіралі[16][6].

Як вже було сказано вище, у переважної більшості живих організмів ДНК складається не з одного, а з двох полінуклеотидних ланцюгів. Ці два довгі ланцюги закручені один навколо іншого у вигляді подвійної спіралі, що стабілізується водневими зв'язками, які утворюються між повернутими один до одного азотистими основами ланцюгів, що входять до неї. У природі ця спіраль зазвичай правозакручена. Напрями від 3'-кінця до 5'-кінця у двох ланцюгах, з яких складається молекула ДНК, протилежні (ланцюги «антипаралельні» один одному).

Ширина подвійної спіралі в її найпоширенішій B-формі становить від 22 до 24 Å, або 2,2 — 2,4 нм, а довжина кожного нуклеотиду 3,3 Å (0,33 нм)[17]. Довжина всієї молекули залежить від виду організму, та може складати від десятків мікрон у деяких вірусів до кількох метрів (в одній хромосомі) у деяких рослин. Подібно до того, як у гвинтових сходах збоку можна побачити сходинки, на подвійній спіралі ДНК в проміжках між фосфатним остовом молекули можна бачити ребра основ, кільця яких розташовані в площині, перпендикулярній до подовжньої осі макромолекули.

Параметри геометричної конформації між сусідніми парами основ у дволанцюговій ДНК

Подвійна спіраль ДНК має декілька параметрів конформації, які можна характеризувати:[18]

  • шифт (англ. shift, Dx), слайд (англ. slide, Dy), райз (англ. rise, Dz) — характеризують зсув однієї пари основ відносно іншої без зміни куту площини пар основ, так, що вони залишаються паралельними;
  • твіст (англ. twist, Ω), ролл (англ. roll, ρ), тилт (англ. tilt, τ) — характеризують повороти площин однієї пари основ відносно іншої;

Жолобки

Триланцюгова ДНК. Великий жолобок ДНК взаємодіє з третім ланцюгом ДНК (жовтий) через нетрадиційні, хугстинові водневі взаємодії

У подвійній спіралі розрізняють малий (12 Å) і великий (22 Å) жолобки[7] (борозенки)[19]. Білки, наприклад, фактори транскрипції, які приєднуються до певних послідовностей у дволанцюговій ДНК, зазвичай взаємодіють з краями основ у великому жолобку, де вони доступніші[20].

ДНК може мати триланцюгову форму[en] при утворенні зв'язків з третім ланцюгом ДНК (або РНК) у великому жолобку через формування окрім канонічних ватсон-кріківських пар, третю хугстинову водневу взаємодію[en].

Утворення зв'язків між основами

Докладніше: Пара основ

Нуклеотиди протилежних ланцюгів ДНК формують зв'язки між собою. В основному це відбувається завдяки водневим зв'язкам протилежних залишків азотистих основ, звідси назва, пара основ (англ. base pares, скорочено bp). Основним і найрозповсюдженішим типом пар основ є Ватсон-Кріківські (назва походить від імен учених Френсіса Кріка та Джеймса Ватсона, див. п. Історія дослідження ДНК)

Ватсон-Кріківські пари основ

Ватсон-Кріківські пари основ є найбільш поширеним типом формування пар основ між ланцюгами ДНК (та РНК) у природі.[21]

При традиційному Ватсон-Кріківському формуванні водневих зв'язків між нуклеотидами, кожна основа на одному з ланцюгів зв'язується з однією певною основою іншого ланцюгу. Таке специфічне зв'язування називається комплементарним. Пуринові основи комплементарні піримідиновим (тобто, здатні до утворення водневих зв'язків з ними): аденін утворює зв'язки тільки з тиміном, а цитозин — з гуаніном. У подвійній спіралі ланцюги також зв'язані за допомогою гідрофобної взаємодії та стекінгу, які не залежать від послідовності основ ДНК[22].

Комплементарність подвійної спіралі означає, що інформація, яка міститься в одному ланцюгу, міститься і в іншому ланцюгу. Оборотність і специфічність взаємодій між комплементарними парами основ важлива для реплікації ДНК і решти всіх функцій ДНК в живих організмах.

Оскільки водневі зв'язки нековалентні, вони легко розриваються і відновлюються. Ланцюги подвійної спіралі можуть розходитися як замок-змійка під дією ферментів (гелікази) або при високій температурі[23].

Різні пари основ утворюють різну кількість водневих зв'язків. Пари A-T зв'язані двома, G-C — трьома водневими зв'язками, тому на розрив пар GC потрібно більше енергії. Відсоток GC-пар і довжина молекули ДНК визначають кількість енергії, необхідної для дисоціації ланцюгів: довгі молекули ДНК з великим вмістом GC більш «тугоплавкі»[24].

Хугстинові пари основ

Приблизно 3% клітинної ДНК формує дуже нетривалі Хугстинові пари[en] (названі на честь біохіміка Карста Хугстина[en]). Така пара формується при розвороті пурину навколо глікозидного зв'язку на 180°.[21] Хугстинові пари основ формуються при утворенні триланцюгових ДНК або при утворенні чотириланцюгової ділянки, так званого G-квадруплексу, або G4, при цьому така структура стабільна.[25]

Синтетичні пари основ

Синтетичні пари основ (англ. Unnatural base pairs, UBP) це такі нуклеотиди ДНК, що створені в лабораторії та не зустрічаються в природі.[26] Ці нуклеотиди формують додаткову, третю пару основ так, що вона розпізнається ДНК-залежною ДНК-полімеразою під час реплікації ДНК чи полімеразної ланцюгової рекації. UBP зазвичай позначаються символами X та Y, хоча хімічна їхня структура не закріплена і варіює від дослідження до дослідження. Відомі синтетичні нуклеотидні пари Ds–Px, d5SICS[en]–dNaM[en] та TPT3–NaM[27]

Альтернативні форми подвійної спіралі

ДНК може існувати в кількох конформаціях. Нині ідентифіковано та описано такі: A-ДНК, B-ДНК, C-ДНК, D-ДНК[28], E-ДНК[29], H-ДНК[30], L-ДНК[28], P-ДНК[31] і Z-ДНК[32][33]. Проте тільки A-, B- і Z-форма ДНК спостерігалися в природних біологічних системах. Конформація, яку приймає ДНК, залежить від послідовності ДНК, величини та напрямку суперскрученості, хімічних модифікації основ і концентрації хімічних речовин у розчині, перш за все концентрацій іонів металів і поліамінів[34]. B-форма, описана вище, є найпоширенішою[35]. Альтернативні конформації подвійної спіралі відрізняються своєю геометрією та розмірами.

A-форма — ширша правостороння спіраль, з дрібнішою і ширшою малою борозенкою і вужчою і глибшою великою борозенкою. Ця форма зустрічається за нефізіологічними умовами в зневоднених зразках ДНК, крім того, вона, ймовірно, зустрічається в живих клітинах у гібридних комплексах ланцюгів ДНК і РНК, та в комплексах ферментної ДНК[36][37]. Сегменти ДНК із хімічно зміненими (метильованими) основами можуть проходити через більші конформаційні зміни та приймають Z-форму. Тут ланцюги закручуються в ліву подвійну спіраль, на відміну від правої спіралі B-форми[38]. Ці структури можуть розпізнаватися специфічними Z-ДНК-зв'язуючими білками й можуть бути залучені до регуляції транскрипції[39].

Просторова організація ДНК в клітинах

ДНК геному бактеріофага: фотографія під трансмісійним електронним мікроскопом

ДНК більшості природних геномів має дволанцюгову структуру — або лінійну (в еукаріотів, деяких вірусів і окремих видів бактерій), або кільцеву (у більшості бактерій та архей, хлоропластів і мітохондрій). Лінійну одноланцюгову ДНК містять деякі віруси, у тому числі бактеріофаги.

ДНК бактерій та архей зазвичай представлена однією кільцевою молекулою ДНК, розташованою в цитоплазмі у вигляді утворення неправильної форми, що називається нуклеоїдом[40].

У клітинах еукаріотів ДНК розташовується головним чином в ядрі у вигляді набору хромосом. ДНК різних хромосом в ядрі не сильно перекручується, хромосоми займають певні об'єми ядра — хромосомні території[en].[41]

Одна молекула хромосомної ДНК набагато довша, ніж діаметр ядра клітини. Так у людини загальна теоретична довжина всіх ДНК хромосом складає 2 метри, тоді як середній діаметр ядра клітини — 6 мкм.[42] Тому в клітині ДНК щільно запакована за допомогою різних білків хроматину. Проте задля зчитування генів білкові комплекси повинні тимчасово від'єднатися від ділянок ДНК, в яких відбувається транскрипція, тому таке пакування ДНК в клітині є динамічним і чітко регульованим.[41]

Нуклеосома, створена з октамеру гістонів та ДНК, накручену на них, плюс лінкерний гістон H1

Найменша структурна одиниця ДНК в клітині це ДНК, намотана на нуклеосому. Нуклеосома складається з восьми корових гістонів, довжина нуклеосомної ділянки ДНК складає 147 пар нуклеотидів. Для успішної реалізації генетичної інформації ДНК повинна від'єднатись від нуклеосоми, це може відбуватися АТФ-залежно за допомогою факторів, які беруть участь у транскрипції. Також модифікації частин нуклеосоми, гістонів, можуть ускладнювати чи полегшувати цей процес, що призводить до активації чи пригнічення активності генів (див. пункт Структурні та регуляторні білки та епігенетика)[43]

Вищий рівень організації геному включає взаємодію нуклеосоми з лінкерними гістонами, формуючи структуру під назвою хроматосома[44]

Доволі довгий час вважали, що хроматин далі формує специфічні структури, які мають назву 30-нм фібрили, яку можна було спостерігати в електронний мікроскоп in vitro. Проте на 2015 рік багато дослідників мають сумніви щодо існування 30-нм фібрили в живій клітині.[41]

Хроматин хребетних формує петлі, які дозволяють взаємодіяти лінійно далеким елементам ДНК, наприклад взаємодія енхансерів та промоторів. Довжина петель хроматину — тисячі нуклеотидів. Далі хроматин людини та миші, також частково D. melanogaster, формують ділянки великої кількості контактів всередині, розділені частинами хромосоми, які мало взаємодіють між собою. Такі ділянки називаються топологічно-асоційовані домени. Довжина ТАД від сотень тисяч до мільйонів пар основ. Вони бувають двох типів, A і B.[41]

Суперскрученість

Якщо узятися за кінці мотузки й почати скручувати їх у різні боки, вона стає коротшою і на мотузці утворюються великі «супервитки». Також може бути суперскручена й ДНК. У звичайному стані ланцюжок ДНК робить один оберт на кожні 10,4 основи, але в суперскрученому стані спіраль може бути згорнута тугіше або розплетена[45]. Виділяють два типи суперскрученості: позитивну — у напрямі нормальних витків, при якому основи розташовані ближче одна до одної; і негативну — в протилежному напрямку. У природі молекули ДНК зазвичай перебувають в стані негативної суперскрученості, який вноситься ферментами, — топоізомеразами[46]. Ці ферменти вилучають додаткову скрученість, що виникає в ДНК в результаті транскрипції та реплікації[47].

Специфічні структури

Теломера

Теломера, представлений T-петлею, 3'-кінцева послідовність якої формує D-петлю. Білкові комплекси, які зв'язані з теломерою: шелтерини[en] та інші
Докладніше: Теломера

На кінцях лінійних хромосом є спеціалізовані структури ДНК, що називаються теломерами. Основна функція цих ділянок — підтримка цілісності кінців хромосом[48]. Звичайна довжина теломерної ділянки в геномі людини та миші — від 5 до 100 kb.[49]

Теломери захищають кінці ДНК від деградації екзонуклеазами та запобігають активації систем репарації, які запускаються у відповідь на розриви ДНК і формування хромосомних аберацій — дицентричних хромосом[50]. Оскільки звичайна ДНК-полімераза не може реплікувати 3'-кінці хромосом, спеціальний фермент — теломераза — після кожного поділу клітини подовжує теломери. При цьому як матриця для подовження ДНК використовується довга некодуюча РНК TERC[en]. Вкорочення теломер є однією з теоретичних причин старіння клітин (див. Межа Гейфліка).

T-петля та D-петля

Послідовність теломер складається з декількох тисяч повторів шести нуклеотидів TTAGGG[51]. Ця структура закручується сама на себе, формуючи T-петлю, або теломерну петлю. 3'-кінець теломери має вигляд одноланцюгової ДНК завдовжки до декількох сотень нуклеотидів,[49] що приєднується до дволанцюгової ДНК. Це триланцюгове утворення називається D-петлею (від англ. displacement loop)[52].

Теломера зв'язана зі специфічними білковими структурами, такими як шелтерин[en].[49]

G-квадруплекс

Структура G-квадруплексу теломер. Зеленим кольором позначений іон металу, хелатований в центрі структури[53]

Послідовності з високим вмістом гуаніну стабілізують кінці хромосом, формуючи дуже незвичайні структури, які називають G-квадруплексами і які складаються з чотирьох, а не двох взаємодійних основ. Чотири гуанінових основи, всі атоми яких знаходяться в одній площині, утворюють пластинку, стабілізовану водневими зв'язками між основами та хелатованим у центрі іоном металу (найчастіше калію). Ці пластинки складаються стопкою одна над іншою[52].

G-квадруплекси можуть формувати теломерні ділянки, проте більшість G4 не знаходиться на теломерах. У клітинних лініях HaCaT знайдено близько 10000 G4, більшість з яких розташовані в вільних від нуклеосом ділянках які активно транскрибуються.[25] Біологічна роль G-квадруплеків не до кінця вивчена, проте формування таких структур може впливати на активність генів. Такі структури можуть запобігати проходженню ДНК-полімерази під час реплікації ДНК, що у свою чергу може призвести до пошкодження ДНК, тому для нормальної реплікації G-квадруплекси повинні бути "розкручені" спеціальними ферментами, хеліказами.[25]

Взаємодія з білками

Взаємодія нуклеосоми (синя) з ДНК (коричнева)

Всі функції ДНК залежать від її взаємодії з білками. Взаємодії можуть бути як неспецифічними, коли білок приєднується до будь-якої молекули ДНК, або залежати від наявності особливої послідовності. Ферменти також можуть взаємодіяти з ДНК. Найважливіші з них — полімерази, що копіюють послідовність основ ДНК на РНК у процесі транскрипції, а також на нову ДНК при синтезі нового ланцюга — реплікації.

Структурні і регуляторні білки

Хроматин

Докладніше: Хроматин

У клітинах ДНК не перебуває у вільному вигляді, натомість вона зв'язана зі структурними білками, утворюючи компактну структуру — хроматин. У випадку еукаріотів та багатьох архей хроматин утворюється за допомогою невеликих лужних білків — гістонів. У решти архей та бактерій ДНК менш щільно упакована за допомогою ряду інших білків, хоча серед них і знайдені гомологічні гістонам білки[54][55][56][57].

Гістони формують кулясті білкові структури — нуклеосоми, навколо кожної з яких вміщається два оберти спіралі ДНК з 147 нуклеотидів. Тобто одна молекула ДНК буде взаємодіяти з великою кількістю нуклеосом, це допомагає компактизвувати ДНК, що часто має розміри на декілька порядків довші, ніж діаметр клітини, у клітинне ядро (див. п. Просторова організація ДНК в клітинах)[58]. Зв'язки між гістонами та ДНК не залежать від конкретної послідовності нуклеотидів ДНК, і утворюються за рахунок іонних зв'язків лужних амінокислот гістонів і кислотних залишків цукрофосфатного остову ДНК[59]. Хімічні модифікації цих амінокислот включають метилювання, фосфорилювання і ацетилювання[60]. Ці хімічні модифікації змінюють силу взаємодії між ДНК і гістонами, впливаючи на доступність специфічних послідовностей для факторів транскрипції і змінюючи швидкість транскрипції[61]. Нуклеосоми повинні бути від'єднані від молекули ДНК для проходження транскрипції та реплікації. У тих генів, які мають високий рівень транскрипції, їхні регуляторні ділянки на початку гена — промотори — часто мають вільну від нуклеосом ділянку (англ. nucleosome-free region, NFR)[41][62]

Інші білки у складі хроматину, які приєднуються до неспецифічних послідовностей, — білки з високою рухливістю в гелях, що асоціюють переважно із зігнутою ДНК[63]. Ці білки важливі для утворення в хроматині структур вищого порядку[64].

Фактор транскрипції AP-1[en], зв'язаний з ДНК

У сперматозоїдах тварин переважна більшість гістонових білків замінюється на протаміни під час сперматогенезу, це дозволяє щільніше запакувати ДНК в ядрі сперматозоїда. Протаміни та ДНК формують тороїдно-подібні структури, діаметром 50-100 нм.[65]

Фактори транскрипції та інші білки

Особлива група білків, що приєднуються до ДНК, — білки, які асоціюють з одноланцюговою ДНК. Найкраще охарактеризований білок цієї групи у людини — реплікаційний білок А, без якого неможливе протікання більшості процесів, де розплітається подвійна спіраль, включаючи реплікацію, рекомбінацію і репарацію ДНК. Білки цієї групи стабілізують одноланцюгову ДНК і запобігають формуванню стебел-петель або деградації ДНК нуклеазами[66].

Водночас інші білки розпізнають специфічні послідовності й приєднуються до них. Найбільш вивчена група таких білків — різні класи факторів транскрипції, тобто білки, що регулюють транскрипцію. Кожен з цих білків розпізнає свою послідовність, часто в промоторі, й активує або пригнічує транскрипцію гену. Це відбувається при асоціації факторів транскрипції з РНК-полімеразою або безпосередньо, або через білки-посередники. Полімераза асоціює спочатку з білками, а потім починає транскрипцію[67]. В інших випадках фактори транскрипції можуть приєднуватися до ферментів, які модифікують гістони, що знаходяться на промоторах, і, таким чином, змінюють доступність ДНК для полімераз[68].

Оскільки специфічні послідовності зустрічаються в багатьох місцях геному, зміни в активності одного типу факторів транскрипції можуть змінити активність тисяч генів[69]. Відповідно, ці білки часто регулюються в процесах відповіді на зміни в навколишньому середовищі, розвитку організму і диференціацію клітин. Специфічність взаємодії факторів транскрипції з ДНК забезпечується численними контактами між амінокислотами і основами ДНК, що дозволяє їм «читати» послідовність ДНК. Більшість контактів з основами відбуваються в головній борозенці, де основи доступніші.[20]

Ферменти, що модифікують ДНК

Топоізомерази і гелікази

Докладніше: Топоізомераза та Гелікази

У клітині ДНК перебуває в суперскрученому стані, що дозволяє їй досягти компактнішої організації. Для протікання багатьох процесів життєдіяльності ДНК повинна бути розкручена, що виконується двома групами білків — топоізомеразами і геліказами.

Топоізомерази — ферменти, які мають як нуклеазну, так і лігазну активності. Ці білки змінюють топологію, зокрема ступінь суперскрученості ДНК. Деякі з цих ферментів розрізають подвійну спіраль ДНК і дозволяють обертатися одному з ланцюгів, тим самим зменшуючи рівень суперскрученості, після чого фермент заклеює розрив[46]. Інші ферменти можуть розрізати один з ланцюгів і проводити другий ланцюжок через розрив, а потім лігувати розрив в першому ланцюгу[70]. Топоізомерази необхідні в багатьох процесах, пов'язаних з ДНК, таких як реплікація і транкрипція[47].

Гелікази — білки, що належать до молекулярних моторів. Вони використовують хімічну енергію нуклеозидтрифосфатів, найчастіше АТФ, для розриву водневих зв'язків між основами, розкручуючи подвійну спіраль на окремі ланцюги[71]. Ці ферменти важливі для більшості процесів, де білкам необхідний доступ до основ ДНК.

Нуклеази і лігази

Докладніше: Нуклеази та ДНК-лігаза
Лігаза (блакитна) формує фосфодіестерний зв'язок між 5' фосфорною групою та 3'-OH групою одноланцюгового розриву ДНК, відновлюючи цукрофосфатний остов ДНК

У різних процесах, що відбуваються в клітині, наприклад, рекомбінації і репарації, беруть участь ферменти, здатні розрізати і відновлювати цілісність ланцюгів ДНК. Ферменти, що розрізають ДНК, називаються нуклеазами. Нуклеази, які гідролізують нуклеотиди на кінцях молекули ДНК, називаються екзонуклеазами, а нуклеази, що розрізають ДНК усередині ланцюга — ендонуклеазами. Нуклеази, що найчастіше використовуються в молекулярній біології і генетичній інженерії, входять до класу рестриктаз, які розрізають ДНК біля специфічних послідовностей. Наприклад, фермент EcoRV (рестрикційний фермент № 5 бактерії E. coli) розпізнає шестинуклеотидну послідовність 5'-GAT|ATC-3' й розрізає ДНК у місці, вказаному вертикальною лінією. У природі ці ферменти захищають бактерії від зараження бактеріофагами, розрізаючи ДНК фага, коли вона вводиться в клітину бактерії. Власна ДНК бактерії захищена від рестриктаз за допомогою метилювання. У цьому випадку нуклеази — частина рестрикційно-модифікаційної системи[72].

ДНК-лігази зшивають цукрофосфатні остови молекул ДНК, використовуючи енергію АТФ. Вони особливо важливі в процесах реплікації ланцюга, що запізнюється, з'єднуючи між собою фрагменти Окадзакі. Крім того, вони використовуються в репарації ДНК і гомологічній рекомбінації[73]. У лабораторних дослідженнях лігази широко використовуються в клонуванні і фінґерпринтингу.

Полімерази

Докладніше: Полімерази

Інша важлива для метаболізму ДНК група ферментів — полімерази — синтезують ланцюги полінуклеотидів з нуклеозидтрифосфатів. Вони додають нуклеотиди до 3'-гідроксильної групи попереднього нуклеотиду в ланцюгу ДНК, тому всі полімерази працюють у напрямі 5' → 3'[74][75]. У активному центрі цих ферментів субстрат — нуклеозидтрифосфат — злучається з комплементарною основою у складі одноланцюгового полінуклеотидного ланцюга — матриці.

У залежності від матриці, яку використовує полімераза, та від продукту, який вона синтезує, полімерази ділять на декілька типів.

ДНК-залежна ДНК-полімераза

У процесі реплікації ДНК ДНК-залежна ДНК-полімераза синтезує копію початкової послідовності ДНК. У цьому процесі дуже важлива точність, оскільки помилки полімеризації приведуть до мутацій, тому багато полімераз мають здатність до «редагування» — виправлення помилок. Полімераза дізнається про помилки в синтезі за відсутністю спаровування між неправильними нуклеотидами. Після визначення відсутності спаровування активується 3' → 5'-екзонуклеазна активність полімерази й неправильна основа вилучається[76]. У більшості організмів ДНК-полімерази працюють у вигляді великого комплексу, що в бактерій називається реплісомою. Вона містить численні додаткові субодиниці, наприклад, гелікази[77].

РНК-залежна ДНК-полімераза

РНК-залежні ДНК-полімерази (зворотні транскриптази) — спеціалізований тип полімераз, які копіюють послідовність РНК на ДНК. До цього класу ферментів належить вірусна зворотна транскриптаза, яка використовується ретровірусами при інфекції клітин, а також теломераза, необхідна для реплікації теломер, та фермент зворотної транскриптази деяких трансозонів[78]. Теломераза — РНК-білковий комплекс, що містить власну матричну РНК, яка й використовується для зворотної транскрипції[50].

ДНК-залежна РНК-полімераза

Транскрипція здійснюється ДНК-залежною РНК-полімеразою, яка копіює послідовність ДНК одного ланцюга на мРНК. На початку транскрипції гену РНК-полімераза приєднується до послідовності на початку гена, промотором, і розплітає спіраль ДНК. Потім вона копіює послідовність гену на матричну РНК доти, доки не дійде до ділянки ДНК в кінці гена — термінатора, де вона зупиняється і від'єднується від ДНК. Окрім того, ДНК-залежна ДНК-полімераза людини, РНК-полімераза II, яка транскрибує більшу частину генів людини, працює у складі великого білкового комплексу, що містить регуляторні й додаткові субодиниці[79].

Біологічні властивості ДНК

ДНК є носієм генетичної інформації, записаної у вигляді нуклеотидної послідовності за допомогою генетичного коду. З молекулами ДНК зв'язані дві основні властивості живих організмів — спадковість і мінливість. У ході процесу, що називається реплікацією ДНК, з початкового, материнського, ланцюга, утворюються дві копії ДНК, які успадковуються дочірніми клітинами при поділі. Клітини, що утворилися таким чином, будуть генетично ідентичними. Потрібна для клітинної життєдіяльності генетична інформація зчитується при експресії генів. У багатьох випадках вона використовується для біосинтезу білків у процесах транскрипції (синтезу молекул РНК на матриці ДНК) і трансляції (синтезу білків на матриці РНК).

Послідовність нуклеотидів «кодує» інформацію про різні типи РНК: кодуючі — матричні (мРНК) — та некодуючі — рибосомні (рРНК), транспортні (тРНК), каталітичні та інші. Всі ці типи РНК синтезуються на основі ДНК у процесі транскрипції. Їхня роль у біосинтезі білків та інших процесах життєдіяльності клітини різна. Матрична РНК містить інформацію про послідовність амінокислот у білку, рибосомальні РНК служать основою для рибосом (складних нуклеопротеїнових комплексів, основна функція яких — збірка білка з окремих амінокислот на основі мРНК), транспортні РНК доставляють амінокислоти до місця збірки білків — в активний центр рибосоми, що рухається по мРНК, проте синтезуються також некодуючі РНК, які можуть виконувати різноманітні регуляторні функції.

Реплікація

Реплікація ДНК: з одної материнської молекули ДНК формуються дві дочірні, ідентичні ДНК
Докладніше: Реплікація ДНК

Поділ клітини необхідний для розмноження одноклітинних і росту багатоклітинних організмів, але до поділу клітина повинна подвоїти геном, щоб дочірні клітини містили ту ж генетичну інформацію, що і початкова клітина. ДНК подвоюється у процесі реплікації[80], що протікає за напівконсервативним механізмом: два ланцюги розділяються, і потім кожна комплементарна послідовність ДНК відтворює для себе пару за допомогою ферменту ДНК-полімераза. Цей фермент будує полінуклеотидний ланцюжок, знаходячи правильний нуклеотид через комплементарне спаровування основ і приєднуючи його до зростаючого ланцюга. ДНК-полімераза, що здійснює більшу частину синтезу (Pol III прокаріотів або Pol δ еукаріотів) не може розпочати синтез нового ланцюга, а тільки нарощує вже існуючий, тому вона потребує наявності праймерів, ділянок ДНК, синтезованих за допомогою спеціальної РНК-полімерази праймази. Оскільки ДНК-полімерази можуть будувати ланцюжок тільки у напрямку 5' → 3', для копіювання антипаралельних ланцюгів використовуються складні механізми з залученням великої кількості білків[81], і цей ланцюг копіюється переривчасто, невеликими ділянками — фрагментами Окадзакі, довжиною близько 200 bp.[82]

Генетична рекомбінація

Рекомбінація відбувається в результаті фізичного розриву в хромосомах (М) і (F) і подальшого з'єднання в іншому порядку з утворенням двох нових хромосом (C1 та C2)

Подвійна спіраль ДНК зазвичай не взаємодіє з іншими сегментами ДНК, а в клітинах еукаріотів різні хромосоми просторово розділені в ядрі[83] і займають свої хромосомні території. Проте в певні періоди клітинного циклу (мейоз або репарація) гомологічні хромосоми можуть обмінюватися нуклеотидними послідовностями.

У процесі рекомбінації дві спіралі ДНК розриваються, після чого безперервність спіралей відновлюється, але не обов'язково в правильному порядку, тому обмін ділянками хромосом може привести до пошкодження цілісності генетичного матеріалу. З іншого боку, рекомбінація дозволяє хромосомам обмінюватися генетичною інформацією, в результаті цього утворюються нові комбінації генів, що збільшує ефективність природного добору й важливо для швидкої еволюції нових білків[84].

У процесі негомологічної рекомбінації (негомологічного з'єднання кінців), що виникає в результаті зовнішніх пошкоджень, дві спіралі ДНК розриваються, після чого неперервність спіралей відновлюється в процесі репарації клітиною дволанцюгових розривів ДНК[85], але не обов'язково в правильному порядку. Тому обмін ділянками негомологічних хромосом може привести до пошкодження цілісності генетичного матеріалу в результаті розриву генів або розриву регуляторних зв'язків — транслокацій.

Найпоширеніша форма рекомбінації — гомологічна рекомбінація — коли рекомбінація виникає між гомологічними хромосомами, тобто хромосомами, що мають дуже схожі послідовності (що зазвичай утворюються в організмах зі статевим розмноженням під час мейозу). Іноді як гомологічні ділянки виступають транспозони. Реакція гомологічної рекомбінації каталізується ферментами, які називаються рекомбіназами, наприклад, Cre. На першому етапі реакції рекомбіназа робить розрив в одному з ланцюгів ДНК, дозволяючи цьому ланцюгу відокремитися від комплементарного ланцюга й приєднається до одного з ланцюгів другої хроматиди. Інший розрив в ланцюгу другої хроматиди дозволяє їй також відокремитися і приєднається до ланцюга, що залишився без пари, з першої хроматиди, формуючи структуру Холідея. Структура Холідея може пересуватися вздовж сполученої пари хромосом, міняючи ланцюги місцями. Реакція рекомбінації завершується, коли фермент розрізає з'єднання, а два ланцюги лігуються[86].

Пошкодження ДНК

Докладніше: Мутація
Інтеркальована хімічна сполука, що знаходиться в середині спіралі ДНК, — бензопірен, основний мутаген тютюнового диму[87]

ДНК може пошкоджуватись різноманітними мутагенами, до яких належать окиснюючі й алкілюючі речовини, а також високоенергетична електромагнітна радіація — ультрафіолетове й рентгенівське випромінювання. Тип пошкодження ДНК залежить від типу мутагена. Наприклад, ультрафіолет пошкоджує ДНК шляхом появи в ній димерів тиміну, які утворюються при формуванні ковалентних зв'язків між сусідніми основами[88].

Активні форми кисню, наприклад «вільні» радикали або перекис водню призводять до кількох типів пошкодження ДНК, включаючи модифікації основ, особливо гуанозину, а також дволанцюгові розриви в ДНК[89]. За деякими оцінками у кожній клітині людини близько 500 основ пошкоджуються окислюючими сполуками щодня[90][91]. Серед різних типів пошкоджень найнебезпечніші — дволанцюгові розриви, тому що вони важко репаруються і можуть призвести до втрат ділянок хромосом (делецій) і транслокацій.

Багато молекул мутагенів вставляються (інтеркалюються) між двома сусідніми парами основ. Більшість цих сполук, наприклад, бромистий етидій, даунорубіцин, доксорубіцин і талідомід, мають ароматичну структуру. Для того, щоб ароматична сполука могла вміститися між основами, вони повинні розійтися, розплітаючи й порушуючи структуру подвійної спіралі. Ці зміни в структурі ДНК перешкоджають транскрипції і реплікації, викликаючи мутації. Тому інтеркалюючі речовини часто є канцерогенами, найвідоміші з яких — бензопірен, акридини, афлатоксини і бромистий етидій[92][93][94], хоча прямих доказів мутагенної дії на людину від бромистого етидію не знайдено,[95] тому це питання залишається контраверсійним. Попри ці негативні властивості, в силу своєї здатності пригнічувати транскрипцію і реплікацію ДНК, деякі речовини, що інтеркалюють до ДНК, використовуються в хіміотерапії для пригнічення швидкого росту ракових клітин[96].

Виправлення пошкодження ДНК

Докладніше: Репарація ДНК

Прокаріоти і ядерні організми мають системи виправлення пошкоджень молекули ДНК. У залежності від типу пошкоджень, репарація може бути дволанцюгових чи одноланцюгових розривів ДНК, чи вилучення неправильного, некомплементарного нуклеотиду з одного ланцюга і заміщення його комплементарним. [97]

Біологічні ролі ДНК

Функціональна послідовність ДНК

Докладніше: Ген та Геном

Генетична інформація геному складається з генів. Ген — одиниця передачі спадковій інформації, що має вигляд безперервної ділянки ДНК і впливає на певну характеристику організму. Білок-кодуючі гени містять відкриту рамку зчитування, яка транскрибуєтся, а також регуляторні послідовності, наприклад, промотори і енхансери, які контролюють експресію генів. Некодуючі РНК відкритих рамок зчитування переважно не мають, проте регуляторні послідовності в них є.

У багатьох організмах тільки мала частина загальної послідовності геному кодує білки. Так тільки близько 1,5% геному людини складається з екзонів, що кодують білок, а понад 50% ДНК складається з повторюваних некодуючих послідовностей ДНК, таких як Alu-повтори[98]. Причини існування такої великої кількості некодуючої ДНК в еукаріотичних геномах і величезна різниця в розмірах геномів (C-значення) — одна з нерозв'язаних наукових загадок[99].

Послідовності геному, що не кодують білок

Докладніше: Некодуюча ДНК

Традиційно некодуючі послідовності ДНК, за винятком промоторів, що безпосередньо передують відкритим рамкам зчитування, розглядалися як «сміттєва ДНК» (англ. junk DNA). Проте тепер накопичується дедалі більше даних, що суперечать цій ідеї й свідчать про різноманітні корисні функції цих послідовностей. Теломери і центромери містять мале число генів, але вони важливі для функціонування і стабільності хромосом[50][100]. Розповсюджена форма некодуючих послідовностей людини — псевдогени, копії генів, інактивовані в результаті мутацій[101]. Ці послідовності є чимось подібним до молекулярних скам'янілостей, хоча іноді вони можуть слугувати початковим матеріалом для дуплікації і подальшої дивергенції генів[102].

Інший тип некодуючої ДНК, що однак транскрибується в РНК — інтрони. Інтрони також є джерелом різноманітності білків в організмі, бо можуть використовуватися як «лінії розрізу і склеювання» при альтернативному сплайсингу[103]. Нарешті, послідовності ДНК, що не кодують білок, можуть кодувати допоміжні клітинні РНК, наприклад малі ядерні РНК[104].

Проєкт Енциклопедії елементів ДНК призначений для встановлення відсотку транскрипції геному та ролі транскрибованих з нього продуктів. За даними ENCODE 2012, у людини приблизно 20,5 тисяч білок-кодуючих генів, що закодовані у 2,94% геному, але якщо брати лише екзони, то ця цифра буде 1,22%. Разом з тим було знайдено майже 9 тисяч малих РНК та близько 9,5 тисяч довгих некодуючих РНК та трохи більше 11 тисяч псевдогенів.[105]

Транскрипція і трансляція

Генетична інформація, закодована в ДНК, повинна бути прочитана і зрештою виражена в синтезі різних біополімерів, з яких складаються клітини. Послідовність основ у ланцюгу ДНК безпосередньо визначає послідовність основ у РНК, на яку вона «переписується» в процесі, що називається транскрипцією.

У випадку мРНК послідовність нуклеотидів визначає амінокислоти білка. Співвідношення між нуклеотидною послідовністю мРНК і амінокислотною послідовністю білків визначається правилами трансляції, які називаються генетичним кодом. Генетичний код складається із кодонів, тринуклеотидних послідовностей (наприклад АСТ, CAG, ТТТ тощо), що безпосередньо слідують одна за одною.

Під час транскрипції нуклеотиди гену копіюються на РНК, що синтезується РНК-полімеразою. Ця копія у разі мРНК декодується рибосомою, яка «зчитує» послідовність мРНК, здійснюючи спаровування матричної РНК з ділянками транспортних РНК, комплексів РНК і амінокислот у процесі трансляції. Оскільки в тринуклеотидних комбінаціях використовуються 4 основи, всього можливі 64 кодони (43 комбінації). Кодони кодують 20 стандартних амінокислот, кожній з яких у більшості випадків відповідає більш ніж один кодон. Один з трьох кодонів, які розташовуються в кінці мРНК, не кодує амінокислоту і визначає кінець білка. Це стоп- або нонсенс-кодони (у більшості організмів — TAA, TGA, TAG).

З ДНК також зчитуються різні некодуючі РНК — молекули, нуклеотидна послідовність яких не буде переведена в амінокислотну послідовність білків. Такі нкРНК можуть виконувати в клітині різноманітні функції, включаючи участь у біосинтезі білків, трансляції, регуляції експресії генів, топологічної організації геномної ДНК тощо.[106]

Еволюція метаболізму ДНК

ДНК містить генетичну інформацію, яка робить можливою життєдіяльність, ріст, розвиток і розмноження всіх сучасних організмів. Проте невідомо протягом якого часу з чотирьох мільярдів років історії життя на Землі ДНК була головним носієм генетичної інформації. Існують гіпотези, що РНК грала центральну роль в обміні речовин, оскільки вона може як переносити генетичну інформацію, так і здійснювати каталіз за допомогою рибозимів[107][108][109]. Крім того, РНК — один із основних компонентів «фабрик білка» — рибосом. Стародавній РНК-світ, де нуклеїнова кислота використовувалася і для каталізу і для перенесення інформації, міг послужити зародком сучасного генетичного коду, що складається з чотирьох основ. Це могло відбутися в результаті того, що число основ в організмі було компромісом між невеликим, що збільшувало точність реплікації, й великим, що збільшувало каталітичну активність рибозимів[110].

На жаль, стародавні генетичні системи не дожили до наших днів. ДНК в найкращих умовах навколишнього середовища зберігається протягом 1 мільйона років, а потім деградує до коротких фрагментів. Отримання ДНК й визначення послідовності генів 16S рРНК з комах, загрузлих в бурштині, який утворився 250 млн років тому, та бактеріальних спор[111] служить темою жвавої дискусії в наукових колах[112][113]. Проте дослідження вказують на те, що навіть за оптимальних умов замороження до -5 C° і перебування в такому стані, кожен зв'язок в молекулі ДНК зруйнується після 6,8 мільйонів років. Проте інформація, яку можна взяти з послідовності ДНК, перестане бути доступною за значно коротший період у 1,5 мільйонів, оскільки за цей період ДНК зруйнується до надто коротких фрагментів. Цього періоду недостатньо навіть для визначення послідовності ДНК динозаврів, які жили мінімум 65 мільйонів років тому[114]

Використання ДНК в технології

Виділення ДНК методом спиртової преципітації. ДНК виглядає як клубок білих ниток

Методи роботи з ДНК

З розвитком молекулярної біології було розроблено багато методів роботи з ДНК. Ці методи перш за все включають виділення ДНК, зазвичай за допомогою руйнування клітин, що містять необхідну ДНК, та спиртової преципітації ДНК з розчину. При необхідності ДНК очищують за допомогою адсорбційної хроматографії. Більші кількості ДНК можна одержати за допомогою полімеразної ланцюгової реакції (ПЛР), що вимагає лише кількох молекул ДНК, але дозволяє ампліфікувати лише відносно невеликі ділянки ДНК, зазвичай до 1500 bp, або молекулярного клонування для ділянок більшої довжини.

Отримана ДНК може бути проаналізована за допомогою рестрикційного аналізу, тобто розрізання ДНК на певних ділянках за допомогою рестриктаз, та розділення отриманих фрагментів за допомогою гелевого електрофорезу, а потім, якщо необхідно, їхньої візуалізації за допомогою саузерн-блоту. У деяких випадках можливий одночасний аналіз цілих геномів, для чого використовуються ДНК-мікрочипи, тобто матриці, на які нанесені флюоресцентно мічені комплементарні ДНК, що дозволяє проведення порівняльної гібридизації геномів та аналіз рівня експресії багатьох генів одночасно (хоча в останньому випадку мова йде про детекцію РНК, а не ДНК).

Ще одним з поширених методів роботи з ДНК є секвенування, тобто встановлення її нуклеотидної послідовності. Численні проєкти секвенування та аналізу ДНК в останні роки 20-го століття та на початку 21-го привели до встановлення послідовностей та опису геномів багатьох організмів всіх головних таксономічних груп. Найбільшим та найвідомішим з них став проєкт геному людини. Тоді як проєкт ENCODE (Енциклопедія елементів ДНК) спрямований на встановлення функцій різних ділянок ДНК геному людини. Функціями мишачого геному займається mouse ENCODE. [115]

У випадках, коли досліджується експресія генів, з клітин виділяють не ДНК, а РНК, яка потім за допомогою зворотної транскрибції переводиться у кДНК. Найбільш уживані методи для вивчення рівня експресії генів це qПЛР

Генна інженерія

Сучасні біологія і біохімія інтенсивно використовують методи, засновані на рекомбінантній ДНК. Рекомбінантна ДНК — штучно створена послідовність ДНК, частини якої можуть бути синтезовані хімічним шляхом, за допомогою ПЛР, або клонуванні з ДНК різних організмів. Рекомбінантні ДНК можуть бути трансформовані в клітини живих організмів у складі плазмід або вірусних векторів[116]. Генетично модифіковані тварини і рослини зазвичай містять рекомбінантні гени, вбудовані в їхні хромосоми. Тоді як генетично модифіковані бактерії і дріжджі використовуються для виробництва рекомбінантних білків, тварини використовуються в медичних дослідженнях[117], а рослини з покращеними харчовими якостями — в сільському господарстві[118][119].

Судово-медична експертиза

Тест на батьківство. ДНК зразки дитини (Д) повинні бути комбінацією розмірів смуг на гелі від матері (М) та батька. У цьому випадку батьком є кандидат #1

Судмедексперти використовують знайдені на місці злочину ДНК крові, сперми, шкіри, слини або волосся для ідентифікації злочинця. Процес ідентифікації називається генетичним фінґерпринтингом або визначенням картини (профайлу) ДНК. У фінґерпринтингу порівнюється варіабельні ДНК геному, наприклад, тандемні повтори: мікросателіти й мінісателіти різних людей. Це надійний метод визначення особистості[120], хоча визначення може бути утруднене при забрудненні сцени злочину ДНК інших людей[121].

Фінґерпринтинг був розроблений в 1984 році британським генетиком Алеком Джеффрейсом (Alec Jeffreys)[122] і вперше використаний як доказ у суді над Коліном Пітчфорком (Colin Pitchfork) в справі, де він був звинувачений у вбивстві й зґвалтуванні[123].

Наразі в багатьох західних країнах, наприклад, Великій Британії і США, у злочинців, звинувачених у злочинах деяких типів, забирається зразок ДНК для бази даних. Це допомогло визначити винних в раніше нерозкритих злочинах, оскільки ДНК зберігається на речових доказах. Ще цей метод використовується для визначення особи у разі масової загибелі людей[124] та багатьох інших тестах.

Також метод генетичного фінґерпринтингу використовується для проведення тесту на батьківство, встановлення відповідності донорських органів, діагностики генетичних хвороб та дослідження популяцій тварин.

Біоінформатика

Біоінформатика включає обробку даних (data mining), що міститься в послідовності ДНК. Розвиток комп'ютерних методів зберігання і пошуку такої інформації привів до розвитку таких напрямів інформатики, що знайшли й інше застосування, як SSA (string searching algorithm), машинне навчання і організація баз даних[125]. Алгоритми типу ССА, які шукають певну послідовність «букв» у більшій послідовності букв, були розроблені для пошуку специфічних послідовностей нуклеотидів[126]. В інших комп'ютерних застосуваннях, наприклад, текстових редакторах найпростіші алгоритми справляються з цим завданням, але прогляд послідовності ДНК належить до складних задач, тому що вони дуже великі й складаються всього з чотирьох букв. Схожа проблема виникає при порівнянні послідовностей із різних організмів (sequence alignment), яке використовується у вивченні філогенетичних взаємин між цими організмами й функцій білків[127]. Дані про послідовність цілих геномів, одним з найскладнішим з яких є геном людини, важко використовувати без опису, що вказує на положення генів і регуляторних послідовностей на кожній хромосомі. Ділянки ДНК, послідовності якої містять фрагменти, асоційовані з генами, що кодують білки або РНК, можуть бути знайдені за допомогою спеціальних алгоритмів, які дозволяють передбачити наявність продуктів експресії генів до їхнього виявлення в результаті експериментів[128].

(А) «Плитка», яка складається з чотирьох молекул ДНК, орієнтованих під кутом 90° одна щодо іншої. З цих плиток можна побудувати ДНК-наномережу (Б)

ДНК і комп'ютери нового покоління

Докладніше: ДНК-комп'ютер

ДНК вперше була використана в обчислювальній техніці для розв'язку задачі пошуку гамільтонового шляху, окремого випадку NP-повної задачі[129]. ДНК-комп'ютер має переваги над електронними комп'ютерами, оскільки теоретично вимагає менше енергії, займає менше місця і ефективніший завдяки можливості одночасних підрахунків (див. Паралельні обчислення). Інші задачі, наприклад, задача автоматів, задача здійсненності бульових формул і варіант задачі комівояжера були проаналізовані за допомогою ДНК-комп'ютерів[130]. Завдяки компактності ДНК вона теоретично може знайти застосування в криптографії, де може використовуватися для конструювання одноразових шифроблокнотів[131].

Історія і антропологія

Оскільки з часом в ДНК накопичуються мутації, які потім передаються у спадок, вона містить історичну інформацію, тож генетики можуть досліджувати еволюційну історію організмів (філогенетику)[132].

Філогенетика — метод еволюційної біології. Якщо порівнюються послідовності ДНК усередині виду, еволюційні генетики можуть довідатися історію окремих популяцій. Ця інформація може бути корисною в різних галузях науки, починаючи з екологічної генетики й закінчуючи антропологією. Наприклад, при дослідженні як мітохондріальної, так і ядерної ДНК твердих тканин (зубів та кісток) мумій було встановлено, що стародавні Єгиптяни більш споріднені до стародавніх Європейців ніж до сучасних Єгиптян. Їхні найближчі родичі проживали в місцевості Левант під час неоліту та бронзової доби.[133]

Іншим прикладом використання послідовності ДНК для встановлення еволюції людини може бути аналіз неандертальського геному і встановлення, що впродовж історії неандертальці парувалися з H. sapiens[134]

ДНК у культурі

«Подвійна спіраль ДНК», Кембриджський університет, скульптор Чарлз Дженкс[en], 2005

Структура молекули ДНК була відкрита у 1953 році та з того часу надихала художників і скульпторів своєю оригінальною формою. На честь подвійної спіралі ДНК побудовано декілька скульптур в рамках проєкту американського скульптора Чарлза Дженкса[en], зокрема встановлена на Кембриджських скульптурних стежках[de] у кампусі Кембриджського університету 2005 року «Подвійна спіраль ДНК».[135] Уособлює подвійну спіраль також Міст Подвійної спіралі у Сінгапурі, відкритий 2010 року.[136] 50-річчю відкриття структури ДНК присвячена 2-фунтова монета Великої Британії авторства скульптора Джона Міллза[en], викарбувана 2003 року.[137]

Прочитання послідовності ДНК людини та інших організмів призвело до появи інструментів, які представляють запис нуклеотидів у вигляді нот, створюючи музичні композиції.[138][139]

Історія дослідження ДНК

Іоганн Фрідріх Мішер

ДНК була відкрита Іоганном Фрідріхом Мішером у 1869 році. Спочатку нова речовина отримала назву «нуклеїн», а пізніше, коли Мішер виявив у неї кислотні властивості, її назвали нуклеїновою кислотою[140]. Біологічна функція нововідкритої речовини була неясна, і довгий час ДНК вважалася запасником фосфору в організмі. Більш того, навіть на початку 20 століття багато біологів вважали, що ДНК не має стосунку до передачі інформації, оскільки будова молекули, на їхню думку, була дуже одноманітною і не могла містити закодовану інформацію.

Поступово було доведено, що саме ДНК, а не білки, як вважалося раніше, є носієм генетичної інформації. Одними з перших вирішальних доказів стали експерименти О. Евері, Коліна Мак-Леода і Маклін Мак-Карті (1944 рік) з трансформації бактерій. Їм вдалося показати, що за так звану трансформацію (придбання хвороботворних властивостей нешкідливою культурою у результаті додавання до неї мертвих хвороботворних бактерій) відповідає виділена з пневмококів ДНК. Експеримент американських учених Алфреда Хершу і Марти Чейз (1952 рік) з міченими радіоактивними ізотопами білками і ДНК бактеріофагів показали, що в заражену клітину передається тільки нуклеїнова кислота фага, а нове покоління фага містить такі ж білки і нуклеїнову кислоту, як і початковий фаг[141].

До 50-х років 20 століття точна будова ДНК, як і спосіб передачі спадкової інформації, залишалася невідомою. Хоч і було напевно відомо, що ДНК складається з кількох ланцюгів, що своєю чергою складаються з нуклеотидів, ніхто не знав точно, скільки цих ланцюгів і як вони сполучені.

Структура подвійної спіралі ДНК була запропонована Френсісом Кріком і Джеймсом Ватсоном у 1953 році на основі рентгеноструктурних даних, отриманих Морісом Вілкінсом і Розаліндою Франклін, і «правил Чаргаффа», згідно з якими в кожній молекулі ДНК дотримуються строгі співвідношення, що зв'язують між собою кількість азотистих основ різних типів[16]. Пізніше запропонована Ватсоном і Кріком модель будови ДНК була доведена, а їхня робота відмічена Нобелівською премією з фізіології і медицини 1962 року. Серед одержувачів не було Розалінди Франклін, що померла на той час, оскільки премія не присуджується посмертно[142].

У відомій доповіді 1957 року Крік окреслив основи так званої «Центральної догми» молекулярної біології, яка передбачає взаємовідношення між ДНК, РНК і білками, та сформулював «адаптерну гіпотезу»[143]. Остаточне підтвердження механізму копіювання, запропонованого на основі спіральної структури, було отримане в 1958 році за допомогою експерименту Мезельсона-Сталя, де було встановлено що ДНК реплікується напівконсервативно. Це була одна з трьох можливих моделей реплікації ДНК, разом з консервативною та розсіюючою моделями.[144] Подальші роботи Кріка і його лабораторії показали, що генетичний код засновується на трійках азотистих основ, що не перекриваються — кодонах. Це відкриття пізніше дозволило Гару Ґобінду Хорані, Роберту Голлі і Маршаллу Ніренбергу розшифрувати генетичний код, за що вони отримали Нобелівську премію з фізіології або медицини за 1968 рік.[145] Ці відкриття позначають початок молекулярної біології.

Див. також

Примітки

Рекомендована література

Література

Посилання

Відео