Генетичний код

відповідність послідовності нуклеотидів у білок-кодуючому гені/ мРНК та в послідовності амінокислот білків

Генети́чний код  — певна відповідність між послідовністю нуклеотидів в молекулі ДНК (мРНК) і послідовністю амінокислот в молекулі білка, яка нею кодується. Ця система правил розташування нуклеотидів в молекулах нуклеїнових кислот (ДНК і РНК) надає всім живим організмам можливість кодування амінокислотної послідовності білків за допомогою послідовності нуклеотидів.

У ДНК використовується чотири нуклеотиди — аденін (А), гуанін (G), цитозин (С) і тимін (T), які в україномовній літературі також часто позначаються літерами А, Г, Ц і Т відповідно. Ці букви складають «алфавіт» генетичного коду. У РНК використовуються ті ж нуклеотиди, за винятком тиміну, який замінений схожим нуклеотидом, — урацилом, який позначається буквою U (або У в україномовній літературі). У молекулах ДНК і РНК нуклеотиди складають ланцюжки й, таким чином, інформація закодована у вигляді послідовності генетичних «букв».

Генетичний код
Комплементарні нуклеотиди

Для синтезу білків у природі використовуються 20 різних амінокислот. Кожен білок є ланцюжком або декількома ланцюжками амінокислот в строго певній послідовності. Ця послідовність називається первинною структурою білка, що також значною мірою визначає всю будову білка, а отже і його біологічні властивості. Набір амінокислот також універсальний для переважної більшості живих організмів.

Експресія генів або реалізація генетичної інформації у живих клітинах (зокрема синтез білка, що кодується геном) здійснюється за допомогою двох основних матричних процесів: транскрипції (тобто синтезу мРНК на матриці ДНК) і трансляції генетичного коду в амінокислотну послідовність (синтез поліпептидного ланцюжка на матриці мРНК). Для кодування 20 амінокислот, а також стоп-сигналу, що означає кінець білкової послідовності, достатньо трьох послідовних нуклеотидів. Набір з трьох нуклеотидів називається кодоном. Прийняті скорочення, що відповідають амінокислотам і кодонам, зображені на малюнку.

Властивості генетичного коду

  • Триплетність — три послідовно розміщені нуклеотиди кодують одну з 20 амінокислот, які разом утворюють триплет, або кодон.
  • Безперервність — кодони не розділяються між собою, тобто інформація зчитується безперервно. Кожний з кодонів не залежить один від одного і під час біосинтезу зчитується повністю.
  • Дискретність — один і той же нуклеотид не може входити одночасно до складу двох або більш кодонів.
  • Специфічність — кожний кодон може кодувати лише одну амінокислоту. Завдяки цьому генетичний код не перекривається.
  • Виродженість — одна і та ж амінокислота може кодуватися декількома різними кодонами.
  • Колінеарність — послідовність кодонів нуклеотидів точно відповідає послідовності амінокислотних залишків у поліпептиді
  • Наявність термінальних кодонів — беззмістовних, або стоп-кодонів, які не здатні кодувати амінокислоти. Вони виконують функцію роздільника між двома ланцюгами кодонів та переривають синтез поліпептиду.
  • Універсальність — єдиний генетичний код є, практично, однаковим в організмах різного рівня складності — від вірусів до людини (хоча існують кілька інших, менш поширених варіантів генетичного коду, див. список на сайті NCBI Taxonomy [Архівовано 1 червня 2009 у Wayback Machine.]).

Варіанти генетичного коду

Більшість організмів переважно користуються одним варіантом коду, так званим «стандартним кодом»[1], проте це не завжди є правилом. Перший приклад відхилення від стандартного генетичного коду був відкритий в 1979 році при дослідженні генів мітохондрій людини. З того часу було знайдено декілька подібних варіантів[2], включаючи різні альтернативні коди мітохондрій[3], наприклад, прочитування стоп-кодону стандартного коду UGA як кодону, що визначає триптофан у мікоплазм. У бактерій і архей GUG і UUG часто використовуються як стартові кодони. В деяких випадках гени починають кодувати білок зі старт-кодону, який відрізняється від зазвичай використовуваного даним видом[1]. У деяких білках нестандартні амінокислоти, такі як селеноцистеїн і піролізин вставляються рибосомою, під час зчитування стоп-кодону за умовами наявності певних послідовностей в мРНК після кодону. Селенцистеїн часто розглядається як 21-ша, а піролізин — 22-га амінокислота, що входять до складу білків.

Таблиця кодонів РНК

неполярніполярніосновнікислотні(стоп-кодон)
 2ий нуклеотид
UCAG
1ий нуклеотидUUUU(Фен/F) ФенілаланінUCU(Сер/S) СеринUAU(Тир/Y) ТирозинUGU(Цис/C) Цистеїн
UUC(Фен/F) ФенілаланінUCC(Сер/S) СеринUAC(Тир/Y) ТирозинUGC(Цис/C) Цистеїн
UUA(Лей/L) ЛейцинUCA(Сер/S) СеринUAAСтоп-кодонUGAСтоп-кодон
UUG(Лей/L) ЛейцинUCG(Сер/S) СеринUAGСтоп-кодонUGG(Трп/W) Триптофан    
CCUU(Лей/L) ЛейцинCCU(Про/P) ПролінCAU(Гіс/H) ГістидинCGU(Арг/R) Аргінін
CUC(Лей/L) ЛейцинCCC(Про/P) ПролінCAC(Гіс/H) ГістидинCGC(Арг/R) Аргінін
CUA(Лей/L) ЛейцинCCA(Про/P) ПролінCAA(Глн/Q) ГлутамінCGA(Арг/R) Аргінін
CUG(Лей/L) ЛейцинCCG(Про/P) ПролінCAG(Глн/Q) ГлутамінCGG(Арг/R) Аргінін
AAUU(Іле/I) ІзолейцинACU(Тре/T) Треонін        AAU(Асн/N) АспарагінAGU(Сер/S) Серин
AUC(Іле/I) ІзолейцинACC(Тре/T) ТреонінAAC(Асн/N) АспарагінAGC(Сер/S) Серин
AUA(Іле/I) ІзолейцинACA(Тре/T) ТреонінAAA(Ліз/K) ЛізинAGA(Арг/R) Аргінін
AUG[A](Мет/M) МетіонінACG(Тре/T) ТреонінAAG(Ліз/K) ЛізинAGG(Арг/R) Аргінін
GGUU(Вал/V) ВалінGCU(Ала/A) АланінGAU(Асп/D) Аспарагінова кислотаGGU(Глі/G) Гліцин
GUC(Вал/V) ВалінGCC(Ала/A) АланінGAC(Асп/D) Аспарагінова кислотаGGC(Глі/G) Гліцин
GUA(Вал/V) ВалінGCA(Ала/A) АланінGAA(Глу/E) Глутамінова кислотаGGA(Глі/G) Гліцин
GUG(Вал/V) ВалінGCG(Ала/A) АланінGAG(Глу/E) Глутамінова кислотаGGG(Глі/G) Гліцин
A  Кодон AUG кодує амінокислоту метіонін, а також слугує як сайт ініціації трансляції.
Діаграма генетичного коду

Див. також

Посилання

Джерела

  • А. В. Сиволоб, С.Р. Рушковський, С.С. Кир'яченко та ін. (2008). Генетика (PDF). К: Видавничо-поліграфічний центр "Київський університет". с. 54-57. Архів оригіналу (PDF) за 4 березня 2016. Процитовано 17 березня 2016. {{cite book}}: Явне використання «та ін.» у: |author= (довідка)