Protéine de liaison à l'ADN

Une protéine de liaison à l'ADN est une protéine comportant un domaine de liaison à l'ADN et qui possède donc une affinité pour l'ADN monocaténaire ou bicaténaire (en double hélice)[1],[2]. Les protéines de liaison à l'ADN spécifiques d'une séquence nucléotidique interagissent généralement avec le grand sillon de l'ADN B car ce dernier expose davantage les paires de bases, ce qui permet de mieux les identifier. Il existe cependant des ligands qui interagissent avec le petit sillon, comme la nétropsine[3] (un polyamide), la distamycine, le colorant Hoechst 33258, la pentamidine (un trypanicide), le DAPI et d'autres encore[4].

Enzyme de restriction EcoRV interagissant avec un segment d'ADN portant sa séquence cible (PDB 1RVA).

Parmi les protéines de liaison à l'ADN, on compte notamment les facteurs de transcription, qui modulent la transcription de l'ADN en ARN, diverses polymérases, des nucléases, qui clivent les molécules d'ADN, ainsi que les histones, qui interviennent dans le conditionnement des chromosomes et dans la régulation de la transcription au sein du noyau des cellules. Les protéines de liaison à l'ADN peuvent contenir des motifs structurels tels que doigt de zinc, hélice-coude-hélice, glissière à leucine, et d'autres encore, qui facilitent la liaison aux molécules d'acide nucléique. Il existe également des exemples de telles protéines moins classiques, comme les effecteurs TAL (en).

Interactions protéine-ADN non spécifiques

Enroulement de l'ADN (orange) autour de la surface d'histones (bleu) formant un nucléosome (PDB 1EQZ).

Les protéines structurelles qui se lient à l'ADN, par exemple au sein des chromosomes, offrent des exemples bien compris d'interactions non spécifiques entre protéines et ADN. Ces protéines organisent l'ADN en une structure compacte appelée chromatine. Chez les eucaryotes, ces structures font intervenir la liaison de l'ADN avec de petites protéines basiques appelées histones. Chez les procaryotes, plusieurs types de protéines entrent en jeu[5],[6].

Les histones constituent un complexe en forme de disque appelé nucléosome contenant deux tours complets d'ADN bicaténaire enroulé autour de lui. Ces interactions non spécifiques s'établissent à travers des liaisons ioniques entre les résidus d'acides aminés basiques et chargés positivement des histones d'une part et le squelette ose-phosphate acide et chargé négativement de l'ADN d'autre part, ce qui les rend très largement indépendantes de la séquence nucléotidique[7]. Parmi les modifications post-traductionnelles de ces acides aminés basiques, on relève des méthylations, des phosphorylations et des acétylations[8]. Ces altérations chimiques modifient l'intensité des interactions entre l'ADN et les histones, rendant l'ADN plus ou moins accessible aux facteurs de transcription et modulant la vitesse de la transcription[9]. Parmi les autres protéines de la chromatine non spécifique d'une séquence d'ADN, on trouve les protéines à grande mobilité, qui se lient à l'ADN distordu[10]. Ces protéines jouent un rôle important dans l'organisation des nucléosomes pour les arranger en structures plus vastes constituant les chromosomes[11].

Protéines de liaison à l'ADN monocaténaire

Il existe un groupe particulier de protéines de liaison à l'ADN qui sont spécifiques à l'ADN monocaténaire. Chez l'homme, la protéine de réplication A est le membre le mieux compris de cette famille. Il intervient dans les processus au cours desquels la double hélice d'ADN est séparée en deux brins, comme la réplication de l'ADN, la recombinaison génétique et la réparation de l'ADN[12]. Ces protéines semblent stabiliser l'ADN monocaténaire et le protéger de la dégradation par les nucléases ainsi que de la formation de structures tige-boucle.

Protéines de liaison à l'ADN spécifiques d'une séquence nucléotidique

Répresseur λ lié à la séquence d'ADN de l'opérateur λ (PDB 1LMB).

Certaines protéines ont évolué afin de ne se lier qu'à certaines séquences d'ADN. Les mieux connues d'entre elles sont les facteurs de transcription, qui sont les protéines de régulation de la transcription de l'ADN en ARN. Chaque facteur de transcription ne se lie qu'à une séquence d'ADN déterminée et active ou inhibe la transcription des gènes qui possèdent cette séquence près de leur promoteur.

Les facteurs de transcription jouent leur rôle de deux manières. D'une part, ils peuvent se lier à l'ARN polymérase responsable de la transcription, directement ou par l'intermédiaire d'autres protéines médiatrices ; ceci permet de placer la polymérase sur le promoteur et lui permet de commencer la transcription[13]. D'autre part, les facteurs de transcription peuvent se lier à des enzymes qui modifient les histones au niveau du promoteur. Ceci favorise l'accès à l'ADN pour les polymérases[14].

Ces séquences d'ADN cibles peuvent se trouver n'importe où à travers le génome d'un être vivant. Ainsi, des changements dans l'activité d'un type de facteurs de transcription peut affecter des milliers de gènes[15]. C'est la raison pour laquelle ces protéines sont souvent la cible de processus de transduction de signal contrôlant la réponse à des changements environnementaux ou la différenciation cellulaire et le développement des organismes. La spécificité étroite de l'interaction entre ces facteurs de transcription et l'ADN provient du fait que ces protéines établissent de nombreux contacts avec les bords des bases nucléiques, ce qui leur permet de « lire » les séquences nucléotidiques. La plupart de ces interactions ont lieu dans le grand sillon de l'ADN, où les bases sont le plus accessibles[1]. On réalise généralement les descriptions mathématiques de la liaison protéine-ADN prenant en compte la spécificité envers les séquences ainsi que la liaison compétitive et coopérative des protéines de types différents à l'aide de modèles en réseau (en)[16]. On a proposé des méthodes de calcul permettant d'identifier la séquence spécifique de liaison d'une protéine à l'ADN afin de tirer profit du grand nombre de séquences à présent disponibles[17].

Notes et références

🔥 Top keywords: