Composants fonctionnels du gène
Chaque gène est constitué de plusieurs composants fonctionnels, chacun impliqué dans une facette différente du processus d’expression du gène (Figure 2-1). De manière générale, cependant, il existe deux unités fonctionnelles principales : la région promotrice et la région codante.
Figure 2-1
Expression génétique. L’ADN d’un gène est transcrit en ARNm qui est, à son tour, traduit en protéine. Les composants fonctionnels d’un gène sont ici schématisés. Les zones du gène destinées à être représentées dans l’ARNm mature sont appelées exons, et (suite…)
La région du promoteur contrôle quand et dans quel tissu un gène est exprimé. Par exemple, les promoteurs du gène de la globine sont responsables de leur expression dans les cellules érythroïdes et non dans les cellules du cerveau. Comment cette expression spécifique aux tissus est-elle obtenue ? Dans l’ADN de la région promotrice du gène, il existe des éléments structurels spécifiques, des séquences de nucléotides (voir « Considérations structurelles » ci-dessous), qui permettent au gène de s’exprimer uniquement dans une cellule appropriée. Ce sont les éléments du gène de la globine qui donnent l’ordre à une cellule érythroïde de transcrire l’ARNm de la globine à partir de ce gène. Ces structures sont appelées éléments cis car elles se trouvent sur la même molécule d’ADN que le gène. Dans certains cas, d’autres éléments cis spécifiques du type de tissu, appelés amplificateurs, résident sur la même molécule d’ADN, mais à de grandes distances de la région codante du gène.6,7 Dans la cellule appropriée, les éléments cis lient des facteurs protéiques qui sont physiquement responsables de la transcription du gène. Dans la cellule concernée, les éléments cis lient des facteurs protéiques qui sont physiquement responsables de la transcription du gène. Ces protéines sont appelées facteurs trans parce qu’elles résident dans le noyau de la cellule, séparément de la molécule d’ADN portant le gène. Par exemple, les cellules du cerveau n’auraient pas les bons facteurs de transcription qui se lient au promoteur de la β-globine, et par conséquent les cellules du cerveau n’exprimeraient pas la globine. Elles auraient cependant des facteurs trans-actifs qui se lient aux promoteurs de gènes spécifiques aux neurones.
La structure de la protéine d’un gène est spécifiée par la région codante du gène. La région codante contient les informations qui indiquent à une cellule érythroïde d’assembler les acides aminés dans le bon ordre pour fabriquer la protéine β-globine. Comment cet ordre des acides aminés est-il spécifié ? Comme décrit en détail ci-dessous, l’ADN est un polymère linéaire constitué de quatre sous-unités distinctes appelées nucléotides. Dans la région codante d’un gène, la séquence linéaire de nucléotides code la séquence d’acides aminés de la protéine. Ce code génétique se présente sous la forme de triplets, de sorte que chaque groupe de trois nucléotides code pour un seul acide aminé. Les 64 triplets qui peuvent être formés par 4 nucléotides dépassent les 20 acides aminés distincts utilisés pour fabriquer les protéines. Cela rend le code dégénéré et permet à certains acides aminés d’être codés par plusieurs triplets différents.8 La séquence nucléotidique de n’importe quel gène peut maintenant être déterminée (voir ci-dessous). En traduisant le code, on peut en déduire une séquence d’acides aminés prédite pour la protéine codée par un gène.