遺伝子の機能的構成要素
すべての遺伝子はいくつかの機能要素からなり、それぞれが遺伝子発現過程の異なる面に関与している(図2-1)。 しかし、大まかに言えば、プロモーター領域とコーディング領域の2つの主要な機能単位がある。
図2-1
遺伝子の発現。 遺伝子のDNAはmRNAに転写され、それがタンパク質に翻訳される。 ここでは遺伝子の機能的な構成要素を模式的に図にしました。 成熟したmRNAで表現される予定の遺伝子の領域はエクソンと呼ばれ、(詳細)
プロモーター領域は遺伝子がいつ、どの組織で発現されるかを制御します。 例えば、グロビン遺伝子のプロモーターは赤血球での発現を司り、脳細胞では発現させない。 この組織特異的な発現はどのようにして実現されているのだろうか。 遺伝子のプロモーター領域のDNAには、特定の構造要素であるヌクレオチド配列(下記の「構造に関する考察」参照)があり、それによって遺伝子が適切な細胞でのみ発現されるようになっているのです。 これがグロビン遺伝子の要素であり、赤血球細胞にその遺伝子からグロビンmRNAを転写するように指示する。 これらの構造は、遺伝子と同じDNA分子に存在するため、シス作用因子と呼ばれる。 場合によっては、エンハンサーと呼ばれる組織型特異的なシス作用因子も同じDNA分子上に存在するが、遺伝子のコード領域からは大きく離れている6,7。 これらのタンパク質は、遺伝子を持つDNA分子とは別に、細胞の核内に存在するため、トランス作用因子と呼ばれる。 例えば、脳細胞はβ-グロビンプロモーターに結合する適切なトランス作用因子を持たないので、脳細胞はグロビンを発現しないことになる。
遺伝子のタンパク質の構造は、遺伝子のコーディング領域によって規定されます。 コーディング領域は、赤血球がβ-グロビン蛋白質を作るためにアミノ酸を適切な順序で組み立てるように指示する情報を含んでいます。 このアミノ酸の順番はどのようにして決まるのだろうか? 後述するように、DNAはヌクレオチドと呼ばれる4つの区別できるサブユニットで構成される線状高分子です。 遺伝子のコード領域では、ヌクレオチドの直線的な配列がタンパク質のアミノ酸配列をコードしている。 この遺伝暗号は、3つのヌクレオチドのグループごとに1つのアミノ酸をコードするように、三重鎖の形になっています。 4つのヌクレオチドで形成できる64のトリプレットは、タンパク質を作るために使われる20の異なるアミノ酸を超える。 このため、暗号は縮退し、いくつかのアミノ酸を複数の異なる3塩基でコードすることができるようになった8。 このコードを翻訳することにより、ある遺伝子がコードするタンパク質の予測されるアミノ酸配列が導き出される
。