Genets funktionelle komponenter
Alle gener består af flere funktionelle komponenter, der hver især er involveret i en anden facet af genekspressionsprocessen (Figur 2-1). I grove træk er der dog to hovedfunktionelle enheder: promotorregionen og den kodende region.
Figur 2-1
Genekspression. Et gens DNA transskriberes til mRNA, som igen oversættes til protein. De funktionelle komponenter i et gen er her skematisk skitseret. Områder af genet, der er bestemt til at være repræsenteret i det modne mRNA, kaldes exoner, og (mere…)
Promotorregionen styrer, hvornår og i hvilket væv et gen udtrykkes. For eksempel er promotorerne for globin-genet ansvarlige for deres ekspression i erytroide celler og ikke i hjerneceller. Hvordan opnås denne vævsspecifikke ekspression? I DNA’et i genets promotorregion er der specifikke strukturelle elementer, nukleotidsekvenser (se “Strukturelle overvejelser” nedenfor), som gør det muligt for genet kun at blive udtrykt i en relevant celle. Det er disse elementer i globin-genet, der instruerer en erytroide celle om at transskribere globin-mRNA fra dette gen. Disse strukturer betegnes som cis-virkende elementer, fordi de befinder sig på det samme DNA-molekyle som genet. I nogle tilfælde findes der andre vævstypespecifikke cis-virkende elementer, kaldet enhancere, på det samme DNA-molekyle, men i stor afstand fra genets kodningsregion.6,7 I den pågældende celle binder de cis-virkende elementer proteinfaktorer, som fysisk er ansvarlige for at transskribere genet. Disse proteiner kaldes trans-virkende faktorer, fordi de befinder sig i cellens kerne, adskilt fra det DNA-molekyle, der bærer genet. F.eks. ville hjerneceller ikke have de rigtige trans-virkende faktorer, der binder til β-globinpromotoren, og derfor ville hjerneceller ikke udtrykke globin. De ville imidlertid have transvirkende faktorer, der binder til neuronspecifikke genpromotorer.
Strukturen af et genprotein er specificeret af genets kodningsregion. Den kodningsregion indeholder de oplysninger, der anviser en erytroide celle til at samle aminosyrer i den rigtige rækkefølge for at fremstille β-globinproteinet. Hvordan er denne rækkefølge af aminosyrer specificeret? Som beskrevet i detaljer nedenfor er DNA en lineær polymer, der består af fire forskellige underenheder kaldet nukleotider. I den kodende region af et gen koder den lineære sekvens af nukleotider for proteinets aminosyresekvens. Denne genetiske kode er i tripletform, således at hver gruppe på tre nukleotider koder for en enkelt aminosyre. De 64 tripletter, der kan dannes af 4 nukleotider, overstiger de 20 forskellige aminosyrer, der anvendes til at fremstille proteiner. Dette gør koden degenereret og gør det muligt for nogle aminosyrer at blive kodet af flere forskellige tripletter.8 Nukleotidsekvensen for et hvilket som helst gen kan nu bestemmes (se nedenfor). Ved at oversætte koden kan man udlede en forudsagt aminosyresekvens for det protein, som et gen koder for.