Funktionelle Komponenten des Gens
Jedes Gen besteht aus mehreren funktionellen Komponenten, von denen jede an einer anderen Facette des Prozesses der Genexpression beteiligt ist (Abbildung 2-1). Grob gesagt gibt es jedoch zwei funktionelle Haupteinheiten: die Promotorregion und die kodierende Region.
Abbildung 2-1
Genexpression. Die DNA eines Gens wird in mRNA umgeschrieben, die wiederum in Protein übersetzt wird. Die funktionellen Bestandteile eines Gens sind hier schematisch dargestellt. Die Bereiche des Gens, die in der reifen mRNA dargestellt werden sollen, werden Exons genannt, und (mehr…)
Die Promotorregion steuert, wann und in welchem Gewebe ein Gen exprimiert wird. So sind beispielsweise die Promotoren des Globin-Gens für die Expression in erythroiden Zellen und nicht in Gehirnzellen verantwortlich. Wie wird diese gewebespezifische Expression erreicht? In der DNA der Promotorregion des Gens gibt es spezifische Strukturelemente, Nukleotidsequenzen (siehe unten „Strukturelle Überlegungen“), die es ermöglichen, dass das Gen nur in einer entsprechenden Zelle exprimiert wird. Dies sind die Elemente im Globin-Gen, die eine erythroide Zelle anweisen, Globin-mRNA von diesem Gen abzuschreiben. Diese Strukturen werden als cis-wirkende Elemente bezeichnet, weil sie sich auf demselben DNA-Molekül wie das Gen befinden. In einigen Fällen befinden sich andere gewebetypspezifische cis-wirkende Elemente, so genannte Enhancer, auf demselben DNA-Molekül, aber in großer Entfernung von der kodierenden Region des Gens.6,7 In der entsprechenden Zelle binden die cis-wirkenden Elemente Proteinfaktoren, die für die Transkription des Gens physisch verantwortlich sind. Diese Proteine werden als trans-acting factors bezeichnet, weil sie sich im Zellkern befinden, getrennt von dem DNA-Molekül, das das Gen trägt. Gehirnzellen würden beispielsweise nicht über die richtigen trans-acting factors verfügen, die an den β-Globin-Promotor binden, und deshalb würden Gehirnzellen kein Globin exprimieren. Sie würden jedoch über trans-agierende Faktoren verfügen, die an neuronenspezifische Genpromotoren binden.
Die Struktur des Proteins eines Gens wird durch die kodierende Region des Gens festgelegt. Die kodierende Region enthält die Information, die eine erythroide Zelle anweist, die Aminosäuren in der richtigen Reihenfolge zusammenzusetzen, um das β-Globinprotein herzustellen. Wie wird diese Reihenfolge der Aminosäuren festgelegt? Wie weiter unten im Detail beschrieben, ist die DNA ein lineares Polymer, das aus vier unterscheidbaren Untereinheiten, den Nukleotiden, besteht. In der kodierenden Region eines Gens kodiert die lineare Sequenz von Nukleotiden die Aminosäuresequenz des Proteins. Dieser genetische Code liegt in Form von Tripletts vor, so dass jede Gruppe von drei Nukleotiden für eine einzelne Aminosäure kodiert. Die 64 Tripletts, die von 4 Nukleotiden gebildet werden können, übersteigen die 20 verschiedenen Aminosäuren, die zur Herstellung von Proteinen verwendet werden. Dadurch wird der Code degeneriert und einige Aminosäuren können durch mehrere verschiedene Tripletts kodiert werden.8 Die Nukleotidsequenz eines jeden Gens kann nun bestimmt werden (siehe unten). Durch Übersetzung des Codes kann man eine vorhergesagte Aminosäuresequenz für das von einem Gen kodierte Protein ableiten.