@TangMi Das Prinzip müsstest Du mir mal darlegen, aus dem heraus ich angeblich nicht verstehen will ...
Aber bitteschön, bleiben wir kurz beim Kollagen. Kollagen ist glücklicherweise sehr einfach aufgebaut, denn an jeder dritten Stelle steht ein Glycin, an den beiden nachfolgenden Stellen meist Prolin und Hydroxyprolin. Das Schema wiederholt sich dann ca. 350 mal, so dass die Peptidketten (eigentlich Tripeptidketten!) sich zu einer Kollagenfaser verdrillen können, die aus einer Tripelhelix besteht.
Während Glycin und Prolin im genetischen Code vierfach redundant repräsentiert sind (Das bedeutet, dass sich Mutationen in der dritten Codon-Position des mRNA-Strangs nicht auf die Translation auswirken, weil beide Aminosäuren jeweils vierfach über die entsprechenden tRNA's bereitgestellt werden können), erfolgt die Bildung des Hydroxyprolins posttranslational durch Ergänzung des Prolins "links" vom Glycin mit einer Hydroxylgruppe, indem ein entsprechendes Enzym unter Verwertung von Sauerstoff aktiv wird.
Bereits daraus ist ersichtlich, das Kollagen a) nur bei Vorhandensein eines Translationsmechanismus' (Proteinbiosynthese) und b) erst nach Vorhandensein einer mit Sauerstoff angereicherten Umgebung (also evolutionsgeschichtlich erst sehr spät) entstehen kann und nicht etwa "spontan". Die Funktionalität des Kollagens ergibt sich darüber hinaus erst nach dem Vorhandensein von Mehrzellern, da dieses insbesondere in den interzellulären Räumen benötigt wird.
Aber da es Dir ja um die exakte Sequenz geht, gebe ich Dir eine kleine Rechenaufgabe. Die Primärsequenz ergibt sich zu [Prolin-Hydroxyprolin-Glycin]n - wobei die mittlere Aminosäure ursprünglich als Prolin codiert ist, so dass sich [Prolin-Prolin-Glycin]n als Ausgangsbasis ergibt. Wir haben also zwei Aminosäuren in Dreieranordnung. Wie hoch ist die Wahrscheinlichkeit, dass sich so eine Anordnung spontan ergibt?
Antwort: 1 zu 2^3 = 1 zu 8
Da die beiden Prolin-Bestandteile austauschbar sind, reduziert sich die Unwahrscheinlichkeit auf die Hälfte, also 1 zu 4.
Berücksichtige ich noch den genetischen Code mit der jeweils vierfachen Redundanz jedes einzelnen Bestandteils, dann erhalte ich (2^4)^3 = 2^12 verschiedene DNA-Sequenzen, die das Tripeptid repräsentieren können - und damit 4096 verschiedene Varianten, die sich im Verlauf der ca. 3110 Nucleotide nach dem Zufallsprinzip abwechseln können. Das heißt, pro Tripeptid stehen etwa 4 Nucleotidabfolgen mit je 9 Nucleotiden zur Verfügung. Somit ist Kollagen seinerseits mehrfach redundant im Genom repräsentiert.