next up previous contents
Nächste Seite: Wechselwirkung Aufwärts: Selbstentwickelte Evolutionsmodelle Vorherige Seite: Selbstentwickelte Evolutionsmodelle   Inhalt

Dekodierung

Die Dekodierung der Gene als Informationseinheiten aus einem Speichermedium ist durch unterschiedliche Mechanismen möglich. Ein sehr einfacher Mechanismus besteht darin, die Gene als einzelne Elemente (ASCII-Zeichen, o.ä.) unabhängig voneinander abzuspeichern. Dies ist technisch einfach realisierbar und daher zeitsparend. Die völlige Unkorreliertheit der Informationseinheiten bei dieser Art der Speicherung ist jedoch sehr unnatürlich, denn in realen Lebewesen sind folgende fundamentale Eigenschaften gegeben:

  1. Gene sind als Bestandteile der DNA in einer Molekülkette, d.h. in einer Sequenz gespeichert. Diese Molekülsequenz ist aus vier Basiselementen, den sogenannten Nukleotiden Adenin, Cytosin, Guanin und Thymin (A,C,G,T) aufgebaut.
  2. In der Reproduktionsphase wird die DNA von einem Ende zum anderen durchlaufen und dabei eine komplementäre RNA-Sequenz erzeugt. Diese RNA bewegt sich zu einer ,,Reproduktionsfabrik`` der Zelle, einem Ribosom, wo das Auslesen und Übersetzen des Inhalts und die daran anschließende Proteinsynthese stattfindet. Tripletts von Nukleotiden dekodieren jeweils für ein bestimmtes Protein. Während des Dekodiervorgangs wird in der RNA nur dann ein Gen ,,gelesen``, wenn ein ,,Startcodon`` (Promotor) zuvor den Beginn eines Gens signalisiert hat.

Unter Berücksichtigung dieser Tatsachen wird in der vorliegenden Arbeit der Schwerpunkt auf Modelle gelegt, die ein dem natürlichen Dekodierschema entsprechendes Verfahren verwenden. Die Gene werden aus einem ,,Bitstring``, einer als binäre Sequenz aufgefaßten Anzahl von Datenworten, durch einen vorgegebenen Lesemechanismus herausgefiltert. In den hier implementierten Modellen wird ein Dekodiermechanismus verwendet, der sich durch einen binären Genbaum darstellen läßt. Die Blätter des Baums, die als Gene interpretiert werden, wurden zufällig erzeugt. Tabelle 1 und Abbildung 6 zeigen die 20 verschiedenen Gene der Länge 3 bis 8 Bits, die in diesem Baum enthalten sind. In der Tabelle ist zusätzlich ein weiter unten erklärtes ,,Startcodon`` mit dem Symbol ,,sc`` aufgelistet. Der Genbaum ermöglicht die eindeutige Zuordnung jeder Bitsequenz zu einem Gen, da er keine unbestimmten Endpunkte enthält. Die konkrete Dekodierung von Bitsequenzen vollzieht sich nach dem folgenden Schema:

  1. Man beginnt an der Wurzel des Genbaums und liest das erste Bit der zu dekodierenden Sequenz.

  2. Wenn dieses Bit eine ,,0`` ist, geht man einen Schritt weiter in den unteren Ast, der von der Wurzel in die nächste Ebene führt. Falls das Bit dagegen eine ,,1`` ist, wird entsprechend in den oberen Ast verzweigt.

  3. Dann liest man das nächste Bit ein und bewegt sich wie zuvor in Abhängigkeit von dem Wert weiter in die nächste Ebene.

  4. Diese Prozedur wird solange fortgeführt, bis ein Blatt des Baums, also ein Gen erreicht worden ist. Dieses Blatt enthält ein Symbol für das dekodierte Gen.

Abbildung: Darstellung der 20 Gene (A-T) als binärer Genbaum
\begin{figure}
\begin{center}
\vspace{0.5cm}
\unitlength=0.50mm
\special{em:line...
...ebox (23.00,9.78)[cc]{\scriptsize Wurzel}}
\end{picture}\end{center}\end{figure}




Tabelle 1: Bitsequenzen der Gene
Gen Länge binäre Darstellung
A 3 001
B 3 011
C 3 110
D 3 111
E 4 0000
F 4 0100
G 4 0101
H 4 1000
I 4 1010
J 4 1011
K 5 10011
L 6 000100
M 6 000101
N 6 000110
O 6 000111
P 6 100100
Q 8 10010100
R 8 10010101
S 8 10010110
T 8 10010111
sc 3 110

Die einzelnen Gene sind durch den binären Genbaum als Bitsequenzen (z.B. ,,001`` für Gen A) definiert. Die Struktur der Bitsequenz als Speichermedium ist ebenfalls festzulegen. Eine naheliegene Möglichkeit besteht in der Anordnung des Bitmusters zu einer zirkular geschlossenen Sequenz, was für die natürliche RNA ebenfalls in einigen Fällen verwirklicht ist [14]. Diese Möglichkeit bietet sich insbesondere für kurze Sequenzen an, da in diesem Fall am Anfang und am Ende der Sequenz keine Informationverluste auftreten. Alternativ dazu lassen sich bei hinreichender Zahl von Bits in der Sequenz auch mit nicht informationstragenden Rändern genügend viele Gene speichern. Für die eindeutige Zuordnung einer Bitsequenz zu einem Gen ist ebenfalls zu definieren, an welchen Bits in der Gesamtsequenz ein Gen beginnen kann. Für diese endgültige Festlegung des Leserahmens werden in dieser Arbeit folgende Möglichkeiten betrachtet:

  1. Maximale Packungsdichte der Gene:
    An jedem Bit beginnt ein Gen. Diese Art der Dekodierung hat folgende Konsequenzen:
  2. An jedem $k$-ten (z.B. jedem zweiten) Bit beginnt ein Gen:
  3. ,,Gen an Gen``, die Gene sind getrennt hintereinander angeordnet:

  4. Gene können nur hinter einem Startcodon beginnen:
    Zur Vermeidung von starken Überlappungen einerseits und Veränderungen des Leserahmens andererseits ist es sinnvoll, eine binäre Startsequenz zu verwenden, die den Beginn eines Gens im Bitmuster signalisiert. Die Wahl dieses Startcodons sollte dafür sorgen, daß eine möglichst sichere Speicherung der Information gegeben ist. Im allgemeinen sind Sequenzen der Form $0_i1_j$ oder $1_i0_j$, $i,j > 0$, geeignete Kandidaten, denn nur sie verhindern durch ihre aperiodische Anordnung, daß Startcodons selbst überlappen können. Die Länge der Startsequenz sollte so gewählt sein, daß genug Information im Bitmuster untergebracht werden kann. Die Gene des in dieser Arbeit verwendeten Genbaums (siehe Abbildung 6) lassen die Startsequenz ,,110`` besonders geeignet erscheinen, weil nur sie ein Überlappen von Genen verhindert. Lediglich ein Startcodon und ein Gen könnnen bei der Verwendung dieser Sequenz überlappen, daher wird sie in der vorliegenden Arbeit als Startcodon verwendet.

In Tabelle 2 sind die Auswirkungen der Dekodierung und der Mutation auf eine vorgegebene Sequenz von 31 Bits (aus der Anfangspopulation einer Simulation entnommen) zu erkennen. Die in dem vorangehenden Abschnitt vorgestellten Dekodiermechanismen werden auf diese (nicht als zirkular geschlossen aufgefaßte) Bitsequenz angewendet und der Einfluß der Mutation des Bits Nr. $10$ (durch ,,$\downarrow$`` markiert) dargestellt. Das Symbol ,,+`` im letzten Beispiel der Tabelle zeigt die Entstehung eines neuen Gens durch die Erzeugung eines Startcodons an.




Tabelle 2: Bitsequenz und Genmuster vor und nach der Mutation
Bitsequenz                                
0  1  0  1  1  0  0  1  0  0  1  0  0  1  0  0  1  1  1  0  1  1  0  1  1  1  1  1  1  1  0  
                 $\downarrow$                                            
0  1  0  1  1  0  0  1  0  1  1  0  0  1  0  0  1  1  1  0  1  1  0  1  1  1  1  1  1  1  0  
Genmuster                                
An jedem Bit beginnt ein Gen:                                
G  J  B  C  P  A  F  P  A  F  P  A  F  K  A  B  D  C  J  B  C  J  B  D  D  D  D  D  C      
       $\downarrow$    $\downarrow$  $\downarrow$  $\downarrow$  $\downarrow$                                            
G  J  B  C  S  A  G  J  B  C  P  A  F  K  A  B  D  C  J  B  C  J  B  D  D  D  D  D  C      
An jedem 2. Bit beginnt ein Gen:                                
G  B  P  F  A  P  F  A  D  J  C  B  D  D  C                                  
   $\downarrow$  $\downarrow$  $\downarrow$                                                      
G  B  S  G  B  P  F  A  D  J  C  B  D  D  C                                  
,,Gen neben Gen``, Gene hintereinander dekodiert:                                
G  P  P  D  B  B  D  C                                                
 $\downarrow$  $\downarrow$                                                          
G  S  F  D  B  B  D  C                                                
Gene beginnen hinter dem Startcodon ,,110``:                                
F  C  D                                                          
$\downarrow$  +                                                            
G  F  C  D                                                        

Diese Gegenüberstellung verdeutlicht insbesondere für die Dekodierungsmethode ,,Gen neben Gen`` die Tatsache, daß die Stärke der Veränderung durch eine einzelne Punktmutation sehr unterschiedlich sein kann. Wie im ersten oben ausgeführten Beispiel erkennbar, kann durch diese einzelne Punktmutation der gesamte nachfolgende genetische Inhalt der Sequenz verändert, d.h. der Leserahmen verschoben werden. Das zweite Beispiel zeigt jedoch, daß der Einfluß dieser Mutation in einer anderen Sequenz auf nur zwei Gene beschränkt sein kann. Die Verwendung eines Startcodons garantiert dagegen (wenn dieses nur geeignet gewählt wird) in jedem Fall die Erhaltung des Leserahmens im Falle einer Mutation. Sie sorgt dafür, daß die Mutation ein lokal wirksamer Operator ist, was auch sinnvoll und gewünscht ist.


next up previous contents
Nächste Seite: Wechselwirkung Aufwärts: Selbstentwickelte Evolutionsmodelle Vorherige Seite: Selbstentwickelte Evolutionsmodelle   Inhalt
RW 2008-07-16