Harry Potter und der Baum des Lebens

„Er hat die Nase seiner Mutter“ ist ein Satz den sich Neugeborene häufiger anhören müssen. Auch später noch bezeugen Leute, dass man die „junge Version seines Onkels“ sei. Es erscheint uns gerade zu offensichtlich, dass nahe Verwandte sich ähnlich sind. Je entfernter die Verwandschaft, desto vager die Ähnlichkeit.

Üblicherweise gilt auch die Umkehrung: Zwei Menschen die sich sehr ähnlich sehen, sind vermutlich eng miteinander verwandt. Dies gilt nicht nur für Menschen, sondern für alle Lebewesen. Die Biologen des 20ten Jahrhunderts nutzten das Aussehen von Lebewesen, um sie in Klassen einzuteilen. So ist der Tiger (wissenschaftlich Panthera tigris) Mitglied der Familie der Katzen. Nicht von der Hand zu weisen, ist die Tatsache, dass zwei Tiger sich ähnlicher sehen, als wenn man sie mit einer gewöhlichen Hauskatze vergleicht; Die wiederum sehen sich deutlich ähnlicher wenn man ihren Körperbau, zum Beispiel das Skelett und das Gebiss, mit einem Schaf oder gar einem Krokodil vergleicht. Daraus lässt sich schließen, dass die Tiere zwar verwandt sind, sich die Trennung im Stammbaum aber vor mehreren Millionen Jahren vollzogen haben muss. Lässt sich ein Tiger gar mit einer Pflanze oder einem Bakterium vergleichen? Unser bisheriger Versuch mit der äußeren Ähnlichkeit kommt hier an seine Grenzen.

Glücklicherweise hat die Technik zum Auslesen eines Genoms, dem individuellen Bauplan eines jeden Lebewesens, in den letzten Jahren erhebliche Fortschritte gemacht. Das Genom ist als ein langkettiges Molekül (DNS) in jeder Zelle gespeichert. Diese Moleküle bestehen aus vier Bausteinen, welche der Einfachheit halber mit vier Buchstaben beschrieben werden: A, C, G und T. Jede menschliche Zelle unseres Körpers hat davon etwa drei Milliarden Stück. Das sind 500 mal mehr Buchstaben als alle sieben Harry Potter Bände zusammen. Ähnlichkeit auf der Ebene des Genoms lässt sich in Tippfehlern messen: Textstellen an denen in der einen Ausgabe ein anderere Buchstabe steht als in einer zweiten Version. Auch wenn es für einen Menschen kein Problem darstellt Harry Potter durchzulesen, so ist es doch eine schwierigere Aufgabe, zwei Ausgaben simultan zu lesen und dabei kleinste Fehler zu bemerken und das dann noch gleich 500 mal. Für eine solche Aufgabe wurden Computer erfunden.

Mit einem Computer lassen sich selbst lange Texte innerhalb von Sekunden vergleichen. Leider gibt es in der Natur noch einige Schwierigkeiten. Manchmal werden im Genom Seiten oder ganze Kapitel, herumgeschoben, entfernt oder kopiert. Will man nun also den Text auf einer Seite vergleichen, muss dazu erst die andere, passende gefunden werden. Deswegen erstellt man mit Hilfe der theoretischen Informatik einen Index. Dieser erlaubt das schnelle Suchen nach Textstellen. Wie im Telefonbuch muss dazu nicht nochmal alles durchgelesen werden, nur um die passende Information zu extrahieren. Mit diesem Trick können nun ähnliche Textstellen gefunden und verglichen werden. Schließlich können wir daraus den gesuchten Stammbaum berechnen. Leider benötigt selbst ein Großrechner noch mehrere Stunden, um diese Aufgabe zu erfüllen. Deswegen wird weiter an schnelleren Algorithmen und Datenstrukturen geforscht, um die Arbeit der Biologen zu vereinfachen.

Dieser Artikel entstand im Rahmen des Evol-Max-Magazin zum Tag der offenen Tür 2015 des Max-Planck-Instituts für Evolutions Biologie, Plön.