Kozak-Konsensussequenz - Kozak consensus sequence

Die Kozak - Konsensussequenz ( Kozak Consensus oder Kozak - Sequenz ) ist ein Nukleinsäure - Motiv , das als die Protein Translation - Initiationsstelle in den meisten eukaryontischen mRNA - Transkripte. Die Sequenz gilt als die optimale Sequenz zur Initiierung der Translation in Eukaryoten und ist ein integraler Aspekt der Proteinregulation und der allgemeinen zellulären Gesundheit und hat Auswirkungen auf menschliche Krankheiten. Es stellt sicher, dass ein Protein aus der genetischen Botschaft korrekt übersetzt wird, indem es die Ribosomenanordnung und die Translationsinitiation vermittelt. Eine falsche Startstelle kann zu nicht funktionsfähigen Proteinen führen. Mit zunehmender Untersuchung sind Erweiterungen der Nukleotidsequenz, wichtige Basen und bemerkenswerte Ausnahmen aufgetreten. Die Sequenz wurde nach der Wissenschaftlerin Marilyn Kozak benannt, die sie entdeckte . Kozak entdeckte die Sequenz durch eine detaillierte Analyse von DNA-Genomsequenzen.

Die Kozak-Sequenz ist nicht mit der ribosomalen Bindungsstelle (RBS) zu verwechseln , die entweder die 5'-Kappe einer Messenger-RNA oder eine interne Ribosomen-Eintrittsstelle (IRES) ist.

Reihenfolge

Die Kozak-Sequenz wurde durch Sequenzieren von 699 Vertebraten-mRNAs bestimmt und durch ortsgerichtete Mutagenese verifiziert . Während anfänglich auf eine Untergruppe von Wirbeltieren beschränkt ( dh Mensch, Kuh, Katze, Hund, Huhn, Meerschweinchen, Hamster, Maus, Schwein, Kaninchen, Schaf und Xenopus ), bestätigten spätere Studien seine Konservierung in höheren Eukaryoten im Allgemeinen. Die Sequenz wurde als 5'- -3' definiert (IUPAC- Nukleobasennotation hier zusammengefasst), wobei: (gcc)gccRccAUGG

  1. Die unterstrichenen Nukleotide zeigen das Translationsstartcodon an , das für Methionin kodiert .
  2. Großbuchstaben weisen auf hochkonservierte Basen hin , dh die 'AUGG'-Sequenz ist konstant oder ändert sich selten, wenn überhaupt.
  3. 'R' bedeutet, dass an dieser Stelle immer ein Purin ( Adenin oder Guanin ) beobachtet wird (wobei Adenin nach Kozak häufiger vorkommt)
  4. ein Kleinbuchstabe bezeichnet die häufigste Basis an einer Stelle, an der die Basis dennoch variieren kann
  5. die Reihenfolge in Klammern (gcc) ist von ungewisser Bedeutung.

Das AUG ist das Initiationscodon, das eine Methionin-Aminosäure am N-Terminus des Proteins kodiert. ( GUG wird selten als Initiationscodon verwendet, aber Methionin ist immer noch die erste Aminosäure, da es die met-tRNA im Initiationskomplex ist, die an die mRNA bindet). Variation innerhalb der Kozak-Sequenz verändert deren "Stärke". Die Stärke der Kozak-Sequenz bezieht sich auf die Begünstigung der Initiation, die beeinflusst, wie viel Protein aus einer bestimmten mRNA synthetisiert wird. Das A- Nukleotid von "AUG" ist in mRNA-Sequenzen als +1 gekennzeichnet, wobei die vorangehende Base als –1 markiert ist. Für einen „starken“ Konsensus müssen die Nukleotide an den Positionen +4 (dh G im Konsensus) und –3 (dh entweder A oder G im Konsensus) relativ zum +1 Nukleotid beide mit dem Konsensus übereinstimmen (es gibt keine 0-Position ). Ein „angemessener“ Konsens hat nur eine dieser Stellen, während ein „schwacher“ Konsens keine dieser Stellen hat. Die cc bei –1 und –2 sind nicht so konserviert, tragen aber zur Gesamtstärke bei. Es gibt auch Hinweise darauf, dass ein G in der -6-Position bei der Initiation der Translation wichtig ist. Während die Positionen +4 und −3 in der Kozak-Sequenz die größte relative Bedeutung bei der Etablierung eines günstigen Initiationskontextes haben, wurde gefunden, dass ein CC- oder AA-Motiv an −2 und −1 bei der Initiation der Translation in Tabak und Mais wichtig ist Pflanzen. Es wurde festgestellt, dass die Proteinsynthese in Hefe stark durch die Zusammensetzung der Kozak-Sequenz in Hefe beeinflusst wird, wobei die Adenin-Anreicherung zu einer höheren Genexpression führt. Eine suboptimale Kozak-Sequenz kann es PIC ermöglichen, an der ersten AUG-Stelle vorbei zu scannen und die Initiation an einem stromabwärts gelegenen AUG-Codon zu beginnen.

Ein Sequenzlogo, das die am stärksten konservierten Basen um das Initiationscodon von über 10 000 menschlichen mRNAs zeigt . Größere Buchstaben weisen auf eine höhere Einbauhäufigkeit hin. Beachten Sie die größere Größe von A und G an Position 8 (−3, Kozak-Position) und an G an Position 14, die der (+4)-Position in der Kozak-Sequenz entspricht.

Ribosomenanordnung

Das Ribosom assembliert auf dem Startcodon (AUG), das sich innerhalb der Kozak-Sequenz befindet. Vor der Translationsinitiation erfolgt das Scannen durch den Präinitiationskomplex (PIC). Der PIC besteht aus der 40S (kleine ribosomale Untereinheit), die an den ternären Komplex eIF2- GTP-intiatorMet tRNA (TC) gebunden ist , um das 43S-Ribosom zu bilden. Unterstützt durch mehrere andere Initiationsfaktoren ( eIF1 und eIF1A, eIF5 , eIF3 , polyA-bindendes Protein ) wird es an das 5'-Ende der mRNA rekrutiert. Die eukaryotische mRNA ist mit einem 7-Methylguanosin (m7G)-Nukleotid versehen, das helfen kann, den PIC an die mRNA zu rekrutieren und das Scannen einzuleiten. Diese Rekrutierung an die m7G 5'-Kappe wird durch die Unfähigkeit eukaryontischer Ribosomen unterstützt, zirkuläre mRNA zu translatieren, die kein 5'-Ende hat. Sobald der PIC an die mRNA bindet, scannt er, bis er das erste AUG-Codon in einer Kozak-Sequenz erreicht. Diese Abtastung wird als Abtastmechanismus der Initiierung bezeichnet.

Ein Überblick über die eukaryotische Initiation, der die Bildung des PIC und die Scanning-Methode der Initiation zeigt.

Der Scanmechanismus der Initiation beginnt, wenn der PIC das 5'-Ende der mRNA bindet. Das Scannen wird durch Dhx29- und Ddx3/Ded1- und eIF4- Proteine stimuliert . Dhx29 und Ddx3/Ded1 sind DEAD-Box-Helikasen, die helfen, jede sekundäre mRNA-Struktur aufzulösen , die das Scannen behindern könnte. Das Scannen einer mRNA wird fortgesetzt, bis das erste AUG-Codon auf der mRNA erreicht ist, dies wird als "Erste AUG-Regel" bezeichnet. Während Ausnahmen von der "Ersten AUG-Regel" existieren, finden die meisten Ausnahmen an einem zweiten AUG-Codon statt, das sich 3 bis 5 Nukleotide stromabwärts vom ersten AUG oder innerhalb von 10 Nukleotiden vom 5'-Ende der mRNA entfernt befindet. Am AUG-Codon wird ein Methionin- tRNA-Anticodon vom mRNA-Codon erkannt. Nach Basenpaarung mit dem Startcodon hilft eIF5 im PIC, ein an eIF2 gebundenes Guanosintriphosphat (GTP) zu hydrolysieren. Dies führt zu einer strukturellen Umlagerung, die den PIC dazu verpflichtet, an die große ribosomale Untereinheit (60S) zu binden und den ribosomalen Komplex (80S) zu bilden. Sobald der 80S-Ribosomenkomplex gebildet ist, beginnt die Elongationsphase der Translation.

Das erste Startcodon, das dem 5'-Ende des Strangs am nächsten liegt, wird nicht immer erkannt, wenn es nicht in einer Kozak-ähnlichen Sequenz enthalten ist. Lmx1b ist ein Beispiel für ein Gen mit einer schwachen Kozak-Konsensussequenz. Für die Initiation der Translation von einer solchen Stelle sind andere Merkmale in der mRNA-Sequenz erforderlich, damit das Ribosom das Initiationscodon erkennt. Ausnahmen von der ersten AUG-Regel können auftreten, wenn sie nicht in einer Kozak-ähnlichen Sequenz enthalten ist. Dies wird als Leaky Scanning bezeichnet und könnte ein möglicher Weg sein, die Translation durch Initiation zu kontrollieren. Für die Initiation der Translation von einer solchen Stelle sind andere Merkmale in der mRNA-Sequenz erforderlich, damit das Ribosom das Initiationscodon erkennt.

Es wird angenommen, dass der PIC an der Kozak-Sequenz durch Wechselwirkungen zwischen eIF2 und den –3 und +4 Nukleotiden in der Kozak-Position blockiert wird. Dieses Anhalten ermöglicht es dem Startcodon und der entsprechenden Anticodonzeit , die richtige Wasserstoffbrückenbindung zu bilden . Die Kozak-Konsensussequenz ist so verbreitet, dass die Ähnlichkeit der Sequenz um das AUG-Codon mit der Kozak-Sequenz als Kriterium zum Auffinden von Startcodons in Eukaryoten verwendet wird.

Unterschiede zur bakteriellen Initiation

Der Scanning-Mechanismus der Initiation, der die Kozak-Sequenz nutzt, kommt nur bei Eukaryoten vor und unterscheidet sich deutlich von der Art und Weise, wie Bakterien die Translation initiieren. Der größte Unterschied ist die Existenz der Shine-Dalgarno (SD)-Sequenz in mRNA für Bakterien. Die SD-Sequenz befindet sich in der Nähe des Startcodons, was im Gegensatz zu der Kozak-Sequenz steht, die tatsächlich das Startcodon enthält. Die Shine-Dalgarno-Sequenz ermöglicht es der 16S- Untereinheit der kleinen Ribosomen-Untereinheit, sofort an das AUG-Startcodon zu binden, ohne dass entlang der mRNA gescannt werden muss. Dies führt zu einem strengeren Selektionsprozess für das AUG-Codon als bei Bakterien. Ein Beispiel für bakterielle Startcodon-Promiskuität kann in der Verwendung der alternativen Startcodons UUG und GUG für einige Gene gesehen werden.

Archaeen- Transkripte verwenden eine Mischung aus SD-Sequenz, Kozak-Sequenz und Leaderless- Initiation. Haloarchaea haben bekanntlich eine Variante der Kozak-Konsensussequenz in ihren Hsp70- Genen.

Mutationen und Krankheiten

Marilyn Kozak zeigte durch systematische Untersuchung von Punktmutationen, dass jede Mutation zu einer starken Konsensussequenz in der –3-Position oder in der +4-Position zu einer stark beeinträchtigten Translationsinitiation sowohl in vitro als auch in vivo führte .

Campomelic Dysplasie, eine Störung, die zu Skelettproblemen führt. Campomelic Dysplasie ist das Ergebnis einer Mutation in der stromaufwärts gelegenen Kozak-Konsensussequenz.

Die Forschung hat gezeigt, dass eine Mutation von G—>C in der -6-Position des β-Globin-Gens (β+45; Mensch) die hämatologische und biosynthetische Phänotypfunktion störte. Dies war die erste Mutation, die in der Kozak-Sequenz gefunden wurde und zeigte eine 30%ige Abnahme der Translationseffizienz. Es wurde bei einer Familie aus dem Südosten Italiens gefunden, die an Thalassämie intermedia litt .

Ähnliche Beobachtungen wurden bezüglich Mutationen in der Position –5 vom Startcodon AUG gemacht. Cytosin in dieser Position zeigte im Gegensatz zu Thymin eine effizientere Translation und erhöhte Expression des Thrombozytenadhäsionsrezeptors, Glykoprotein Ibα beim Menschen.

Auch Mutationen der Kozak-Sequenz können drastische Auswirkungen auf die menschliche Gesundheit haben, insbesondere die Herzkrankheit mit dem GATA4- Gen. Das GATA4-Gen ist für die Genexpression in einer Vielzahl von Geweben einschließlich des Herzens verantwortlich. Wenn das Guanosin an der -6-Position in der Kozak-Sequenz von GATA4 zu einem Cytosin mutiert wird, kommt es zu einer Verringerung des GATA4-Proteinspiegels, was zu einem Vorhofseptumdefekt im Herzen führt.

Die Fähigkeit der Kozak-Sequenz, die Translation zu starten, kann zu neuen Initiationscodons in der typischerweise untranslatierten Region des 5' (5' UTR)-Endes des mRNA-Transkripts führen. Wenn in dieser Region eine G-zu-A-Mutation beobachtet wurde, führte dies zu einer außerhalb des Leserahmens und damit zu einer Proteinmutation. Dieses mutierte Protein führt zu einer Campomelen-Dysplasie . Campomelic Dysplasie ist eine Entwicklungsstörung, die zu Fehlbildungen des Skeletts führt.

Variationen in der Konsensussequenz

Der Kozak-Konsens wurde unterschiedlich beschrieben als:

     65432-+234
(gcc)gccRccAUGG (Kozak 1987)
       AGNNAUGN
        ANNAUGG
        ACCAUGG (Spotts et al., 1997, mentioned in Kozak 2002)
     GACACCAUGG (H. sapiens HBB, HBD, R. norvegicus Hbb, etc.) 
Kozak-ähnliche Sequenzen in verschiedenen Eukaryoten
Biota Stamm Konsenssequenzen
Wirbeltier (Kozak 1987) gccRccATGG
Fruchtfliege ( Drosophila spp.) Gliederfüßer atMAAMATGamc
Angehende Hefe ( Saccharomyces cerevisiae ) Ascomycota aAaAaAATGTCt
Schleimpilz ( Dictyostelium discoideum ) Amöbozoen aaaAAAATGRna
Ciliate Ciliophora nTaAAAATGRct
Malaria-Protozoen ( Plasmodium spp.) Apikomplexa taaAAAATGAan
Toxoplasma ( Toxoplasma gondii ) Apikomplexa gncAaaATGg
Trypanosomatidae Euglenozoa nnnAnnATGnC
Landpflanzen acAACAATGGC
Mikroalge (Dunaliella salina ) Chlorophyta gccaagATGgcg

Siehe auch

  • mRNA , der Nukleinsäurebotenstoff, der als Mittelsmann im zentralen Dogma der Biologie dient
  • Ribosom , die molekulare Maschine, die für die Proteinsynthese verantwortlich ist
  • Shine-Dalgarno-Sequenz , die ribosomale Bindungsstelle von Prokaryoten .
  • Translation , der Prozess der Peptidsynthese

Verweise

Weiterlesen