Einzelzellsequenzierung - Single cell sequencing

Die Einzelzellsequenzierung untersucht die Sequenzinformationen einzelner Zellen mit optimierten Next-Generation-Sequencing- (NGS)-Technologien und bietet eine höhere Auflösung zellulärer Unterschiede und ein besseres Verständnis der Funktion einer einzelnen Zelle im Kontext ihrer Mikroumgebung. Bei Krebs kann die Sequenzierung der DNA einzelner Zellen beispielsweise Aufschluss über Mutationen geben, die von kleinen Zellpopulationen getragen werden. In der Entwicklung kann die Sequenzierung der von einzelnen Zellen exprimierten RNAs Aufschluss über die Existenz und das Verhalten verschiedener Zelltypen geben. In mikrobiellen Systemen kann eine Population derselben Spezies genetisch klonal erscheinen, aber die Einzelzellsequenzierung von RNA oder epigenetische Modifikationen können eine Variabilität von Zelle zu Zelle aufdecken, die Populationen helfen kann, sich schnell an das Überleben in sich ändernden Umgebungen anzupassen.

Hintergrund

Eine typische menschliche Zelle besteht aus etwa 2 x 3,3 Milliarden Basenpaaren DNA und 600 Millionen Basen mRNA. Normalerweise wird eine Mischung aus Millionen von Zellen zur Sequenzierung der DNA oder RNA mit traditionellen Methoden wie der Sanger-Sequenzierung oder der Illumina-Sequenzierung verwendet . Durch die tiefe Sequenzierung von DNA und RNA aus einer einzelnen Zelle können zelluläre Funktionen umfassend untersucht werden. Wie typische NGS Experimente enthalten die Protokolle von Einzelzellen - Sequenzierung im allgemeinen die folgenden Schritte: Isolierung einer einzelnen Zelle, Nukleinsäure-Extraktion und Amplifikation, Sequenzierung Bibliothek Vorbereitung, Sequenzierung und bioinformatischen Datenanalyse. Es ist schwieriger, eine Einzelzellsequenzierung durchzuführen als eine Sequenzierung aus Zellen in großen Mengen. Die minimale Menge an Ausgangsmaterialien aus einer einzelnen Zelle führt dazu, dass Degradation, Probenverlust und Kontamination deutliche Auswirkungen auf die Qualität der Sequenzierungsdaten haben. Darüber hinaus ist aufgrund der Menge der verwendeten Nukleinsäuren im Pikogrammbereich häufig eine starke Amplifikation während der Probenvorbereitung der Einzelzellsequenzierung erforderlich, was zu einer ungleichmäßigen Abdeckung, Rauschen und einer ungenauen Quantifizierung der Sequenzierungsdaten führt.

Jüngste technische Verbesserungen machen die Einzelzellsequenzierung zu einem vielversprechenden Werkzeug, um eine Reihe scheinbar unzugänglicher Probleme anzugehen. So können beispielsweise heterogene Proben, seltene Zelltypen, Zelllinienbeziehungen, Mosaike von somatischen Geweben, Analysen von nicht kultivierbaren Mikroben und Krankheitsverlauf durch Einzelzellsequenzierung aufgeklärt werden. Die Einzelzellsequenzierung wurde von der Nature Publishing Group zur Methode des Jahres 2013 gewählt.

Sequenzierung des Einzelzellgenoms (DNA)

Die Einzelzell-DNA-Genomsequenzierung umfasst das Isolieren einer einzelnen Zelle, das Amplifizieren des gesamten Genoms oder der interessierenden Region, das Konstruieren von Sequenzierungsbibliotheken und das anschließende Anwenden der DNA-Sequenzierung der nächsten Generation (z. B. Illumina , Ion Torrent , MGI ). In Säugersystemen wurde die Einzelzell-DNA-Sequenzierung in großem Umfang angewendet, um die normale Physiologie und Krankheit zu untersuchen. Die Einzelzellauflösung kann die Rolle des genetischen Mosaiks oder der intratumoralen genetischen Heterogenität bei der Krebsentwicklung oder dem Ansprechen auf die Behandlung aufdecken. Im Kontext des Mikrobioms wird ein Genom eines einzelnen einzelligen Organismus als Single Amplified Genom (SAG) bezeichnet. Fortschritte bei der Einzelzell-DNA-Sequenzierung haben die Sammlung genomischer Daten von unkultivierten prokaryontischen Spezies ermöglicht, die in komplexen Mikrobiomen vorkommen. Obwohl sich SAGs durch eine geringe Vollständigkeit und signifikante Verzerrung auszeichnen, haben jüngste Fortschritte im Computerbereich den Aufbau nahezu vollständiger Genome aus zusammengesetzten SAGs ermöglicht. Daten, die von Mikroorganismen gewonnen werden, könnten in Zukunft Verfahren für die Kultivierung etablieren. Einige der Genom-Assembly-Tools, die bei der Einzelzell-Genomsequenzierung verwendet werden können, umfassen: SPAdes , IDBA-UD, Cortex und HyDA.

Methoden

Diese Abbildung veranschaulicht Schritte, die im Arbeitsablauf der Einzelzell-Genomsequenzierung beteiligt sind. MDA steht für Multiple Displacement Amplification.

Eine Liste von mehr als 100 verschiedenen Einzelzell-Omics-Methoden wurde veröffentlicht.

Multiple Displacement Amplification (MDA) ist eine weit verbreitete Technik, die es ermöglicht, Femtogramme von DNA von Bakterien auf Mikrogramm für die Sequenzierung zu amplifizieren . Zu den für MDA-Reaktionen erforderlichen Reagenzien gehören: Zufallsprimer und DNA-Polymerase aus dem Bakteriophagen phi29. Bei einer 30-Grad-isothermen Reaktion wird die DNA mit den enthaltenen Reagenzien amplifiziert. Während die Polymerasen neue Stränge herstellen, findet eine Strangverdrängungsreaktion statt, bei der mehrere Kopien von jeder Matrizen-DNA synthetisiert werden. Gleichzeitig werden die zuvor verlängerten Stränge verdrängt. MDA-Produkte haben eine Länge von ca. 12 kb und reichen bis ca. 100 kb, was den Einsatz in der DNA-Sequenzierung ermöglicht. Im Jahr 2017 wurde eine wesentliche Verbesserung dieser Technik namens WGA-X eingeführt, indem eine thermostabile Mutante der phi29-Polymerase genutzt wurde, die zu einer besseren Genomgewinnung aus einzelnen Zellen, insbesondere solchen mit hohem G+C-Gehalt, führte. MDA wurde auch in einem mikrofluidischen Tröpfchen-basierten System implementiert, um eine hochparallelisierte Einzelzell-Genom-Amplifikation zu erreichen. Durch die Einkapselung einzelner Zellen in Tröpfchen zum Einfangen und Amplifizieren von DNA bietet dieses Verfahren im Vergleich zu herkömmlichem MDA eine geringere Verzerrung und einen verbesserten Durchsatz.

Eine andere gängige Methode ist MALBAC . Diese Methode beginnt mit einer isothermen Amplifikation wie bei MDA, aber die Primer werden von einer „gemeinsamen“ Sequenz für die nachgeschaltete PCR-Amplifikation flankiert. Wenn die vorläufigen Amplikons erzeugt werden, fördert die gemeinsame Sequenz die Selbstligation und die Bildung von „Schleifen“, um eine weitere Amplifikation zu verhindern. Im Gegensatz zu MDA wird das hochverzweigte DNA-Netzwerk nicht gebildet. Stattdessen werden die Loops in einem weiteren Temperaturzyklus denaturiert, sodass die Fragmente mit PCR amplifiziert werden können. MALBAC wurde auch in einem mikrofluidischen Gerät implementiert, aber die Amplifikationsleistung wurde durch die Einkapselung in Nanolitertröpfchen nicht signifikant verbessert.

Beim Vergleich von MDA und MALBAC führt MDA zu einer besseren Genomabdeckung, aber MALBAC bietet eine gleichmäßigere Abdeckung über das gesamte Genom. MDA könnte zur Identifizierung von SNPs effektiver sein , wohingegen MALBAC zum Nachweis von Kopienzahlvarianten bevorzugt wird. Während die Durchführung von MDA mit einem mikrofluidischen Gerät Bias und Kontamination deutlich reduziert, zeigt die an MALBAC beteiligte Chemie nicht das gleiche Potenzial für eine verbesserte Effizienz.

Ein besonders geeignetes Verfahren zur Entdeckung genomischer Strukturvariationen ist die Einzelzell-DNA-Matrizenstrang-Sequenzierung (auch bekannt als Strand-seq). Unter Verwendung des Prinzips der Einzelzell-Tri-Channel-Verarbeitung, die gemeinsame Modellierung von Leseorientierung, Lesetiefe und Haplotyp-Phase verwendet, ermöglicht Strand-seq die Entdeckung des gesamten Spektrums somatischer struktureller Variationsklassen mit einer Größe von ≥200 kb. Strand-seq überwindet die Beschränkungen der auf der Amplifikation des gesamten Genoms basierenden Methoden zur Identifizierung somatischer genetischer Variationsklassen in einzelnen Zellen, da es nicht anfällig gegen Lese-Chimäre ist, die zu Calling-Artefakten führen (detailliert im folgenden Abschnitt besprochen) und weniger von Tropfen betroffen ist aus. Die Wahl der Methode hängt vom Ziel der Sequenzierung ab, da jede Methode andere Vorteile bietet.

Einschränkungen

Die MDA einzelner Zellgenome führt zu einer sehr ungleichmäßigen Genomabdeckung, dh einer relativen Über- und Unterrepräsentation verschiedener Regionen der Matrize, was zum Verlust einiger Sequenzen führt. Dieser Prozess besteht aus zwei Komponenten: a) stochastische Über- und Unterverstärkung zufälliger Regionen; und b) systematischer Bias gegenüber Regionen mit hohem GC-Gehalt. Die stochastische Komponente kann adressiert werden, indem Einzelzell-MDA-Reaktionen vom gleichen Zelltyp gepoolt werden, indem eine Fluoreszenz-in-situ-Hybridisierung (FISH) und/oder eine Bestätigung nach der Sequenzierung verwendet wird. Der Bias von MDA gegenüber Regionen mit hohem GC-Gehalt kann durch die Verwendung thermostabiler Polymerasen, wie in dem als WGA-X bezeichneten Prozess, angegangen werden.

Single-Nukleotid-Polymorphismen (SNPs), die einen großen Teil der genetischen Variation im menschlichen Genom ausmachen , und die Kopienzahlvariation (CNV) stellen Probleme bei der Einzelzellsequenzierung dar, ebenso wie die begrenzte Menge an DNA, die aus einer einzelnen Zelle extrahiert wird. Aufgrund der geringen DNA-Mengen bereitet eine genaue DNA-Analyse selbst nach der Amplifikation Probleme, da die Abdeckung gering und fehleranfällig ist. Bei MDA beträgt die durchschnittliche Genomabdeckung weniger als 80 % und SNPs, die nicht durch Sequenzierungs-Reads abgedeckt werden, werden ausgeschlossen. Darüber hinaus weist MDA ein hohes Verhältnis von Allel- Dropout auf und erkennt keine Allele aus heterozygoten Proben. Derzeit werden verschiedene SNP-Algorithmen verwendet, aber keiner ist spezifisch für die Einzelzell-Sequenzierung. MDA mit CNV wirft auch das Problem auf, falsche CNVs zu identifizieren, die die echten CNVs verbergen. Um dies zu lösen, können Algorithmen dieses Rauschen erkennen und beseitigen, wenn Muster aus falschen CNVs erzeugt werden können, um echte Varianten zu erzeugen.

Strand-seq überwindet die Grenzen von Methoden, die auf der Amplifikation des gesamten Genoms für das Genvarianten-Calling basieren: Da Strand-seq keine Reads (oder Read-Paare) erfordert, die die Grenzen (oder Breakpoints) von CNVs oder kopienbalancierten strukturellen Variantenklassen überschreiten, ist es weniger anfällig für gängige Artefakte von Einzelzellmethoden, die auf der Amplifikation des gesamten Genoms basieren, einschließlich Dropouts von Variantenaufrufen aufgrund fehlender Reads am Varianten-Breakpoint und Read-Chimäre.Strand-seq entdeckt das gesamte Spektrum struktureller Variationsklassen von mindestens 200 kb Größe einschließlich Bruch-Fusions-Brücken-Zyklen und Chromothripsis- Ereignissen, sowie balancierte Inversionen und Kopienzahl-balancierte oder unbalancierte Translokationen." Strukturelle Variantenaufrufe von Strand-seq werden durch den Chromosomenlängen- Haplotyp aufgelöst , der zusätzliche Variantenaufruf-Spezifität bietet. Als aktuelle Einschränkung erfordert Strand-seq sich teilende Zellen für die strangspezifische Markierung mit Bromdesoxyuridin (BrdU), und das met hod erkennt keine Varianten mit einer Größe von weniger als 200 KB, wie z. B. das Einfügen von mobilen Elementen .

Anwendungen

Mikrobiome gehören aufgrund der Schwierigkeit, die meisten Mikroorganismen in den meisten Umgebungen zu kultivieren, zu den Hauptzielen der Einzelzellgenomik. Die Einzelzellgenomik ist eine leistungsstarke Methode, um mikrobielle Genomsequenzen ohne Kultivierung zu erhalten. Dieser Ansatz wurde in großem Umfang auf Meeres-, Boden-, Untergrund-, Organismen- und andere Arten von Mikrobiomen angewendet, um ein breites Spektrum von Fragen im Zusammenhang mit mikrobieller Ökologie, Evolution, öffentlichem Gesundheitswesen und biotechnologischem Potenzial zu beantworten.

Die Krebssequenzierung ist ebenfalls eine neue Anwendung von scDNAseq. Frische oder gefrorene Tumoren können unter Verwendung von Gesamtgenom-DNAS-Ansätzen recht gut in Bezug auf SCNAs, SNVs und Umlagerungen analysiert und kategorisiert werden. Krebs-scDNAseq ist besonders nützlich für die Untersuchung der Komplexitätstiefe und der zusammengesetzten Mutationen, die in amplifizierten therapeutischen Zielen wie Rezeptor-Tyrosin-Kinase-Genen (EGFR, PDGFRA usw.) Auftretensmuster dieser Mutationen innerhalb einzelner Zellen des Tumors. Eine solche Überlappung kann eine Redundanz der Signalwegaktivierung und der Tumorzellresistenz bereitstellen.

Einzelzell-DNA-Methylom-Sequenzierung

Ein Verfahren zur DNA-Methylierungssequenzierung einzelner Zellen.

Die Einzelzell-DNA-Methylom-Sequenzierung quantifiziert die DNA-Methylierung . Es gibt mehrere bekannte Methylierungsarten, die in der Natur vorkommen, darunter 5-Methylcytosin (5mC), 5-Hydromethylcytosin (5hmC), 6-Methyladenin (6mA) und 4mC 4-Methylcytosin (4mC). Bei Eukaryoten, insbesondere Tieren, ist 5mC entlang des Genoms weit verbreitet und spielt eine wichtige Rolle bei der Regulierung der Genexpression durch die Unterdrückung transponierbarer Elemente . Die Sequenzierung von 5mC in einzelnen Zellen kann zeigen, wie epigenetische Veränderungen über genetisch identische Zellen eines einzelnen Gewebes oder einer Population zu Zellen mit unterschiedlichen Phänotypen führen.

Methoden

Die Bisulfit-Sequenzierung hat sich zum Goldstandard für den Nachweis und die Sequenzierung von 5 mC in Einzelzellen entwickelt. Die Behandlung von DNA mit Bisulfit wandelt Cytosinreste in Uracil um, lässt jedoch 5-Methylcytosinreste unberührt. Daher behält DNA, die mit Bisulfit behandelt wurde, nur methylierte Cytosine. Um die Methylom-Auslesung zu erhalten, wird die Bisulfit-behandelte Sequenz auf ein unmodifiziertes Genom ausgerichtet. Die Bisulfit-Sequenzierung des gesamten Genoms wurde 2014 in Einzelzellen erreicht. Die Methode überwindet den DNA-Verlust, der mit dem typischen Verfahren verbunden ist, bei dem Sequenzierungsadapter vor der Bisulfit-Fragmentierung hinzugefügt werden. Stattdessen werden die Adapter hinzugefügt, nachdem die DNA behandelt und mit Bisulfit fragmentiert wurde, sodass alle Fragmente durch PCR amplifiziert werden können. Mit Deep Sequencing erfasst diese Methode ~40% der gesamten CpGs in jeder Zelle. Mit der bestehenden Technologie kann DNA vor der Bisulfit-Behandlung nicht amplifiziert werden, da die 5mC-Markierungen nicht von der Polymerase kopiert werden.

Eine weitere Methode ist die Bisulfit-Sequenzierung mit reduzierter Repräsentation von Einzelzellen (scRRBS). Diese Methode nutzt die Tendenz methylierter Cytosine, sich an CpG-Inseln (CGIs) zu gruppieren, um Bereiche des Genoms mit hohem CpG-Gehalt anzureichern. Dies reduziert die Sequenzierungskosten im Vergleich zur Bisulfit-Sequenzierung des gesamten Genoms, schränkt jedoch die Abdeckung dieser Methode ein. Wenn RRBS auf Massenproben angewendet wird, wird die Mehrheit der CpG-Stellen in Genpromotoren nachgewiesen, aber die Stellen in Genpromotoren machen nur 10 % der CpG-Stellen im gesamten Genom aus. In Einzelzellen werden 40 % der CpG-Stellen aus der Sammelprobe nachgewiesen. Um die Abdeckung zu erhöhen, kann diese Methode auch auf einen kleinen Pool von Einzelzellen angewendet werden. In einer Probe von 20 gepoolten Einzelzellen wurden 63 % der CpG-Stellen aus der Sammelprobe nachgewiesen. Das Poolen einzelner Zellen ist eine Strategie zur Erhöhung der Methylomabdeckung, jedoch auf Kosten der Verschleierung der Heterogenität in der Zellpopulation.

Einschränkungen

Während die Bisulfit-Sequenzierung der am weitesten verbreitete Ansatz für den 5mC-Nachweis bleibt, ist die chemische Behandlung hart und fragmentiert und zersetzt die DNA. Dieser Effekt wird verstärkt, wenn von Massenproben zu Einzelzellen übergegangen wird. Andere Verfahren zum Nachweis der DNA-Methylierung umfassen methylierungsempfindliche Restriktionsenzyme. Restriktionsenzyme ermöglichen auch den Nachweis anderer Methylierungsarten, wie beispielsweise 6mA mit DpnI. Die auf Nanoporen basierende Sequenzierung bietet auch einen Weg zur direkten Methylierungssequenzierung ohne Fragmentierung oder Modifikation der ursprünglichen DNA. Nanoporen-Sequenzierung wurde verwendet, um die Methylome von Bakterien zu sequenzieren, die von 6 mA und 4 mC (im Gegensatz zu 5 mC in Eukaryoten) dominiert werden, aber diese Technik wurde noch nicht auf einzelne Zellen herunterskaliert.

Anwendungen

Die Einzelzell-DNA-Methylierungssequenzierung wurde häufig verwendet, um epigenetische Unterschiede in genetisch ähnlichen Zellen zu untersuchen. Um diese Methoden während ihrer Entwicklung zu validieren, wurden die Einzelzell-Methylomdaten einer gemischten Population erfolgreich durch hierarchisches Clustering klassifiziert, um verschiedene Zelltypen zu identifizieren. Eine andere Anwendung ist die Untersuchung einzelner Zellen während der ersten Zellteilungen in der frühen Entwicklung, um zu verstehen, wie verschiedene Zelltypen aus einem einzigen Embryo entstehen. Die Einzelzell-Ganzgenom-Bisulfit-Sequenzierung wurde auch verwendet, um seltene, aber hochaktive Zelltypen bei Krebs wie zirkulierende Tumorzellen (CTCs) zu untersuchen.

Vergleich von Einzelzell-Methylierungssequenzierungsmethoden hinsichtlich der Abdeckung, Stand 2015 auf Mus musculus

Einzelzell-Assay für Transposase-zugängliches Chromatin mit Sequenzierung (scATAC-seq)

Einzelzelltransposase-zugängliche Chromatin-Sequenzierung kartiert die Zugänglichkeit von Chromatin im gesamten Genom. Eine Transposase fügt Sequenzierungsadapter direkt in offene Chromatinregionen ein, wodurch diese Regionen amplifiziert und sequenziert werden können.

Einzelzell-Transkriptom-Sequenzierung (scRNA-seq)

Standardmethoden wie Microarrays und Bulk- RNA-Seq- Analyse analysieren die Expression von RNAs aus großen Zellpopulationen. In gemischten Zellpopulationen können diese Messungen kritische Unterschiede zwischen einzelnen Zellen innerhalb dieser Populationen verschleiern.

Einzelzell-RNA-Sequenzierung (scRNA-seq) liefert die Expressionsprofile einzelner Zellen und gilt ab 2020 als Goldstandard für die Definition von Zellzuständen und Phänotypen. Obwohl es nicht möglich ist, vollständige Informationen über jede von jeder Zelle exprimierte RNA zu erhalten, Aufgrund der geringen Materialmenge können Muster der Genexpression durch Gen- Clustering-Analysen identifiziert werden . Dies kann die Existenz seltener Zelltypen innerhalb einer Zellpopulation aufdecken, die möglicherweise noch nie zuvor gesehen wurde. Zum Beispiel wurden 2018 von zwei Gruppen identifiziert, die scRNA-Seq auf Lungen-Atemwegsepithelien durchführten , seltene spezialisierte Zellen in der Lunge, die als pulmonale Ionozyten bezeichnet werden und den Transmembran- Leitfähigkeitsregulator für zystische Fibrose exprimieren.

Methoden

Workflow für die Einzelzell-RNA-Sequenzierung

Aktuelle scRNA-seq-Protokolle beinhalten die Isolierung einzelner Zellen und ihrer RNA und dann das Befolgen der gleichen Schritte wie Bulk-RNA-seq: reverse Transkription (RT), Amplifikation, Generierung von Bibliotheken und Sequenzierung. Frühe Verfahren trennten einzelne Zellen in separate Vertiefungen; neuere Verfahren kapseln einzelne Zellen in Tröpfchen in einem Mikrofluidikgerät ein, wo die reverse Transkriptionsreaktion stattfindet, wodurch RNAs in cDNAs umgewandelt werden. Jedes Tröpfchen trägt einen DNA-"Barcode", der die von einer einzelnen Zelle abgeleiteten cDNAs eindeutig markiert. Sobald die reverse Transkription abgeschlossen ist, können die cDNAs vieler Zellen zur Sequenzierung zusammengemischt werden; Transkripte einer bestimmten Zelle werden durch den einzigartigen Barcode identifiziert.

Zu den Herausforderungen für scRNA-Seq gehören die Erhaltung der anfänglichen relativen Häufigkeit von mRNA in einer Zelle und die Identifizierung seltener Transkripte. Der Schritt der reversen Transkription ist entscheidend, da die Effizienz der RT-Reaktion bestimmt, wie viel der RNA-Population der Zelle schließlich vom Sequenzierer analysiert wird. Die Prozessivität von reversen Transkriptasen und die verwendeten Priming-Strategien können die Produktion von cDNA voller Länge und die Erzeugung von Bibliotheken beeinflussen, die zum 3'- oder 5'-Ende von Genen vorgespannt sind.

Im Amplifikationsschritt wird derzeit entweder PCR oder In-vitro-Transkription (IVT) verwendet, um cDNA zu amplifizieren. Einer der Vorteile von PCR-basierten Verfahren ist die Fähigkeit, cDNA voller Länge zu erzeugen. Jedoch kann auch eine unterschiedliche PCR-Effizienz bestimmter Sequenzen (z. B. GC-Gehalt und Snapback-Struktur) exponentiell amplifiziert werden, wodurch Bibliotheken mit ungleichmäßiger Abdeckung erzeugt werden. Auf der anderen Seite können, während durch IVT erzeugte Bibliotheken einen PCR-induzierten Sequenz-Bias vermeiden können, spezifische Sequenzen ineffizient transkribiert werden, wodurch ein Sequenzausfall verursacht oder unvollständige Sequenzen erzeugt werden. Mehrere scRNA-seq-Protokolle wurden veröffentlicht: Tang et al., STRT, SMART-seq, CEL-seq, RAGE-seq, Quartz-seq. und C1-Käfig. Diese Protokolle unterscheiden sich in Bezug auf Strategien für die reverse Transkription, cDNA-Synthese und -Amplifikation und die Möglichkeit, sequenzspezifische Barcodes (dh UMIs ) aufzunehmen, oder die Fähigkeit, gepoolte Proben zu verarbeiten.

Im Jahr 2017 wurden zwei Ansätze eingeführt, um gleichzeitig die mRNA- und Proteinexpression einzelner Zellen durch Oligonukleotid-markierte Antikörper, bekannt als REAP-seq und CITE-seq, zu messen.

Einschränkungen

Die meisten RNA-Seq-Methoden hängen vom Einfangen von Poly(A)-Schwanzen ab , um mRNA anzureichern und reichlich vorhandene und nicht aussagekräftige rRNA zu verbrauchen. Daher sind sie oft darauf beschränkt, polyadenylierte mRNA-Moleküle zu sequenzieren. Neuere Studien beginnen jedoch nun, die Bedeutung von Nicht-Poly(A)-RNA, wie z. Small-seq ist eine Einzelzellmethode, die kleine RNAs (<300 Nukleotide) wie microRNAs, Fragmente von tRNAs und kleine nukleoläre RNAs in Säugerzellen erfasst. Diese Methode verwendet eine Kombination aus „Oligonukleotidmasken“ (die das Einfangen von sehr häufig vorkommenden 5.8S-rRNA-Molekülen hemmen) und Größenauswahl, um große RNA-Spezies wie andere sehr häufig vorkommende rRNA-Moleküle auszuschließen. Um auf größere Nicht-Poly(A)-RNAs, wie lange nicht-kodierende mRNA, Histon-mRNA, zirkuläre RNA und Enhancer-RNA, abzuzielen, ist die Größenauswahl nicht anwendbar, um die sehr häufig vorkommenden ribosomalen RNA-Moleküle (18S- und 28s-rRNA) zu vernichten. Single-Cell RamDA-Seq ist eine Methode, die dies erreicht, indem eine reverse Transkription mit zufälligem Priming (Random Displacement Amplification) in Gegenwart von „not so random“ (NSR)-Primern durchgeführt wird, die speziell entwickelt wurden, um ein Priming auf rRNA-Molekülen zu vermeiden. Während dieses Verfahren erfolgreich Gesamt-RNA-Transkripte voller Länge für die Sequenzierung einfängt und eine Vielzahl von Nicht-Poly(A)-RNAs mit hoher Empfindlichkeit detektiert, weist es einige Einschränkungen auf. Die NSR-Primer wurden sorgfältig entsprechend der rRNA-Sequenzen im spezifischen Organismus (Maus) entworfen, und das Designen neuer Primer-Sets für andere Spezies würde einen erheblichen Aufwand erfordern. Kürzlich demonstrierte eine CRISPR-basierte Methode namens scDASH (single-cell depletion of reichlichll sequence by hybridization) einen weiteren Ansatz zur Depletion von rRNA-Sequenzen aus Einzelzell-Gesamt-RNA-Seq-Bibliotheken.

Bakterien und andere Prokaryoten sind derzeit aufgrund des Fehlens von polyadenylierter mRNA nicht für Einzelzell-RNA-seq zugänglich. Daher wird die Entwicklung von Einzelzell-RNA-seq-Methoden, die nicht vom Einfangen von Poly(A)-Schwanzen abhängen, auch entscheidend dazu beitragen, Mikrobiom-Studien mit Einzelzellauflösung zu ermöglichen. Bei bakteriellen Massenstudien wird normalerweise eine allgemeine rRNA-Verarmung angewendet, um den Mangel an polyadenylierter mRNA bei Bakterien zu überwinden, aber auf Einzelzellebene ist die in einer Zelle gefundene Gesamt-RNA zu klein. Der Mangel an polyadenylierter mRNA und die Knappheit an Gesamt-RNA in einzelnen Bakterienzellen sind zwei wichtige Barrieren, die den Einsatz von scRNA-seq in Bakterien einschränken.

Anwendungen

scRNA-Seq wird in vielen biologischen Disziplinen eingesetzt, darunter Entwicklungsbiologie , Neurologie , Onkologie , Immunologie , Herz-Kreislauf-Forschung und Infektionskrankheiten .

Mit maschinellen Lernmethoden wurden Daten aus Bulk-RNA-Seq verwendet, um das Signal-Rausch-Verhältnis in scRNA-Seq zu erhöhen. Insbesondere haben Wissenschaftler Genexpressionsprofile aus Pan-Krebs- Datensätzen verwendet, um Koexpressionsnetzwerke aufzubauen , und diese dann auf Genexpressionsprofile einzelner Zellen angewendet, um eine robustere Methode zum Nachweis des Vorhandenseins von Mutationen in einzelnen Zellen anhand von Transkriptebenen zu erhalten.

Einige scRNA-seq-Methoden wurden auch auf einzellige Mikroorganismen angewendet. SMART-seq2 wurde verwendet, um einzellige eukaryotische Mikroben zu analysieren, aber da es auf dem Einfangen von Poly(A)-Schwanzen beruht, wurde es nicht in prokaryotischen Zellen angewendet. Mikrofluidische Ansätze wie Drop-seq und die Fluidigm IFC-C1-Geräte wurden verwendet, um einzelne Malariaparasiten oder einzelne Hefezellen zu sequenzieren. Die Einzelzellhefestudie versuchte, die heterogene Stresstoleranz in isogenen Hefezellen zu charakterisieren, bevor und nachdem die Hefe Salzstress ausgesetzt wurde. Eine Einzelzellanalyse der verschiedenen Transkriptionsfaktoren durch scRNA-seq zeigte Heterogenität in der Population. Diese Ergebnisse legen nahe, dass die Regulierung zwischen den Mitgliedern einer Population variiert, um die Überlebenschancen für einen Bruchteil der Bevölkerung zu erhöhen.

Die erste Einzelzell-Transkriptomanalyse in einer prokaryotischen Spezies wurde unter Verwendung des Terminator-Exonuklease-Enzyms zum selektiven Abbau von rRNA und Rolling-Circle-Amplifikation (RCA) von mRNA durchgeführt. Bei diesem Verfahren wurden die Enden der einzelsträngigen DNA zusammenligiert, um einen Kreis zu bilden, und die resultierende Schleife wurde dann als Matrize für die lineare RNA-Amplifikation verwendet. Die endgültige Produktbibliothek wurde dann durch Microarray mit geringem Bias und guter Abdeckung analysiert. RCA wurde jedoch nicht mit RNA-seq getestet, die typischerweise eine Sequenzierung der nächsten Generation verwendet. Einzelzell-RNA-seq für Bakterien wäre sehr nützlich für die Untersuchung von Mikrobiomen. Es würde Probleme ansprechen, die bei herkömmlichen Massenmetatranskriptomik-Ansätzen auftreten, wie z.

scRNA-Seq hat beträchtliche Einblicke in die Entwicklung von Embryonen und Organismen, einschließlich des Wurms Caenorhabditis elegans , und der regenerativen Planarien Schmidtea mediterranea und Axolotl Ambystoma mexicanum, geliefert . Die ersten auf diese Weise kartierten Wirbeltiere waren Zebrafische und Xenopus laevis . Dabei wurden jeweils mehrere Stadien des Embryos untersucht, wodurch der gesamte Entwicklungsprozess zellweise abgebildet werden konnte. Die Wissenschaft hat diese Fortschritte als den Durchbruch des Jahres 2018 anerkannt .

Überlegungen

Isolierung einzelner Zellen

Es gibt mehrere Möglichkeiten, einzelne Zellen vor der Amplifikation und Sequenzierung des gesamten Genoms zu isolieren. Die fluoreszenzaktivierte Zellsortierung (FACS) ist ein weit verbreiteter Ansatz. Einzelne Zellen können auch durch Mikromanipulation gesammelt werden, beispielsweise durch serielle Verdünnung oder durch Verwendung einer Patchpipette oder eines Nanoröhrchens, um eine einzelne Zelle zu ernten. Die Vorteile der Mikromanipulation sind Einfachheit und geringe Kosten, aber sie sind mühsam und anfällig für eine falsche Identifizierung von Zelltypen unter dem Mikroskop. Die Laser-Capture-Mikrodissektion (LCM) kann auch zum Sammeln einzelner Zellen verwendet werden. Obwohl die LCM das Wissen über die räumliche Lage einer entnommenen Zelle innerhalb eines Gewebes bewahrt, ist es schwierig, eine ganze einzelne Zelle zu erfassen, ohne auch die Materialien von benachbarten Zellen zu sammeln. Zu den Hochdurchsatzverfahren zur Einzelzellisolierung gehört auch die Mikrofluidik . Sowohl FACS als auch Mikrofluidik sind genau, automatisch und in der Lage, unverzerrte Proben zu isolieren. Beide Methoden erfordern jedoch zuerst das Ablösen der Zellen von ihrer Mikroumgebung, wodurch die Transkriptionsprofile bei der RNA-Expressionsanalyse gestört werden.

Anzahl der zu analysierenden Zellen

scRNA-Seq

Im Allgemeinen werden für ein typisches Massenzell- RNA-Sequenzierungs- (RNA-seq)-Experiment zehn Millionen Reads generiert und ein Gen mit über dem Schwellenwert von 50 Reads pro kb pro Million Reads (RPKM) wird als exprimiert betrachtet. Bei einem Gen mit einer Länge von 1 kb entspricht dies 500 Reads und einem minimalen Variationskoeffizienten (CV) von 4% unter der Annahme der Poisson-Verteilung . Für eine typische Säugerzelle mit 200.000 mRNA müssen Sequenzierungsdaten von mindestens 50 Einzelzellen gepoolt werden, um diesen minimalen CV-Wert zu erreichen. Aufgrund der Effizienz der reversen Transkription und anderer Störungen, die in die Experimente eingeführt wurden, sind jedoch mehr Zellen für genaue Expressionsanalysen und Zelltypidentifizierung erforderlich.

Siehe auch

Verweise