Pressemitteilung

Maschinelles Lernen
11.04.2019

Mit PAGA klare Sicht im Big-Data-Nebel

Bei der Analyse molekularer Prozesse auf Basis einzelner Zellen entstehen schnell große Datenmengen. Forschende des Helmholtz Zentrums München und der Technischen Universität München zeigen jetzt, welche Möglichkeiten ihr Computer-Algorithmus PAGA* bietet. Auf der Basis von Big Data erstellen sie eine graphische, leicht interpretierbare Karte, die zelluläre Prozesse und Schicksale in komplexen Zusammenhängen aufzeigt. Ihre Veröffentlichung ist in Genome Biology erschienen.

PAGA-basierte Einbettung der Entwicklungstrajektorien im Embryo des Zebrafisches, gefärbt nach Zeitpunkten. © Originaldaten von Wagner et al., Science (2018).

Das Schicksal einzelner Zellen im Körper ist in vielerlei Hinsicht relevant. Forscher wollen Entwicklungsprozesse untersuchen, aber auch verstehen, wie es zur Entstehung von Krankheiten kommt. „Bei Experimenten entstehen große Datensätze, sprich Big Data“, erklärt Prof. Dr. Dr. Fabian Theis, Direktor des Institute of Computational Biology (ICB) am Helmholtz Zentrum München und Professor für Mathematische Modellierung biologischer Systeme an der Technischen Universität München (TUM). Forscher erfassen nicht nur Informationen über die Zelle selbst**, sondern auch über Wechselwirkungen mit anderen Zellen oder anderen Gewebetypen. Theis: „Bislang gab es jedoch keine Möglichkeiten, um komplexe Prozesse auf zellulärer Ebene verständlich abzubilden.“

PAGA interpretiert Big Data

Forscher arbeiteten dabei bislang mit zwei Ansätzen zur Datenanalyse. Entweder suchten sie nach Zellen mit ähnlichen Eigenschaften und gruppierten diese („Clustering“). Oder sie beschrieben den zeitlichen Ablauf von Zellen auf ihren Entwicklungspfaden („Trajektorieninferenz“). „Wenn man diese sehr unterschiedlichen „Brillen“ nimmt, um auf die Daten zu sehen, entstehen natürlich abweichende und unklare Interpretationen“, ergänzt Dr. Dr. Alex Wolf. Er leitete bis vor kurzem ein Machine Learning Team am ICB. „PAGA leistet alles, was Clustering und Trajektorieninferenz kann, in einer einzigen Analyse, mit einer einzigen Methode und einem einzigen schlüssigen Ansatz zur Modellierung.“ Je nach gewünschter Auflösung gruppiert das Tool Zellen beispielsweise anhand ihres Zelltyps (etwa Hautzellen), ihres biologischen Zustands (beispielsweise in Teilung) und zeigt die dabei zelluläre Übergänge zwischen Typen und Zuständen auf.

Anwendung in der Forschung

In den letzten Monaten sind mehrere Fachartikel erschienen, die zeigen, welche Möglichkeiten PAGA bietet. Mireya Plass vom Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft rekonstruierte zusammen mit Wolf und Kollegen den vollständigen zellulären Stammbaum eines Plattwurms*** - einer der von Science kuratierten wissenschaftlichen Durchbrüche des Jahres 2018****. Vor kurzem hat ein Team um Blanca Pijuan-Sala von der University of Cambridge mit Hilfe von PAGA zum ersten Mal die Entwicklungsprozesse eines Mausembryos rekonstruiert*****. Weitere Fachartikel zeigen, dass PAGA auch im klinischen Kontext wichtige Ergebnisse liefert. Forschende vom Broad Institute of MIT and Harvard untersuchten chronisch-entzündliche Darmerkrankungen******. Sie konnten nachweisen, dass Störungen der Zellentwicklung das Krankheitsbild erklären, die Abstammungslinien der Zellen im Darm erhielten sie mit PAGA. Theis sieht im Tool auch künftig große Potenziale: „Im Grunde kann jedes biologische Phänomen, das sich auf einen zellulären Prozess zurückführen lässt, mit PAGA analysiert werden, sobald auch Daten vorhanden sind.“

Weitere Informationen

Originalpublikation
Wolf FA et al (2019): PAGA: graph abstraction reconciles clustering with trajectory inference through a topology preserving map of single cells, doi: 10.1186/s13059-019-1663-x, Link: https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1663-x

* PAGA steht für partition-based graph abstraction (PAGA): ein Verfahren, bei dem verschiedene Ansätze wie die Gruppierung von Zellen nach Eigenschaften und die zeitliche Entwicklung gemeinsam betrachtet werden.

** Dazu gehören u.a. das Transkriptom (die Gesamtheit aller aktiven Gene), das Proteom (die Gesamtheit aller gebildeten Proteine), die Morphologie (das Erscheinungsbild einer Zelle) bzw. das Epigenom (die Gesamtheit aller Veränderungen an der DNA und an speziellen Proteinen im Zellkern, den Histonen).

*** Plass M et al (2018): Cell type atlas and lineage tree of a whole complex animal by single-cell transcriptomics, doi: 10.1126/science.aaq1723

**** Link: https://vis.sciencemag.org/breakthrough2018/

***** Pijuan-Sala B et al (2019): A single-cell molecular map of mouse gastrulation and early organogenesis, doi: 10.1038/s41586-019-0933-9

****** Smillie CS et al, Rewiring of the cellular and inter-cellular landscape of the human colon during ulcerative colitis, doi: 10.1101/455451

Das Helmholtz Zentrum München verfolgt als Deutsches Forschungszentrum für Gesundheit und Umwelt das Ziel, personalisierte Medizin für die Diagnose, Therapie und Prävention weit verbreiteter Volkskrankheiten wie Diabetes mellitus, Allergien und Lungenerkrankungen zu entwickeln. Dafür untersucht es das Zusammenwirken von Genetik, Umweltfaktoren und Lebensstil. Der Hauptsitz des Zentrums liegt in Neuherberg im Norden Münchens. Das Helmholtz Zentrum München beschäftigt rund 2.300 Mitarbeiter und ist Mitglied der Helmholtz-Gemeinschaft, der 19 naturwissenschaftlich-technische und medizinisch-biologische Forschungszentren mit rund 37.000 Beschäftigten angehören. 

Das Institut für Computational Biology (ICB) führt datenbasierte Analysen biologischer Systeme durch. Durch die Entwicklung und Anwendung bioinformatischer Methoden werden Modelle zur Beschreibung molekularer Prozesse in biologischen Systemen erarbeitet. Ziel ist es, innovative Konzepte bereitzustellen, um das Verständnis und die Behandlung von Volkskrankheiten zu verbessern.

Die Technische Universität München (TUM) ist mit rund 550 Professorinnen und Professoren, 41.000 Studierenden sowie 10.000 Mitarbeiterinnen und Mitarbeitern eine der forschungsstärksten Technischen Universitäten Europas. Ihre Schwerpunkte sind die Ingenieurwissenschaften, Naturwissenschaften, Lebenswissenschaften und Medizin, verknüpft mit den Wirtschafts- und Sozialwissenschaften. Die TUM handelt als unternehmerische Universität, die Talente fördert und Mehrwert für die Gesellschaft schafft. Dabei profitiert sie von starken Partnern in Wissenschaft und Wirtschaft. Weltweit ist sie mit dem Campus TUM Asia in Singapur sowie Verbindungsbüros in Brüssel, Kairo, Mumbai, Peking, San Francisco und São Paulo vertreten. An der TUM haben Nobelpreisträger und Erfinder wie Rudolf Diesel, Carl von Linde und Rudolf Mößbauer geforscht. 2006 und 2012 wurde sie als Exzellenzuniversität ausgezeichnet. In internationalen Rankings gehört sie regelmäßig zu den besten Universitäten Deutschlands. 

Wir verwenden Cookies um Ihnen den Besuch der Webseite so angenehm wie möglich zu machen. Wir benötigen Cookies um die Dienste ständig zu verbessern, bestimmte Features zu ermöglichen und wenn wir Dienste bzw. Inhalte Dritter einbetten, wie beispielsweise den Videoplayer. Durch die Nutzung unserer Webseite stimmen Sie der Nutzung von Cookies zu. Wir verwenden unterschiedliche Arten von Cookies. Hier haben Sie die Möglichkeit, Ihre Cookie-Einstellungen zu personalisieren:

Einstellung anzeigen.
In unserer Datenschutzerklärung finden Sie weitere Informationen.

Dort können Sie Ihre Cookie-Einstellungen jederzeit ändern.