Perseus übersetzt Proteomik-Daten
Ohne Proteine läuft im Organismus gar nichts. Diese Moleküle arbeiten als molekulare Maschinen, stehen als Baumaterial zur Verfügung und treten in einer Vielzahl anderer Rollen auf. Sie sind selten aber Einzelkämpfer, so dass mittlerweile die Analyse der Gesamtheit aller Proteine in einer Zelle, einem Gewebe, einer Körperflüssigkeit oder sogar in einem Organismus im Vordergrund steht. So lässt sich nachweisen, welches Molekül wann und wo in welcher Menge auftritt und mit wem es interagiert, wobei es entsprechende Ansätze für andere biologische Moleküle gibt. Moderne Hochdurchsatzverfahren wie die Massenspektrometrie liefern die nötigen Rohdaten von oft vielen Tausend unterschiedlichen Proteine.
Aus diesen Datenbergen müssen sinnvolle und relevante Zusammenhänge extrahiert und interpretiert werden, was heute angesichts der ungeheuren Menge an Rohdaten nur noch mit Hilfe computerbasierter Methoden möglich ist. „Diese Schritte sind zum Flaschenhals bei Hochdurchsatz-Studien geworden", sagt Jürgen Cox, Leiter der Arbeitsgruppe "Computational Systems Biochemistry" am Max-Planck-Institut für Biochemie, unter dessen Leitung die Perseus-Plattform entwickelt wurde. „Vermutlich liegen noch viele potenziell wichtige Ergebnisse in bereits erhobenen Proteomik Daten verboren, nur weil die passenden Computermethoden technisch zu anspruchsvoll sind oder nicht bei den Forschern landen, die die biologische Relevanz der Ergebnisse erfassen könnten."
Cox und sein Team haben deshalb dafür gesorgt, dass einzelne Algorithmen nicht mehr länger ihren Weg in die richtigen Labors finden müssen, sondern dass sich Forscher ihre Software nach Bedarf an einer zentralen Stelle abholen können. Die Perseus-Plattform erlaubt unter anderem auch hochvariante Proteinmengen zu durchleuchten und zu analysieren. Sie kann Proteinmengen quantifizieren sowie die Interaktionen und Modifikationen der Moleküle erfassen. Die Plattform enthält statistische Methoden, die etwa Muster erkennen, Langzeitdaten analysieren, multiple Hypothesen testen und auch Daten unterschiedlicher Verfahren vergleichen.
Vorkenntnisse oder ein spezielles Training sind nicht nötig, weil die Plattform eine interaktive Umgebung mit Selbstbeteiligung ist, deren Nutzung sich weitgehend intuitiv erschließen sollte. Beschreibungen der Funktionen und Parameter auf der Seite helfen dabei ebenso wie YouTube-Videos zur Nutzung und eine Google-Gruppe mit bereits mehr als 1400 aktiven Nutzern. „Perseus hat die ersten Probeläufe auch bei extrem komplexen interdisziplinären Untersuchungen erfolgreich absolviert", sagt Cox. „Tatsächlich läuft die Software nicht nur bei proteomischen, sondern auch bei anderen großen Datensets. Wir werden die Programme künftig etwa an metabolomische Studien anpassen."
Original publication:
S. Tyanova, T. Temu, P. Sinitcyn, A. Carlson, M.Y. Hein, T. Geiger, M. Mann & J. Cox: The Perseus computational platform for comprehensive analysis of (prote)omics data, Nature Methods, Juni 2016
DOI: 10.1038/nmeth.3901