deepTools – einfach(er) das Genom analysieren
Die open-source-Software deepTools bietet effiziente und leicht zu bedienende Werkzeuge für komplexe Analysen zur Tiefensequenzierung.
Die Sequenzierung des Erbguts ist in den letzten 10 Jahre billiger, präziser und schneller geworden. Dadurch steigen die erzeugten Datenmengen rapide an. Aufgrund deren Größe und Komplexität nimmt die Analyse sehr viel Zeit in Anspruch. Wissenschaftler am Max-Planck-Institut für Immunbiologie und Epigenetik haben nun eine Software entwickelt, mit der Rohdaten aus DNA-Sequenzierungen in einem Bruchteil der bisherigen Zeit standardisiert und transparent bearbeitet werden können. Dadurch werden Experimente wesentlich leichter vergleichbar. Eine Webplattform macht die open-source-Software auch Programmier-Laien leicht zugänglich. Software und Dokumentation wurden im Fachjournal Nucleic Acid Research veröffentlicht.
Mit dem Abschluss des Human-Genom-Projekts im Jahr 2000 hielt die DNA-Sequenzierung Einzug in den wissenschaftlichen Alltag. Verbesserte Methoden und optimierte Rechenverfahren verkürzten die Zeit von der Probenahme bis zur Datenanalyse um das 1000-fache. „Heute ist nicht mehr das Auslesen des DNA-Codes der zeitaufwändigste Schritt, sondern die Interpretation der Daten. Hier leistet die von uns entwickelte Software deepTools einen wichtigen Beitrag“, sagt Dr. Thomas Manke, Leiter der Bionformatik-Gruppe am MPI für Immunbiologie und Epigenetik. Die open-source-Software deepTools sowie seine ausführliche Dokumentation sind im Netz jedem kostenlos zugänglich (http://deeptools.github.io).
deepTools führt alle wichtigen Analyseschritte durch, die nach einer (Tiefen-)Sequenzierung notwendig werden: nach der Erstellung der DNA-Sequenz lassen sich mit deepTools Qualitätskontrollen und statistische Normalisierungen durchführen. In Zusammenarbeit mit Informatikern der Universität Freiburg wurde Nutzern die Software auch über die Webplattform ‚Galaxy’ zugänglich gemacht. Dies soll vor allem Nicht-Informatikern den Umgang mit der Software erleichtern. „Dank der einfachen Bedienbarkeit mit Galaxy und der ausführlichen Anleitung mit vielen Beispielen aus der Praxis können Wissenschaftler ihre Daten mit deepTools selbst analysieren. Damit werden sie wesentlich flexibler und eigenständiger als zuvor“, erklärt Friederike Dündar, Ko-Erstautorin der Publikation.
Aufgrund angepasster Abläufe und unter optimierter Ausnutzung der Computerkapazitäten lassen sich Analysen mit deepTools in einem Bruchteil der bisher benötigten Zeit durchführen. Für eine weitere Beschleunigung sorgt die weitgehende Trennung von Datenanalyse und Datenvisualisierung.
Anders als die meisten bisherigen Software-Lösungen wurde deepTools so entwickelt, dass es unterschiedlichsten Anwendungen und Bedürfnissen entspricht. Ein sehr hohes Maß an Standardisierung und Dokumentation des Programmpakets erleichtert die Vergleichbarkeit zwischen unterschiedlichen Experimenten und Forschungsgruppen wesentlich. „Diese Vergleichbarkeit zu verbessern war uns ein besonderes Anliegen. Dadurch sparen die Wissenschaftler bei Aufbereitung und Formatierung der Daten die Zeit, die sie später für die Interpretation der Daten verwenden können“, sagt Dr. Fidel Ramírez, Ko-Erstautor der Publikation.