Seltene Krankheiten entschlüsseln: Eine KI-gestützte diagnostische Revolution
Kamilia Zaripova
Von seltenen Krankheiten sind weltweit über 300 Millionen Menschen betroffen, doch die meisten Patienten warten 5-7 Jahre auf eine korrekte Diagnose. Es gibt über 7.000 seltene Krankheiten, von denen 80% genetisch bedingt sind und für fast die Hälfte keine ursächlichen Gene identifiziert wurden. Diese diagnostische Herausforderung - die "diagnostische Odyssee" - wird durch künstliche Intelligenz verändert. In diesem Blog wird untersucht, wie KI-Tools wie Wissensgraphen und maschinelles Lernen die Diagnose seltener Krankheiten revolutionieren und sie für Patienten, die Antworten am dringendsten benötigen, schneller und genauer machen.
Einführung
Trotz großer Fortschritte in der DNA-Technologie wird die Hälfte aller Patienten mit vermuteten genetischen Krankheiten auch nach umfassenden Gentests nicht diagnostiziert. Seltene Krankheiten betreffen einzeln weniger als 1 von 2.000 Menschen, zusammengenommen jedoch Hunderte von Millionen Menschen weltweit - eine gewaltige kollektive Gesundheitsherausforderung [van Karnebeek et al., 2024].
Die "diagnostische Odyssee" beschreibt, was viele Patienten erleben: jahrelange ergebnislose Tests, Besuche bei mehreren Fachärzten und steigende Arztrechnungen ohne klare Antworten. Diese Reise verursacht erheblichen Stress für die Familien und verzögert Behandlungen, die ein Fortschreiten der Krankheit verhindern oder die Lebensqualität verbessern könnten.
Die herkömmliche Diagnose beruht darauf, dass Ärzte klinische Symptome manuell mit komplexen genetischen Daten verknüpfen - ein Prozess, der immer schwieriger wird, je größer und komplexer die genetischen Datenbanken werden. Künstliche Intelligenz bietet eine Lösung, indem sie Patientensymptome automatisch mit umfangreichen medizinischen Wissensdatenbanken verknüpft und so möglicherweise die Diagnose beschleunigt und die Ergebnisse für Patienten mit seltenen genetischen Erkrankungen verbessert.
Biologische Schlüsselkonzepte
Um die Rolle der künstlichen Intelligenz bei der Diagnose seltener Krankheiten zu verstehen, muss man sich mit mehreren wichtigen Konzepten vertraut machen:
DNA, Genom und Exom:
Das menschliche Genom enthält 3 Milliarden DNA-"Buchstaben", die als Anweisungen für die menschliche Entwicklung dienen. Das Exom macht nur 2 % des Genoms aus - die Teile, die für Proteine kodieren -, enthält aber 85 % der krankheitsverursachenden Mutationen. Dies macht die Exom-Sequenzierung für die Diagnose kosteneffizient.
Phänotyp gegen Genotyp:
Der Phänotyp bezieht sich auf beobachtbare Merkmale wie körperliche Merkmale, Symptome und Testergebnisse. Der Genotyp bezieht sich auf die gesamte genetische Ausstattung einer Person. Die Beziehung zwischen ihnen ist komplex - ähnliche Symptome können unterschiedliche genetische Ursachen haben, und dieselbe genetische Veränderung kann manchmal unterschiedliche Symptome verursachen.
Biomedizinische Wissensgraphen (WG):
Diese organisieren medizinische Informationen als zusammenhängende Netzwerke, die Gene, Krankheiten, Symptome und Behandlungen durch definierte Beziehungen miteinander verbinden. Sie helfen Computern, komplexe biologische Zusammenhänge zu verstehen und Schlussfolgerungen zu ziehen, die bei einer separaten Betrachtung der Komponenten möglicherweise nicht offensichtlich sind. Ein Beispiel für einen patientenspezifischen Wissensgraphen - der Teil des gesamten WG, der mit patientenspezifischen Daten abgebildet wird - ist in Abbildung 1 dargestellt.
Priorisierung der Gene:
Computergestützte Methoden, die Gene danach einstufen, wie wahrscheinlich es ist, dass sie die Krankheit eines Patienten verursachen. Diese Algorithmen kombinieren mehrere Arten von Beweisen, um diagnostische Entscheidungen zu treffen.
Abbildung 1: Ein Beispiel für einen vereinfachten patientenspezifischen Ein-Sprung-Subgraphen und seine Nachbarschaft, der die Beziehungen zwischen dem POLR3A-Gen und damit verbundenen Genen, Krankheiten und Phänotypen veranschaulicht. Der echte Patientensubgraph weist eine ähnliche Struktur auf, ist aber wesentlich komplexer.
Große diagnostische Herausforderungen
Mehrere miteinander verknüpfte Probleme machen die Diagnose seltener Krankheiten besonders schwierig:
Umfang und Wissenslücken:
Bei über 7.000 seltenen Krankheiten, aber weniger als 500 zugelassenen Behandlungen [van Karnebeek et al., 2024], haben die meisten Ärzte nur mit einem kleinen Teil dieser Krankheiten zu tun. Für fast die Hälfte der genetisch bedingten Krankheiten wissen wir immer noch nicht, welche Gene dafür verantwortlich sind.
Lange diagnostische Verzögerungen:
Patienten warten in der Regel 5-7 Jahre auf eine Diagnose [van Karnebeek et al., 2024], während derer sie möglicherweise falsche Diagnosen erhalten, sich unnötigen Eingriffen unterziehen und wichtige Behandlungszeitfenster verpassen. Dies führt zu einem "Diagnosetrauma" - einer psychologischen Belastung durch anhaltende medizinische Unsicherheit.
Bevölkerungs-Bias:
Datenbanken für genetische Forschung sind zu 78% europäisch [van Karnebeek et al., 2024], was die diagnostische Genauigkeit für Patienten mit anderem ethnischen Hintergrund einschränkt. Dadurch werden gesundheitliche Ungleichheiten aufrechterhalten und die Wirksamkeit der genetischen Medizin für unterrepräsentierte Bevölkerungsgruppen verringert.
Unklare genetische Varianten:
Bei modernen Gentests werden Millionen von genetischen Veränderungen gefunden, von denen viele als "Varianten unklarer Bedeutung" eingestuft werden - Veränderungen, von denen wir nicht wissen, ob sie Krankheiten verursachen. Diese Ungewissheit erschwert die Diagnose, da die Ärzte nicht feststellen können, welche Varianten tatsächlich problematisch sind.
Abbildung 2: Transformation klinischer Arbeitsabläufe: Traditioneller gegen KI-gestützter Ansatz. (A) Der traditionelle ärztliche Arbeitsablauf umfasst vier aufeinanderfolgende Schritte mit erheblichen Herausforderungen in jeder Phase und erfordert 5-7 Jahre für die Diagnose mit einer Erfolgsquote von 50-60%. Ärzte sehen sich bei der Bewertung mit einer Verzerrung durch Mustererkennung, zeitintensiven Literaturrecherchen, einer begrenzten Abdeckung des Genpanels (20-50 Gene) und einer komplexen Varianteninterpretation konfrontiert. (B) Ein KI-gestützter Arbeitsablauf rationalisiert den Prozess in drei integrierten Schritten unter Verwendung der standardisierten Human Phenotype Ontology (HPO)-Terminologie, einer umfassenden genomweiten Analyse von mehr als 8.000 Genen und einer klinischen Entscheidungshilfe, wodurch die Diagnosezeit auf 3-6 Monate mit einer Erfolgsquote von 70-85% reduziert wird. Die Auswirkungen zeigen erhebliche Verbesserungen in Bezug auf die Zeiteffizienz, die Genabdeckung, die diagnostische Qualität und die Erfahrung der Ärzte und stellen einen Paradigmenwechsel hin zu einer systematischeren und umfassenderen Diagnose seltener Krankheiten dar.
Die 5 bis 7 Jahre, die bei herkömmlichen diagnostischen Odysseen anfallen, werden nicht mit direkter ärztlicher Arbeit verbracht, sondern ergeben sich aus den fragmentierten Versorgungswegen: Patienten besuchen mehrere Spezialisten, unterziehen sich aufeinanderfolgenden Tests und warten Monate zwischen den Terminen. Jedes negative Ergebnis setzt den Prozess neu in Gang, während die Ärzte manuell die Literatur durchsehen und Varianten neu bewerten, wenn neue Erkenntnisse auftauchen. KI-gestützte Arbeitsabläufe verkürzen diesen Prozess drastisch, indem sie genetische und phänotypische Daten innerhalb von Stunden integrieren. Die klinische Bestätigung, die genetische Beratung und die ethische Berichterstattung erfordern jedoch nach wie vor menschliche Aufsicht, was erklärt, warum die Gesamtzeit nach wie vor im Bereich von mehreren Monaten statt von Tagen liegt.
Die Lücke schließen: Wo KI zum Einsatz kommt
Aus Sicht eines Klinikers erfordert die Diagnose seltener Krankheiten oft die Integration vieler verschiedener Informationen – klinischer Beobachtungen, Labordaten, Bildgebungsbefunden und, sofern verfügbar, Ergebnissen der Gensequenzierung. Jeder Fall ist einzigartig, und obwohl die Gentechnologie rasante Fortschritte gemacht hat, bleibt die Interpretation der Ergebnisse im richtigen klinischen Kontext komplex. Künstliche Intelligenz kann diesen Prozess unterstützen, indem sie Ärzten hilft, sich effizienter in der wachsenden Menge an genomischen und phänotypischen Erkenntnissen zurechtzufinden.
In der Praxis fungieren KI-Tools als Erweiterung der klinischen Argumentation. Sie aggregieren Informationen aus veröffentlichten Studien, Variantendatenbanken und Phänotyp-Ontologien und zeigen mögliche Zusammenhänge zwischen den Befunden eines Patienten und bekannten genetischen Mechanismen auf. Anstatt das medizinische Urteilsvermögen zu ersetzen, liefern sie strukturierte, evidenzbasierte Vorschläge, die als Orientierung für weitere Untersuchungen dienen. Beispielsweise könnte ein KI-System einen bisher nicht in Betracht gezogenen Zusammenhang zwischen einem Gen und einer Krankheit vorschlagen, der mit dem Phänotyp des Patienten übereinstimmt, und so eine gezielte Nachuntersuchung anstelle einer breit angelegten explorativen Untersuchung veranlassen.
Die jüngsten Fortschritte in der KI-gestützten Diagnostik haben dazu geführt, dass sich der analytische Fokus von Genomsequenzierungsdaten hin zu klinischen Phänotypen verlagert hat. Im Gegensatz zu früheren Systemen, die sich in erster Linie auf genetische Informationen oder vordefinierte Kandidaten-Genlisten stützen, können diese neuen Ansätze direkt auf der Grundlage der bei der Patientenuntersuchung verfügbaren phänotypischen Beschreibungen arbeiten. Dies ermöglicht die Erstellung vorläufiger Diagnosehypothesen, noch bevor die Laborergebnisse vorliegen. Durch die Integration beobachtbarer klinischer Merkmale mit strukturierten biomedizinischen Wissensgraphen können solche Methoden den Genen Priorität einräumen, die am ehesten mit dem beobachteten Krankheitsbild übereinstimmen. In der klinischen Praxis erleichtert dies eine frühere Hypothesenbildung, gezieltere Teststrategien und eine verbesserte Kommunikation mit Patienten und Familien hinsichtlich möglicher Diagnoseverläufe.
Letztendlich entsprechen diese Entwicklungen weitgehend den etablierten Mustern der klinischen Argumentation – beginnend mit der Charakterisierung der Symptome, gefolgt von der Differentialdiagnose und der iterativen Verfeinerung, sobald neue Daten vorliegen. Die Einbettung von KI in diesen Arbeitsablauf hat das Potenzial, Diagnoseprozesse zu beschleunigen, die Transparenz zu erhöhen und den Umfang der Analyse zu erweitern, während die zentrale Rolle des Klinikers bei der Interpretation und Entscheidungsfindung erhalten bleibt.
Wie die KI das Bild verändert
Forscher haben drei wichtige KI-Ansätze entwickelt, um die diagnostischen Herausforderungen zu bewältigen, die jeweils unterschiedliche Aspekte des Rätsels der seltenen Krankheiten angehen:
DNA-basierte Methoden:
Was sie tun: Diese Werkzeuge analysieren genetische Sequenzierungsdaten, um krankheitsverursachende DNA-Varianten zu identifizieren.
Wie sie funktionieren: Werkzeuge wie MutationTaster [Steinhaus et al., 2021], CADD [Rentzsch et al., 2019], und M-CAP [Jagadeesh et al., 2016] verwenden Algorithmen des maschinellen Lernens, die auf Millionen bekannter genetischer Varianten trainiert wurden. Sie bewerten Faktoren wie die Häufigkeit der Varianten in gesunden Populationen, ihre Auswirkungen auf die Proteinstruktur und die Frage, ob ähnliche Varianten bereits mit Krankheiten in Verbindung gebracht wurden.
Warum dieser Ansatz? Wenn man den genauen genetischen "Tippfehler" identifizieren kann, der die Krankheit eines Patienten verursacht, kann man eine endgültige Diagnose stellen und eine gezielte Behandlung durchführen. Diese Instrumente sind jedoch begrenzt, da sie umfassende Datenbanken mit gut charakterisierten Varianten benötigen, um genaue Vorhersagen treffen zu können, was bedeutet, dass sie für jeden Patienten zuvor einen Gentest durchführen müssen.
Symptombasierte Werkzeuge:
Was sie tun: Sie konzentrieren sich auf beobachtbare Patientenmerkmale - Symptome, körperliche Merkmale und Testergebnisse - und nicht auf genetische Daten.
Wie sie funktionieren: Phenolyzer [Yang et al., 2015, Köhler et al., 2009] durchforstet medizinische Literatur um Verbindungen zwischen Symptomen und relevanten Genen herzustellen, wobei im Wesentlichen gefragt wird: "Welche Gene werden neben diesen Symptomen in Forschungsarbeiten am häufigsten erwähnt?" Gesichtsanalyse-Tools wie DeepGestalt [Gurovich et al., 2019] und GestaltMatcher [Hsieh et al., 2022]erkennen mit Hilfe von Computervision subtile Gesichtsmerkmale, die menschliche Ärzte übersehen könnten, und analysieren Faktoren wie Augenabstand, Nasenform und Gesichtsproportionen, die auf bestimmte genetische Syndrome hinweisen können.
Warum dieser Ansatz? Viele genetisch bedingte Krankheiten haben ausgeprägte Symptommuster, die vor einem Gentest auftreten, und manche Patienten haben keinen Zugang zu teuren Gentests. Diese Instrumente haben jedoch Probleme, wenn Patienten ungewöhnliche Kombinationen von Symptomen aufweisen oder wenn mehrere Erkrankungen ähnliche Merkmale verursachen.
Kombinierte Ansätze:
Was sie tun: Hybride Methoden integrieren sowohl genetische als auch klinische Informationen, um die Diagnosegenauigkeit zu verbessern.
Wie sie funktionieren: AI-MARRVEL (AIM) [Mao et al., 2024] verwendet einen Zufallswald - stellen Sie sich vor, dass mehrere Expertenausschüsse jeweils darüber abstimmen, welche genetischen Varianten am verdächtigsten sind, und dann ihre Stimmen kombinieren. Dabei werden sowohl DNA-Sequenzierungsdateien als auch standardisierte Symptombeschreibungen gleichzeitig analysiert. Wissensgraphenmethoden wie CADA [Peng et al., 2021] und SHEPHERD [Alsentzer et al., 2022] erstellen vernetzte Karten des medizinischen Wissens, indem sie Symptome mit Krankheiten und Genen durch etablierte Beziehungen verknüpfen und dann KI einsetzen, um den kürzesten "Weg" von den Symptomen eines Patienten zu möglichen genetischen Ursachen zu finden. Zwei weitere weit verbreitete integrierte Tools sind Amelie [Birgmeier et al., 2020] und PhenoApt [Chen et al., 2023], die ebenfalls klinische Phänotypen mit genomischen Daten kombinieren, um die Priorisierung von Genen zu unterstützen.
Amelie konzentriert sich auf die literaturbasierte Entdeckung von Genen und erstellt eine Rangliste von Genkandidaten auf Grundlage der Ähnlichkeit zwischen den Symptomen eines Patienten (kodiert in Begriffen der Human Phenotype Ontology) und den Phänotyp-Gen-Assoziationen, die aus Millionen von wissenschaftlichen Artikeln gewonnen wurden. Dieses Modell kann ohne die Liste der Kandidatengene nicht funktionieren. PhenoApt hingegen funktioniert auch ohne vorherige genetische Daten, indem es die Phänotypen von Patienten direkt mit Wissensgraphen zu Genen und Krankheiten verknüpft. Beide Ansätze ebneten den Weg für neuere Methoden wie PhenoKG, die diese Ideen erweitern, indem sie auf das gesamte Genom skalieren und die Abhängigkeit von vorheriger Filterung aufheben.
Warum dieser Ansatz? Die Kombination mehrerer Arten von Erkenntnissen sollte theoretisch genauere Diagnosen liefern als die alleinige Verwendung genetischer oder klinischer Daten. Die Einschränkung von SHEPHERD besteht jedoch darin, dass Ärzte eine vorausgewählte Liste von Kandidatengenen vorlegen müssen, was den Zweck verfehlt, wenn die Ärzte bereits wissen, welche Gene sie in Verdacht haben.
PhenoKG:
Vor kurzem haben wir einen neuen Ansatz vorgeschlagen [Zaripova et al., 2025].
Was PhenoKG tut: Es arbeitet ausschließlich mit den Symptomen des Patienten, ohne dass ein Gentest erforderlich ist.
Wie es funktioniert: Das System nimmt die Symptombeschreibung eines Patienten und reichert sie mit biomedizinischen Wissensgraphen an, die komplexe Beziehungen zwischen Symptomen, Krankheiten und Genen erfassen. Anstatt mit einer kleinen Liste von 15-20 von Experten vermuteten Genen zu beginnen, ordnet PhenoKG etwa 8.000 Gene im gesamten menschlichen Genom nach ihrer Wahrscheinlichkeit, die Erkrankung des Patienten zu verursachen. PhenoKG verwendet graphenbasierte Netzwerke, um zu modellieren, wie Symptome mit Krankheiten und Krankheiten mit Genen zusammenhängen, und erfasst so patientenspezifische Muster, die bei herkömmlichen Ansätzen möglicherweise übersehen werden.
Warum das wichtig ist: Dieser Ansatz behebt drei kritische Einschränkungen: Er erfordert keine teuren Gentests im Vorfeld, er ist nicht davon abhängig, dass die Ärzte bereits wissen, welche Gene zu vermuten sind, und er kann potenziell neue Krankheits-Gen-Assoziationen entdecken, die auf herkömmlichen, von Experten erstellten Listen nicht erscheinen würden. Das System erreicht ohne vorherige Filterung eine Genauigkeit von 22.5 ± 2.5%, d.h. in 22.5 ± 2.5% der Fälle erscheint das richtige krankheitsverursachende Gen unter den am besten bewerteten Vorschlägen. Mit optionalem Experteninput steigt die Genauigkeit auf 83.9 ± 1.2%, was die Wirksamkeit sowohl als eigenständiges Instrument als auch als Ergänzung zu herkömmlichen klinischen Arbeitsabläufen belegt. Im Vergleich zu bestehenden Systemen übertrifft PhenoKG die Ergebnisse von SHEPHERD (10,4% ohne vorherige Filterung → 65,9% mit vorheriger Filterung), Amelie (51,8% mit Kandidatengenlisten) und PhenoApt (16,7% ohne Kandidatengene) erheblich. Dies könnte besonders wertvoll sein für Patienten mit ungewöhnlichen Krankheitsbildern oder für Patienten aus unterrepräsentierten Bevölkerungsgruppen, bei denen das vorhandene Wissen möglicherweise unvollständig ist. Die nächsten Schritte wären hier die Erstellung einer Liste von Kandidatengenen, die nur die Phänotypen enthält.
Blick nach vorn
Die Konvergenz neu entstehender computergestützter Paradigmen bietet ungeahnte Möglichkeiten für bahnbrechende Innovationen bei der Diagnose seltener Krankheiten. Künftige Systeme könnten föderierte Lernarchitekturen mit differenziertem Datenschutz für Edge-Diagnosemodelle auf mobilen Geräten nutzen, die die Erkennung akustischer Biomarker in Echtzeit und die Phänotypisierung durch Computer Vision ohne Datenaustausch ermöglichen. Graphenbasierte Kausalschlussmodelle könnten patientenspezifische digitale Zwillinge unter Verwendung hybrider neuronal-symbolischer Architekturen erzeugen, die kontrafaktische genetische Szenarien über biologische Prozesse auf mehreren Ebenen simulieren. Blockchain-gestützte Diagnosenetzwerke könnten Multi-Agenten-Konsensalgorithmen implementieren, bei denen spezialisierte KI-Komponenten Fälle durch aufmerksamkeitsbasierte neuronale Architekturen mit Unsicherheitsquantifizierung kollaborativ lösen. Groß angelegte multimodale Basismodelle, die auf genomischen Sequenzen, medizinischer Bildgebung und Sensordaten trainiert sind, könnten ein "few-shot"-Lernen für neuartige Zustände durch modusübergreifende Aufmerksamkeitsmechanismen und kontrastive Lernziele ermöglichen. Am interessantesten ist vielleicht, dass temporale neuronale Graphen-Netzwerke mit dynamischen Wissensgraphen-Einbettungen zukünftige Gen-Krankheits-Assoziationen mit Hilfe von Variations-Auto-Encodern vor der experimentellen Validierung vorhersagen könnten. Der Bereich der seltenen Krankheiten ist ein ideales Testfeld für diese fortschrittlichen Ansätze, denn hier schaffen hochdimensionale Daten, komplexe biologische Zusammenhänge und dringender klinischer Bedarf die perfekte Umgebung, um die KI-Forschung in Richtung robusterer, interpretierbarer und klinisch umsetzbarer Systeme voranzutreiben.
Referenzen
Emily Alsentzer, Michelle M Li, Shilpa N Kobren, Ayush Noori, Undiagnosed Diseases Network, Isaac S Kohane, and Marinka Zitnik. Few shot learning for phenotype-driven diagnosis of patients with rare genetic diseases. npj Digit. Med. 8, 380 (2025).
Yaron Gurovich, Yair Hanani, Omri Bar, Guy Nadav, Nicole Fleischer, Dekel Gelbman, Lina Basel-Salmon, Peter M Krawitz, Susanne B Kamphausen, Martin Zenker, et al. Identifying facial phenotypes of genetic disorders using deep learning. Nature medicine, 25(1):60–64, 2019.
Tzung-Chien Hsieh, Aviram Bar-Haim, Shahida Moosa, Nadja Ehmke, Karen W Gripp, Jean Tori Pantel, Magdalena Danyel, Martin Atta Mensah, Denise Horn, Stanislav Rosnev, et al. Gestaltmatcher facilitates rare disease matching using facial phenotype descriptors. Nature genetics, 54(3):349–357, 2022.
Karthik A Jagadeesh, Aaron M Wenger, Mark J Berger, Harendra Guturu, Peter D Stenson, David N Cooper, Jonathan A Bernstein, and Gill Bejerano. M-cap eliminates a majority of variants of uncertain significance in clinical exomes at high sensitivity. Nature genetics, 48 (12):1581–1586, 2016.
Sebastian Köhler, Marcel H Schulz, Peter Krawitz, Sebastian Bauer, Sandra Dölken, Claus E Ott, Christine Mundlos, Denise Horn, Stefan Mundlos, and Peter N Robinson. Clinical diagnostics in human genetics with semantic similarity searches in ontologies. The American Journal of Human Genetics, 85(4):457–464, 2009.
Dongxue Mao, Chaozhong Liu, Linhua Wang, Rami AI-Ouran, Cole Deisseroth, Sasidhar Pa- supuleti, Seon Young Kim, Lucian Li, Jill A Rosenfeld, Linyan Meng, et al. AI-MARRVEL—a knowledge-driven AI system for diagnosing mendelian disorders. NEJM AI, 1(5):AIoa2300009, 2024.
Chengyao Peng, Simon Dieck, Alexander Schmid, Ashar Ahmad, Alexej Knaus, Maren Wenzel, Laura Mehnert, Birgit Zirn, Tobias Haack, Stephan Ossowski, et al. CADA: phenotype-driven gene prioritization based on a case-enriched knowledge graph. NAR Genomics and Bioinformatics, 3(3):lqab078, 2021.
Philipp Rentzsch, Daniela Witten, Gregory M Cooper, Jay Shendure, and Martin Kircher. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic acids research, 47(D1):D886–D894, 2019.
Robin Steinhaus, Sebastian Proft, Markus Schuelke, David N Cooper, Jana Marie Schwarz, and Dominik Seelow. Mutationtaster2021. Nucleic Acids Research, 49(W1):W446–W451, 2021.
Clara DM van Karnebeek, Anne O’Donnell-Luria, Gareth Baynam, Anaïs Baudot, Tudor Groza, Judith JM Jans, Timo Lassmann, Mary Catherine V Letinturier, Stephen B Montgomery, Peter N Robinson, et al. Leaving no patient behind! expert recommendation in the use of innovative technologies for diagnosing rare diseases. Orphanet Journal of Rare Diseases, 19 (1):357, 2024.
Hui Yang, Peter N Robinson, and Kai Wang. Phenolyzer: phenotype-based prioritization of candidate genes for human diseases. Nature methods, 12(9):841–843, 2015.
Kamilia Zaripova, Ege Özsoy, Nassir Navab, and Azade Farshad. Phenokg: Knowledge graph- driven gene discovery and patient insights from phenotypes alone, 2025, https://doi.org/10.48550/arXiv.2506.13119.