Wir können Gesundheit

Analyse gesammelter Daten

Patientenakten auswerten, ohne die Privatsphäre zu verletzen

am Dienstag, 10. Mai 2016

© RUB, Schirdewahn

© RUB, Schirdewahn

Patientenakten könnten wichtige Hinweise enthalten, wie man Krankheiten früher erkennen kann. Doch bei ihrer Analyse werden leicht persönliche Daten preisgegeben. Hier hilft die Mathematik.

Gesammelte Patientenakten auszuwerten und dabei keine sensiblen Informationen über einzelne Personen preiszugeben ist eine Herausforderung. Das Team um Prof. Dr. Hans Simon vom Horst-Görtz-Institut für IT-Sicherheit der Ruhr-Universität Bochum hat eine Methode entwickelt, die das erlaubt. Die Mathematiker verrauschen die Daten so, dass einzelne Personen bei der Analyse anonym bleiben. Trotzdem können selbstständig lernende Computerprogramme in den veränderten Daten ähnlich gut Zusammenhänge aufdecken wie in den Originaldaten.

Verrauschte Daten

Im Prinzip funktioniert das Verrauschen wie folgt: Für jede Patientenakte wird gewürfelt; die Zahl der Augen wird auf alle Werte in der Akte aufaddiert. Das verändert die einzelnen Daten unvorhersehbar und heftig, macht sich aber im Idealfall bei statistischen Zusammenfassungen nicht stärker bemerkbar als eine ohnehin in den Daten enthaltene Zufallsschwankung.

Für ihre Arbeit haben die Wissenschaftler am Bochumer Lehrstuhl für Mathematik und Informatik zunächst genau definiert, was es mathematisch bedeutet, dass die Patienten anonym bleiben sollen. Und was es heißt, dass die Ergebnisse mit und ohne Verrauschen ähnlich sein sollen. Um die definierten Anforderungen zu erfüllen, übersetzten die Mathematiker das Problem in eine geometrische Darstellung.

Daten als Vektoren dargestellt

Jede Patientenakte repräsentierten sie als Vektor, also als einen Pfeil in einem geometrischen Raum. Der Auswertalgorithmus durfte nur Ja/Nein-Fragen stellen, etwa: Ist der Patient Raucher? Ist der Patient schwerer als 80 Kilogramm? Auch jede dieser Fragen stellten die Mathematiker als Vektor dar. Bildeten die Vektoren für Akte und Frage einen stumpfen Winkel, symbolisierte das eine Nein-Antwort; ein spitzer Winkel stand für eine Ja-Antwort.

Die Wissenschaftler verrauschten dann nicht mehr die Originaldaten, sondern führten diesen Schritt erst aus, nachdem sie die Daten in Vektoren umgewandelt hatten. Das erlaubte es ihnen, Informationen über einzelne Patienten anonym zu halten, aber trotzdem statistische Aussagen über die gesammelten Daten aller Patienten zu treffen.

Ausführlicher Beitrag im Wissenschaftsmagazin Rubin

Das Wissenschaftsmagazin Rubin der Ruhr-Universität Bochum berichtet ausführlich über die Arbeit von Hans Simon unter http://rubin.rub.de/de/wie-mathematik-patienten-schuetzt.

Gesundheitswissenschaften

MedEcon Ruhr © 2017

Wir können Gesundheit
MedEcon Ruhr