Massgeschneiderte Lösungen für Statistik und Datenmanagement

Am Departement Klinische Forschung (DKF) wird das Statistikprogramm R für die Nutzung in der klinischen Forschung optimiert.

R ist eine Programmierumgebung für statistische Berechnungen und Grafiken. Das Programm läuft auf verschiedenen Betriebssystemen, steht unter einer Open-Source Lizenz und kann so von den Nutzerinnen und Nutzern erweitert und modifiziert werden. 1992 für Anwender mit statistischen Aufgaben entwickelt, wurde R inzwischen in der Statistik zu einer Standardanwendung mit einer grossen Fangemeinde. Diese stellt laufend neu entwickelte statistische Verfahren für R online zur Verfügung.

Diese sogenannten «Pakete» erweitern den Umfang der Funktionen von R, um Daten effizienter und schneller mit den neusten Methoden zu analysieren und darzustellen. Zu den aktiven Anwendern von R zählen auch Thomas Fabbro, Milica Markovic und Patrick R. Wright. Sie haben zwei innovative R-Pakete programmiert, die eine effiziente und professionelle Implementierung statistischer Methoden bei der Stichprobenberechnung einerseits und eine vereinfachte Schnittstelle zwischen Datenbank und Auswertung andererseits ermöglichen.

Stichprobenberechnung
In der Planung einer klinischen Studie ist das Berechnen der Stichprobengrösse ein zentraler Schritt mit tiefgreifenden Folgen. Dennoch bleibt meist nur sehr wenig Zeit, um verschiedene Methoden zu evaluieren und die Sensitivität der Schätzung gegenüber den getroffenen Annahmen zu studieren. Hier setzte das R-Packet «sse» für «Sample Size Estimation» an. Es erlaubt, die Stichprobengrössenberechnungen für unterschiedliche Szenarien zu evaluieren. Dabei können sämtliche in R verfügbaren Methoden verwendet werden. Zudem erlaubt das Framework für komplexe Studiendesigns mittels sogenannten «Resampling» Methoden die Stichbrobengrösse effizient zu schätzen. Thomas Fabbro hat für die Entwicklung von sse einen Grant der Swiss Clinical Trial Organisation (SCTO) erhalten.

Graphik sse R-Paket

Statt nur einer nackten Zahl liefert das R-Paket «sse» zusätzlich eine Abbildung, die veranschaulicht wie sensitiv die Berechnung hinsichtlich den getroffenen Annahmen ist.



Effizientes Datenmanagement
«secuTrialR» ist ein gemeinsames Projekt von Patrick Wright, Milica Markovic und Alan Haynes, Senior Statistiker an der Clinical Trial Unit Bern. Das Paket wurde, wie der Name andeutet, für den Datenexport aus «secuTrial®» entwickelt, einem Datenmanagementsystem für klinische Studienprojekte. Das System eignet sich für komplexe Datensätze und wird vom DKF als Standardlösung für das Datenmanagement empfohlen. Mittels dem neuen Paket werden die in der Datenbank «secuTrial®» erfassten Forschungsdaten direkt in das Programm «R» eingelesen und können anschliessend direkt ausgewertet werden. Durch die Standardisierung redundanter Prozesse wird der technische Aufwand reduziert und es bleibt mehr Zeit für die Bearbeitung inhaltlicher Fragestellungen.


Durch die Standardisierung redundanter Prozesse wird
der technische Aufwand reduziert und es bleibt mehr Zeit für die
Bearbeitung inhaltlicher Fragestellungen.

Patrick R. Wright und Milica Markovic, Data Scientists am DKF

Milica & Patrick
Graphik SecuTrialR

Das secuTrialR Paket erleichtert die Visualisierung von Daten zur Studienrekrutierung. Das gezeigte Beispiel kann mit
zwei Zeilen Programmiercode erstellt werden und ist somit sowohl für Experten als auch für R-Neulinge gut zugänglich.


Departement Klinische Forschung, Oktober 2019, aktualisiert Januar 2020