Depuis quelques semaines, je fais beaucoup d’analyse de survie. Je ne suis pas une experte dans ce domaine. J’ai appris la base en participant à un groupe d’étude organisé à l’interne. À chaque rencontre, nous approfondissions la matière du livre « Survival Analysis. A Self-Learning Text » de David G. Kleinbaum et Mitchel Klein. À la fin du livre, il y a du code pour aider les débutants à faire leurs premières analyses en SAS, Stata, SPSS et … R! J’ai donc utilisé le très bon module R ‘survival’ pour faire mes premières analyses! Tout s’est bien passé, mais mon problème, c’est que je voulais faire mes analyses en Python. J’ai d’abord utilisé RPy2 , un module qui permet d’appeler R dans du code Python. C’est assez cool et il y a aussi un moyen de convertir les structures de données de module pandas vers R. J’utilise pandas pour structurer mes données en Python; ce module offre un équivalent du dataframe de R. Tout fonctionnait très bien, mais ce genre de code (entremêlant des langages) est un peu difficile à lire et à maintenir.

Je suis alors tombée sur le module lifelines de Cameron Davidson-Pilon. C’est un module en python pour faire de l’analyse de survie. Plus besoin de faire le pont entre R et Python!! Les courbes de Kaplan-Meier se font facilement.

test

Même si les modèles de Cox (Cox Proprotional Hazard) ne sont pas implémentés pour l’instant (Cameron dit que ça va venir), lifelines mérite définitivement qu’on lui donne une chance!

MISE-À-JOUR

[2014-06-09] : Les modèles de Cox sont maintenant disponibles dans la version 0.4 de lifelines!