L’apprentissage automatique est de plus en plus populaire parmi les bio-informaticiens et les biologistes. Ces algorithmes ont montré qu’ils pouvaient donner des résultats très intéressants et sont de plus en plus accessibles. Ce type de modèle peut désormais être appliqué facilement à un ensemble de données en utilisant des librairies en R ou en Python. Par exemple, la librairie Python, Scikit-learn, implémente plusieurs des algorithmes les plus connus tels que les modèles de régression, la forêt d’arbres décisionnels (Random Forest), les machines à vecteurs de support (SVM) en plus de fournir une documentation détaillée.
Même l’apprentissage profond (par exemple réseaux de neurones avec de multiples couches ou des réseaux à convolution) est facilement accessible de nos jours. Il existe plusieurs programmes facilitant l’utilisation de ces modèles plus complexes : certains sont de bas niveau comme Theano and TensorFlow tandis que d’autres sont de plus haut niveau tel que Lasagne, Blocks, Mariana et Keras. Lasagne, Blocks et Mariana
sont en fait construits « par-dessus » Theano. Wikipedia et le site web de deeplearning.net présentent des listes plus complètes des différents outils qui existent pour nous faciliter la vie.
Mariana, l’un de ces outils, a d’ailleurs été développé par un étudiant de l’IRIC et a été testé par quelques membres de la plate-forme de bio-informatique. Regardez le vidéo ci-dessous pour en apprendre plus sur ce framework qui se veut « un framework d’apprentissage automatique extensible, en Python, construit par-dessus Theano et se concentrant sur la facilité d’utilisation » *.
J’espère que la prochaine fois que vous serez tentez par l’apprentissage automatique, c’est avec enthousiasme que vous mènerez votre projet à terme. Maintenant vous savez que vous n’avez pas besoin d’être un expert en la matière; il existe des options conçues spécialement pour vous!!
Video1. Tariq Daouda présentant Mariana.
* Traduction libre de : « Extendable Python Machine Learning Framework build on top of Theano that focuses on ease of use. »
Laisser un commentaire