Publié par
Il y a 1 année · 4 minutes · Data

Compte rendu du meetup Machine Learning

meetup-machine-learningJeudi dernier, nous étions fiers de sponsoriser le meetup Machine Learning Paris, qui s’est tenu à la salle de conférences Étoile Saint-Honoré ! Voici un compte-rendu des conférences, ainsi que la vidéo de l’événement !

meetup-machine-learning-xebia

Paul-Henri Hincelin, Dataiku – Putting data science in production 

Dataiku a donné une présentation introductive sur les aspects liés à la mise en production de projets data. Ils se sont principalement focalisés sur le passage d’un environnement de build à un environnement de run, comme par exemple :

  •  consistent packaging ;
  •  ré-entraînement des modèles à prévoir dans l’environnement de run ;
  •  l’importance de l’implication du métier : définition de KPI compréhensibles par le métier pour faciliter suivi et diagnostic ;
  •  prévision à l’avance d’une stratégie de roll-back pour la correction d’erreurs.

Martin Prillard, Talentoday – Présentation des activités de recherche

Talentoday propose de réaliser aux candidats un test psychométrique dans le but de mieux se connaître sur le plan professionnel et ainsi mieux s’orienter dans une éventuelle recherche de poste ou entreprise qui leur correspondrait au mieux. À l’aide de quelques Random Forest, clustering et techniques de visualisation intelligentes, Martin a analysé près de 3 millions de ces tests individuels. Ces analyses lui ont permis d’identifier et de segmenter différentes cultures d’entreprise ainsi que les traits de caractère responsables d’une bonne réussite professionnelle selon les postes.

La présentation à été suivie par beaucoup, beaucoup de questions et le débat s’est finalement animé sur le fait de savoir comment le Machine Learning pouvait aujourd’hui aider aussi des disciplines sociales, très proches des statistiques à la base. Une preuve que les champs d’application de la Data Science peuvent être très vastes et variés, mais peuvent aussi déboucher sur des réflexions plus profondes sur la meilleure manière de les utiliser et de les appliquer.

Florent Signal – Drust

Drust est une jeune start-up qui récupère de données télématiques d’automobiles, les contextualise et les enrichie (notamment avec des données de traffic et de météo) pour la quantification et la prévention du risque routier. C’est grâce à un petit boîtier qui s’installe dans sa propre voiture que le données sont collectées et analysées. Voilà la voiture connectée ! Drust se prépare à pouvoir toucher de nombreux conducteurs, tout en leur garantissant une confidentialité complète sur l’utilisation de leurs données. De potentiels contacts avec des constructeurs seraient aussi à envisager.

Themis Sapsis, MIT – Robust prediction of extreme wave events in realistic seas

Nous avons assisté à la présentation des travaux de recherche d’un des labos du MIT, autour de la prédiction d’événements rares, comme les rogue waves, des vagues très hautes et dangereuses qui se produisent soudainement dans les océans. Il y a beaucoup d’ingénierie impliquée, surtout pour la mesure et la quantification de l’énergie des vagues, mais finalement les paramètres utilisés pour la prédiction sont au nombre de deux : l’amplitude et la largeur de groupes de vagues. Les simulations semblent prometteuses, et montrent une belle mise en oeuvre de méthodes d’analyse de données associées à des outils plus physiques pour répondre à un problème complexe de détection d’évènements rares.

Cyril Colin, Karim Lalami – eLum

Les deux jeunes entrepreneurs ont montré comment ils utilisent le Machine Learning pour la prédiction et l’optimisation en temps réel des flux d’énergie pour améliorer la gestion et le stockage d’énergie, avec des avantages pour les distributeurs d’énergie, les consommateurs et la planète.

Laurence Vachon, MathWorks – Mission on Mars robot challenge 2016

Laurence a présenté le challenge lancé par MathWorks, qui a pour but la programmation du robot Rover pour l’exploration de Mars.

Amine El Helou, MathWorks – Deep Neural Networks in Matlab

Amine nous a fait une démo du module Matlab de Deep Learning pour la classification d’images et la reconnaissance d’objet. Il a montré à travers un notebook Matlab les principales étapes de code pour concevoir, entraîner et utiliser un Convolutional Neural Network sur le dataset CIFAR-10, qui a pour objectif la classification en 10 catégories distinctes d’images.

Et voici la vidéo !

La vidéo est aussi disponible sur xebia TV.
Giulia Bianchi
Giulia est Data Scientist à Xebia depuis un an. Après deux ans d'experience professionnelle en bioinformatique, elle travaille actuellement sur des volumes de données plus importants en mettant en place des algorithmes de machine learning et en participant aux discussions avec les data ingénieurs pour la mise en production des modèles. Elle travaille surtout avec Python, Spark et R. Elle est passionnée par l'IoT et elle suit les nouvelles tendances du monde de la data en participant aux différents Meetups et en suivant des blogs.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *