Yoann Benoit
Yoann est Data Scientist chez Xebia depuis près de deux ans. Il intervient sur de nombreux sujets autour de la Data Science et du Big Data, allant de la collecte, du traitement et de l'analyse des données jusqu'à la mise en production de pipelines complets de Machine Learning. Speaker et rédacteur à la fois sur les concepts et les technologies liées à la Data Science, il travaille principalement avec Python, Scala et Spark. Il intervient de plus en tant que formateur sur l'Analyse de Données et le Machine Learning sur Spark.
Il y a 3 semaines

TensorFlow & Deep Learning – Episode 3 – Modifiez votre Réseau de Neurones en toute simplicité

Dans le précédent article, nous avons mis en place toute la mécanique de création et d’entraînement d’un réseau de neurones. De la gestion des inputs jusqu’à la visualisation des résultats dans TensorBoard, en passant par les opérations d’inférence et d’entraînement, toute la chaîne était présente pour entraîner notre premier réseau de neurones: le Softmax Regression....

Il y a 1 mois

TensorFlow & Deep Learning – Episode 2 – Notre premier réseau de neurones

Maintenant que nous avons vu les bases de TensorFlow, nous allons pouvoir commencer à entrer dans le vif du sujet et implémenter notre premier réseau de neurones. L’objectif de cet article est de décortiquer les grandes étapes nécessaires à la création et à l’entraînement d’un réseau de neurones, jusqu’à la visualisation finale des résultats dans TensorBoard....

Il y a 2 mois

TensorFlow Dev Summit, comme si vous y étiez (2/2)

Le 15 février 2017 à Mountain View s’est tenu le tout premier TensorFlow Dev Summit. Au programme de cette conférence, la sortie de la version 1.0 de TensorFlow, mais aussi de nombreuses présentations sur les optimisations internes propres à TensorFlow, les différentes APIs ainsi que de nombreux cas d’usage. Si vous avez raté cet évènement, pas...

Il y a 2 mois

TensorFlow Dev Summit, comme si vous y étiez (1/2)

Le 15 février 2017 à Mountain View s’est tenu le tout premier TensorFlow Dev Summit. Au programme de cette conférence, la sortie de la version 1.0 de TensorFlow, mais aussi de nombreuses présentations sur les optimisations internes propres à TensorFlow, les différentes API ainsi que de nombreux cas d’usage. Si vous avez raté cet évènement,...

Il y a 2 mois

TensorFlow & Deep Learning – Épisode 1 – Introduction

Publié par Yoann Benoit

Nous en entendons beaucoup parler ces derniers temps, et pour cause, TensorFlow est devenu en un temps record l’un des frameworks de référence pour le Deep Learning, utilisé aussi bien dans la recherche qu’en entreprise pour des applications en production. Au-delà de la hype présente autour de ce framework et des projets qui émergent grâce...

Il y a 5 mois

Data Science & Internet of Things

Avec le développement de la connectivité sur de nombreux objets et appareils, l’apparition des nouveaux protocoles de communication comme LorA et Sigfox, l’arrivée sur le marché des capteurs peu chers et l’inflation des données qu’ils émettent, l’IoT (Internet des Objets) prend désormais de la place, non seulement dans nos vies quotidienne, mais aussi au niveau...

Il y a 10 mois

Retours sur PyData Paris

Les 14 et 15 juin, nous étions à la deuxième édition parisienne de PyData, la conférence internationale regroupant tous les sujets traitant de près ou de loin de Python et de la Data. Au cours de cet article, nous allons vous faire un retour sur quelques-unes des interventions qui nous ont marqués. Overview : programme...

Il y a 10 mois

PySpark sur votre IDE – Comment faire ?

Publié par Yoann Benoit

Spark est maintenant un framework incontournable pour le traitement massif de données. Il est aussi de plus en plus utilisé dans les équipes de développement de projets Data, surtout via son API principale en Scala. Qu’en est-il de Python ? Si cette API est elle aussi massivement utilisée, force est de constater qu’on la retrouve...

Il y a 1 année

Introduction des bases de la programmation en Python

Publié par Yoann Benoit

L’une de nos valeurs est le partage de connaissance. Dans cette logique, nous avons pris l’habitude de contribuer dans le magazine Programmez! sur différents sujets. Cette fois-ci, c’est un de nos Data Scientists, Yoann Benoit, qui a souhaité écrire un article sur Python. C’est un langage de programmation interprété et orienté objet de plus en...

Il y a 2 années

From scikit-learn to Spark ML

Publié par Yoann Benoit

Dans un récent billet de blog de Databricks et Olivier Girardot, From Pandas to Apache Spark’s DataFrame, les auteurs nous montraient comment transposer le traitement et l’analyse de données faites avec la librairie Python pandas en DataFrames PySpark. L’article prouvait que, bien que quelques différences techniques existent dues au fait que les objets traités ne...

Il y a 2 années

Article Programmez! – Vos premiers pas en Machine Learning

En avril 2015, le Magazine Programmez a publié un article sur le Machine Learning. Ecrit par deux Xebians, Yoann Benoit et Thomas Ounnas, cet article vous forme au Machine Learning. En effet, au travers de cet article, ils vous proposent une initiative au Machine Learning, qui est un sous-ensemble de l’Intelligence Artificielle. Cette discipline permet...

Il y a 2 années

Les outils de la Data Science : Spark MLlib, mise en pratique (2/2)

Publié par Yoann Benoit, Alban Phelip

  Dans le précédent article, nous vous présentions les différents concepts liés à MLlib : les types de RDD à fournir, la structure des algorithmes et la démarche à adopter pour construire une chaîne de traitement de Machine Learning. Nous allons maintenant mettre en pratique ces concepts à travers plusieurs exemples basés sur les différents algorithmes...

Il y a 2 années

Tech-Event Initiation au Machine Learning avec Spark le 4 Juin

Savoir faire du Machine Learning, notamment dans un contexte Big Data, est une compétence de plus en plus recherchée de nos jours. Pourtant cette discipline est loin d’être la plus simple à acquérir. Xebia vous propose de vous initier progressivement au Machine Learning et au framework Spark. Nous utiliserons les outils les plus récents des...

Il y a 2 années

Les outils de la Data Science : Spark MLlib, théorie et concepts (1/2)

Publié par Yoann Benoit, Alban Phelip

Dans deux précédents articles nous vous présentions R et Python et comment ils sont utilisés en Data Science. La limite de ces langages est cependant rapidement atteinte lorsque l’on a affaire à de gros jeux de données qui ne tiennent plus en mémoire. Dans ce cas là, la solution à envisager est de distribuer les...

Il y a 2 années

Les outils de la Data Science : Python Data Tools

Suite de notre série d’articles de présentation des outils de la Data Science, nous présentons aujourd’hui Python. Python est un langage orienté objet bénéficiant d’une syntaxe précise et efficace. Il est couramment utilisé par les Data Scientists grâce à ses librairies d’analyse numérique et de calcul scientifique (numpy, scipy, pandas) et de visualisation (matplotlib), mais...

Xebia.TV

"On ne reste pas dans notre zone de confort, on est toujours en train d'évoluer."

Découvrez les trajectoires de nos Consultants… et imaginez la vôtre ! Gérôme, Développeur Back end chez Xebia.

"En changeant de projet, Xebia me permet de constamment me renouveler."

Découvrez les trajectoires de nos Consultants… et imaginez la vôtre Julien, Consultant Manager et Développeur Full Stack chez Xebia.

"Au delà de la bonne ambiance, en plus de collègues, j'ai trouvé des copains."

Découvrez les trajectoires de nos Consultants… et imaginez la vôtre Pablo Lopez, Directeur Technique de Xebia.