Yoann Benoit
Yoann est Data Scientist chez Xebia depuis près de deux ans. Il intervient sur de nombreux sujets autour de la Data Science et du Big Data, allant de la collecte, du traitement et de l'analyse des données jusqu'à la mise en production de pipelines complets de Machine Learning. Speaker et rédacteur à la fois sur les concepts et les technologies liées à la Data Science, il travaille principalement avec Python, Scala et Spark. Il intervient de plus en tant que formateur sur l'Analyse de Données et le Machine Learning sur Spark.
Il y a 5 jours

TensorFlow & Deep Learning – Episode 2 – Notre premier réseau de neurones

Maintenant que nous avons vu les bases de TensorFlow, nous allons pouvoir commencer à entrer dans le vif du sujet et implémenter notre premier réseau de neurones. L’objectif de cet article est de décortiquer les grandes étapes nécessaires à la création et à l’entraînement d’un réseau de neurones, jusqu’à la visualisation finale des résultats dans TensorBoard....

Il y a 3 semaines

TensorFlow Dev Summit, comme si vous y étiez (2/2)

Le 15 février 2017 à Mountain View s’est tenu le tout premier TensorFlow Dev Summit. Au programme de cette conférence, la sortie de la version 1.0 de TensorFlow, mais aussi de nombreuses présentations sur les optimisations internes propres à TensorFlow, les différentes APIs ainsi que de nombreux cas d’usage. Si vous avez raté cet évènement, pas...

Il y a 3 semaines

TensorFlow Dev Summit, comme si vous y étiez (1/2)

Le 15 février 2017 à Mountain View s’est tenu le tout premier TensorFlow Dev Summit. Au programme de cette conférence, la sortie de la version 1.0 de TensorFlow, mais aussi de nombreuses présentations sur les optimisations internes propres à TensorFlow, les différentes API ainsi que de nombreux cas d’usage. Si vous avez raté cet évènement,...

Il y a 4 semaines

TensorFlow & Deep Learning – Épisode 1 – Introduction

Publié par Yoann Benoit

Nous en entendons beaucoup parler ces derniers temps, et pour cause, TensorFlow est devenu en un temps record l’un des frameworks de référence pour le Deep Learning, utilisé aussi bien dans la recherche qu’en entreprise pour des applications en production. Au-delà de la hype présente autour de ce framework et des projets qui émergent grâce...

Il y a 3 mois

Data Science & Internet of Things

Avec le développement de la connectivité sur de nombreux objets et appareils, l’apparition des nouveaux protocoles de communication comme LorA et Sigfox, l’arrivée sur le marché des capteurs peu chers et l’inflation des données qu’ils émettent, l’IoT (Internet des Objets) prend désormais de la place, non seulement dans nos vies quotidienne, mais aussi au niveau...

Il y a 9 mois

Retours sur PyData Paris

Les 14 et 15 juin, nous étions à la deuxième édition parisienne de PyData, la conférence internationale regroupant tous les sujets traitant de près ou de loin de Python et de la Data. Au cours de cet article, nous allons vous faire un retour sur quelques-unes des interventions qui nous ont marqués. Overview : programme...

Il y a 9 mois

PySpark sur votre IDE – Comment faire ?

Publié par Yoann Benoit

Spark est maintenant un framework incontournable pour le traitement massif de données. Il est aussi de plus en plus utilisé dans les équipes de développement de projets Data, surtout via son API principale en Scala. Qu’en est-il de Python ? Si cette API est elle aussi massivement utilisée, force est de constater qu’on la retrouve...

Il y a 1 année

Introduction des bases de la programmation en Python

Publié par Yoann Benoit

L’une de nos valeurs est le partage de connaissance. Dans cette logique, nous avons pris l’habitude de contribuer dans le magazine Programmez! sur différents sujets. Cette fois-ci, c’est un de nos Data Scientists, Yoann Benoit, qui a souhaité écrire un article sur Python. C’est un langage de programmation interprété et orienté objet de plus en...

Il y a 1 année

From scikit-learn to Spark ML

Publié par Yoann Benoit

Dans un récent billet de blog de Databricks et Olivier Girardot, From Pandas to Apache Spark’s DataFrame, les auteurs nous montraient comment transposer le traitement et l’analyse de données faites avec la librairie Python pandas en DataFrames PySpark. L’article prouvait que, bien que quelques différences techniques existent dues au fait que les objets traités ne...

Il y a 2 années

Article Programmez! – Vos premiers pas en Machine Learning

En avril 2015, le Magazine Programmez a publié un article sur le Machine Learning. Ecrit par deux Xebians, Yoann Benoit et Thomas Ounnas, cet article vous forme au Machine Learning. En effet, au travers de cet article, ils vous proposent une initiative au Machine Learning, qui est un sous-ensemble de l’Intelligence Artificielle. Cette discipline permet...

Il y a 2 années

Les outils de la Data Science : Spark MLlib, mise en pratique (2/2)

Publié par Alban Phelip, Yoann Benoit

  Dans le précédent article, nous vous présentions les différents concepts liés à MLlib : les types de RDD à fournir, la structure des algorithmes et la démarche à adopter pour construire une chaîne de traitement de Machine Learning. Nous allons maintenant mettre en pratique ces concepts à travers plusieurs exemples basés sur les différents algorithmes...

Il y a 2 années

Tech-Event Initiation au Machine Learning avec Spark le 4 Juin

Savoir faire du Machine Learning, notamment dans un contexte Big Data, est une compétence de plus en plus recherchée de nos jours. Pourtant cette discipline est loin d’être la plus simple à acquérir. Xebia vous propose de vous initier progressivement au Machine Learning et au framework Spark. Nous utiliserons les outils les plus récents des...

Il y a 2 années

Les outils de la Data Science : Spark MLlib, théorie et concepts (1/2)

Publié par Alban Phelip, Yoann Benoit

Dans deux précédents articles nous vous présentions R et Python et comment ils sont utilisés en Data Science. La limite de ces langages est cependant rapidement atteinte lorsque l’on a affaire à de gros jeux de données qui ne tiennent plus en mémoire. Dans ce cas là, la solution à envisager est de distribuer les...

Il y a 2 années

Les outils de la Data Science : Python Data Tools

Suite de notre série d’articles de présentation des outils de la Data Science, nous présentons aujourd’hui Python. Python est un langage orienté objet bénéficiant d’une syntaxe précise et efficace. Il est couramment utilisé par les Data Scientists grâce à ses librairies d’analyse numérique et de calcul scientifique (numpy, scipy, pandas) et de visualisation (matplotlib), mais...

Xebia.TV

Présentation du Framework SAFe - Agilité à l'échelle de l'entreprise par Dean Leffingwell

Le 6 mars dernier, lors d'un événement exceptionnel en petit comité, organisé par Xebia, Dean Leffingwell a présenté SAFe, son origine et son impact dans les entreprises. Découvrez l'introduction, les essentiels et des retours d'experience de la mise en place de SAFe, par Dean Leffingwell, créateur du framework SAFe.

Présentation du Framework SAFe - Agilité à l'échelle de l'entreprise

Le 6 mars dernier, lors d'un événement exceptionnel en petit comité, organisé par Xebia, Dean Leffingwell a présenté SAFe, son origine et son impact dans les entreprises. Découvrez la présentation sur l’état de l’agilité à l’échelle et SAFe en France par Luc Legardeur, Président de Xebia et Renaud Chevalier, responsable de l’offre Agile chez Xebia.

Mobile Things S01 E01- Clean Architecture sur application mobile avec LaFourchette

Le choix d’une architecture est primordiale dans n’importe quelle application mobile Android ou iOS. Dans cette première édition de Mobile Things organisé par Xebia, l’équipe Android de LaFourchette vous présentera la clean architecture (enjeux, avantages, inconvénients) dans sa théorie mais aussi sa mise en pratique avec du code et des exemples.