Description de l'auteur

Articles

Publié par Yoann Benoit

Il y a 3 ans

PySpark sur votre IDE – Comment faire ?

Spark est maintenant un framework incontournable pour le traitement massif de données. Il est aussi de plus en plus utilisé dans les équipes de développement de projets Data, surtout via son API principale en Scala. Qu’en est-il de Python ? Si cette API est elle aussi massivement utilisée, force est de constater qu’on la retrouve...

Publié par Yoann Benoit

Il y a 4 ans

Introduction des bases de la programmation en Python

L’une de nos valeurs est le partage de connaissance. Dans cette logique, nous avons pris l’habitude de contribuer dans le magazine Programmez! sur différents sujets. Cette fois-ci, c’est un de nos Data Scientists, Yoann Benoit, qui a souhaité écrire un article sur Python. C’est un langage de programmation interprété et orienté objet de plus en...

Publié par Yoann Benoit

Il y a 4 ans

From scikit-learn to Spark ML

Dans un récent billet de blog de Databricks et Olivier Girardot, From Pandas to Apache Spark’s DataFrame, les auteurs nous montraient comment transposer le traitement et l’analyse de données faites avec la librairie Python pandas en DataFrames PySpark. L’article prouvait que, bien que quelques différences techniques existent dues au fait que les objets traités ne...

Il y a 4 ans

Article Programmez! – Vos premiers pas en Machine Learning

En avril 2015, le Magazine Programmez a publié un article sur le Machine Learning. Ecrit par deux Xebians, Yoann Benoit et Thomas Ounnas, cet article vous forme au Machine Learning. En effet, au travers de cet article, ils vous proposent une initiative au Machine Learning, qui est un sous-ensemble de l’Intelligence Artificielle. Cette discipline permet...

Publié par Yoann Benoit, Alban Phelip

Il y a 4 ans

Les outils de la Data Science : Spark MLlib, mise en pratique (2/2)

  Dans le précédent article, nous vous présentions les différents concepts liés à MLlib : les types de RDD à fournir, la structure des algorithmes et la démarche à adopter pour construire une chaîne de traitement de Machine Learning. Nous allons maintenant mettre en pratique ces concepts à travers plusieurs exemples basés sur les différents algorithmes...

Il y a 4 ans

Tech-Event Initiation au Machine Learning avec Spark le 4 Juin

Savoir faire du Machine Learning, notamment dans un contexte Big Data, est une compétence de plus en plus recherchée de nos jours. Pourtant cette discipline est loin d’être la plus simple à acquérir. Xebia vous propose de vous initier progressivement au Machine Learning et au framework Spark. Nous utiliserons les outils les plus récents des...

Publié par Yoann Benoit, Alban Phelip

Il y a 4 ans

Les outils de la Data Science : Spark MLlib, théorie et concepts (1/2)

Dans deux précédents articles nous vous présentions R et Python et comment ils sont utilisés en Data Science. La limite de ces langages est cependant rapidement atteinte lorsque l’on a affaire à de gros jeux de données qui ne tiennent plus en mémoire. Dans ce cas là, la solution à envisager est de distribuer les...

Il y a 4 ans

Les outils de la Data Science : Python Data Tools

Suite de notre série d’articles de présentation des outils de la Data Science, nous présentons aujourd’hui Python. Python est un langage orienté objet bénéficiant d’une syntaxe précise et efficace. Il est couramment utilisé par les Data Scientists grâce à ses librairies d’analyse numérique et de calcul scientifique (numpy, scipy, pandas) et de visualisation (matplotlib), mais...

Nous recrutons

Être un Xebian, c'est faire partie d'un groupe de passionnés ; C'est l'opportunité de travailler et de partager avec des pairs parmi les plus talentueux.