Résultats

Publié par Giulia Bianchi

Il y a 10 mois

Automated Machine Learning: is it the end of the sexiest job of the 21st century ?

Le Harvard Business Review a défini le Data Scientist comme le poste le plus sexy du nouveau siècle. Dans l’article on peut lire : If “sexy” means having rare qualities that are much in demand, data scientists are already there. They are difficult and expensive to hire and, given the very competitive market for their services, difficult...

Il y a 10 mois

Exploration de données en Scala

Aujourd’hui, c’est la première journée où Henri va faire de la data. Henri est développeur back Scala à la base, et aimerait contribuer à la partie data de son projet. Or, la plupart des outils sont en Python. On peut certes trouver rapidement des How-To sur Internet traitant de la data en Python, mais Henri, lui,...

Publié par Qian Jin, Anta Aidara

Il y a 12 mois

Série spéciale AWS re:Invent 2017 – Réalité virtuelle & augmentée et Machine Learning

Pour ce 5e et dernier article de cette série de décembre revenant sur les annonces nous ayant marqué lors de la récente AWS re:Invent, nous revenons pour vous sur les annonces parmis les plus innovantes de cette conférence : réalité virtuelle, réalité augmentée ainsi que machine learning ! Les autres articles de cette série sont...

Publié par Sylvain Lequeux

Il y a 1 année

Tester du code Spark – 2 – La pratique

Que de la théorie. Les tests du code Spark semblent abonnés à cette réalité : tout reste théorique. À croire qu’en réaliser est impossible. Il est grand temps de remédier à ce problème et démontrer que le sujet est abordable par tous. Quitter la théorie, c’est débuter par les bonnes pratiques. Des réflexes sur la spécification...

Publié par Diana Ortega

Il y a 1 année

GopherCon Denver : Retour sur la conference Go

Les 12,13,14 et 15 Juillet, a eu lieu Gophercon à Denver (Colorado, USA). La conférence la plus importante sur le langage Go. La séance du 12 a été dédiée aux ateliers. Les séances du 13 et 14 ont été dédiées aux conférences. Le 15 (Community Day), était l’occasion pour la communauté Go de s’exprimer au travers...

Publié par Yoann Benoit

Il y a 2 années

TensorFlow & Deep Learning – Episode 3 – Modifiez votre Réseau de Neurones en toute simplicité

Dans le précédent article, nous avons mis en place toute la mécanique de création et d’entraînement d’un réseau de neurones. De la gestion des inputs jusqu’à la visualisation des résultats dans TensorBoard, en passant par les opérations d’inférence et d’entraînement, toute la chaîne était présente pour entraîner notre premier réseau de neurones: le Softmax Regression....

Publié par Florian Desrousseaux

Il y a 2 années

Mener à bien vos ateliers d’idéation Data

                      À l’occasion du Mois de la Data qui sera organisé en mai par Xebia, découvrez ou redécouvrez le « Kit use cases data« . Le Mois de la Data sera articulé autour de 4 TechEvents chaque mardi du mois de mai, avec pour chacun d’eux un...

Publié par Yoann Benoit

Il y a 2 années

TensorFlow & Deep Learning – Episode 2 – Notre premier réseau de neurones

Maintenant que nous avons vu les bases de TensorFlow, nous allons pouvoir commencer à entrer dans le vif du sujet et implémenter notre premier réseau de neurones. L’objectif de cet article est de décortiquer les grandes étapes nécessaires à la création et à l’entraînement d’un réseau de neurones, jusqu’à la visualisation finale des résultats dans TensorBoard....

Il y a 2 années

TensorFlow Dev Summit, comme si vous y étiez (2/2)

Le 15 février 2017 à Mountain View s’est tenu le tout premier TensorFlow Dev Summit. Au programme de cette conférence, la sortie de la version 1.0 de TensorFlow, mais aussi de nombreuses présentations sur les optimisations internes propres à TensorFlow, les différentes APIs ainsi que de nombreux cas d’usage. Si vous avez raté cet évènement, pas...

Il y a 2 années

TensorFlow Dev Summit, comme si vous y étiez (1/2)

Le 15 février 2017 à Mountain View s’est tenu le tout premier TensorFlow Dev Summit. Au programme de cette conférence, la sortie de la version 1.0 de TensorFlow, mais aussi de nombreuses présentations sur les optimisations internes propres à TensorFlow, les différentes API ainsi que de nombreux cas d’usage. Si vous avez raté cet évènement,...

Publié par Yoann Benoit

Il y a 2 années

TensorFlow & Deep Learning – Épisode 1 – Introduction

Nous en entendons beaucoup parler ces derniers temps, et pour cause, TensorFlow est devenu en un temps record l’un des frameworks de référence pour le Deep Learning, utilisé aussi bien dans la recherche qu’en entreprise pour des applications en production. Au-delà de la hype présente autour de ce framework et des projets qui émergent grâce...

Publié par Bruno Bouchahoua

Il y a 2 années

REX workshop Big Data chez AWS

Retour sur les services permettant de répondre aux cas d’utilisation big data au travers des solutions AWS. En décembre dernier, j’ai participé dans les locaux d’Amazon France à Clichy à un workshop dédié à l’utilisation des services Big Data du leader du cloud public. L’objectif de cette journée : découvrir les services permettant de répondre...

Publié par Sylvain Lequeux

Il y a 2 années

Tester du code Spark : 1- La théorie

Spark est plus puissant et plus simple à utiliser que MapReduce, mais comment tester du code Spark ? Voici notre vision ! Spark est un framework de calcul distribué créé à Berkeley en 2010. Il connait une adoption impressionnante. Plusieurs raisons à cela : des performances de très loin supérieures à MapReduce et un framework à...

Publié par Yoann Benoit

Il y a 2 années

PySpark sur votre IDE – Comment faire ?

Spark est maintenant un framework incontournable pour le traitement massif de données. Il est aussi de plus en plus utilisé dans les équipes de développement de projets Data, surtout via son API principale en Scala. Qu’en est-il de Python ? Si cette API est elle aussi massivement utilisée, force est de constater qu’on la retrouve...

Publié par Alexandre Dergham

Il y a 3 années

Screencast : trouvez un commit avec git-bisect

En complément de l’article de Bastien Bonnet sur la commande git-bisect, voici une vidéo illustrant l’utilisation de cette commande et la recherche par dichotomie.

Publié par Thomas Ounnas

Il y a 3 années

Une Introduction aux Modèles Graphiques avec Figaro

Les modèles graphiques sont un mélange de théorie des probabilités et de théorie des graphes. Ensemble, ces deux disciplines forment un framework qui permet de représenter une multitude de problèmes, tels les systèmes de diagnostics médicaux, les problèmes de reconnaissance du langage, ceux de tracking d’objets ou encore de manière plus générale les systèmes d’aide...

Publié par Yoann Benoit

Il y a 3 années

From scikit-learn to Spark ML

Dans un récent billet de blog de Databricks et Olivier Girardot, From Pandas to Apache Spark’s DataFrame, les auteurs nous montraient comment transposer le traitement et l’analyse de données faites avec la librairie Python pandas en DataFrames PySpark. L’article prouvait que, bien que quelques différences techniques existent dues au fait que les objets traités ne...

Publié par Alban Phelip

Il y a 3 années

Découvrez SparkR, la nouvelle API de Spark

Le 11 juin dernier la version 1.4.0 de Apache Spark a été publiée. Parmi toutes les nouveautés annoncées la plus importante était la venue d’une nouvelle API venant s’ajouter aux trois déjà existantes (Scala, Java et Python) : R. R est un langage d’analyse statistique particulièrement apprécié chez les statisticiens. Nous vous présentions sur ce blog...

Nous recrutons

Être un Xebian, c'est faire partie d'un groupe de passionnés ; C'est l'opportunité de travailler et de partager avec des pairs parmi les plus talentueux.