Résultats

Publié par Giulia Bianchi, Loic Divad

Il y a 1 semaine

Deux Data Lovers au Spark+AI Summit Europe 2018

Apache Spark, initialement développé à l’université de Californie à Berkeley par AMPLab, est un framework de traitement de données distribuées pour effectuer des analyses complexes à grande échelle. Dans un écosystème riche, il a su se hisser parmi les produits les plus utilisés en Big Data. Il a permis de nombreuses avancées pour la recherche...

Publié par Souhaib Guitouni

Il y a 4 semaines

Spark Structured Streaming avec Kafka Schema Registry

Introduction : L’idée de cet article est de brancher Spark Structured Streaming à Kafka pour consommer des messages en Avro dont le schéma est géré par le Schema Registry. L’objectif est de se dissocier de la déclaration manuelle du schéma de données côté consommateur. Ceci pourrait être utile pour découpler la production de la consommation...

Publié par Jonathan Norblin

Il y a 1 année

Spark : comprendre et corriger l’exception Task not serializable

Dans tous les langages, le debugging peut parfois s’avérer une tâche fastidieuse. C’est d’autant plus le cas lorsque l’on utilise un framework distribué avec beaucoup de concepts complexes sous-jacents, comme Spark. Cet article propose de revenir sur l’une des erreurs les plus souvent rencontrées lors du développement d’applications avec Spark, et qui n’est pas toujours...

Publié par Sylvain Lequeux

Il y a 1 année

Tester du code Spark – 2 – La pratique

Que de la théorie. Les tests du code Spark semblent abonnés à cette réalité : tout reste théorique. À croire qu’en réaliser est impossible. Il est grand temps de remédier à ce problème et démontrer que le sujet est abordable par tous. Quitter la théorie, c’est débuter par les bonnes pratiques. Des réflexes sur la spécification...

Publié par Sylvain Lequeux

Il y a 2 années

Tester du code Spark : 1- La théorie

Spark est plus puissant et plus simple à utiliser que MapReduce, mais comment tester du code Spark ? Voici notre vision ! Spark est un framework de calcul distribué créé à Berkeley en 2010. Il connait une adoption impressionnante. Plusieurs raisons à cela : des performances de très loin supérieures à MapReduce et un framework à...

Publié par Xebia France

Il y a 3 années

Revue de Presse Xebia

La revue de presse hebdomadaire des technologies Big Data, Cloud et Web, architectures Java et mobilité dans des environnements agiles, proposée par Xebia. Mobilité Offrez à vos applications tvOS un outil de reporting digne de ce nom ! Craftsmanship Move fast and fix things Front CodeceptJS: un nouveau framework de test end-to-end Comprendre les propriétés...

Publié par Xebia France

Il y a 3 années

Retour sur le « Paris Spark meetup », avec la présence de Sean Owen de Cloudera

Le 11 juin dernier, le Paris Spark Meetup a réuni plus de 280 personnes à la Société Générale. Avec l’aide de notre partenaire technologique , Cloudera, et Influans, nous avons mis notre expertise en commun sur Apache Spark. Afin de découvrir ces technologies et frameworks utilisés dans le traitement de la donnée, trois sessions étaient...

Publié par Xebia France

Il y a 4 années

Xebia, le Paris Spark meetup et Cloudera, en la présence de Sean Owen, vous invitent à un meetup exceptionnel !

Apache Spark, Spark ML, recommendation, etc. vous intéressent ? Rendez-vous le 11 juin prochain à la Société Générale (corporate & investment banking) ! En partenariat avec la SGCIB, le Paris Spark Meetup et Cloudera (en la présence de Sean Owen, Directeur of Data Sciences), nous organisons l’événement data de ce début d’été. A ne pas manquer...

Il y a 4 années

Tech-Event Initiation au Machine Learning avec Spark le 4 Juin

Savoir faire du Machine Learning, notamment dans un contexte Big Data, est une compétence de plus en plus recherchée de nos jours. Pourtant cette discipline est loin d’être la plus simple à acquérir. Xebia vous propose de vous initier progressivement au Machine Learning et au framework Spark. Nous utiliserons les outils les plus récents des...

Publié par Xebia France

Il y a 4 années

Revue de Presse Xebia

La revue de presse hebdomadaire des technologies Big Data, Cloud et Web, architectures Java et mobilité dans des environnements agiles, proposée par Xebia. Agilité Project vs. Product (Par Emmanuel Sciara) Jira, Kanban & Physical Boards: An Agile Life at TweetDeck (Par Ludovic Perot) #NoEstimates Project Planning Using Monte Carlo Simulation (Par Arnaud Bracchetti) Front Sortie...

Publié par Xebia France

Il y a 4 années

Revue de Presse Xebia

La revue de presse hebdomadaire des technologies Big Data, Cloud et Web, architectures Java et mobilité dans des environnements agiles, proposée par Xebia. Mobilité Jean-Pierre Simard : Uncovering SourceKit (Par Simone Civetta) Jon Reid : AppCode for Better TDD (Par Simone Civetta) Front Introduction à la programmation réactive (Par Yannick Grenzinger) Data Spark 1.0.1 :...

Publié par Xebia France

Il y a 5 années

Revue de Presse Xebia

La revue de presse hebdomadaire des technologies Big Data, Cloud et Web, architectures Java et mobilité dans des environnements agiles, proposée par Xebia. Agilité Un retour à Scrum (Par Ludovic Perot) Mise en place d’un Kanban dans une équipe marketing (Par Yannick Quenec’hdu) Front Principes de visualisation de données (Par Yannick Grenzinger) Data Tout sur...

Nous recrutons

Être un Xebian, c'est faire partie d'un groupe de passionnés ; C'est l'opportunité de travailler et de partager avec des pairs parmi les plus talentueux.