Traitement distribué pour les Big Data

Description: 

Traitement distribué pour les Big Data 

Du 8 au 10 Juin 2021

Les entreprises produisent d'énormes quantités de données chaque jour. Ces données sont stockées puis traitées et analysées pour en tirer de la valeur. Grâce aux plateformes de stockage et de traitements distribués de type Hadoop, il est devenu plus facile pour les ingénieurs de répondre aux problématiques du Big Data avec une grande efficacité et à un coût réduit. Ce séminaire vous offre l'occasion de vous essayer au traitement distribué de données massives via la plateforme Hadoop et ses outils comme Hive et Spark.

Les participants seront capables de :

1. Stocker des données sur Hadoop

2. Implémenter en Python des algorithmes MapReduce et les exécuter sur une plateforme Hadoop

3. Charger des données sur Hive et les traiter à l’aide du langage HiveQL

4. Charger des données dans Spark et les traiter à l’aide du langage Spark SQL

Date: 
08-06-2021
Site By