Bienvenue sur Scribd !

0% ont trouvé ce document utile (0 vote)

31 vues

Fondements Du Big Data TP1

Transféré par

Ce document décrit les étapes pour installer et configurer Apache Hadoop sur Windows. Il explique comment configurer les différents composants de Hadoop tels que NameNode, DataNode et YARN. Les étapes incluent la modification des fichiers de configuration comme core-site.xml, hdfs-site.xml, mapred-site.xml et yarn-site.xml ainsi que le démarrage et l'arrêt des services HDFS et YARN.

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Fondements Du Big Data TP1

Transféré par

Hanane Nadi

0% ont trouvé ce document utile (0 vote)

31 vues3 pages

Titre original

Fondements du Big Data TP1

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

0% ont trouvé ce document utile (0 vote)

31 vues3 pages

Fondements Du Big Data TP1

Transféré par

Hanane Nadi

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

Passer à la page

Vous êtes sur la page 1sur 3

Rechercher à l'intérieur du document

Université Abdelmalek Essaadi Enseignants :

MOHAMED CHERRADI
Ecole Nationale des Sciences Appliquées &&
Al Hoceima Anass EL HADDADI

Filière : Ingénierie de données Niveau : 2ème Année

Module : Big Data
A.U : 2022/2023

TP 01 :
« Installation du Hadoop sous Windows. »
1. Objectif

Cette séance de TP constitue un premier pas vers l’utilisation d’outils Big Data. Nous avons fait le choix de
l’environnement Apache Hadoop, car c’est un Framework open-source de stockage distribué et de traitement
parallèle de données volumineuses sur un cluster HDFS.

Au terme de ce TP, vous serez capables d’installer et lancer toutes les composantes de Hadoop correctement.
Pour la configuration Hadoop, nous devons modifier les composantes répertoriés ci-dessous.

 Définir le chemin dans les variables d'environnement: Java, et Hadoop

 Core-site.xml
 Mapred-site.xml
 Hdfs-site.xml
 Yarn-site.xml
 Hadoop-env.cmd (Définir l'environnement Java Home dans Hadoop)
 Créez deux dossiers datanode et namenode

2. Installation

2.1. Configuration du NameNode (NN)

 Core-site.xml : Configurer l’essentiel de Hadoop, tel que hostname et le port du NameNode (fs.default.name)

 Hdfs-site.xml : Configurer HDFS, en particulier, les nœuds NameNode (NN), Secondary NameNode (SNN), et
les DataNode (DN)

o dfs.namenode.name.dir : La liste des répertoires ou le NameNode stocke ces métadonnées persistantes.

Le NN stocke une copie de métadonnées dans chaque répertoire de la liste.

o dfs.datanode.name.dir : Liste des répertoires dans lequel le DataNode stocke des blocs. Chaque block
est stocké dans un seul de ces répertoires.

o dfs.namenode.checkpoint.dir : Liste de répertoires dans lequel le NameNode Secondaire stocke les

checkpoints. Il stocke des checkpoints dans chaque répertoire de la liste.

o dfs.replication : Par défaut, HDFS réplique les blocks de données avec un facteur de 3. Lorsqu’il est
exécuté avec un seul DataNode, HDFS ne peut pas réplique les blocs de données en trois DataNodes. Ce
problème est résolu par la valeur 1.
Université Abdelmalek Essaadi Enseignants :
MOHAMED CHERRADI
Ecole Nationale des Sciences Appliquées &&
Al Hoceima Anass EL HADDADI

Filière : Ingénierie de données Niveau : 2ème Année

Module : Big Data
A.U : 2022/2023

Fig. 1 : Configuration du NameNode.

2.2. Démarrage du HDFS (NN && DN)

a. Formatage des fichiers systèmes :

hdfs namenode -format

- Créer les métadonnées initiales dans le disque (fsimage), dans le répertoire spécifie.

- NB : Le formatage du HDFS est obligatoire, pour que le cluster démarre

b. Démarrage du NN et DN :

start-dfs

- Une fois le cluster est démarré, après 3S :

 Les DN(s) envoient un signal de pulsation au NN, et s’inscrivent auprès du NN
 Le NN envoi à son tour ses identifiants aux DN(s)
 Interface Web pour le NN, par défaut : http://localhost:50070
 Vérification des nœuds (JVM Process Status Tool)
jps
 Arrêt des nœuds
Stop-dfs

2.3. Démarrage du HDFS (NN && DN)

 Le fichier mapred-site.xml : Configuration des paramètres du MapReduce

o mapreduce.framework.name : Runtime framework pour l’éxecution des jobs MapReduce. Elle peut
etre local, classic, ou yarn.
Université Abdelmalek Essaadi Enseignants :
MOHAMED CHERRADI
Ecole Nationale des Sciences Appliquées &&
Al Hoceima Anass EL HADDADI

Filière : Ingénierie de données Niveau : 2ème Année

Module : Big Data
A.U : 2022/2023

 Le fichier yarn.xml : Configuration des paramètres de YARN (Ressource Manager, Node Manager, …)

o yarn.nodemanager.aux-services : Indique à Node Manager qu’un service auxiliaire appelé

« mapreduce.shuffle » doit étre implementé.

o yarn.nodemanager.aux-services.mapreduce.shuffle.class : Définit la classe à utiliser pour l’opération

shuffle

Fig. 2 : Configuration du service YARN.

2.4. Démarrage du YARN

Start-yarn

 Pour afficher YARN Ressource Manager dans le navigateur : https://localhost:8080

 Pour arrêter YARN :

Stop-yarn

Vous aimerez peut-être aussi

Cahier de Recette
Document37 pages
Cahier de Recette
Momoleskyzo
Pas encore d'évaluation
Cours 02 Intro Hadoop
Document30 pages
Cours 02 Intro Hadoop
Michael Sniper Wu
Pas encore d'évaluation
Correction - Control - Big Data - GR4
Document2 pages
Correction - Control - Big Data - GR4
Younes Oulad Sayad
Pas encore d'évaluation
Chapitre 2 Hadoop-Part1
Document26 pages
Chapitre 2 Hadoop-Part1
souhail nahed
100% (1)
TP1 Hadoop3.1.2
Document20 pages
TP1 Hadoop3.1.2
fatima ezzahrae el ghatous
Pas encore d'évaluation
chp2 Hadoopmapreduce
Document58 pages
chp2 Hadoopmapreduce
Arnauld
Pas encore d'évaluation
Cours1 2 Bigdata 1
Document93 pages
Cours1 2 Bigdata 1
mohamed aziz madhoun
Pas encore d'évaluation
tp1 Hdfs
Document7 pages
tp1 Hdfs
Raja Bs
Pas encore d'évaluation
tp1 BigData
Document9 pages
tp1 BigData
Haitam Laaouini
Pas encore d'évaluation
Exam Bd1718 SR
Document5 pages
Exam Bd1718 SR
Ayachi Emna
Pas encore d'évaluation
Hadoop 1
Document61 pages
Hadoop 1
Mouhamed Bouazzi
Pas encore d'évaluation
CH 1
Document53 pages
CH 1
ya.latreche
Pas encore d'évaluation
Bigdata
Document2 pages
Bigdata
asma.chaabouni345
Pas encore d'évaluation
Installation-Hadoop Mastere
Document17 pages
Installation-Hadoop Mastere
thouraya hsan
Pas encore d'évaluation
TP5Bigdata INDIA 2023 2024
Document5 pages
TP5Bigdata INDIA 2023 2024
Zn
Pas encore d'évaluation
Control Big Data N°4-AU22-23
Document3 pages
Control Big Data N°4-AU22-23
Ferdaous Hdioud
Pas encore d'évaluation
TP 2
Document4 pages
TP 2
moad
Pas encore d'évaluation
Examen Big DATA
Document4 pages
Examen Big DATA
zaki worker
Pas encore d'évaluation
TD2(Chap3_4)
Document6 pages
TD2(Chap3_4)
jeonchama9720
Pas encore d'évaluation
TD 0 Eclipse Et HDFS
Document4 pages
TD 0 Eclipse Et HDFS
test user
Pas encore d'évaluation
Big Data tp1
Document6 pages
Big Data tp1
hajrikoussay03
Pas encore d'évaluation
Output
Document16 pages
Output
Chenafi Dia El Hak
Pas encore d'évaluation
Big Data
Document3 pages
Big Data
Lamiae Elgueloui
Pas encore d'évaluation
TP01 Installation de Hadoop Sous Linux
Document10 pages
TP01 Installation de Hadoop Sous Linux
Manal Ess
Pas encore d'évaluation
TP Hadoop
Document11 pages
TP Hadoop
Jas Min
Pas encore d'évaluation
BigChapitre 03 Partie02
Document11 pages
BigChapitre 03 Partie02
khliaissa46
Pas encore d'évaluation
Cours 4 Architecture - Big Data Hadoop2 HDFS YARN
Document40 pages
Cours 4 Architecture - Big Data Hadoop2 HDFS YARN
alaska8fouad
Pas encore d'évaluation
Bendjerad Abdellah
Document5 pages
Bendjerad Abdellah
hichambed
Pas encore d'évaluation
Hadoop Ecosystem
Document37 pages
Hadoop Ecosystem
hajar.filali4
Pas encore d'évaluation
TP N°1 - Installation Via Paquets
Document6 pages
TP N°1 - Installation Via Paquets
Ferdaous Hd
Pas encore d'évaluation
Hadoop Installation Sous Windows - Sysblog
Document18 pages
Hadoop Installation Sous Windows - Sysblog
Roland Kagbo
Pas encore d'évaluation
TP DHCP, DNS, Apache Et Mail
Document4 pages
TP DHCP, DNS, Apache Et Mail
Ivan Megaptché
Pas encore d'évaluation
TP 4 Reseaux
Document2 pages
TP 4 Reseaux
rihab
0% (1)
Big Data
Document29 pages
Big Data
Cedric Messina
Pas encore d'évaluation
EFM Création D'une Application Cloud Native Bahae Eddine Halim
Document7 pages
EFM Création D'une Application Cloud Native Bahae Eddine Halim
Siham DL
Pas encore d'évaluation
Chapitre 3 LEcosystème Hadoop VF
Document42 pages
Chapitre 3 LEcosystème Hadoop VF
Brahim Ben Saada
100% (1)
Elets Correct S1 Linux
Document5 pages
Elets Correct S1 Linux
Meryam El Maaroufy
Pas encore d'évaluation
tp2 Map Reduce
Document5 pages
tp2 Map Reduce
Raja Bs
Pas encore d'évaluation
1 ELFADDOULI BigData HDFS 2022
Document22 pages
1 ELFADDOULI BigData HDFS 2022
abdou boulif
Pas encore d'évaluation
Chapitre2 Fondements Big Data Hdfs
Document23 pages
Chapitre2 Fondements Big Data Hdfs
Hmad SADAQ
Pas encore d'évaluation
M1101 TD 03 Correction
Document3 pages
M1101 TD 03 Correction
FH
71% (7)
Big Data
Document16 pages
Big Data
Rima CHEMENGUI
Pas encore d'évaluation
DS 2021 2022
Document2 pages
DS 2021 2022
bro
Pas encore d'évaluation
Big Data
Document6 pages
Big Data
zaki worker
Pas encore d'évaluation
Lab1 Distructuion Under Oracle - Partie 1
Document21 pages
Lab1 Distructuion Under Oracle - Partie 1
bamekki abderrahmane
Pas encore d'évaluation
TP1 MR - Initiation
Document4 pages
TP1 MR - Initiation
Rabab Rabab
Pas encore d'évaluation
2 Elfaddouli Bigdata Mapred 2022
Document25 pages
2 Elfaddouli Bigdata Mapred 2022
abdou boulif
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part4
Document2 pages
Mickaelbaron-Hadoopinstallation Part4
satmania
Pas encore d'évaluation
EPI BigData Partie4 Hadoop Sagar Samya
Document48 pages
EPI BigData Partie4 Hadoop Sagar Samya
Lobna Sidia
Pas encore d'évaluation
Linux Sujet2
Document5 pages
Linux Sujet2
medaminedehbiprv
Pas encore d'évaluation
Chapter 2 HDFS and ZooKeeper - v2
Document70 pages
Chapter 2 HDFS and ZooKeeper - v2
Sweety Princess
Pas encore d'évaluation
Chapitre3 NoSQL Avec Redis
Document44 pages
Chapitre3 NoSQL Avec Redis
Godni Rodney
Pas encore d'évaluation
Tp0 Installation Hadoopv2
Document13 pages
Tp0 Installation Hadoopv2
AZELOUALIDINE KAWTAR
Pas encore d'évaluation
Cours Intro Hadoop v27022014 Erraki Haddad
Document62 pages
Cours Intro Hadoop v27022014 Erraki Haddad
Zohra CHANNOUF
Pas encore d'évaluation
Fiche de TD INF 356
Document21 pages
Fiche de TD INF 356
Sali Yaya Farani
Pas encore d'évaluation
Fiche TP N°4: Configuration Du Réseau: Objectifs
Document2 pages
Fiche TP N°4: Configuration Du Réseau: Objectifs
Mahamat Saleh
Pas encore d'évaluation
Lab 3
Document15 pages
Lab 3
Maryâm Bôuch
Pas encore d'évaluation
Chap2 Hadoop
Document74 pages
Chap2 Hadoop
Abdelhakim Traouli
Pas encore d'évaluation
TP 1 HADOOP
Document6 pages
TP 1 HADOOP
masrour
Pas encore d'évaluation
tp1 Mapreduce
Document15 pages
tp1 Mapreduce
Ivan003
Pas encore d'évaluation
Guide Des Commandes SED Sous Linux
D'Everand
Guide Des Commandes SED Sous Linux
Anna Sederman
Pas encore d'évaluation
Cours Systems D'exploitation
Document37 pages
Cours Systems D'exploitation
Abderrahim AitBouna
Pas encore d'évaluation
New Generation Oracle Rac
Document15 pages
New Generation Oracle Rac
delano93
Pas encore d'évaluation
ch3 CRUD
Document32 pages
ch3 CRUD
fatma.abid
Pas encore d'évaluation
Catalog - 1 - Solutions-De-Stockage - FR - FR PDF
Document48 pages
Catalog - 1 - Solutions-De-Stockage - FR - FR PDF
Kouakou Christian Kouassi
Pas encore d'évaluation
Cours Robot Structural Analysis
Document42 pages
Cours Robot Structural Analysis
ziadhajjaji1949
Pas encore d'évaluation
Commander Sa Maison À Distance Avec Un Raspberry Pi
Document69 pages
Commander Sa Maison À Distance Avec Un Raspberry Pi
Officine Pharm
Pas encore d'évaluation
Cahier Des Charges Gestion Des Utilisateurs
Document40 pages
Cahier Des Charges Gestion Des Utilisateurs
Jacques Alain MANG II
Pas encore d'évaluation
Question Entretien
Document5 pages
Question Entretien
khadija.bendaouia
Pas encore d'évaluation
Documentation Nagios
Document14 pages
Documentation Nagios
Bertrand Girault
Pas encore d'évaluation
Architectur Parallèle
Document163 pages
Architectur Parallèle
Abdellah Afetasse
Pas encore d'évaluation
Développement
Document14 pages
Développement
praveen rathod
Pas encore d'évaluation
Hibernate (Par BOUSETTA)
Document20 pages
Hibernate (Par BOUSETTA)
M B
Pas encore d'évaluation
GOL455 20161 Plan
Document6 pages
GOL455 20161 Plan
betouche.abdelkrim
Pas encore d'évaluation
Armoire TGBT
Document4 pages
Armoire TGBT
mohamed_amri100
Pas encore d'évaluation
SYS1A1516-TP N°07
Document7 pages
SYS1A1516-TP N°07
Karim Karima
Pas encore d'évaluation
Utiliser Les Repères de Mise en Page Et D
Document4 pages
Utiliser Les Repères de Mise en Page Et D
Youssef Zelmad
Pas encore d'évaluation
Technologie Docker
Document73 pages
Technologie Docker
Mouhamed moustapha Diop
Pas encore d'évaluation
Logicielsenconstruction - 2012 03 19 - 15 18 45 - 394
Document29 pages
Logicielsenconstruction - 2012 03 19 - 15 18 45 - 394
Øğ Mouha Øwť
Pas encore d'évaluation
20.les Constantes Et Les Constantes Magiques
Document5 pages
20.les Constantes Et Les Constantes Magiques
fpaul1319
Pas encore d'évaluation
Installation Dun Serveur de Dc3a9ploiement Windows
Document30 pages
Installation Dun Serveur de Dc3a9ploiement Windows
Lero19 Boumba
Pas encore d'évaluation
Vsphere Replication 84 Admin
Document166 pages
Vsphere Replication 84 Admin
issamosissam
Pas encore d'évaluation
Projet Linux-1
Document7 pages
Projet Linux-1
Lamine Dieng
Pas encore d'évaluation
Héberger Un Service WCF - Dotnet-France
Document28 pages
Héberger Un Service WCF - Dotnet-France
Assam Toumi
Pas encore d'évaluation
Chap4 - Créer Des Images Docker Avec Le DOCKERFILE
Document8 pages
Chap4 - Créer Des Images Docker Avec Le DOCKERFILE
HOUMANAT
Pas encore d'évaluation
Introduction À HTML - 2
Document2 pages
Introduction À HTML - 2
Miss Ouissem
Pas encore d'évaluation
Pulsar Mu - Manuel Utilisateur
Document23 pages
Pulsar Mu - Manuel Utilisateur
paolo.nobert.pro
Pas encore d'évaluation
Polycop1 Exercices FPES
Document24 pages
Polycop1 Exercices FPES
Ayyoub
Pas encore d'évaluation
M-Files User Guide
Document722 pages
M-Files User Guide
koniba81
Pas encore d'évaluation
Test Word
Document2 pages
Test Word
khaled safi
Pas encore d'évaluation