Yarn Big Data
Yarn Big Data
Yarn Big Data
Prácticas BigData
1. YARN EN ENTORNOS PSEUDO-DISTRIBUIDO
• Copiamos el fichero “mapred-site.xml.template” a “mapred-site.xml”
• Ponemos la siguiente propiedad.
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
• Y en el fichero yarn-site.xml ponemos las siguientes:
<property>
<name>yarn.resourcemanager.hostname</name>
<value>nodo1</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
• Arrancamos HDFS si no lo está
• Arrancamos los servicios YARN
start-yarn.sh
• Comprobamos con jps que tenemos los dos procesos de YARN
• Arrancamos HDFS si no lo está
• Arrancamos los servicios YARN
• Start-yarn.sh
• Arrancamos el servicio que permite guardar el histórico de los Jobs lanzados
• En el caso de tener hadoop versión 2 ejecutamos el comando
/mr-jobhistory-daemon.sh starthistoryserver
• En el caso de tener haddop 3 ejecutamos el comando
www.apasoft-training.com 1
Apasoft Training
www.apasoft-training.com 2
Apasoft Training
www.apasoft-training.com 3