Merge Files Store in A Directory To A File

This Java code uses MapReduce to merge files stored in a local directory into a single file stored in HDFS. It opens input files from the local filesystem, reads the contents in blocks, and writes these blocks to the output file on HDFS. Any exceptions during this process are printed.

Uploaded by

msodhani

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

341 views3 pages

Merge Files Store in A Directory To A File

Uploaded by

msodhani

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 3

Merge files store in a directory to a file

import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
public class PutMerge {
public static void main(String[] args) throws IOException {
Configuration conf = new Configuration();
FileSystem hdfs = FileSystem.get(conf);
FileSystem local = FileSystem.getLocal(conf);
Path inputDir = new Path(args[0]);
Path hdfsFile = new Path(args[1]);
try {
FileStatus[] inputFiles = local.listStatus(inputDir);
FSDataOutputStream out = hdfs.create(hdfsFile);
for (int i=0; i<inputFiles.length; i++) {
System.out.println(inputFiles[i].getPath().getName());
FSDataInputStream in = local.open(inputFiles[i].getPath());
byte buffer[] = new byte[256];
int bytesRead = 0;
while( (bytesRead = in.read(buffer)) > 0) {
out.write(buffer, 0, bytesRead);
}
in.close();
}
out.close();
} catch (IOException e) {
e.printStackTrace();
}}}
Copy contains of a file in another file with , sign
import java.io.IOException;
import java.util.*;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.conf.*;
import org.apache.hadoop.io.*;
import org.apache.hadoop.mapred.*;
import org.apache.hadoop.util.*;
public class MyJob extends Configured implements Tool {
public static class MapClass extends MapReduceBase implements Mapper<Text, Text, Text,
Text>
{
public void map(Text key, Text value,OutputCollector<Text, Text> output,Reporter reporter)
throws IOException
{
output.collect(value, key);
}
}
public static class Reduce extends MapReduceBase
implements Reducer<Text, Text, Text, Text> {
public void reduce(Text key, Iterator<Text> values,
OutputCollector<Text, Text> output,
Reporter reporter) throws IOException {
String csv = "";
while (values.hasNext()) {
if (csv.length() > 0) csv += ",";
csv += values.next().toString();
}
output.collect(key, new Text(csv));
}
}
public int run(String[] args) throws Exception {
Configuration conf = getConf();
JobConf job = new JobConf(conf, MyJob.class);
Path in = new Path(args[0]);
Path out = new Path(args[1]);
FileInputFormat.setInputPaths(job, in);
FileOutputFormat.setOutputPath(job, out);
job.setJobName("MyJob");
job.setMapperClass(MapClass.class);
job.setReducerClass(Reduce.class);
job.setInputFormat(KeyValueTextInputFormat.class);
job.setOutputFormat(TextOutputFormat.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);
job.set("key.value.seaparator.in.input.line", ",");
JobClient.runJob(job);
return 0;
}
public static void main(String[] args) throws Exception {
int res = ToolRunner.run(new Configuration(), new MyJob(), args);
System.exit(res);
}
}

Find Sum and Avertage of Salary on the basis of SEX

import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.FloatWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class avgtot {
public static class MapperClass extends
Mapper<LongWritable, Text, Text, FloatWritable> {
public void map(LongWritable key, Text empRecord, Context con)
throws IOException, InterruptedException {
String[] word = empRecord.toString().split("\\t");
String sex = word[2];
try {
Float salary = Float.parseFloat(word[5]);
con.write(new Text(sex), new FloatWritable(salary));
} catch (Exception e) {
e.printStackTrace();
}}}
public static class ReducerClass extends
Reducer<Text, FloatWritable, Text, Text> {
public void reduce(Text key, Iterable<FloatWritable> valueList,
Context con) throws IOException, InterruptedException {
try {
Float total = (float) 0;
int count = 0;
for (FloatWritable var : valueList)
{
total += var.get();
System.out.println("reducer " + var.get());
count++;
}
Float avg = (Float) total / count;
String out = "Total: " + total + " :: " + "Average: " + avg;
con.write(key, new Text(out));
} catch (Exception e) {
e.printStackTrace();
}
}
}
public static void main(String[] args) {
Configuration conf = new Configuration();
try {
Job job = Job.getInstance(conf, "avegage total");
job.setJarByClass(avgtot.class);
job.setMapperClass(MapperClass.class);
job.setReducerClass(ReducerClass.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(FloatWritable.class);
Path pathInput = new Path(args[0]);
Path pathOutputDir = new Path(args[1]);
FileInputFormat.addInputPath(job, pathInput);
FileOutputFormat.setOutputPath(job, pathOutputDir );
FileInputFormat.addInputPath(job, pathInput);
FileOutputFormat.setOutputPath(job, pathOutputDir);
System.exit(job.waitForCompletion(true) ? 0 : 1);
} catch (IOException e) {
e.printStackTrace();
} catch (ClassNotFoundException e) {
e.printStackTrace();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}

Advanced Mapreduce
No ratings yet
Advanced Mapreduce
37 pages
Data Structure and Algorithm
100% (1)
Data Structure and Algorithm
17 pages
CSF443 Lab-Report Nimish Shandilya 1000016934
No ratings yet
CSF443 Lab-Report Nimish Shandilya 1000016934
17 pages
SAP LSMW Step by Step Full Document
No ratings yet
SAP LSMW Step by Step Full Document
34 pages
BDA Output
No ratings yet
BDA Output
32 pages
(Male) Data Collection & Monitoring Assistant DCMA PDF
50% (2)
(Male) Data Collection & Monitoring Assistant DCMA PDF
483 pages
Lab File Format
No ratings yet
Lab File Format
60 pages
Cloud PDF
No ratings yet
Cloud PDF
47 pages
Step 2 - First MapReduce Program
No ratings yet
Step 2 - First MapReduce Program
25 pages
Hadoop
No ratings yet
Hadoop
51 pages
BDC Final Record
No ratings yet
BDC Final Record
36 pages
Installation of Hadoop
No ratings yet
Installation of Hadoop
37 pages
BDA Exp Removed Removed
No ratings yet
BDA Exp Removed Removed
33 pages
Customer - 3.java: Import Import Import Import Import Import Import Import
No ratings yet
Customer - 3.java: Import Import Import Import Import Import Import Import
15 pages
Dsa Prac 5 19DCS038
No ratings yet
Dsa Prac 5 19DCS038
16 pages
Hadoop
No ratings yet
Hadoop
19 pages
BDF Programs
No ratings yet
BDF Programs
32 pages
Map Reduce
No ratings yet
Map Reduce
5 pages
BDT Lab 6 22mis1067
No ratings yet
BDT Lab 6 22mis1067
13 pages
BDAV Practical
No ratings yet
BDAV Practical
17 pages
Document 6
No ratings yet
Document 6
15 pages
BDA MapReduce Program
No ratings yet
BDA MapReduce Program
8 pages
MR Progs For Self Excercise
No ratings yet
MR Progs For Self Excercise
14 pages
Project Management Checklist
No ratings yet
Project Management Checklist
2 pages
Sets Bda
No ratings yet
Sets Bda
19 pages
Hadoop Wordcount Program
No ratings yet
Hadoop Wordcount Program
20 pages
Average of Integer: Driver
No ratings yet
Average of Integer: Driver
3 pages
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
No ratings yet
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
3 pages
Hadoop Mini Project
No ratings yet
Hadoop Mini Project
8 pages
All
No ratings yet
All
11 pages
Exp2 Hadoop
No ratings yet
Exp2 Hadoop
6 pages
DSBDA GRP B 1
No ratings yet
DSBDA GRP B 1
8 pages
104 Da11-13
No ratings yet
104 Da11-13
14 pages
DSBDA GRP B 1
No ratings yet
DSBDA GRP B 1
8 pages
Cloud LAB 10.1,11.1,12.1
No ratings yet
Cloud LAB 10.1,11.1,12.1
6 pages
Classcreation
No ratings yet
Classcreation
2 pages
6 - Simple Wordcount
No ratings yet
6 - Simple Wordcount
2 pages
Dsbda Group B 1
No ratings yet
Dsbda Group B 1
5 pages
Practical 2-3
No ratings yet
Practical 2-3
3 pages
Bda 1
No ratings yet
Bda 1
6 pages
Big Data Fundamentals and Platforms Assginment 3
No ratings yet
Big Data Fundamentals and Platforms Assginment 3
6 pages
02-Wordcount Mapreduce
No ratings yet
02-Wordcount Mapreduce
5 pages
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
No ratings yet
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
13 pages
Lab3 BigData-MapReduce
No ratings yet
Lab3 BigData-MapReduce
8 pages
Exp 4 Word Count
No ratings yet
Exp 4 Word Count
4 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
7 pages
Exp 3 4
No ratings yet
Exp 3 4
7 pages
B1 Instructions
No ratings yet
B1 Instructions
9 pages
Wrordcount
No ratings yet
Wrordcount
2 pages
MapReduce Programs
No ratings yet
MapReduce Programs
10 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
Sribharanitharan.M 71762234049
No ratings yet
Sribharanitharan.M 71762234049
2 pages
MapReduce - Notes
No ratings yet
MapReduce - Notes
17 pages
DSBDA11 Code
No ratings yet
DSBDA11 Code
3 pages
Week 1 Hadoop and Hdfs Commands
No ratings yet
Week 1 Hadoop and Hdfs Commands
1 page
Word Count Program
No ratings yet
Word Count Program
2 pages
Palak
No ratings yet
Palak
10 pages
Cacti ISP Billing PDF
No ratings yet
Cacti ISP Billing PDF
42 pages
Using Map Reduce Concept, Implement A Java Pro...
No ratings yet
Using Map Reduce Concept, Implement A Java Pro...
2 pages
html5 Cheat Sheet wc3 PDF
No ratings yet
html5 Cheat Sheet wc3 PDF
16 pages
ADA Lab Manual
No ratings yet
ADA Lab Manual
34 pages
BDC
No ratings yet
BDC
18 pages
Evenoddsum Program
No ratings yet
Evenoddsum Program
2 pages
As/400 Interview Question
100% (20)
As/400 Interview Question
47 pages
Normalization of Database Tables
No ratings yet
Normalization of Database Tables
21 pages
Prerequisites: Single Node Setup Cluster Setup
No ratings yet
Prerequisites: Single Node Setup Cluster Setup
5 pages
Unit V
No ratings yet
Unit V
28 pages
SAP Tech Document
No ratings yet
SAP Tech Document
2 pages
Experiment - 1: DDL (Data Definition Lan-Guage) DML (Data Manipulation Language) DCL (Data Control Lan - Guage)
No ratings yet
Experiment - 1: DDL (Data Definition Lan-Guage) DML (Data Manipulation Language) DCL (Data Control Lan - Guage)
2 pages
MapReduce Example
No ratings yet
MapReduce Example
3 pages
Big Data?: Hadoop?
No ratings yet
Big Data?: Hadoop?
2 pages
SAP Note 82478 - SAP System OS/DB Migration: Symptom
No ratings yet
SAP Note 82478 - SAP System OS/DB Migration: Symptom
3 pages
1 Asp - Net Notes
100% (1)
1 Asp - Net Notes
21 pages
Data Extraction, Cleanup and Transformation Tools: T.R.Lekhaa Ap-It Snsce
No ratings yet
Data Extraction, Cleanup and Transformation Tools: T.R.Lekhaa Ap-It Snsce
24 pages
Online Shopping Mall
No ratings yet
Online Shopping Mall
23 pages
Allintext
No ratings yet
Allintext
7 pages
DBMS Case Study IPL Pie in The Sky v2
No ratings yet
DBMS Case Study IPL Pie in The Sky v2
8 pages
Setics Sttar: Using Fme and Setics Sttar To Industrialize FTTX Network Design Studies
100% (1)
Setics Sttar: Using Fme and Setics Sttar To Industrialize FTTX Network Design Studies
17 pages
Adme Q & A: Question & Answer
No ratings yet
Adme Q & A: Question & Answer
3 pages
Analisis Dan Perancangan Sistem Informasi Kesiswaan
No ratings yet
Analisis Dan Perancangan Sistem Informasi Kesiswaan
20 pages
Qlik Sense Security Rules List
No ratings yet
Qlik Sense Security Rules List
17 pages
3 Eer 05 01 2024
No ratings yet
3 Eer 05 01 2024
38 pages
Chapter - 3 Binary Files: 3.1 Reading and Writing To A Binary File
No ratings yet
Chapter - 3 Binary Files: 3.1 Reading and Writing To A Binary File
8 pages
II Writing The Queries For The Invoice Database (50%)
No ratings yet
II Writing The Queries For The Invoice Database (50%)
3 pages
Windows Registry, Disk Defragmentor, Manage Disks
No ratings yet
Windows Registry, Disk Defragmentor, Manage Disks
10 pages
Result Mining For Performance Enhancement
No ratings yet
Result Mining For Performance Enhancement
1 page
Connect To MySQl
No ratings yet
Connect To MySQl
1 page
SQL Interview Questions
No ratings yet
SQL Interview Questions
50 pages
General: Intel Hex File Format
No ratings yet
General: Intel Hex File Format
4 pages
Documenting Data Flow Diagrams
No ratings yet
Documenting Data Flow Diagrams
4 pages
CSC410 2017-2018
No ratings yet
CSC410 2017-2018
2 pages
Tracking Security Log Issues Occure in Cloud Environment
No ratings yet
Tracking Security Log Issues Occure in Cloud Environment
1 page
Implementing Activity Diagram On Web With Optimization
No ratings yet
Implementing Activity Diagram On Web With Optimization
1 page
Task Scheduling Via Service
No ratings yet
Task Scheduling Via Service
1 page
An Approach of Analyzing Big Data Stored On Cloud Through Mining Technique
No ratings yet
An Approach of Analyzing Big Data Stored On Cloud Through Mining Technique
1 page
PySpark Learning Hub 1700684461
No ratings yet
PySpark Learning Hub 1700684461
8 pages
Achyuta Sushma - Resume
No ratings yet
Achyuta Sushma - Resume
6 pages
Consistency Model PDF
No ratings yet
Consistency Model PDF
4 pages
Python Reference: An Alphabetical Guide
From Everand
Python Reference: An Alphabetical Guide
Jo Foster
No ratings yet
Introduction to PHP, Part 5, Second Edition
From Everand
Introduction to PHP, Part 5, Second Edition
Adam Majczak
No ratings yet

Merge Files Store in A Directory To A File

Uploaded by

Merge Files Store in A Directory To A File

Uploaded by

Merge files store in a directory to a file

Find Sum and Avertage of Salary on the basis of SEX

You might also like