Spark SQL

Uploaded by

The document discusses Spark DataFrames and Datasets using Scala. It shows how to create DataFrames from data, rename columns, sort data and describe datasets. It also demonstrates creating datasets from JSON and Parquet files and reading a CSV file.

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Spark SQL

Uploaded by

Karthikeyan

0% found this document useful (0 votes)

47 views2 pages

Original Title

16. SPARK SQL

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Download as txt, pdf, or txt

0% found this document useful (0 votes)

47 views2 pages

Spark SQL

Uploaded by

Karthikeyan

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Download as txt, pdf, or txt

Jump to Page

You are on page 1of 2

Search inside document

1) DATAFRAME:

import org.apache.spark.sql.SparkSession
val sparkSession = SparkSession.builder.master("local").appName("Spark session in
Fresco").getOrCreate()
val langPercentDF = spark.createDataFrame(List(("Scala", 35), ("Python", 30), ("R",
15), ("Java", 20)))
langPercentDF.show()
val lpDF = langPercentDF.withColumnRenamed("_1",
"language").withColumnRenamed("_2", "percent")
lpDF.orderBy(desc("percent")).show(false)

2) DATASET:
import org.apache.spark.sql.SparkSession
val spark = SparkSession.builder.master("local").appName("Spark session in
Fresco").getOrCreate()
val numDS = spark.range(5, 100, 5)
numDS.show()
numDS.orderBy(desc("id")).show(5)
numDS.describe().show()

3) CREATE DATSET by JSON

{"name":"Rahul","age":"35"}
{"name":"Sachin","age":"46"}
import org.apache.spark.sql.SparkSession
val spark = SparkSession.builder.master("local").appName("Spark session in
Fresco").getOrCreate()
val peopleDS = spark.read.json("/projects/People.json")
peopleDS.show()
case class Person(name:String,age:String)
object Main
{
def main(args: Array[String])
{
var Person1 = Person("35", "Rahul")
var Person2 = Person("46", "Sachin")
println("Age of the Person1 is " + Person1.age);
println("Name of the Person1 is " + Person1.name);
println("Age of the Person2 is " + Person2.age);
println("Name of the Person2 is " + Person2.name);
}
}

4) PARQUET
{"name":"Rahul","age":"35"}
{"name":"Sachin","age":"46"}
import org.apache.spark.sql.SparkSession
val spark = SparkSession.builder.master("local").appName("Spark session in
Fresco").getOrCreate()
val peopleDS = spark.read.json("/projects/People.json")
peopleDS.show()
val peoplePAR = peopleDS.write.parquet("/projects/challenge/data.parquet")
val sqlContext = new org.apache.spark.sql.SQLContext(sc)
val data = sqlContext.read.parquet("/projects/challenge/data.parquet")
data.show()

5) CSV Files
git clone https://github.com/frescoplaylab/Census.git
import org.apache.spark.sql.SparkSession
val spark = SparkSession.builder().master("local[1]").appName("Spark Session in
Frescoplay").getOrCreate()
val dfs = spark.read.format("csv").option("header",
"true").option("Inferschema","true").option("mode",
"DROPMALFORMED").load("/projects/challenge/Census/demography.csv")
val joined = dfs.join(TotalPopulation, "Total Population")

A Detailed Lesson Plan in Math For Grade Iv: (M4NS-Ib-5.2)
Document4 pages
A Detailed Lesson Plan in Math For Grade Iv: (M4NS-Ib-5.2)
Teacher Sittie
100% (12)
Pyspark MCQ
Document3 pages
Pyspark MCQ
Eren Levi
No ratings yet
Jquery Notes W3schools
Document8 pages
Jquery Notes W3schools
Sanjay Kumar
100% (2)
Scikit
Document4 pages
Scikit
Anzal Malik
No ratings yet
Yael English Test
Document14 pages
Yael English Test
Olimpiu Ant
No ratings yet
Lesson Plan Like The Molave
Document6 pages
Lesson Plan Like The Molave
Junelyn Gapuz Villar
100% (3)
Python Oops
Document10 pages
Python Oops
John Solomon
No ratings yet
This Study Resource Was
Document4 pages
This Study Resource Was
yihinaf
No ratings yet
Machine Learning Scikit Handson
Document4 pages
Machine Learning Scikit Handson
Akshay Sharada Hanmant Suryawanshi
No ratings yet
Jquery - Introduction: Welcome To The Odyssey With Jquery!
Document17 pages
Jquery - Introduction: Welcome To The Odyssey With Jquery!
Shubham Mittal
100% (1)
E1 Fresco Prob3 Correct PDF Free
Document1 page
E1 Fresco Prob3 Correct PDF Free
ikhwancules46
No ratings yet
SASS A CSS Preprocessor
Document4 pages
SASS A CSS Preprocessor
venkatesh nerella
No ratings yet
Python 3 - Functions & OOPs
Document27 pages
Python 3 - Functions & OOPs
Waris Akhter
No ratings yet
Backbone Js
Document7 pages
Backbone Js
kashyap
No ratings yet
Java8 Innards
Document4 pages
Java8 Innards
Abhishek Kumar
No ratings yet
E1 Fresco Prob3 Correct
Document1 page
E1 Fresco Prob3 Correct
Kaushik Raj
No ratings yet
Exercise - ANOVA - Fresco
Document1 page
Exercise - ANOVA - Fresco
Arpita Das
No ratings yet
Python 3 Oops Hands On
Document7 pages
Python 3 Oops Hands On
rajesh
No ratings yet
Backbone JS
Document4 pages
Backbone JS
Shantha Moorthy
0% (1)
The Series Data Structure: Import Pandas As PD
Document8 pages
The Series Data Structure: Import Pandas As PD
Bhanu Jha
No ratings yet
DataFrame Operations
Document1 page
DataFrame Operations
Arpita Das
No ratings yet
Python Pandas MCQs
Document7 pages
Python Pandas MCQs
Yees BoojPai
No ratings yet
Oops and Functions
Document6 pages
Oops and Functions
alpha -N
No ratings yet
Numpy - Python Package For Data
Document9 pages
Numpy - Python Package For Data
Daniel N Sherine Foo
No ratings yet
Python 3 Functions and OOPs FP
Document10 pages
Python 3 Functions and OOPs FP
Priya Satheesh
No ratings yet
Num Py
Document46 pages
Num Py
ytmusik4
No ratings yet
Module 3
Document2 pages
Module 3
sach
No ratings yet
NumPy Arrays and Pandas Series Object
Document18 pages
NumPy Arrays and Pandas Series Object
Parv Mudgal
No ratings yet
Writing An Hadoop MapReduce Program in Python
Document21 pages
Writing An Hadoop MapReduce Program in Python
Vigneshwaran Sundaresan
No ratings yet
Hands On Python Qualis Pytest
Document7 pages
Hands On Python Qualis Pytest
TECHer YT
No ratings yet
Getting Started With Memcached Sample Chapter
Document5 pages
Getting Started With Memcached Sample Chapter
Packt Publishing
No ratings yet
356 Eca DDQSJ WTs L8 ZLEmn A
Document23 pages
356 Eca DDQSJ WTs L8 ZLEmn A
Nanda Kishore Beechani
No ratings yet
Descriptor
Document4 pages
Descriptor
roy.scar2196
No ratings yet
Hands-On Learning With KubeFlow + Keras - TensorFlow 2.0 + TF Extended
Document1 page
Hands-On Learning With KubeFlow + Keras - TensorFlow 2.0 + TF Extended
Stan Laurel
No ratings yet
Angular Js
Document536 pages
Angular Js
mahendar
No ratings yet
Wings 1
Document1 page
Wings 1
ravi kumar
No ratings yet
Os Practical File
Document34 pages
Os Practical File
Priyaranjan
No ratings yet
ECMAScript6 Handson
Document2 pages
ECMAScript6 Handson
Humza Ahmed Siddiqui
100% (1)
Indigo Site Automation
Document2 pages
Indigo Site Automation
Neha Tyagi
No ratings yet
Unstructured Data Classification Handson
Document4 pages
Unstructured Data Classification Handson
mohamed yasin
No ratings yet
ReactJS Assignment 2
Document7 pages
ReactJS Assignment 2
Ganesh Thapa
No ratings yet
Python Qualis
Document6 pages
Python Qualis
Ragav Endran
No ratings yet
Python-Module03-Case Study03
Document2 pages
Python-Module03-Case Study03
kallolacharya1974
100% (1)
Python MCQ
Document21 pages
Python MCQ
preethi
No ratings yet
Artillery API
Document25 pages
Artillery API
Rohit Aich
No ratings yet
Python Pandas Hands-On CID 55937
Document10 pages
Python Pandas Hands-On CID 55937
Stark
No ratings yet
Cross Browser Testing Selenium Handson
Document3 pages
Cross Browser Testing Selenium Handson
harikasatyanarayana603
No ratings yet
PYTHON OOPS HandsON
Document19 pages
PYTHON OOPS HandsON
Aradhana Mehra
No ratings yet
Kibana
Document1 page
Kibana
hdfbglifb
No ratings yet
Flask-Python Web Framework Hands-On
Document12 pages
Flask-Python Web Framework Hands-On
Girish Sawant
No ratings yet
Data Story 2
Document2 pages
Data Story 2
Senthil Lakshmi
No ratings yet
Advanced Time Series Analysis
Document3 pages
Advanced Time Series Analysis
Ayush Garg
100% (1)
Pytest Pythonqulis
Document5 pages
Pytest Pythonqulis
Naman
No ratings yet
Ansible Automation Sibelius
Document3 pages
Ansible Automation Sibelius
Rahul Jain
No ratings yet
Stat 2
Document3 pages
Stat 2
smrutiranjan parida
No ratings yet
Nagios Admin Interview Questions
Document13 pages
Nagios Admin Interview Questions
abhi garg
No ratings yet
Frescoplay Courses - Dump
Document32 pages
Frescoplay Courses - Dump
Sameer Krishna
No ratings yet
Context
Document4 pages
Context
roy.scar2196
No ratings yet
Generics
Document4 pages
Generics
Siva Karthick
No ratings yet
E1 Fresco Prob2 Correct
Document1 page
E1 Fresco Prob2 Correct
Kaushik Raj
No ratings yet
Java servlet Second Edition
From Everand
Java servlet Second Edition
Gerardus Blokdyk
No ratings yet
Dark Dex SYN X
Document1 page
Dark Dex SYN X
João Lucas
No ratings yet
Spark Cheat Sheet 1717838924
Document10 pages
Spark Cheat Sheet 1717838924
monachatterjee962
No ratings yet
CGFNG
Document1 page
CGFNG
Karthikeyan
No ratings yet
Writing SQL Queries
Document15 pages
Writing SQL Queries
Karthikeyan
No ratings yet
L-Systems: Simulation of Development and Growth
Document56 pages
L-Systems: Simulation of Development and Growth
Karthikeyan
No ratings yet
Introduction To Automata Introduction To Automata Theoryy: Reading: Chapter 1
Document24 pages
Introduction To Automata Introduction To Automata Theoryy: Reading: Chapter 1
Karthikeyan
No ratings yet
App
Document2 pages
App
Karthikeyan
No ratings yet
Typography and Readability: Antiikva Groteski
Document8 pages
Typography and Readability: Antiikva Groteski
Barta Jolán
No ratings yet
Instructional Plan in Araling Panlipunan-. 1 (12) : Elements of The Plan
Document6 pages
Instructional Plan in Araling Panlipunan-. 1 (12) : Elements of The Plan
Yares Mercedita L.
No ratings yet
Data Analytics with MS Excel Lab Manual Full 2024-25
Document30 pages
Data Analytics with MS Excel Lab Manual Full 2024-25
K. yoga priya Priya
No ratings yet
Voice and Touch Control Home Automation: Sushant Kumar S.S Solanki
Document4 pages
Voice and Touch Control Home Automation: Sushant Kumar S.S Solanki
Saiviswanth Boggarapu
No ratings yet
Mantra Pushpam (IAST)
Document4 pages
Mantra Pushpam (IAST)
Omkaarnath
No ratings yet
C1 Adv Book 2 AK
Document16 pages
C1 Adv Book 2 AK
Francisco Botella Juan
No ratings yet
0047 001 PDF
Document386 pages
0047 001 PDF
Sarbu Ana
No ratings yet
2024 CAT PAT Grade 10 Learner Guide
Document42 pages
2024 CAT PAT Grade 10 Learner Guide
Decide Mkansi
No ratings yet
Periodic Table and Periodicity - Print - Quizizz
Document5 pages
Periodic Table and Periodicity - Print - Quizizz
Izzati
No ratings yet
Meridium APM Basics V3.6.0.0.0
Document295 pages
Meridium APM Basics V3.6.0.0.0
Jay
No ratings yet
Saxophone Grade 7
Document20 pages
Saxophone Grade 7
Imogen Hawkins
No ratings yet
Rapunzel by The Grimm Brothers - A Comparison of The Versions of 1812 and 1857
Document4 pages
Rapunzel by The Grimm Brothers - A Comparison of The Versions of 1812 and 1857
wicus1
No ratings yet
Directed Acyclic Graph
Document7 pages
Directed Acyclic Graph
Baccha N00B
No ratings yet
Shahaaab___Romance
Document235 pages
Shahaaab___Romance
nasiruzainabgatawa
No ratings yet
Brief History of The Bakossi People
Document8 pages
Brief History of The Bakossi People
Ewane Mpode
No ratings yet
174-Article Text-315-1-10-20211231
Document11 pages
174-Article Text-315-1-10-20211231
elvida
No ratings yet
XI-Poem 1 Ms Ammara
Document10 pages
XI-Poem 1 Ms Ammara
Ammara Khalid
No ratings yet
Cs411 Midterm Solved Mcqs by Junaid
Document48 pages
Cs411 Midterm Solved Mcqs by Junaid
xaifiii176
No ratings yet
EZTwain User Guide
Document187 pages
EZTwain User Guide
glarrana
No ratings yet
Learn WPF in One Week
Document138 pages
Learn WPF in One Week
Marcelo Pereira da Silva
100% (1)
Study Abroad Booster Program
Document11 pages
Study Abroad Booster Program
anik30
No ratings yet
VI SEM CSE CS1351 Artificial Intelligence UNIT-III Question and Answers
Document18 pages
VI SEM CSE CS1351 Artificial Intelligence UNIT-III Question and Answers
Puspha Vasanth R
No ratings yet
Sem1Foundver.2 (Reading and Writing) 2
Document82 pages
Sem1Foundver.2 (Reading and Writing) 2
J cl
No ratings yet
DE2i-150 User Manual Vo.04
Document111 pages
DE2i-150 User Manual Vo.04
Lucas Cambuim
No ratings yet
Augustine, Origen and The Exegesis of Paul
Document28 pages
Augustine, Origen and The Exegesis of Paul
Ostap
No ratings yet
Sickle Cell Anaemia by SAL
Document4 pages
Sickle Cell Anaemia by SAL
Sahar Ahmed Laskar
No ratings yet
Đề thi thử vào lớp 6 chất lượng cao - Môn Tiếng Anh Đề số 1 (40 câu)
Document3 pages
Đề thi thử vào lớp 6 chất lượng cao - Môn Tiếng Anh Đề số 1 (40 câu)
Thu Hằng Trần
No ratings yet