Error Log

The query resulted in an OutOfMemorySparkException because the size of the broadcasted table far exceeded the driver memory limit of 4GB. The document recommends disabling broadcasts for this query using spark.sql.autoBroadcastJoinThreshold=-1 to avoid this issue.

Uploaded by

Sumanta Dutta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

155 views2 pages

Error Log

Uploaded by

Sumanta Dutta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

org.apache.spark.sql.execution.

OutOfMemorySparkException: Size of broadcasted table

far exceeds estimates and exceeds limit of spark.driver.maxResultSize=4294967296.
You can disable broadcasts for this query using set
spark.sql.autoBroadcastJoinThreshold=-1
---------------------------------------------------------------------------
Py4JJavaError Traceback (most recent call last)
127 if submission:
128 submission.submit_status('In Progress', stage=stage)
--> 129 method()
130 submission.submit_status('Completed', stage=stage)
131 else:

/local_disk0/spark-d72471c9-08db-4f0d-b38c-8cb06cc4fc63/userFiles-87519a89-ae11-
4133-92d0-28f1df2ea516/scripts.zip/integrated_dim_product_unharmonised.py in
process()
37
38 output_df = transform(source_df, current_df, epos_product_lookup_df)
---> 39 load(output_df)
40
41 log_info(__name__, "process", "finish::success")

/local_disk0/spark-d72471c9-08db-4f0d-b38c-8cb06cc4fc63/userFiles-87519a89-ae11-
4133-92d0-28f1df2ea516/scripts.zip/integrated_dim_product_unharmonised.py in
load(df)
85
86 # don't write output unless df has values in
---> 87 if df.head(1):
88 df.write.mode('overwrite').parquet(output_path)
89

/databricks/spark/python/pyspark/sql/dataframe.py in head(self, n)
1744 rs = self.head(1)
1745 return rs[0] if rs else None
-> 1746 return self.take(n)
1747
1748 def first(self):

/databricks/spark/python/pyspark/sql/dataframe.py in take(self, num)

767 [Row(age=2, name='Alice'), Row(age=5, name='Bob')]
768 """
--> 769 return self.limit(num).collect()
770
771 def tail(self, num):

/databricks/spark/python/pyspark/sql/dataframe.py in collect(self)
713 # Default path used in OSS Spark / for non-DF-ACL clusters:
714 with SCCallSiteSync(self._sc) as css:
--> 715 sock_info = self._jdf.collectToPython()
716 return list(_load_from_socket(sock_info,
BatchedSerializer(PickleSerializer())))
717

/databricks/spark/python/lib/py4j-0.10.9.1-src.zip/py4j/java_gateway.py in
__call__(self, *args)
1302
1303 answer = self.gateway_client.send_command(command)
-> 1304 return_value = get_return_value(
1305 answer, self.gateway_client, self.target_id, self.name)
1306
/databricks/spark/python/pyspark/sql/utils.py in deco(*a, **kw)
115 def deco(*a, **kw):
116 try:
--> 117 return f(*a, **kw)
118 except py4j.protocol.Py4JJavaError as e:
119 converted = convert_exception(e.java_exception)

/databricks/spark/python/lib/py4j-0.10.9.1-src.zip/py4j/protocol.py in
get_return_value(answer, gateway_client, target_id, name)
324 value = OUTPUT_CONVERTER[type](answer[2:], gateway_client)
325 if answer[1] == REFERENCE_TYPE:
--> 326 raise Py4JJavaError(
327 "An error occurred while calling {0}{1}{2}.\n".
328 format(target_id, ".", name), value)

Py4JJavaError: An error occurred while calling o690.collectToPython.

: org.apache.spark.sql.execution.OutOfMemorySparkException: Size of broadcasted
table far exceeds estimates and exceeds limit of
spark.driver.maxResultSize=4294967296. You can disable broadcasts for this query
using set spark.sql.autoBroadcastJoinThreshold=-1
at org.apache.spark.sql.execution.exchange.BroadcastExchangeExec.
$anonfun$relationFuture$1(BroadcastExchangeExec.scala:202)
at org.apache.spark.sql.SparkSession.withActive(SparkSession.scala:968)
at org.apache.spark.sql.execution.SQLExecution$.
$anonfun$withThreadLocalCaptured$4(SQLExecution.scala:448)
at scala.util.DynamicVariable.withValue(DynamicVariable.scala:62)
at org.apache.spark.sql.execution.SQLExecution$.
$anonfun$withThreadLocalCaptured$3(SQLExecution.scala:448)
at scala.util.DynamicVariable.withValue(DynamicVariable.scala:62)
at org.apache.spark.sql.execution.SQLExecution$.
$anonfun$withThreadLocalCaptured$2(SQLExecution.scala:447)
at
org.apache.spark.sql.execution.SQLExecution$.withOptimisticTransaction(SQLExecution
.scala:465)
at org.apache.spark.sql.execution.SQLExecution$.
$anonfun$withThreadLocalCaptured$1(SQLExecution.scala:446)
at
java.util.concurrent.CompletableFuture$AsyncSupply.run(CompletableFuture.java:1604)
at org.apache.spark.util.threads.SparkThreadLocalCapturingRunnable.
$anonfun$run$1(SparkThreadLocalForwardingThreadPoolExecutor.scala:104)
at scala.runtime.java8.JFunction0$mcV$sp.apply(JFunction0$mcV$sp.java:23)
at
org.apache.spark.util.threads.SparkThreadLocalCapturingHelper.runWithCaptured(Spark
ThreadLocalForwardingThreadPoolExecutor.scala:68)
at
org.apache.spark.util.threads.SparkThreadLocalCapturingHelper.runWithCaptured$
(SparkThreadLocalForwardingThreadPoolExecutor.scala:54)
at
org.apache.spark.util.threads.SparkThreadLocalCapturingRunnable.runWithCaptured(Spa
rkThreadLocalForwardingThreadPoolExecutor.scala:101)
at
org.apache.spark.util.threads.SparkThreadLocalCapturingRunnable.run(SparkThreadLoca
lForwardingThreadPoolExecutor.scala:104)
at
java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at
java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:750)

Examples With Practical Guide For Pyspark
No ratings yet
Examples With Practical Guide For Pyspark
127 pages
Pyspark Basics
No ratings yet
Pyspark Basics
16 pages
Micro Project On DBMS
97% (29)
Micro Project On DBMS
12 pages
Associate Developer Apache Spark 3.5
No ratings yet
Associate Developer Apache Spark 3.5
6 pages
SQL - & - Pyspak
No ratings yet
SQL - & - Pyspak
6 pages
PySpark Optimization Scenarios - Wipro
No ratings yet
PySpark Optimization Scenarios - Wipro
8 pages
Journal
No ratings yet
Journal
47 pages
Scenarios Where Bad Records Occur
No ratings yet
Scenarios Where Bad Records Occur
38 pages
Code
No ratings yet
Code
13 pages
Introducing Letters
No ratings yet
Introducing Letters
33 pages
Stdout
No ratings yet
Stdout
13 pages
Pyspark Funcamentals
No ratings yet
Pyspark Funcamentals
10 pages
Top 100 Pyspark Functions For Data Engineers 1738131847
No ratings yet
Top 100 Pyspark Functions For Data Engineers 1738131847
30 pages
Pyspark Cheatsheet
No ratings yet
Pyspark Cheatsheet
21 pages
A926534728 - 28953 - 8 - 2025 - Spark Mllib
No ratings yet
A926534728 - 28953 - 8 - 2025 - Spark Mllib
8 pages
Pyspark - SQL Module
No ratings yet
Pyspark - SQL Module
132 pages
PySpark Cheatsheet
No ratings yet
PySpark Cheatsheet
12 pages
(Big Data Analytics With PySpark) (CheatSheet)
No ratings yet
(Big Data Analytics With PySpark) (CheatSheet)
7 pages
T09 Sparksql
No ratings yet
T09 Sparksql
30 pages
Databricks Certified Data Engineer Associate 9
No ratings yet
Databricks Certified Data Engineer Associate 9
12 pages
Word Count
No ratings yet
Word Count
3 pages
Must Know Pyspark Coding Before Databricks Interview
No ratings yet
Must Know Pyspark Coding Before Databricks Interview
7 pages
DataGrokr Technical Assignment - Data Engineering
No ratings yet
DataGrokr Technical Assignment - Data Engineering
4 pages
Py Spark 3 Quick Reference Guide
No ratings yet
Py Spark 3 Quick Reference Guide
2 pages
Apache Spark - Practices
No ratings yet
Apache Spark - Practices
24 pages
Senior Data Engineer Qs
No ratings yet
Senior Data Engineer Qs
7 pages
Spark Optimisation
No ratings yet
Spark Optimisation
7 pages
Labsession1 SparkRDD
No ratings yet
Labsession1 SparkRDD
2 pages
Pyspark 12 Questions
No ratings yet
Pyspark 12 Questions
8 pages
Python Pyspark Q's
No ratings yet
Python Pyspark Q's
16 pages
Spark Optimization 1741826797
No ratings yet
Spark Optimization 1741826797
7 pages
PDS2MC02 Locf
No ratings yet
PDS2MC02 Locf
2 pages
Python Data Exploratory Commands
No ratings yet
Python Data Exploratory Commands
9 pages
Spark - Out of Memory Exception Handling
No ratings yet
Spark - Out of Memory Exception Handling
3 pages
TCS Rejected Many Due To Weak PySpark Logic!?
No ratings yet
TCS Rejected Many Due To Weak PySpark Logic!?
7 pages
Big Data Analytics in Apache Spark
No ratings yet
Big Data Analytics in Apache Spark
79 pages
Car Analytics Solution
No ratings yet
Car Analytics Solution
4 pages
Comparison of SQL
No ratings yet
Comparison of SQL
11 pages
Databricks Exam
No ratings yet
Databricks Exam
14 pages
Optimizing 1 TB Data in Pyspark
No ratings yet
Optimizing 1 TB Data in Pyspark
4 pages
Etl Commands For Pyspark
No ratings yet
Etl Commands For Pyspark
8 pages
Pyspark
No ratings yet
Pyspark
6 pages
Complete Data Engineer Interview Guide
No ratings yet
Complete Data Engineer Interview Guide
3 pages
Pyspark Coding Questions From StrataScratch Platform
No ratings yet
Pyspark Coding Questions From StrataScratch Platform
23 pages
BDA All 37 Practical Answers
No ratings yet
BDA All 37 Practical Answers
3 pages
Optimizing 1TB Data Handling Using PySpark 3p
No ratings yet
Optimizing 1TB Data Handling Using PySpark 3p
3 pages
Fundamental Pyspark Operations 1708364268
No ratings yet
Fundamental Pyspark Operations 1708364268
10 pages
23CP309T BDA MSE Question Paper
No ratings yet
23CP309T BDA MSE Question Paper
2 pages
Pyspark Questions
No ratings yet
Pyspark Questions
2 pages
PySpark Real Time Q&A
No ratings yet
PySpark Real Time Q&A
5 pages
Final Print Py Spark
No ratings yet
Final Print Py Spark
133 pages
Pyspark Theory Questions
No ratings yet
Pyspark Theory Questions
5 pages
Spark Interview Questions
No ratings yet
Spark Interview Questions
4 pages
PySpark Reference Guide
No ratings yet
PySpark Reference Guide
2 pages
Spark Commands
No ratings yet
Spark Commands
3 pages
PySpark Interview Questions
No ratings yet
PySpark Interview Questions
3 pages
Apache Spark
No ratings yet
Apache Spark
5 pages
Ms. S. A. Kshirsagar: Sycm - Dms
No ratings yet
Ms. S. A. Kshirsagar: Sycm - Dms
35 pages
2018 Winter Model Answer Paper
No ratings yet
2018 Winter Model Answer Paper
20 pages
Spark Test Que
No ratings yet
Spark Test Que
3 pages
Interview Questions
No ratings yet
Interview Questions
2 pages
SQL Performance Explained
No ratings yet
SQL Performance Explained
122 pages
CICS MQ Program - Which Reads From MQ and Updates Db2
100% (1)
CICS MQ Program - Which Reads From MQ and Updates Db2
86 pages
SQL Injection Using Kaali Linux
No ratings yet
SQL Injection Using Kaali Linux
5 pages
Introduction To SQL Light
No ratings yet
Introduction To SQL Light
170 pages
Project 08 Movie and Cinema
No ratings yet
Project 08 Movie and Cinema
3 pages
Oracle Products Purchased 2010-2014
No ratings yet
Oracle Products Purchased 2010-2014
19 pages
Setting Up A Mysql Cluster Step by Step
No ratings yet
Setting Up A Mysql Cluster Step by Step
11 pages
Xii Ip Holidays Homework 2024
No ratings yet
Xii Ip Holidays Homework 2024
11 pages
Ebook PE Query Optimization
No ratings yet
Ebook PE Query Optimization
62 pages
DBMS Unit-2 (I)
No ratings yet
DBMS Unit-2 (I)
35 pages
Manual Mridul
No ratings yet
Manual Mridul
44 pages
DBMS LAB Final
No ratings yet
DBMS LAB Final
40 pages
Structured Query Language
No ratings yet
Structured Query Language
29 pages
Computerproject Class 12
No ratings yet
Computerproject Class 12
17 pages
Day 1 - 12 A C Ls - 8 - Interface Python With SQL 2024 - 2025
No ratings yet
Day 1 - 12 A C Ls - 8 - Interface Python With SQL 2024 - 2025
10 pages
Introduction To Database Systems (CS 4320 at Cornell) : Immanuel Trummer
No ratings yet
Introduction To Database Systems (CS 4320 at Cornell) : Immanuel Trummer
33 pages
Technote #Cm6 Omnitrend: How To Transfer An Omnitrend Database Into Microsoft SQL Format Using Microsoft Access
No ratings yet
Technote #Cm6 Omnitrend: How To Transfer An Omnitrend Database Into Microsoft SQL Format Using Microsoft Access
5 pages
20S15023 FDM Review Questions Exercises PDF
No ratings yet
20S15023 FDM Review Questions Exercises PDF
28 pages
Train Ticket Booking System
No ratings yet
Train Ticket Booking System
53 pages
Topic 05
No ratings yet
Topic 05
21 pages
Mysql Basics and Installation: by Debasis Samanta
No ratings yet
Mysql Basics and Installation: by Debasis Samanta
32 pages
Alfresco With OpenLDAP (Simple Authentication, v3.1.1)
No ratings yet
Alfresco With OpenLDAP (Simple Authentication, v3.1.1)
10 pages
Pert4 - Act1 - Apri Sandricha - 50419955
No ratings yet
Pert4 - Act1 - Apri Sandricha - 50419955
10 pages
Daatabase Assignment
No ratings yet
Daatabase Assignment
4 pages
1.) Autonomy
No ratings yet
1.) Autonomy
1 page
Could Not Connect Unable To Find Driver Net - Sourceforge.jtds - Jdbc.driver
No ratings yet
Could Not Connect Unable To Find Driver Net - Sourceforge.jtds - Jdbc.driver
3 pages
Homework 7 Fa 11
No ratings yet
Homework 7 Fa 11
3 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Some Tutorials in Computer Networking Hacking
From Everand
Some Tutorials in Computer Networking Hacking
Dr. Hidaia Mahmood Alassouli
No ratings yet

Error Log

Uploaded by

Error Log

Uploaded by

org.apache.spark.sql.execution.

OutOfMemorySparkException: Size of broadcasted table

/databricks/spark/python/pyspark/sql/dataframe.py in take(self, num)

Py4JJavaError: An error occurred while calling o690.collectToPython.

You might also like