Starter-Chasedb1-Ca720eec-4 (1) .Ipynb - File

This document describes an automatically generated Jupyter notebook for exploring a dataset. It contains starter code for importing libraries, defining plotting functions, and listing the image files in the dataset directory. The notebook explains there are no CSV files and the plotting functions cannot provide insights for the image file types. It concludes by encouraging the user to fork the notebook to continue their own exploratory analysis.

Uploaded by

Peruru Famida Najumun

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

56 views6 pages

Starter-Chasedb1-Ca720eec-4 (1) .Ipynb - File

Uploaded by

Peruru Famida Najumun

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 6

{

"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Introduction\n",
"Greetings from the Kaggle bot! This is an automatically-generated kernel with
starter code demonstrating how to read in the data and begin exploring. If you're
inspired to dig deeper, click the blue \"Fork Notebook\" button at the top of this
kernel to begin editing."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Exploratory Analysis\n",
"To begin this exploratory analysis, first import libraries and define
functions for plotting the data using `matplotlib`. Depending on the data, not all
plots will be made. (Hey, I'm just a simple kerneling bot, not a Kaggle
Competitions Grandmaster!)"
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {
"_kg_hide-input": false,
"collapsed": false
},
"outputs": [],
"source": [
"from mpl_toolkits.mplot3d import Axes3D\n",
"from sklearn.preprocessing import StandardScaler\n",
"import matplotlib.pyplot as plt # plotting\n",
"import numpy as np # linear algebra\n",
"import os # accessing directory structure\n",
"import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"There is 0 csv file in the current version of the dataset:\n"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {
"_kg_hide-input": false,
"collapsed": false
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"/kaggle/input/Image_08L.jpg\n",
"/kaggle/input/Image_12L.jpg\n",
"/kaggle/input/Image_11R.jpg\n",
"/kaggle/input/Image_09L.jpg\n",
"/kaggle/input/Image_03R.jpg\n",
"/kaggle/input/Image_12L_2ndHO.png\n",
"/kaggle/input/Image_06L_2ndHO.png\n",
"/kaggle/input/Image_02R_2ndHO.png\n",
"/kaggle/input/Image_03R_1stHO.png\n",
"/kaggle/input/Image_06R_2ndHO.png\n",
"/kaggle/input/Image_12R.jpg\n",
"/kaggle/input/Image_01R_1stHO.png\n",
"/kaggle/input/Image_06R.jpg\n",
"/kaggle/input/Image_11L_2ndHO.png\n",
"/kaggle/input/Image_07R_2ndHO.png\n",
"/kaggle/input/Image_02R.jpg\n",
"/kaggle/input/Image_14R.jpg\n",
"/kaggle/input/Image_11L.jpg\n",
"/kaggle/input/Image_07L.jpg\n",
"/kaggle/input/Image_01L_2ndHO.png\n",
"/kaggle/input/Image_11L_1stHO.png\n",
"/kaggle/input/Image_12L_1stHO.png\n",
"/kaggle/input/Image_10R.jpg\n",
"/kaggle/input/Image_06R_1stHO.png\n",
"/kaggle/input/Image_14L_1stHO.png\n",
"/kaggle/input/Image_08R.jpg\n",
"/kaggle/input/Image_11R_2ndHO.png\n",
"/kaggle/input/Image_09L_1stHO.png\n",
"/kaggle/input/Image_01R_2ndHO.png\n",
"/kaggle/input/Image_09L_2ndHO.png\n",
"/kaggle/input/Image_14R_2ndHO.png\n",
"/kaggle/input/Image_11R_1stHO.png\n",
"/kaggle/input/Image_03L.jpg\n",
"/kaggle/input/Image_06L_1stHO.png\n",
"/kaggle/input/Image_09R_1stHO.png\n",
"/kaggle/input/Image_13R_1stHO.png\n",
"/kaggle/input/Image_14L.jpg\n",
"/kaggle/input/Image_01L.jpg\n",
"/kaggle/input/Image_05R_2ndHO.png\n",
"/kaggle/input/Image_13R.jpg\n",
"/kaggle/input/Image_09R.jpg\n",
"/kaggle/input/Image_07L_2ndHO.png\n",
"/kaggle/input/Image_09R_2ndHO.png\n",
"/kaggle/input/Image_01R.jpg\n",
"/kaggle/input/Image_10R_1stHO.png\n",
"/kaggle/input/Image_10L_1stHO.png\n",
"/kaggle/input/Image_04R.jpg\n",
"/kaggle/input/Image_07R.jpg\n",
"/kaggle/input/Image_02R_1stHO.png\n",
"/kaggle/input/Image_13L_1stHO.png\n",
"/kaggle/input/Image_12R_2ndHO.png\n",
"/kaggle/input/Image_08R_1stHO.png\n",
"/kaggle/input/Image_08L_1stHO.png\n",
"/kaggle/input/Image_05L_1stHO.png\n",
"/kaggle/input/Image_13L_2ndHO.png\n",
"/kaggle/input/Image_10L_2ndHO.png\n",
"/kaggle/input/Image_03L_2ndHO.png\n",
"/kaggle/input/Image_07R_1stHO.png\n",
"/kaggle/input/Image_08L_2ndHO.png\n",
"/kaggle/input/Image_02L_2ndHO.png\n",
"/kaggle/input/Image_01L_1stHO.png\n",
"/kaggle/input/Image_03L_1stHO.png\n",
"/kaggle/input/Image_12R_1stHO.png\n",
"/kaggle/input/Image_05L_2ndHO.png\n",
"/kaggle/input/Image_04R_1stHO.png\n",
"/kaggle/input/Image_08R_2ndHO.png\n",
"/kaggle/input/Image_05L.jpg\n",
"/kaggle/input/Image_02L.jpg\n",
"/kaggle/input/Image_04R_2ndHO.png\n",
"/kaggle/input/Image_05R_1stHO.png\n",
"/kaggle/input/Image_13R_2ndHO.png\n",
"/kaggle/input/Image_04L_2ndHO.png\n",
"/kaggle/input/Image_14L_2ndHO.png\n",
"/kaggle/input/Image_02L_1stHO.png\n",
"/kaggle/input/Image_14R_1stHO.png\n",
"/kaggle/input/Image_06L.jpg\n",
"/kaggle/input/Image_13L.jpg\n",
"/kaggle/input/Image_04L_1stHO.png\n",
"/kaggle/input/Image_10R_2ndHO.png\n",
"/kaggle/input/Image_03R_2ndHO.png\n",
"/kaggle/input/Image_10L.jpg\n",
"/kaggle/input/Image_07L_1stHO.png\n",
"/kaggle/input/Image_05R.jpg\n",
"/kaggle/input/Image_04L.jpg\n"
]
}
],
"source": [
"for dirname, _, filenames in os.walk('/kaggle/input'):\n",
" for filename in filenames:\n",
" print(os.path.join(dirname, filename))\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"The next hidden code cells define functions for plotting data. Click on
the \"Code\" button in the published kernel to reveal the hidden code."
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {
"_kg_hide-input": true,
"collapsed": true
},
"outputs": [],
"source": [
"# Distribution graphs (histogram/bar graph) of column data\n",
"def plotPerColumnDistribution(df, nGraphShown, nGraphPerRow):\n",
" nunique = df.nunique()\n",
" df = df[[col for col in df if nunique[col] > 1 and nunique[col] < 50]] #
For displaying purposes, pick columns that have between 1 and 50 unique values\n",
" nRow, nCol = df.shape\n",
" columnNames = list(df)\n",
" nGraphRow = (nCol + nGraphPerRow - 1) / nGraphPerRow\n",
" plt.figure(num = None, figsize = (6 * nGraphPerRow, 8 * nGraphRow), dpi =
80, facecolor = 'w', edgecolor = 'k')\n",
" for i in range(min(nCol, nGraphShown)):\n",
" plt.subplot(nGraphRow, nGraphPerRow, i + 1)\n",
" columnDf = df.iloc[:, i]\n",
" if (not np.issubdtype(type(columnDf.iloc[0]), np.number)):\n",
" valueCounts = columnDf.value_counts()\n",
" valueCounts.plot.bar()\n",
" else:\n",
" columnDf.hist()\n",
" plt.ylabel('counts')\n",
" plt.xticks(rotation = 90)\n",
" plt.title(f'{columnNames[i]} (column {i})')\n",
" plt.tight_layout(pad = 1.0, w_pad = 1.0, h_pad = 1.0)\n",
" plt.show()\n"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {
"_kg_hide-input": true,
"collapsed": true
},
"outputs": [],
"source": [
"# Correlation matrix\n",
"def plotCorrelationMatrix(df, graphWidth):\n",
" filename = df.dataframeName\n",
" df = df.dropna('columns') # drop columns with NaN\n",
" df = df[[col for col in df if df[col].nunique() > 1]] # keep columns where
there are more than 1 unique values\n",
" if df.shape[1] < 2:\n",
" print(f'No correlation plots shown: The number of non-NaN or constant
columns ({df.shape[1]}) is less than 2')\n",
" return\n",
" corr = df.corr()\n",
" plt.figure(num=None, figsize=(graphWidth, graphWidth), dpi=80,
facecolor='w', edgecolor='k')\n",
" corrMat = plt.matshow(corr, fignum = 1)\n",
" plt.xticks(range(len(corr.columns)), corr.columns, rotation=90)\n",
" plt.yticks(range(len(corr.columns)), corr.columns)\n",
" plt.gca().xaxis.tick_bottom()\n",
" plt.colorbar(corrMat)\n",
" plt.title(f'Correlation Matrix for {filename}', fontsize=15)\n",
" plt.show()\n"
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {
"_kg_hide-input": true,
"collapsed": true
},
"outputs": [],
"source": [
"# Scatter and density plots\n",
"def plotScatterMatrix(df, plotSize, textSize):\n",
" df = df.select_dtypes(include =[np.number]) # keep only numerical columns\
n",
" # Remove rows and columns that would lead to df being singular\n",
" df = df.dropna('columns')\n",
" df = df[[col for col in df if df[col].nunique() > 1]] # keep columns where
there are more than 1 unique values\n",
" columnNames = list(df)\n",
" if len(columnNames) > 10: # reduce the number of columns for matrix
inversion of kernel density plots\n",
" columnNames = columnNames[:10]\n",
" df = df[columnNames]\n",
" ax = pd.plotting.scatter_matrix(df, alpha=0.75, figsize=[plotSize,
plotSize], diagonal='kde')\n",
" corrs = df.corr().values\n",
" for i, j in zip(*plt.np.triu_indices_from(ax, k = 1)):\n",
" ax[i, j].annotate('Corr. coef = %.3f' % corrs[i, j], (0.8, 0.2),
xycoords='axes fraction', ha='center', va='center', size=textSize)\n",
" plt.suptitle('Scatter and Density Plot')\n",
" plt.show()\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Oh, no! There are no automatic insights available for the file types used in
this dataset. As your Kaggle kerneler bot, I'll keep working to fine-tune my hyper-
parameters. In the meantime, please feel free to try a different dataset."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Conclusion\n",
"This concludes your starter analysis! To go forward from here, click the
blue \"Fork Notebook\" button at the top of this kernel. This will create a copy of
the code and environment for you to edit. Delete, modify, and add code as you
please. Happy Kaggling!"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.6"
}
},
"nbformat": 4,
"nbformat_minor": 0
}

Apurba Learning 1
No ratings yet
Apurba Learning 1
17 pages
EDA Assignment Day 14.ipynb
No ratings yet
EDA Assignment Day 14.ipynb
19 pages
Image Processing - Ipynb
No ratings yet
Image Processing - Ipynb
175 pages
Inbuilt Kmeans
No ratings yet
Inbuilt Kmeans
3 pages
List of Practical File Questions-1
No ratings yet
List of Practical File Questions-1
2 pages
Seaborn Ipynb
No ratings yet
Seaborn Ipynb
514 pages
Potato
No ratings yet
Potato
16 pages
ASme Design Guide Weathering Steel Bridges
No ratings yet
ASme Design Guide Weathering Steel Bridges
86 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
18 pages
Vaishnav Alone CV - 2025-01-09-061931
No ratings yet
Vaishnav Alone CV - 2025-01-09-061931
2 pages
Wa0027.
No ratings yet
Wa0027.
34 pages
Pathophysiology of Type 1 Diabetes Mellitus
No ratings yet
Pathophysiology of Type 1 Diabetes Mellitus
2 pages
Stats Practicals - Ipynb
No ratings yet
Stats Practicals - Ipynb
9 pages
ISEA Grease Interceptor Solutions - 2023-Digital
No ratings yet
ISEA Grease Interceptor Solutions - 2023-Digital
36 pages
Data Warehousing and Data Mining
No ratings yet
Data Warehousing and Data Mining
24 pages
ResnetSGD Ipynb
No ratings yet
ResnetSGD Ipynb
190 pages
PPOResNet Ipynb
No ratings yet
PPOResNet Ipynb
163 pages
100 Numpy Exercises - Ipynb
No ratings yet
100 Numpy Exercises - Ipynb
30 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
Face Recognition Using Pca - Ipynb
No ratings yet
Face Recognition Using Pca - Ipynb
843 pages
Final Question1 With Results
No ratings yet
Final Question1 With Results
21 pages
Aadarsh
No ratings yet
Aadarsh
26 pages
Smart Factory Energy Prediction - Ipynb
No ratings yet
Smart Factory Energy Prediction - Ipynb
355 pages
Alzheimer Disease Detection Using ANN
No ratings yet
Alzheimer Disease Detection Using ANN
14 pages
Finalised Question 1
No ratings yet
Finalised Question 1
40 pages
Engine Speed Circuit Fault
No ratings yet
Engine Speed Circuit Fault
7 pages
Malicious Coding
No ratings yet
Malicious Coding
4 pages
ML Lab File Batch 1
No ratings yet
ML Lab File Batch 1
20 pages
Pandas
No ratings yet
Pandas
91 pages
ML Lab Manual
No ratings yet
ML Lab Manual
24 pages
Autism Withfaces
No ratings yet
Autism Withfaces
7 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
Notebook-Disease Prediction Using Machine Learning
No ratings yet
Notebook-Disease Prediction Using Machine Learning
141 pages
Coding Tugas Besar Analitika Data
No ratings yet
Coding Tugas Besar Analitika Data
7 pages
Practica de NumPy - Ipynb
No ratings yet
Practica de NumPy - Ipynb
19 pages
Pandas para Analisis de Datos
No ratings yet
Pandas para Analisis de Datos
10 pages
Shiva Teja
No ratings yet
Shiva Teja
19 pages
10 Neural Nets With Keras - Ipynb
No ratings yet
10 Neural Nets With Keras - Ipynb
159 pages
CNN - Hand Gesture Recognition
No ratings yet
CNN - Hand Gesture Recognition
13 pages
Skin Cancer Detection Using Deep Learning Models - Ipynb
No ratings yet
Skin Cancer Detection Using Deep Learning Models - Ipynb
189 pages
Transfer Learning Q3 2
No ratings yet
Transfer Learning Q3 2
36 pages
BPH803E3 Cosmetic Science
No ratings yet
BPH803E3 Cosmetic Science
2 pages
Weather Forecasting
No ratings yet
Weather Forecasting
5 pages
Code MLT
No ratings yet
Code MLT
9 pages
Speech Emotion Recognition - Sound Classification - Ipynb
No ratings yet
Speech Emotion Recognition - Sound Classification - Ipynb
474 pages
2018 M Crabbe Mann - Ethyl Cellulose Cellulose Acetate and Carboxymethy (Retrieved - 2023!04!10)
No ratings yet
2018 M Crabbe Mann - Ethyl Cellulose Cellulose Acetate and Carboxymethy (Retrieved - 2023!04!10)
17 pages
Housing Project Using Tensor Flow Python Code
No ratings yet
Housing Project Using Tensor Flow Python Code
13 pages
Oratile Pega Performance Practice Reflective Essay
No ratings yet
Oratile Pega Performance Practice Reflective Essay
6 pages
Mod Menu Log - Com - Carxtech.sr
No ratings yet
Mod Menu Log - Com - Carxtech.sr
27 pages
Bilal Ahmad Ai & DSS Assign # 03
No ratings yet
Bilal Ahmad Ai & DSS Assign # 03
7 pages
Mark 7 Arterion Injection System Brochure (PP-M-MARK-US-0076-1) - 0
No ratings yet
Mark 7 Arterion Injection System Brochure (PP-M-MARK-US-0076-1) - 0
9 pages
ML Lab Manual
No ratings yet
ML Lab Manual
90 pages
Satellite Imagery DeepLearning-Base - Ipynb
No ratings yet
Satellite Imagery DeepLearning-Base - Ipynb
297 pages
23ES1111 - Problem Solving Using C Programming Lab
No ratings yet
23ES1111 - Problem Solving Using C Programming Lab
3 pages
Pattern Recognition Lab
No ratings yet
Pattern Recognition Lab
24 pages
Credit Card Fraud Detection V29.Ipynb
No ratings yet
Credit Card Fraud Detection V29.Ipynb
976 pages
Machine Learning Through Python Lab Mannual
No ratings yet
Machine Learning Through Python Lab Mannual
33 pages
DS Unit 6
No ratings yet
DS Unit 6
16 pages
Kyocera Ecosys P2135DN en SM R2 PDF
No ratings yet
Kyocera Ecosys P2135DN en SM R2 PDF
126 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
Machine Learning LAB MANUAL
No ratings yet
Machine Learning LAB MANUAL
23 pages
Python Course Cheat Sheet
No ratings yet
Python Course Cheat Sheet
30 pages
Practical On Numpy - Ipynb
No ratings yet
Practical On Numpy - Ipynb
441 pages
SSPC Pa2
100% (3)
SSPC Pa2
11 pages
C7025 (英文) ver1 6
No ratings yet
C7025 (英文) ver1 6
11 pages
Kmeans
No ratings yet
Kmeans
31 pages
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
No ratings yet
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
28 pages
Section 7
No ratings yet
Section 7
33 pages
Despiece Motor XR 200
No ratings yet
Despiece Motor XR 200
45 pages
Science Grade Vi Third Summative Test
No ratings yet
Science Grade Vi Third Summative Test
4 pages
MIS Concept: - : Information System
No ratings yet
MIS Concept: - : Information System
6 pages
BHSPCL Project
No ratings yet
BHSPCL Project
88 pages
Areva Japan Accident 20110324
No ratings yet
Areva Japan Accident 20110324
33 pages
22
No ratings yet
22
7 pages
Data Visualization Code
No ratings yet
Data Visualization Code
123 pages
1SCA104913R1001 Ot40f3c Change Over Switch
No ratings yet
1SCA104913R1001 Ot40f3c Change Over Switch
3 pages
Ecological Inventory
No ratings yet
Ecological Inventory
8 pages
Engineering Physics PHY-109 Waves-1: Quantum Mechanics
No ratings yet
Engineering Physics PHY-109 Waves-1: Quantum Mechanics
16 pages
Question Paper-1 - FEA Model Exam
No ratings yet
Question Paper-1 - FEA Model Exam
2 pages
Bearings Simply Supported Shaft
No ratings yet
Bearings Simply Supported Shaft
8 pages
Rife Instrument History
No ratings yet
Rife Instrument History
224 pages
Def Load - Data (Data - Directory)
No ratings yet
Def Load - Data (Data - Directory)
3 pages
Chapter 3.
No ratings yet
Chapter 3.
15 pages
Song BK 112018
No ratings yet
Song BK 112018
61 pages
Tk01 Revised Assignment3
No ratings yet
Tk01 Revised Assignment3
131 pages
1 Notmnist - Ipynb
No ratings yet
1 Notmnist - Ipynb
15 pages
General Rules: Competition Categories
No ratings yet
General Rules: Competition Categories
11 pages
Ariba Procure To Pay
0% (1)
Ariba Procure To Pay
2 pages
15CSL76 Students
No ratings yet
15CSL76 Students
18 pages

Starter-Chasedb1-Ca720eec-4 (1) .Ipynb - File

Uploaded by

Starter-Chasedb1-Ca720eec-4 (1) .Ipynb - File

Uploaded by

{

You might also like