0% menganggap dokumen ini bermanfaat (0 suara)

39 tayangan9 halaman

Untitled 4

1. Analisis univariate menunjukkan distribusi usia dan jam kerja per minggu serta rata-rata usia tertinggi untuk kelompok pendapatan 30-40 tahun. 2. Analisis bivariate menunjukkan rerata usia kelompok pendapatan <=US$50K lebih rendah dibanding >US$50K dan uji t menolak hipotesis nol. 3. Kesimpulannya, usia berperan dalam membedakan kelompok pendapatan.

Diunggah oleh

2PA25Aprillia Ayu Marshanda

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

39 tayangan9 halaman

Untitled 4

Diunggah oleh

2PA25Aprillia Ayu Marshanda

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

Anda di halaman 1/ 9

import packages

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
import warnings
warnings.filterwarnings("ignore")
from scipy.stats import ttest_ind, ttest_rel
from scipy import stats

import data
data = pd.read_csv("https://gitlab.com/andreass.bayu/file-
directory/-/raw/main/adult.csv")
data.head(10)

age workclass fnlwgt education educational-num \

0 25 Private 226802 11th 7
1 38 Private 89814 HS-grad 9
2 28 Local-gov 336951 Assoc-acdm 12
3 44 Private 160323 Some-college 10
4 18 ? 103497 Some-college 10
5 34 Private 198693 10th 6
6 29 ? 227026 HS-grad 9
7 63 Self-emp-not-inc 104626 Prof-school 15
8 24 Private 369667 Some-college 10
9 55 Private 104996 7th-8th 4

marital-status occupation relationship race gender

\
0 Never-married Machine-op-inspct Own-child Black Male

1 Married-civ-spouse Farming-fishing Husband White Male

2 Married-civ-spouse Protective-serv Husband White Male

3 Married-civ-spouse Machine-op-inspct Husband Black Male

4 Never-married ? Own-child White Female

5 Never-married Other-service Not-in-family White Male

6 Never-married ? Unmarried Black Male

7 Married-civ-spouse Prof-specialty Husband White Male

8 Never-married Other-service Unmarried White Female

9 Married-civ-spouse Craft-repair Husband White Male

capital-gain capital-loss hours-per-week native-country income

0 0 0 40 United-States <=50K
1 0 0 50 United-States <=50K
2 0 0 40 United-States >50K
3 7688 0 40 United-States >50K
4 0 0 30 United-States <=50K
5 0 0 30 United-States <=50K
6 0 0 40 United-States <=50K
7 3103 0 32 United-States >50K
8 0 0 40 United-States <=50K
9 0 0 10 United-States <=50K

Age
i. distribusi
data['age'].hist(figsize=(8,8))
plt.show()
ii. deskripsi
data[data["age"]>70].shape

(868, 15)

Income
i. distribusi
plt.figure(figsize=(7,7))
total = float(len(data) )

ax = sns.countplot(x="income", data=data)
for p in ax.patches:
height = p.get_height()
ax.text(p.get_x()+p.get_width()/2.,
height + 3,
'{:1.2f}'.format((height/total)*100),
ha="center")
plt.show()

ii. deskripsi Distribusi di atas menjelaskan bahwa :

Dataset ini tidak seimbang, yaitu 23,93% di antaranya termasuk dalam kelompok
pendapatan 1 (yang berpenghasilan lebih dari $50K) dan 76% termasuk dalam kelompok
pendapatan 0 (yang berpenghasilan kurang dari $50K).
Age - Income
i. Boxplot
fig = plt.figure(figsize=(10,10))
sns.boxplot(x="income", y="age", data=data)
plt.show()
data[['income', 'age']].groupby(['income'],
as_index=False).mean().sort_values(by='age', ascending=False)

income age
1 >50K 44.275178
0 <=50K 36.872184

ii. Deskripsi Bivariate boxplot di atas menjelaskan bahwa :

Rata-rata "usia" untuk kelompok Penghasilan (<= $50K) adalah 36,8 tahun. Dan untuk
kelompok Penghasilan (> $50K) adalah 44,2 tahun Kelompok pendapatan(<=50K)
memiliki median "usia"(34 tahun) lebih rendah daripada kelompok Pendapatan(>50K)
yang memiliki median "usia"(42 tahun).
iii. uji hipotesis
import random
data = data[(np.abs(stats.zscore(data["age"])) < 3)]

income_1 = data[data['income']=='<=50K']['age']
income_0 = data[data['income']=='>50K']['age']

income_0 = income_0.values.tolist()
income_0 = random.sample(income_0, 100)
income_1 = income_1.values.tolist()
income_1 = random.sample(income_1, 100)

from scipy.stats import ttest_ind

ttest,pval = ttest_ind(income_1,income_0,equal_var = False)
print("ttest",ttest)
print('p value',pval)

if pval <0.05:
print("null hypothesis ditolak")
else:
print("null hypothesis diterima")

ttest -3.690070133020414
p value 0.00029878818647073786
null hypothesis ditolak

iv. Kesimpulan akhir Menggunakan analisis statistik,

Dapat disimpulkan bahwa terdapat perbedaan yang signifikan pada rerata usia kelompok
berpenghasilan >50K dan kelompok berpenghasilan <=50K. Hal Ini membuktikan bahwa
usia memiliki peranan dalam membedakan kelompok pendapatan.
1. Univariate analysis
i. Distribusi
data['hours-per-week'].hist(figsize=(8,8))
plt.show()
ii. deskripsi
# Untuk usia 30-40 tahun mendapatkan upah paling tertinggi yaitu
>25.000

Income
i. Distribusi
plt.figure(figsize=(7,7))
total = float(len(data) )

ax = sns.countplot(x="income", data=data)
for p in ax.patches:
height = p.get_height()
ax.text(p.get_x()+p.get_width()/2.,
height + 3,
'{:1.2f}'.format((height/total)*100),
ha="center")
plt.show()

ii. deskripsi
# Berdasarkan diagram diatas tidak seimbang, sekitar 23,96% masuk ke
dalam kelompok pendapatan lebih dari 50.000 dolar dan sekitar 76%
masuk ke dalam kelompok pendapatan kurang ari 50.000 dolar.

Bivariate analysis
fig = plt.figure(figsize=(10,10))
sns.boxplot(x="income", y="hours-per-week", data=data)
plt.show()
ii. deskripsi
# Rata - rata usia untuk kelompok kurang dari 50.000 dolar adalah 36,8
tahun dengan median 34 dan untuk kelompok diatas 50.000 dolar adalah
44,2 tahun dengan median 42.

iii. Uji Hipotesis

# Alternate Hypothesis :- ada perbedaan Rerata kelompok pendapatan
>50k dan kelompok pendapatan <=50k.

iv. Kesimpulan akhir

# Kesimpulannya, usia membuktikan adanya perbedaan dalam pendapatan.

Anda mungkin juga menyukai

Penduduk Kabupaten Majalengka Berumur 15 Tahun Ke Atas Yang Bekerja Selama Seminggu Yang Lalu Menurut Jenis Pekerjaan Utama Dan Pendidikan
Belum ada peringkat
Penduduk Kabupaten Majalengka Berumur 15 Tahun Ke Atas Yang Bekerja Selama Seminggu Yang Lalu Menurut Jenis Pekerjaan Utama Dan Pendidikan
242 halaman
Obsessive Compulsive Disorder
100% (1)
Obsessive Compulsive Disorder
1 halaman
2PA25 - Kelompok 2 - Field Setting
Belum ada peringkat
2PA25 - Kelompok 2 - Field Setting
10 halaman
Laporan Preview 1A Karakteristik Demografi
Belum ada peringkat
Laporan Preview 1A Karakteristik Demografi
24 halaman
Tugas Praktikum I Biostatistik
Belum ada peringkat
Tugas Praktikum I Biostatistik
27 halaman
Jumlah Penduduk Menurut Kelompok Usia Dan Jenis Kelamin Tangerang Sel
Belum ada peringkat
Jumlah Penduduk Menurut Kelompok Usia Dan Jenis Kelamin Tangerang Sel
3 halaman
Statistik Migrasi Jawa Tengah Hasil SP 2010
Belum ada peringkat
Statistik Migrasi Jawa Tengah Hasil SP 2010
108 halaman
Modul Stata (LPM, Logit, Probit) - Joan-1
Belum ada peringkat
Modul Stata (LPM, Logit, Probit) - Joan-1
13 halaman
SCCRC 08
Belum ada peringkat
SCCRC 08
30 halaman
Logo Uir Pembatas
100% (1)
Logo Uir Pembatas
2 halaman
Bapak Prastowo, M.Ec - Dev. (Workshop Analisis Kualitatif)
Belum ada peringkat
Bapak Prastowo, M.Ec - Dev. (Workshop Analisis Kualitatif)
50 halaman
Statistika 02
Belum ada peringkat
Statistika 02
41 halaman
Paradigma
Belum ada peringkat
Paradigma
37 halaman
Rivani Jahyanti - Laporan 6 Dan 7 APG
Belum ada peringkat
Rivani Jahyanti - Laporan 6 Dan 7 APG
14 halaman
J1a119209 - Widiarni - Tugas 1 Praktikum Biostatistik
Belum ada peringkat
J1a119209 - Widiarni - Tugas 1 Praktikum Biostatistik
39 halaman
Tugas Vilka Metode Statistika 2
Belum ada peringkat
Tugas Vilka Metode Statistika 2
8 halaman
Tabulasi Komunitas Toronipa
Belum ada peringkat
Tabulasi Komunitas Toronipa
14 halaman
Decision Tree - Kelompok 1
Belum ada peringkat
Decision Tree - Kelompok 1
18 halaman
Deskio Muhammad Fadil
Belum ada peringkat
Deskio Muhammad Fadil
10 halaman
Dasar Kependudukan (Minggu Ke 2)
Belum ada peringkat
Dasar Kependudukan (Minggu Ke 2)
33 halaman
Team Teaching Komputasi BIG DATA M1
100% (1)
Team Teaching Komputasi BIG DATA M1
11 halaman
Part 2 Demografi
Belum ada peringkat
Part 2 Demografi
32 halaman
Data Wrangling Python
Belum ada peringkat
Data Wrangling Python
20 halaman
Membaca File Dengan Menggunakan Pandas
Belum ada peringkat
Membaca File Dengan Menggunakan Pandas
16 halaman
Tugas 1 Nidaan Hafiyya 1700825
Belum ada peringkat
Tugas 1 Nidaan Hafiyya 1700825
26 halaman
Kelompok 3 - Bipolar - Kukira Kau Rumah
Belum ada peringkat
Kelompok 3 - Bipolar - Kukira Kau Rumah
12 halaman
Evaluasi Dampak
Belum ada peringkat
Evaluasi Dampak
14 halaman
Proyeksi Penduduk
Belum ada peringkat
Proyeksi Penduduk
26 halaman
Data Wrangling
Belum ada peringkat
Data Wrangling
21 halaman
1 SM PDF
Belum ada peringkat
1 SM PDF
12 halaman
Tugas Uas Statistik
Belum ada peringkat
Tugas Uas Statistik
5 halaman
Pertemuan M8
Belum ada peringkat
Pertemuan M8
9 halaman
Ta Kependudukan
Belum ada peringkat
Ta Kependudukan
22 halaman
Shindi Shella - Klasifikasi Data Adult Income Di Amerika Serikat PDF
Belum ada peringkat
Shindi Shella - Klasifikasi Data Adult Income Di Amerika Serikat PDF
8 halaman
Demografi
Belum ada peringkat
Demografi
6 halaman
TUGAS-2 - Zaky Abyan Hidhayat - 22-505044-SV-21757
Belum ada peringkat
TUGAS-2 - Zaky Abyan Hidhayat - 22-505044-SV-21757
7 halaman
Pengelompokan KabupatenKota Di Pulau Kalimantan Dengan Fuzzy C-Means Berdasarkan Indikator Kemiskinan
Belum ada peringkat
Pengelompokan KabupatenKota Di Pulau Kalimantan Dengan Fuzzy C-Means Berdasarkan Indikator Kemiskinan
8 halaman
Lampiran (Sukma Taroniarta)
Belum ada peringkat
Lampiran (Sukma Taroniarta)
8 halaman
Bab I
Belum ada peringkat
Bab I
7 halaman
01 - Abyan Maulvi S.A - Exercise Graph
Belum ada peringkat
01 - Abyan Maulvi S.A - Exercise Graph
7 halaman
Dikha Rizki S - 20422424 - 2IC03
Belum ada peringkat
Dikha Rizki S - 20422424 - 2IC03
6 halaman
Rifqi Shafiyuddin 21422446 2IC01
Belum ada peringkat
Rifqi Shafiyuddin 21422446 2IC01
6 halaman
Dikha Rizki S - 20422424 - 2IC03
Belum ada peringkat
Dikha Rizki S - 20422424 - 2IC03
6 halaman
LAMPIRAN
Belum ada peringkat
LAMPIRAN
10 halaman
Revisi: Jadwal Pelajaran SMP Al Kamal Jakarta TAHUN PELAJARAN 2023/2024
Belum ada peringkat
Revisi: Jadwal Pelajaran SMP Al Kamal Jakarta TAHUN PELAJARAN 2023/2024
5 halaman
Tugas INDIVIDU 3
Belum ada peringkat
Tugas INDIVIDU 3
5 halaman
Kel 3 Konsep Dasar Demografi Perencanaan Kesehatan
Belum ada peringkat
Kel 3 Konsep Dasar Demografi Perencanaan Kesehatan
26 halaman
Analisis Kependudukan
Belum ada peringkat
Analisis Kependudukan
7 halaman
Definisi Kependudukan
Belum ada peringkat
Definisi Kependudukan
2 halaman
Kasus Penelitian
Belum ada peringkat
Kasus Penelitian
4 halaman
Lembar Kerja Peserta Didik 2
Belum ada peringkat
Lembar Kerja Peserta Didik 2
11 halaman
Kependudukan Migrasi Risen
Belum ada peringkat
Kependudukan Migrasi Risen
5 halaman
Riandhika Vianto (17818821 - 4MA88) - Weeks 5
Belum ada peringkat
Riandhika Vianto (17818821 - 4MA88) - Weeks 5
6 halaman
Contoh Tabulasi Data Primer
Belum ada peringkat
Contoh Tabulasi Data Primer
6 halaman
Task 4
Belum ada peringkat
Task 4
3 halaman
Uts 2020
Belum ada peringkat
Uts 2020
5 halaman
Aprillia Ayu Marshanda
Belum ada peringkat
Aprillia Ayu Marshanda
2 halaman
Trophy Cetak
Belum ada peringkat
Trophy Cetak
2 halaman
Sarah Maulida Rahmah
Belum ada peringkat
Sarah Maulida Rahmah
5 halaman
Tugas Besar ML
Belum ada peringkat
Tugas Besar ML
4 halaman
Kartun
Belum ada peringkat
Kartun
2 halaman
Keadaan Angkatan Kerja Di Indonesia Februari 2021-288-289
Belum ada peringkat
Keadaan Angkatan Kerja Di Indonesia Februari 2021-288-289
2 halaman