0% found this document useful (0 votes)

4 views

project code

The document outlines a Python script for predicting computer virus presence using machine learning techniques. It involves data preprocessing, model training with a Random Forest Classifier, and generating predictions on a test dataset. The script also includes data visualization and evaluation metrics for model performance.

Uploaded by

sirajknl

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views

project code

Uploaded by

sirajknl

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

# This Python 3 environment comes with many helpful analytics libraries installed

# It is defined by the kaggle/python Docker image:

https://github.com/kaggle/docker-python
# For example, here's several helpful packages to load

import numpy as np # linear algebra

import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

# Input data files are available in the read-only "../input/" directory

# For example, running this (by clicking run or pressing Shift+Enter) will list all
files under the input directory

import os
for dirname, _, filenames in os.walk('/kaggle/input'):
for filename in filenames:
print(os.path.join(dirname, filename))

# You can write up to 20GB to the current directory (/kaggle/working/) that gets
preserved as output when you create a version using "Save & Run All"
# You can also write temporary files to /kaggle/temp/, but they won't be saved
outside of the current session

/kaggle/input/computer-virus-predictor/sample_submission.csv
/kaggle/input/computer-virus-predictor/train.csv
/kaggle/input/computer-virus-predictor/test.csv

train_df = pd.read_csv('/kaggle/input/computer-virus-predictor/train.csv')
train_1_df = train_df.drop(columns = ['MachineID','ProductName','EngineVersion',
'AppVersion','SignatureVersion', 'IsBetaUser', 'PlatformType','Processor',
'OSVersion','OsPlatformSubRelease','OSBuildLab',
'SKUEditionName','MDC2FormFactor','DeviceFamily','PrimaryDiskType','ChassisType','P
owerPlatformRole','NumericOSVersion','OSArchitecture','OSBranch','OSEdition','OSSku
FriendlyName','OSInstallType','AutoUpdateOptionsName','OSGenuineState','LicenseActi
vationChannel','FlightRing','DateAS','DateOS'])
train_1_df["id"] = train_1_df.index
train_1_df.head()
train_1_df.tail()

train_1_df.dtypes

import matplotlib.pyplot as plt

import seaborn as sns
sns.heatmap(train_1_df.corr(numeric_only=True))

from sklearn.linear_model import LogisticRegression

from sklearn.model_selection import train_test_split

train_1_df = train_1_df[train_1_df['RealTimeProtectionState'].notna()]
train_1_df = train_1_df[train_1_df['AntivirusConfigID'].notna()]
train_1_df = train_1_df[train_1_df['CityID'].notna()]
train_1_df = train_1_df[train_1_df['SMode'].notna()]
train_1_df = train_1_df[train_1_df['IEVersionID'].notna()]
train_1_df = train_1_df[train_1_df['ProcessorCoreCount'].notna()]
train_1_df = train_1_df[train_1_df['PrimaryDisplayDiagonalInches'].notna()]

train_1_df = train_1_df[train_1_df['FirewallEnabled'].notna()]
train_1_df = train_1_df[train_1_df['TotalPhysicalRAMMB'].notna()]
train_1_df = train_1_df[train_1_df['EnableLUA'].notna()]
train_1_df = train_1_df[train_1_df['OEMModelID'].notna()]
train_1_df = train_1_df[train_1_df['InternalBatteryNumberOfCharges'].notna()]
train_1_df = train_1_df[train_1_df['IsGamer'].notna()]
train_1_df = train_1_df[train_1_df['OSInstallLanguageID'].notna()]
train_1_df = train_1_df[train_1_df['IsFlightsDisabled'].notna()]
train_1_df = train_1_df[train_1_df['FirmwareManufacturerID'].notna()]
train_1_df = train_1_df[train_1_df['IsVirtualDevice'].notna()]

X_train = train_1_df.drop(columns = ['target'])

Y_train = train_1_df['target']
x_train, x_test, y_train, y_test = train_test_split(X_train, Y_train,
test_size=0.3)
train_1_df.isna().sum()

#Create the model

from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier()
model.fit(X_train, Y_train)
prediction = model.predict(x_test)

from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

print(classification_report(y_test,prediction))
print(confusion_matrix(y_test,prediction))

test_df = pd.read_csv('/kaggle/input/computer-virus-predictor/test.csv')
x_test = test_df.drop(columns = ['MachineID','ProductName','EngineVersion',
'AppVersion','SignatureVersion', 'IsBetaUser', 'PlatformType','Processor',
'OSVersion','OsPlatformSubRelease','OSBuildLab',
'SKUEditionName','MDC2FormFactor','DeviceFamily','PrimaryDiskType','ChassisType','P
owerPlatformRole','NumericOSVersion','OSArchitecture','OSBranch','OSEdition','OSSku
FriendlyName','OSInstallType','AutoUpdateOptionsName','OSGenuineState','LicenseActi
vationChannel','FlightRing','DateAS','DateOS'])
x_test["id"] = x_test.index
x_test = x_test[x_test['RealTimeProtectionState'].notna()]
x_test = x_test[x_test['AntivirusConfigID'].notna()]
x_test = x_test[x_test['CityID'].notna()]
x_test = x_test[x_test['SMode'].notna()]
x_test = x_test[x_test['IEVersionID'].notna()]
x_test = x_test[x_test['ProcessorCoreCount'].notna()]
x_test = x_test[x_test['PrimaryDisplayDiagonalInches'].notna()]
x_test = x_test[x_test['FirewallEnabled'].notna()]
x_test = x_test[x_test['TotalPhysicalRAMMB'].notna()]
x_test = x_test[x_test['EnableLUA'].notna()]
x_test = x_test[x_test['OEMModelID'].notna()]
x_test = x_test[x_test['InternalBatteryNumberOfCharges'].notna()]
x_test = x_test[x_test['IsGamer'].notna()]
x_test = x_test[x_test['OSInstallLanguageID'].notna()]
x_test = x_test[x_test['IsFlightsDisabled'].notna()]
x_test = x_test[x_test['FirmwareManufacturerID'].notna()]
x_test = x_test[x_test['IsVirtualDevice'].notna()]

prediction = model.predict(x_test)

final_prediction = pd.DataFrame({'id': x_test.id, 'target': prediction})

final_prediction.to_csv('submission.csv', index=False)

House Price Prediction: Project Description
No ratings yet
House Price Prediction: Project Description
11 pages
Pattern Recognition Lab
No ratings yet
Pattern Recognition Lab
24 pages
7 Data Science / Machine Learning Cheat Sheets in One
100% (1)
7 Data Science / Machine Learning Cheat Sheets in One
9 pages
analysis-on-weight-capacity
No ratings yet
analysis-on-weight-capacity
4 pages
Data Science Libraries
No ratings yet
Data Science Libraries
4 pages
Heart Disease Prediction - Colab
No ratings yet
Heart Disease Prediction - Colab
18 pages
Untitled Document
No ratings yet
Untitled Document
19 pages
Project Kaggle Intro
No ratings yet
Project Kaggle Intro
1 page
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
ML Final Prac
No ratings yet
ML Final Prac
47 pages
Notebook40476b8e91 Ipynb
No ratings yet
Notebook40476b8e91 Ipynb
1 page
To Study About Numpy, Pandas and Matplotlib Libraries in Python
No ratings yet
To Study About Numpy, Pandas and Matplotlib Libraries in Python
21 pages
Final ML File
No ratings yet
Final ML File
34 pages
Bda Prac 1_merged
No ratings yet
Bda Prac 1_merged
28 pages
Weather Forecasting
No ratings yet
Weather Forecasting
5 pages
Machine Learning Lab Dlihebca6sem
100% (1)
Machine Learning Lab Dlihebca6sem
25 pages
linear
No ratings yet
linear
2 pages
Practical Labs Guide
No ratings yet
Practical Labs Guide
34 pages
Da Program
No ratings yet
Da Program
18 pages
External
No ratings yet
External
11 pages
Exercise5 Solution
No ratings yet
Exercise5 Solution
22 pages
Approachin190808095205 PDF
No ratings yet
Approachin190808095205 PDF
112 pages
Mastering Go A Practical Guide to Developers: A Practical Guide to Developers
From Everand
Mastering Go A Practical Guide to Developers: A Practical Guide to Developers
Miguel Miranda de Mattos
No ratings yet
Tushar ML
No ratings yet
Tushar ML
52 pages
Data Science Machine Leraning222
No ratings yet
Data Science Machine Leraning222
11 pages
Lab08 ML
No ratings yet
Lab08 ML
6 pages
ML MANUAL
No ratings yet
ML MANUAL
21 pages
Train
No ratings yet
Train
17 pages
Question- 2-Interview Question ML
No ratings yet
Question- 2-Interview Question ML
13 pages
4. Data Analytics I
No ratings yet
4. Data Analytics I
4 pages
Coe Projects
No ratings yet
Coe Projects
7 pages
CTRL
No ratings yet
CTRL
5 pages
P 4 Andp 5
No ratings yet
P 4 Andp 5
4 pages
ML Practical 205160694034
No ratings yet
ML Practical 205160694034
33 pages
pyspark-nlp-from-scratch
No ratings yet
pyspark-nlp-from-scratch
3 pages
ISAA Lab DA 5 KRISH
No ratings yet
ISAA Lab DA 5 KRISH
11 pages
houses prices prediction model
No ratings yet
houses prices prediction model
11 pages
Deepak Data Analysis 1
No ratings yet
Deepak Data Analysis 1
31 pages
0 PDF
No ratings yet
0 PDF
9 pages
Fork of Brain Tumour Last
No ratings yet
Fork of Brain Tumour Last
115 pages
DNN ALL Practical 28
No ratings yet
DNN ALL Practical 28
34 pages
Profound Linux For Developers
From Everand
Profound Linux For Developers
Onder Teker
No ratings yet
Answerkey
No ratings yet
Answerkey
4 pages
Tensor Flow and Keras Sample Programs
No ratings yet
Tensor Flow and Keras Sample Programs
22 pages
University Institute of Engineering Department of Computer Science & Engineering
No ratings yet
University Institute of Engineering Department of Computer Science & Engineering
11 pages
1Data Preprocessing
No ratings yet
1Data Preprocessing
4 pages
Laptop Price Prediction
No ratings yet
Laptop Price Prediction
15 pages
machinelearning
No ratings yet
machinelearning
26 pages
MLLabManual
No ratings yet
MLLabManual
24 pages
Machine Learning Laboratory
No ratings yet
Machine Learning Laboratory
23 pages
Dive Into Sea of C
From Everand
Dive Into Sea of C
M Ashok
No ratings yet
Machine Learning Laboratory: Manual
No ratings yet
Machine Learning Laboratory: Manual
52 pages
ml_labmanual (3)
No ratings yet
ml_labmanual (3)
33 pages
ML IU48prac1,2
No ratings yet
ML IU48prac1,2
16 pages
Certificate
No ratings yet
Certificate
33 pages
Machine Learning Guide: Meher Krishna Patel
No ratings yet
Machine Learning Guide: Meher Krishna Patel
121 pages
Inspiring Powershell Articles
From Everand
Inspiring Powershell Articles
Murat Yildirimoglu
No ratings yet
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
No ratings yet
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
25 pages
Profile Long Hoang
No ratings yet
Profile Long Hoang
12 pages
Connectors 14.03.11
No ratings yet
Connectors 14.03.11
4 pages
A Study On Customer Satisfaction Towards Honda Two Wheelers
No ratings yet
A Study On Customer Satisfaction Towards Honda Two Wheelers
56 pages
Mech Sensotronic Brake Control Report
No ratings yet
Mech Sensotronic Brake Control Report
25 pages
Cold Storage Bluestar
No ratings yet
Cold Storage Bluestar
10 pages
Laman Pengakuan English Language
No ratings yet
Laman Pengakuan English Language
6 pages
The Effectiveness of Values Education' Program Integrated With The 4 Grade Science and Technology Instructional Program
No ratings yet
The Effectiveness of Values Education' Program Integrated With The 4 Grade Science and Technology Instructional Program
6 pages
Performance Formulas For Power Plant
100% (1)
Performance Formulas For Power Plant
1 page
Greenbasil - Abridged Director's Report - Final
No ratings yet
Greenbasil - Abridged Director's Report - Final
7 pages
Relative Pronouns and Relative Clauses Q
No ratings yet
Relative Pronouns and Relative Clauses Q
3 pages
Business Plan Template Erasmus
No ratings yet
Business Plan Template Erasmus
14 pages
Prof Ed Review Material 5 With ANSWERS
No ratings yet
Prof Ed Review Material 5 With ANSWERS
4 pages
Business Plan of Apple Inc
No ratings yet
Business Plan of Apple Inc
4 pages
Detailed Lesson Plan Horticulture Learning Area: Technology in Livelihood Education I. Objectives
100% (9)
Detailed Lesson Plan Horticulture Learning Area: Technology in Livelihood Education I. Objectives
4 pages
Annexure-I Instrument Datasheet For Self Actuating Pressure Control Valve
No ratings yet
Annexure-I Instrument Datasheet For Self Actuating Pressure Control Valve
5 pages
A History of Mobile Gaming
No ratings yet
A History of Mobile Gaming
16 pages
MANZO DENTAL APPOINTMENT SYSTEM IAN FORMAT March 15
No ratings yet
MANZO DENTAL APPOINTMENT SYSTEM IAN FORMAT March 15
9 pages
Risk, Reliability
100% (1)
Risk, Reliability
20 pages
Kisi-Kis Penyusunan Soal-Soal Bahasa Inggris Ujian Tengah Semester Tap/2021 Kelas: Iv
No ratings yet
Kisi-Kis Penyusunan Soal-Soal Bahasa Inggris Ujian Tengah Semester Tap/2021 Kelas: Iv
14 pages
Compressor Clutch
100% (2)
Compressor Clutch
6 pages
Q2 Oral Comm Module 6
No ratings yet
Q2 Oral Comm Module 6
12 pages
Hush Brochure
No ratings yet
Hush Brochure
24 pages
HS 119 NotesSlides
No ratings yet
HS 119 NotesSlides
70 pages
F9 - Mock B - Questions
No ratings yet
F9 - Mock B - Questions
7 pages
Coding Box Operation Guide
No ratings yet
Coding Box Operation Guide
11 pages
Computer Network Lab Manual r22 CSD
No ratings yet
Computer Network Lab Manual r22 CSD
61 pages
Summary IFRS For SME
100% (1)
Summary IFRS For SME
17 pages
Keys and Loose Pins - 1
No ratings yet
Keys and Loose Pins - 1
19 pages
Chapter-7 EM
No ratings yet
Chapter-7 EM
13 pages
7MCE1C4-Principles of Compiler Design
No ratings yet
7MCE1C4-Principles of Compiler Design
117 pages

project code

Uploaded by

project code

Uploaded by

# This Python 3 environment comes with many helpful analytics libraries installed

# It is defined by the kaggle/python Docker image:

import numpy as np # linear algebra

# Input data files are available in the read-only "../input/" directory

import matplotlib.pyplot as plt

from sklearn.linear_model import LogisticRegression

X_train = train_1_df.drop(columns = ['target'])

#Create the model

from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

final_prediction = pd.DataFrame({'id': x_test.id, 'target': prediction})

You might also like