0% found this document useful (0 votes)

5 views2 pages

Project Code

The document outlines a Python script for predicting computer virus presence using machine learning techniques. It involves data preprocessing, model training with a Random Forest Classifier, and generating predictions on a test dataset. The script also includes data visualization and evaluation metrics for model performance.

Uploaded by

sirajknl

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views2 pages

Project Code

Uploaded by

sirajknl

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

# This Python 3 environment comes with many helpful analytics libraries installed

# It is defined by the kaggle/python Docker image:

https://github.com/kaggle/docker-python
# For example, here's several helpful packages to load

import numpy as np # linear algebra

import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

# Input data files are available in the read-only "../input/" directory

# For example, running this (by clicking run or pressing Shift+Enter) will list all
files under the input directory

import os
for dirname, _, filenames in os.walk('/kaggle/input'):
for filename in filenames:
print(os.path.join(dirname, filename))

# You can write up to 20GB to the current directory (/kaggle/working/) that gets
preserved as output when you create a version using "Save & Run All"
# You can also write temporary files to /kaggle/temp/, but they won't be saved
outside of the current session

/kaggle/input/computer-virus-predictor/sample_submission.csv
/kaggle/input/computer-virus-predictor/train.csv
/kaggle/input/computer-virus-predictor/test.csv

train_df = pd.read_csv('/kaggle/input/computer-virus-predictor/train.csv')
train_1_df = train_df.drop(columns = ['MachineID','ProductName','EngineVersion',
'AppVersion','SignatureVersion', 'IsBetaUser', 'PlatformType','Processor',
'OSVersion','OsPlatformSubRelease','OSBuildLab',
'SKUEditionName','MDC2FormFactor','DeviceFamily','PrimaryDiskType','ChassisType','P
owerPlatformRole','NumericOSVersion','OSArchitecture','OSBranch','OSEdition','OSSku
FriendlyName','OSInstallType','AutoUpdateOptionsName','OSGenuineState','LicenseActi
vationChannel','FlightRing','DateAS','DateOS'])
train_1_df["id"] = train_1_df.index
train_1_df.head()
train_1_df.tail()

train_1_df.dtypes

import matplotlib.pyplot as plt

import seaborn as sns
sns.heatmap(train_1_df.corr(numeric_only=True))

from sklearn.linear_model import LogisticRegression

from sklearn.model_selection import train_test_split

train_1_df = train_1_df[train_1_df['RealTimeProtectionState'].notna()]
train_1_df = train_1_df[train_1_df['AntivirusConfigID'].notna()]
train_1_df = train_1_df[train_1_df['CityID'].notna()]
train_1_df = train_1_df[train_1_df['SMode'].notna()]
train_1_df = train_1_df[train_1_df['IEVersionID'].notna()]
train_1_df = train_1_df[train_1_df['ProcessorCoreCount'].notna()]
train_1_df = train_1_df[train_1_df['PrimaryDisplayDiagonalInches'].notna()]

train_1_df = train_1_df[train_1_df['FirewallEnabled'].notna()]
train_1_df = train_1_df[train_1_df['TotalPhysicalRAMMB'].notna()]
train_1_df = train_1_df[train_1_df['EnableLUA'].notna()]
train_1_df = train_1_df[train_1_df['OEMModelID'].notna()]
train_1_df = train_1_df[train_1_df['InternalBatteryNumberOfCharges'].notna()]
train_1_df = train_1_df[train_1_df['IsGamer'].notna()]
train_1_df = train_1_df[train_1_df['OSInstallLanguageID'].notna()]
train_1_df = train_1_df[train_1_df['IsFlightsDisabled'].notna()]
train_1_df = train_1_df[train_1_df['FirmwareManufacturerID'].notna()]
train_1_df = train_1_df[train_1_df['IsVirtualDevice'].notna()]

X_train = train_1_df.drop(columns = ['target'])

Y_train = train_1_df['target']
x_train, x_test, y_train, y_test = train_test_split(X_train, Y_train,
test_size=0.3)
train_1_df.isna().sum()

#Create the model

from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier()
model.fit(X_train, Y_train)
prediction = model.predict(x_test)

from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

print(classification_report(y_test,prediction))
print(confusion_matrix(y_test,prediction))

test_df = pd.read_csv('/kaggle/input/computer-virus-predictor/test.csv')
x_test = test_df.drop(columns = ['MachineID','ProductName','EngineVersion',
'AppVersion','SignatureVersion', 'IsBetaUser', 'PlatformType','Processor',
'OSVersion','OsPlatformSubRelease','OSBuildLab',
'SKUEditionName','MDC2FormFactor','DeviceFamily','PrimaryDiskType','ChassisType','P
owerPlatformRole','NumericOSVersion','OSArchitecture','OSBranch','OSEdition','OSSku
FriendlyName','OSInstallType','AutoUpdateOptionsName','OSGenuineState','LicenseActi
vationChannel','FlightRing','DateAS','DateOS'])
x_test["id"] = x_test.index
x_test = x_test[x_test['RealTimeProtectionState'].notna()]
x_test = x_test[x_test['AntivirusConfigID'].notna()]
x_test = x_test[x_test['CityID'].notna()]
x_test = x_test[x_test['SMode'].notna()]
x_test = x_test[x_test['IEVersionID'].notna()]
x_test = x_test[x_test['ProcessorCoreCount'].notna()]
x_test = x_test[x_test['PrimaryDisplayDiagonalInches'].notna()]
x_test = x_test[x_test['FirewallEnabled'].notna()]
x_test = x_test[x_test['TotalPhysicalRAMMB'].notna()]
x_test = x_test[x_test['EnableLUA'].notna()]
x_test = x_test[x_test['OEMModelID'].notna()]
x_test = x_test[x_test['InternalBatteryNumberOfCharges'].notna()]
x_test = x_test[x_test['IsGamer'].notna()]
x_test = x_test[x_test['OSInstallLanguageID'].notna()]
x_test = x_test[x_test['IsFlightsDisabled'].notna()]
x_test = x_test[x_test['FirmwareManufacturerID'].notna()]
x_test = x_test[x_test['IsVirtualDevice'].notna()]

prediction = model.predict(x_test)

final_prediction = pd.DataFrame({'id': x_test.id, 'target': prediction})

final_prediction.to_csv('submission.csv', index=False)

Topic: Identifying Errors: New Curriculum 2023
No ratings yet
Topic: Identifying Errors: New Curriculum 2023
13 pages
Machine Learning Lab Dlihebca6sem
100% (1)
Machine Learning Lab Dlihebca6sem
25 pages
AquaLab 4 Water Activity Meter Manual
No ratings yet
AquaLab 4 Water Activity Meter Manual
129 pages
The Art of Growing Irish Potatoes in Sacks
No ratings yet
The Art of Growing Irish Potatoes in Sacks
6 pages
Pattern Recognition Lab
No ratings yet
Pattern Recognition Lab
24 pages
The Manual For The Quality Management of Educational Programmes in Myanmar
100% (1)
The Manual For The Quality Management of Educational Programmes in Myanmar
160 pages
Breakout Play (Trend Following) - Trading Plan - Full (Sample)
91% (11)
Breakout Play (Trend Following) - Trading Plan - Full (Sample)
15 pages
Victoria Code of Practice For Using Concrete Pump
0% (1)
Victoria Code of Practice For Using Concrete Pump
56 pages
List of Imported Libraries
No ratings yet
List of Imported Libraries
12 pages
7 Data Science / Machine Learning Cheat Sheets in One
100% (1)
7 Data Science / Machine Learning Cheat Sheets in One
9 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
ASI Show Orlando 2025 Exhibitor List
No ratings yet
ASI Show Orlando 2025 Exhibitor List
16 pages
On Job Annual Training Plan 2023
No ratings yet
On Job Annual Training Plan 2023
3 pages
Polynomial Sample Problems
No ratings yet
Polynomial Sample Problems
3 pages
Position Paper
No ratings yet
Position Paper
2 pages
Deepak Data Analysis 1
No ratings yet
Deepak Data Analysis 1
31 pages
Chapter 3 Data Modeling Using The Entity Relationship ER Model
No ratings yet
Chapter 3 Data Modeling Using The Entity Relationship ER Model
55 pages
House Price Prediction: Project Description
No ratings yet
House Price Prediction: Project Description
11 pages
Approachin190808095205 PDF
No ratings yet
Approachin190808095205 PDF
112 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
DNN ALL Practical 28
No ratings yet
DNN ALL Practical 28
34 pages
Hyperlipidemia 1
No ratings yet
Hyperlipidemia 1
54 pages
Fork of Brain Tumour Last
No ratings yet
Fork of Brain Tumour Last
115 pages
ML Practical 205160694034
No ratings yet
ML Practical 205160694034
33 pages
Tushar ML
No ratings yet
Tushar ML
52 pages
Heart Disease Prediction - Colab
No ratings yet
Heart Disease Prediction - Colab
18 pages
Train
No ratings yet
Train
17 pages
Final ML File
No ratings yet
Final ML File
34 pages
ML Final Prac
No ratings yet
ML Final Prac
47 pages
Heuristic Search Strategies
No ratings yet
Heuristic Search Strategies
23 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
20 pages
Practical Labs Guide
No ratings yet
Practical Labs Guide
34 pages
ML Manual
No ratings yet
ML Manual
21 pages
ISO 9001 Clauses Simply Explained Rev.1
No ratings yet
ISO 9001 Clauses Simply Explained Rev.1
26 pages
Worksheet KTSP - Kelas 7
No ratings yet
Worksheet KTSP - Kelas 7
31 pages
Tensor Flow and Keras Sample Programs
No ratings yet
Tensor Flow and Keras Sample Programs
22 pages
DevOps Part I
No ratings yet
DevOps Part I
16 pages
Pro Proctor User Guide
No ratings yet
Pro Proctor User Guide
24 pages
Untitled Document
No ratings yet
Untitled Document
19 pages
Exercise5 Solution
No ratings yet
Exercise5 Solution
22 pages
To Study About Numpy, Pandas and Matplotlib Libraries in Python
No ratings yet
To Study About Numpy, Pandas and Matplotlib Libraries in Python
21 pages
Da Program
No ratings yet
Da Program
18 pages
0 PDF
No ratings yet
0 PDF
9 pages
Bda Prac 1 - Merged
No ratings yet
Bda Prac 1 - Merged
28 pages
Mlalllabprgs
No ratings yet
Mlalllabprgs
17 pages
ML LabManual
No ratings yet
ML LabManual
16 pages
Class Xii PDF For Practical
No ratings yet
Class Xii PDF For Practical
24 pages
AAM PR QB
No ratings yet
AAM PR QB
13 pages
Order Now Whatsapp: Course: Teacher Education in Pakistan (8626) Semester: Spring, 2023 Level: B.Ed. (1.5 Years)
No ratings yet
Order Now Whatsapp: Course: Teacher Education in Pakistan (8626) Semester: Spring, 2023 Level: B.Ed. (1.5 Years)
14 pages
Quiksam PDF
No ratings yet
Quiksam PDF
6 pages
ISAA Lab DA 5 KRISH
No ratings yet
ISAA Lab DA 5 KRISH
11 pages
Waiting For Santa - Barney Wiki - Fandom 44 58
No ratings yet
Waiting For Santa - Barney Wiki - Fandom 44 58
7 pages
University Institute of Engineering Department of Computer Science & Engineering
No ratings yet
University Institute of Engineering Department of Computer Science & Engineering
11 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
Aiml Practical
No ratings yet
Aiml Practical
17 pages
Practical File Machine Learning
No ratings yet
Practical File Machine Learning
29 pages
Question - 2-Interview Question ML
No ratings yet
Question - 2-Interview Question ML
13 pages
Coe Projects
No ratings yet
Coe Projects
7 pages
BIG DATA - Assign
No ratings yet
BIG DATA - Assign
28 pages
ML Lab Manual
No ratings yet
ML Lab Manual
36 pages
ML Manual
No ratings yet
ML Manual
30 pages
Test Bank For Community Policing A Contemporary Perspective 6th Edition Kappelerdownload
100% (12)
Test Bank For Community Policing A Contemporary Perspective 6th Edition Kappelerdownload
32 pages
NZ Pa 36 New Zealand Numeracy Stages 1 To 8 Weekly Planning Template English Ver 2
No ratings yet
NZ Pa 36 New Zealand Numeracy Stages 1 To 8 Weekly Planning Template English Ver 2
12 pages
ML Record
No ratings yet
ML Record
19 pages
Weather Forecasting
No ratings yet
Weather Forecasting
5 pages
External
No ratings yet
External
11 pages
Lab08 ML
No ratings yet
Lab08 ML
6 pages
Houses Prices Prediction Model
No ratings yet
Houses Prices Prediction Model
11 pages
Practical (Data Science)
No ratings yet
Practical (Data Science)
13 pages
Anu Arora Report
No ratings yet
Anu Arora Report
8 pages
Betas
No ratings yet
Betas
4 pages
Big Data Practical
No ratings yet
Big Data Practical
20 pages
P 4 Andp 5
No ratings yet
P 4 Andp 5
4 pages
Answerkey
No ratings yet
Answerkey
4 pages
CTRL
No ratings yet
CTRL
5 pages
Analysis On Weight Capacity
No ratings yet
Analysis On Weight Capacity
4 pages
Data Analytics I
No ratings yet
Data Analytics I
4 pages
NCMA 219 RUBRICS - ADMINISTERING Magnesium Sulfate
No ratings yet
NCMA 219 RUBRICS - ADMINISTERING Magnesium Sulfate
3 pages
Data Science Libraries
No ratings yet
Data Science Libraries
4 pages
Pyspark NLP From Scratch
No ratings yet
Pyspark NLP From Scratch
3 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
David Wall VP Hse & Im EPT - HSE, Operations & Engineering: Confidential BP-HZN - BLYOO196756
No ratings yet
David Wall VP Hse & Im EPT - HSE, Operations & Engineering: Confidential BP-HZN - BLYOO196756
3 pages
Download
No ratings yet
Download
3 pages
Project Kaggle Intro
No ratings yet
Project Kaggle Intro
1 page
MaheswariVeni Auth Nagercoil
No ratings yet
MaheswariVeni Auth Nagercoil
2 pages
Pressure Transmitter Offer
No ratings yet
Pressure Transmitter Offer
2 pages
Mechanical Engineering Seminars
No ratings yet
Mechanical Engineering Seminars
1 page
Notebook40476b8e91 Ipynb
No ratings yet
Notebook40476b8e91 Ipynb
1 page
Linear
No ratings yet
Linear
2 pages

Project Code

Uploaded by

Project Code

Uploaded by

# This Python 3 environment comes with many helpful analytics libraries installed

# It is defined by the kaggle/python Docker image:

import numpy as np # linear algebra

# Input data files are available in the read-only "../input/" directory

import matplotlib.pyplot as plt

from sklearn.linear_model import LogisticRegression

X_train = train_1_df.drop(columns = ['target'])

#Create the model

from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

final_prediction = pd.DataFrame({'id': x_test.id, 'target': prediction})

You might also like