Step 2

Uploaded by

sam.sepiol999

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

22 views2 pages

Step 2

Uploaded by

sam.sepiol999

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

import requests

from bs4 import BeautifulSoup

import pandas as pd

# Base URL without the page number

base_url = 'https://www.mr-bricolage.mu/Trianon/maison/decoration/decoration-des-
murs-et-plafonds/papiers-peints-et-panoramiques.html?discount=1&p='

# List to store product data from all pages

all_products = []
seen_products = set() # To track unique products

# Step 1: Loop through pages 1 to 6

for page_num in range(1, 7):
# Construct the URL for the current page
url = base_url + str(page_num)

# Send an HTTP request to the page

response = requests.get(url)
response.raise_for_status() # Check if the request was successful

# Parse the HTML content using BeautifulSoup

soup = BeautifulSoup(response.text, 'html.parser')

# Extract product details and add to the list

products = soup.find_all('li', class_='item product product-item')

current_page_products = []

for product in products:

name_tag = product.find('h2', class_='product-details__name')
name = name_tag.text.strip() if name_tag else 'No Name Found'

discount_tag = product.find('span', class_='product-details__discount-

percentage')
discount = discount_tag.text.strip() if discount_tag else 'No Discount'

price_tag = product.find('span', class_='price-wrapper')

price = price_tag.text.strip().replace('₨ ', '').replace(',', '') if
price_tag else 'No Price Found'

# Create a unique identifier for each product (name + price)

product_id = f"{name}-{price}"

# Check if the product is already seen

if product_id in seen_products:
print(f"Duplicate product detected on page {page_num}. Stopping.")
break
else:
seen_products.add(product_id)
current_page_products.append({
'Name': name,
'Discount': discount,
'Price': price
})

if not current_page_products:
print(f"No new products on page {page_num}. Stopping.")
break
all_products.extend(current_page_products)
print(f"Page {page_num} processed successfully.")

# Step 2: Create a DataFrame and save it to an Excel file

df = pd.DataFrame(all_products)
df.to_excel('all_products.xlsx', index=False)

print("Data has been saved to all_products.xlsx")

IP Project File
No ratings yet
IP Project File
25 pages
E-Commerce - Python - Project - Student - File (1) Answer
No ratings yet
E-Commerce - Python - Project - Student - File (1) Answer
167 pages
Amazon Apparel PDF
No ratings yet
Amazon Apparel PDF
138 pages
Ip Code and Output
No ratings yet
Ip Code and Output
56 pages
Vnprod
No ratings yet
Vnprod
33 pages
Links
No ratings yet
Links
24 pages
PRJCT Report
No ratings yet
PRJCT Report
22 pages
IP Project 1.0
No ratings yet
IP Project 1.0
26 pages
Python PPT
No ratings yet
Python PPT
27 pages
Lab Building Simple Shopping Cart Using Python, Flask, MySQL
No ratings yet
Lab Building Simple Shopping Cart Using Python, Flask, MySQL
14 pages
CS Project
No ratings yet
CS Project
20 pages
Shop Management System
No ratings yet
Shop Management System
17 pages
Inventory Management System
No ratings yet
Inventory Management System
17 pages
Python
No ratings yet
Python
18 pages
Web Scrapping Project Phase 4 1679950739
No ratings yet
Web Scrapping Project Phase 4 1679950739
12 pages
BT 5930
No ratings yet
BT 5930
14 pages
Outputs and Code
No ratings yet
Outputs and Code
14 pages
UI21CS29 Lab2
No ratings yet
UI21CS29 Lab2
11 pages
CS Project Report Template
No ratings yet
CS Project Report Template
14 pages
Gift Shop Management System Project
No ratings yet
Gift Shop Management System Project
7 pages
Directory Structure
No ratings yet
Directory Structure
10 pages
Performance Task
No ratings yet
Performance Task
5 pages
Rate Analogy
No ratings yet
Rate Analogy
9 pages
Lang Chain Agent
No ratings yet
Lang Chain Agent
9 pages
B - 2 CIE Web Scraping
No ratings yet
B - 2 CIE Web Scraping
8 pages
Library Management System Code
No ratings yet
Library Management System Code
7 pages
Restaurant Management @pythonnotes1
No ratings yet
Restaurant Management @pythonnotes1
8 pages
Import Pandas As PD
No ratings yet
Import Pandas As PD
7 pages
Dropdownlistscraping
No ratings yet
Dropdownlistscraping
7 pages
Gadget Management System
No ratings yet
Gadget Management System
3 pages
Aasma Pes1ug23cs008 Unit 1
No ratings yet
Aasma Pes1ug23cs008 Unit 1
6 pages
Web Scraping Assignment Ebay
No ratings yet
Web Scraping Assignment Ebay
6 pages
Dealeroflink: Import From Import Import Import Import Import Import
No ratings yet
Dealeroflink: Import From Import Import Import Import Import Import
6 pages
Project Py PDF
No ratings yet
Project Py PDF
6 pages
CS 1101 Programming Assignment 2
No ratings yet
CS 1101 Programming Assignment 2
5 pages
Exp 16
No ratings yet
Exp 16
6 pages
Khusbu
No ratings yet
Khusbu
5 pages
Final TXT
No ratings yet
Final TXT
4 pages
Aa
No ratings yet
Aa
4 pages
Web Scraping
No ratings yet
Web Scraping
2 pages
Price Comparison Extension
No ratings yet
Price Comparison Extension
4 pages
Bakery Items
No ratings yet
Bakery Items
4 pages
Class User
No ratings yet
Class User
4 pages
6
No ratings yet
6
3 pages
CODE BAsE
No ratings yet
CODE BAsE
3 pages
PPL Practical
No ratings yet
PPL Practical
3 pages
Online Reatil Data
No ratings yet
Online Reatil Data
3 pages
Assignment 2 U0P
No ratings yet
Assignment 2 U0P
3 pages
Demo
No ratings yet
Demo
2 pages
Database Dict
No ratings yet
Database Dict
2 pages
Step 3
No ratings yet
Step 3
2 pages
MR Brico Url
No ratings yet
MR Brico Url
2 pages
Mini Project Info
No ratings yet
Mini Project Info
2 pages
Dune Tha Mart
No ratings yet
Dune Tha Mart
2 pages
Dbrecords Django
No ratings yet
Dbrecords Django
2 pages
How To Create A Fully Functional E-Commerce Website With Django - by Andika Pratama - Analytics Vidhya - Medium
No ratings yet
How To Create A Fully Functional E-Commerce Website With Django - by Andika Pratama - Analytics Vidhya - Medium
1 page
React Portfolio App Development: Increase your online presence and create your personal brand
From Everand
React Portfolio App Development: Increase your online presence and create your personal brand
Abdelfattah Ragab
No ratings yet
Angular Shopping Store: From Scratch to Successful Payment
From Everand
Angular Shopping Store: From Scratch to Successful Payment
Abdelfattah Ragab
No ratings yet
Angular Generative AI: Building an intelligent CV enhancer with Google Gemini
From Everand
Angular Generative AI: Building an intelligent CV enhancer with Google Gemini
Abdelfattah Ragab
No ratings yet
MCTS 70-515 Exam: Web Applications Development with Microsoft .NET Framework 4 (Exam Prep)
From Everand
MCTS 70-515 Exam: Web Applications Development with Microsoft .NET Framework 4 (Exam Prep)
Eddie Vi
4/5 (1)