0% au considerat acest document util (0 voturi)

36 vizualizări20 pagini

S3 - Python - MongoDB - MySQL - Flask

Documentul prezintă modalități de prelucrare a datelor din baze de date MySQL și MongoDB utilizând Python. Sunt descrise pașii de conectare, interogare și manipulare a datelor, precum și exemple de implementare a acestor operații.

Încărcat de

Ionut Tumurica

Drepturi de autor

Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.

Formate disponibile

Descărcați ca DOCX, PDF, TXT sau citiți online pe Scribd

0% au considerat acest document util (0 voturi)

36 vizualizări20 pagini

S3 - Python - MongoDB - MySQL - Flask

Încărcat de

Ionut Tumurica

Drepturi de autor

Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.

Formate disponibile

Descărcați ca DOCX, PDF, TXT sau citiți online pe Scribd

Sunteți pe pagina 1/ 20

Seminar 3 – Prelucrarea datelor din MySQL și MongoDB utilizând Python

1. Python – MySQL
Pentru conexiunea cu o bază de date MySQL se parcurg următorii pași:
1. Se importă pachetul mysql.connector în Python:
import mysql.connector
2. Se precizează conexiunea la serverul MySQL:
db_connection=mysql.connector.connect(
host="localhost",
user ="bdsa",
passwd="Bdsa_1234",

database="clienti_daune",port=3306,auth_plugin='mysql_native_passwor
d')

3. Se deschide un cursor:
cursor=db_connection.cursor()

4. Se specifică într-o variabilă de tip șir de caractere comanda SQL, inclusiv parametrii
precizați prin %s. Se execută interogarea prin intermediul cursorului:
sql_stm="""select * from clienti_daune.T_CLIENTI_LEASING where
SUMA_SOLICITATA > %s """
params=(v_suma,)
cursor=db_connection.cursor()
cursor.execute(sql_stm,params)
lista_mysql=cursor.fetchall()
pprint(lista_mysql)

5. Se închide cursorul și conexiunea cu baza de date:

cursor.close()
db_connection.close()

Exemplul 1: Să se returneze într-o listă de tupluri toți clienții din tabela

T_CLIENTI_LEASING din baza de date Oracle care au solicitat pentru creditare o suma mai
mare decât o valoare introdusă de la tastatură.
Lista rezultată va fi inserată în tabela cu același nume din MySQL. Înainte de operația de
insert se vor șterge toate înregistrările existente în tabela din MySQL care satisfac condiția
referitoare la sumă.
import cx_Oracle
from pprint import pprint

# Realizarea conexiunii cu serverul Oracle

#Conexiunea - user student_ps, parola oracle, host:37.120.250.20,
service_name oracle

1
connection = cx_Oracle.connect("student_ps", "oracle",
"37.120.250.20/oracle")
sql_oracle="""SELECT ID_CLIENT, NUME_CLIENT, PROFESIA, SEX, MONEDA,
VENIT_ANUAL, CONT_CURENT, VENIT_ANUAL_RON, VAL_CREDITE_RON, VARSTA,
CATEGORIE
, DESCRIERE, PRESCORING, SUMA_DEPOZIT, FIDELITATE, STARE_CIVILA,
PROBABILITATE_CONTRACTARE_N, SUMA_SOLICITATA, PRAG_SUMA_ACORDATA,
data
FROM t_clienti_leasing where suma_solicitata > :p_suma """
cursor = connection.cursor()
v_suma = input("Introduceti suma ceruta pentru creditare: ");
cursor.execute(sql_oracle, p_suma=v_suma)
lista_clienti=cursor.fetchall()
#inchidere cursor si conexiune cu Oracle
cursor.close()
connection.close()
#afisare lista clienti
#pprint (lista_clienti)

#importul datelor din lista_clienti in MySQL:

import mysql.connector

#conexiunea cu baza de date MySQL

db_connection=mysql.connector.connect(
host="localhost",
user ="bdsa",
passwd="Bdsa_1234",

database="clienti_daune",port=3306,auth_plugin='mysql_native_passwor
d')

#stergem inregistrarile pre-existente daca este cazul

cursor=db_connection.cursor()
del_stm = """DELETE FROM clienti_daune.T_CLIENTI_LEASING WHERE
SUMA_SOLICITATA > %s"""
params=(v_suma,)
cursor.execute(del_stm,params)
cursor.close()
db_connection.commit()

#inserare clienti din lista_clienti

#pprint(lista_clienti)
insert_stm="""INSERT INTO clienti_daune.T_CLIENTI_LEASING
(ID_CLIENT, NUME_CLIENT, PROFESIA, SEX, MONEDA, VENIT_ANUAL,
CONT_CURENT, VENIT_ANUAL_RON, VAL_CREDITE_RON, VARSTA, CATEGORIE,
DESCRIERE, PRESCORING, SUMA_DEPOZIT, FIDELITATE, STARE_CIVILA,
PROBABILITATE_CONTRACTARE_N, SUMA_SOLICITATA, PRAG_SUMA_ACORDATA,
DATA)
VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,
%s, %s)"""
cursor=db_connection.cursor()
for r in lista_clienti:
cursor.execute(insert_stm,r)

2
#print(str(cursor.rowcount) + " au fost inserate in tabela
T_CLIENTI_LEASING")
cursor.close()
db_connection.commit()

#regasire lista clienti

sql_stm="""select * from clienti_daune.T_CLIENTI_LEASING where
SUMA_SOLICITATA > %s """
params=(v_suma,)
cursor=db_connection.cursor()
cursor.execute(sql_stm,params)
lista_mysql=cursor.fetchall()
pprint(lista_mysql)
cursor.close()

db_connection.close()

Exemplul 2: Modificați probabilitatea de contractare astfel încât aceasta să fie 1 pentru

clienții care au prescoringul cuprins între două limite introduse de la tastatură. Testați modul
de finalizare a tranzacțiilor prin proprietatea autocommit=True/False a conexiunii.
from pprint import pprint
import mysql.connector
p_min = input("Introduceti limita inferioara pentru prescoring: ")
p_max = input("Introduceti limita superioara pentru prescoring: ")
#conexiunea cu baza de date MySQL
db_connection=mysql.connector.connect(
host="localhost",
user ="bdsa",
passwd="Bdsa_1234",

database="clienti_daune",port=3306,auth_plugin='mysql_native_passwor
d')
#db_connection.autocommit = False
#stergem inregistrarile pre-existente daca este cazul
cursor=db_connection.cursor()
del_stm = """UPDATE clienti_daune.T_CLIENTI_LEASING SET
PROBABILITATE_CONTRACTARE_N =0 WHERE PRESCORING BETWEEN %s and %s"""
params=(p_min, p_max,)
cursor.execute(del_stm,params)
cursor.close()
#db_connection.commit()

#regasire lista clienti

sql_stm="""select * from clienti_daune.T_CLIENTI_LEASING WHERE
PRESCORING BETWEEN %s and %s"""
params=(p_min, p_max,)
cursor=db_connection.cursor()
cursor.execute(sql_stm,params)
lista_mysql=cursor.fetchall()
pprint(lista_mysql)
cursor.close()

3
db_connection.close()

Încărcarea datelor returnate de MySQL într-un DataFrame Pandas se realizează similar cu cea
utilizată de pachetul cx_Oracle. În acest caz utilizarea cursorului nu mai este necesară:
df = pd.read_sql(statement, con=db_connection,params={p1, p1, ….})

Exemplul 3: Să se returneze într-un DataFrame Pandas clientii cu vârsta mai mare decât o
valoare introdusă de la tastatură. Să se calculeze în funcție de profesia suma totală și valoarea
medie a sumelor solicitate de acești clienți. Să se reprezinte grafic.
from pprint import pprint
import mysql.connector
import pandas as pd
import matplotlib.pyplot as plt
#conexiunea cu baza de date MySQL
v_min = input("Introduceti limita inferioara pentru varsta: ")
db_connection=mysql.connector.connect(
host="localhost",
user ="bdsa",
passwd="Bdsa_1234",

database="clienti_daune",port=3306,auth_plugin='mysql_native_passwor
d')

#regasire clienti si incarcare in df

sql_stm="""select * from clienti_daune.T_CLIENTI_LEASING WHERE
VARSTA > %s"""
df = pd.read_sql(sql_stm, con=db_connection,params={v_min})
db_connection.close()
#prelucrare si afisare date
df_g= df.loc[:,['PROFESIA',
'SUMA_SOLICITATA']].groupby('PROFESIA').agg(["mean","sum"])
df_g.plot(kind='bar')
plt.xlabel('PROFESIA')
plt.ylabel('SUMA SOLICITATA, total si medie')
plt.legend(title='Suma solicitata:')
plt.title('Repartizarea sumelor in functie de profesie')
plt.show()

Exemplul 4: Încărcați într-un DataFrame Pandas lista clienților care au o anumită profesie
întrodusă de la tastatură. Calculați valoarea medie a valorilor numerice grupate în funcție de
sex si moneda.
import mysql.connector
import pandas as pd
#conexiunea cu baza de date MySQL
v_profesia = input("Introduceti profesia: ")
v_profesia='%'+v_profesia.lower()+'%'
db_connection=mysql.connector.connect(
host="localhost",
user ="bdsa",
passwd="Bdsa_1234",

4
database="clienti_daune",port=3306,auth_plugin='mysql_native_passwor
d')

#regasire clienti si incarcare in df

Exemplul 5: Transformați exemplul de mai sus astfel încât codul să ruleze sub formă de Web
API și să fie accesibil printr-un URL. Vom utiliza Flask pentru a putea rula codul sub forma
unui Web API. Modalitatea de lucru cu Flask a fost descrisă în curs.
import mysql.connector
import pandas as pd
import flask
from flask import request, jsonify
import json

app = flask.Flask(__name__)
app.config["DEBUG"] = False

# home page
@app.route('/', methods=['GET'])
def home():
return '''<h1>Regasirea clientilor cu o anumita profesie</h1>
<p>API pentru calcularea statisticilor in functie de
profesie.</p>'''

@app.errorhandler(404)
def page_not_found(e):
return "<h1>404</h1><p>The resource could not be found.</p>",
404

# pagina: http://127.0.0.1:5000/api/v1/resources/profesie_clienti?
profesia=inginer

@app.route('/api/v1/resources/profesie_clienti', methods=['GET'])
def api_profesie_clienti():
# Verificarea parametrului introdus in URL.
if 'profesia' in request.args:
v_profesia = str(request.args.get('profesia', type=str))
v_profesia = '%' + v_profesia.lower() + '%'
else:
return "Error: Nu a fost precizat profesia. Va rugam
specificati o profesie: Inginer, Medic, Avocat....."

# conexiunea cu baza de date MySQL

5
db_connection = mysql.connector.connect(
host="localhost",
user="bdsa",
passwd="Bdsa_1234",
database="clienti_daune", port=3306,
auth_plugin='mysql_native_password')

# regasire clienti si incarcare in df

sql_stm = """select * from clienti_daune.T_CLIENTI_LEASING WHERE
profesia like %s"""
df = pd.read_sql(sql_stm, con=db_connection,
params={v_profesia})
db_connection.close()
# prelucrare si afisare date
df_g = df.groupby(['SEX', 'MONEDA']).mean().reset_index()
# return "Optimizarea a fost realizata!"
ljson = df_g.to_json(orient='records')
return jsonify(json.loads(ljson))

app.run()

6
2. Python - MongoDB
Interacțiunea dintre Python și MongoDB este posibilă prin intermediul pachetului pymongo
care conține metode pentru accesul la bazele de date și colecțiile stocate în MongoDb.
Pașii pentru accesul la documentele din MongoDB sunt următorii:

1. Se importă pachetul pymongo în Python:

import pymongo

2. Se precizează conexiunea la serverul MongoDB:

conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")

3. Opțional se pot afișa bazele de date disponibile:

print(conn.list_database_names())

4. Se precizează baza de date care se va accesa:

db = conn["NUME_DATABASE"]

5. Opțional se pot afișa colecțiile de date disponibile:

print(db.list_collection_names())

6. Se precizează colecția care urmează să fie accesată:

collection = db["NUME_COLECTIE"]

7. Se formează parametrii pentru regăsirea datelor și returnarea acestora într-un cursor:

projection={"_id":0,
"CAMP1":1,
"CAMP2":1,
……… }
sort=[("CAMP1", 1)]

8. Se returnează datele într-o variabilă de tip cursor:

cursor=collection.find({},projection=projection, sort=sort)

9. Datele din cursor se pot încărca direct într-o listă de documente MongoDB sub forma de
dicționare:

set_clienti=list(cursor)

O altă variantă: se poate inițializa o listă goală și la fiecare iterație a cursorului se adaugă un
document în listă. Avantajul ar fi că se pot face prelucrări suplimentare pe fiecare record din
cursor înaintea încărcării în listă, de exemplu nu încărcăm documentele pentru care valoarea
daunei este null:
set_clienti=[]
for r in cursor:
if str(r['VALOARE_DAUNA'])!='nan':
set_clienti.append(r)

10. Putem să afisăm lista de documente:

7
print (set_clienti)

11. Închidem cursorul:

cursor.close()

Datele sunt încărcate în listă și pot fi prelucrate ulterior.

Exemplul 6. Conectarea la MongoDB și afișarea documentelor din colecția clienti_daune.
Se returnează doar câmpurile: MARCA, MODEL, REGIUNEPRODUCATOR ,
TARAPRODUCATOR și VALOARE_DAUNA.
Documentele vor fi ordonate în funcție de MARCA.
Nu se vor încărca documentele cu valori lipsă pentru daune.
import pymongo
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
print(conn.list_database_names())
db = conn["daune_leasing"]
print(db.list_collection_names())
collection = db["clienti_daune"]
projection={"_id":0,
"TARAPRODUCATOR":1,
"REGIUNEPRODUCATOR":1,
"MARCA":1,
"MODEL":1,
"VALOARE_DAUNA":1
}
sort=[("MARCA", 1)]
cursor=collection.find({},projection=projection, sort=sort)
#lista set_clienti este o lista de dictionare care va contine campurile
selectate
set_clienti=[]
for r in cursor:
if str(r['VALOARE_DAUNA'])!='nan':
set_clienti.append(r)
print (set_clienti)
cursor.close()

O variantă mai elegantă de afișare o oferă pachetul pprint și metoda pprint. Vom adăuga la
început importul acesteia:
from pprint import pprint

La final, afișăm lista set_clienti cu pprint (înlocuim print (set_clienti)):

pprint (set_clienti)

Exemplul 7. Modificăm exemplul de mai sus astfel încât să fie încărcate toare
documentele, deci lista va fi încărcată cu set_clienti=list(cursor).
Calculăm valoarea totală a daunelor pentru o marcă auto introdusă de utilizator de la
tastatură (cu metoda input)
import pymongo
from pprint import pprint
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
db = conn["daune_leasing"]
collection = db["clienti_daune"]

8
projection={"_id":0,
"TARAPRODUCATOR":1,
"REGIUNEPRODUCATOR":1,
"MARCA":1,
"MODEL":1,
"VALOARE_DAUNA":1
}
sort=[("MARCA", 1)]
cursor=collection.find({},projection=projection, sort=sort)
set_clienti=list(cursor)
#pprint (set_clienti)
cursor.close()
#prelucrarea datelor din lista
v_marca = input("Introduceti marca: ")
print ("Marca selectata este : ", v_marca)
total_daune=0
for r in set_clienti:
if str(r['MARCA']).find(v_marca.upper())!=-1:
total_daune=total_daune+r['VALOARE_DAUNA']
print ("Valoarea totala a daunelor pentru marca", v_marca, " este: ",
total_daune)

Exemplul 8. Să se numere frecvența de apariție a cuvintelor din câmpul DAUNA.

Se vor afișa cuvintele și frecvența de apariție în ordine descrescătoare.
Introduceți o condiție pentru eliminarea cuvintelor uzuale ('the', 'and', 'to', 'a',
'in', 'not', 'of') și a cuvintelor cu mai puțin de 50 apariții
import pymongo
from pprint import pprint
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
db = conn["daune_leasing"]
collection = db["clienti_daune"]
projection = {"_id": 0,
"DAUNA": 1,
"MARCA": 1,
"MODEL": 1,
"VALOARE_DAUNA": 1
}
sort = [("DAUNA", -1)]
cursor = collection.find({}, projection=projection, sort=sort)
set_clienti = list(cursor)
cursor.close()
lista_cuvinte=[]
try:
for dauna in set_clienti:
lista_cuvinte=lista_cuvinte + str(str(dauna['DAUNA']).lower()).split()
except:
print('Nu s-a precizat dauna!')
#print(lista_cuvinte)
# numaram cuvintele si le adaugam intr-un dictionar
#initial dictionarul este gol si va fi completat cu cuvinte
dictionar = {}
for cuvant in lista_cuvinte:
if cuvant not in dictionar:
dictionar[cuvant] = 1
else:
dictionar[cuvant] += 1
#formam lista cuvintelor si a frecventei de aparitie sortata descrescator
aparitie = []
for key, value in dictionar.items():
if key not in ('the', 'and', 'to', 'a', 'in', 'not', 'of') and value>50:
aparitie.append((value, key))
aparitie.sort(reverse=True)
pprint(aparitie)

9
Exemplul 9. Să se modifice exemplul de mai sus astfel încât să se afișeze cuvintele cele
mai frecvente pentru o anumită marca auto:
import pymongo
from pprint import pprint
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
db = conn["daune_leasing"]
collection = db["clienti_daune"]
projection = {"_id": 0,
"DAUNA": 1,
"MARCA": 1,
"MODEL": 1,
"VALOARE_DAUNA": 1
}
sort = [("DAUNA", -1)]
cursor = collection.find({}, projection=projection, sort=sort)
set_clienti = list(cursor)
cursor.close()
v_marca = input("Introduceti marca: ")
lista_cuvinte=[]
try:
for dauna in set_clienti:
if str(dauna['MARCA']).find(v_marca.upper()) != -1:
lista_cuvinte=lista_cuvinte +
str(str(dauna['DAUNA']).lower()).split()
except:
print('Nu s-a precizat dauna!')
#print(lista_cuvinte)
# numaram cuvintele si le adaugam intr-un dictionar
#initial dictionarul este gol si va fi completat cu cuvinte
dictionar = {}
for cuvant in lista_cuvinte:
if cuvant not in dictionar:
dictionar[cuvant] = 1
else:
dictionar[cuvant] += 1
#formam lista cuvintelor si a frecventei de aparitie sortata descrescator
aparitie = []
for key, value in dictionar.items():
if key not in ('the', 'and', 'to', 'a', 'in', 'not', 'of') and value>50:
aparitie.append((value, key))
aparitie.sort(reverse=True)
pprint(aparitie)

Pentru analiza mai avansată a datelor din MongoDB se poate utiliza pachetul pandas.
Conexiunea cu MongoDB se gestionează de către pachetul PyMongo, iar datele din cursor se
încarcă într-un DataFrame Pandas astfel:
df = pd.DataFrame.from_dict(list(cursor))

Exemplul 10. Majorați cu 10% pretul manoperei pentru autoturismele fabricate inainte de
2010 și care au componenta BATTERY defectă.
import pymongo
import pandas as pd
from pprint import pprint
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
db = conn["daune_leasing"]
collection = db["clienti_daune"]
projection = {"_id": 0,
"AN_FABRICATIE": 1,

10
"MARCA": 1,
"COMPONENTA": 1,
"PRET_MANOPERA": 1
}
sort = [("MARCA", 1)]
cursor = collection.find({}, projection=projection, sort=sort)
#incarcam in dataframe inregistrarile din cursor
df = pd.DataFrame.from_dict(list(cursor))
cursor.close()
pprint (df.loc[(df['AN_FABRICATIE'] < 2010) & (df['COMPONENTA']
=='BATTERY'), 'PRET_MANOPERA'])
df.loc[(df['AN_FABRICATIE'] < 2010) & (df['COMPONENTA'] =='BATTERY'),
'PRET_MANOPERA']=df.loc[(df['AN_FABRICATIE'] < 2010) & (df['COMPONENTA']
=='BATTERY'), 'PRET_MANOPERA']*1.10
pprint(df.loc[(df['AN_FABRICATIE'] < 2010) & (df['COMPONENTA']
=='BATTERY'), 'PRET_MANOPERA'])
df.to_csv('clienti_daune_mod.csv')

Exemplul 11: Modificați exemplul de mai sus astfel încât condiția de regăsire a datelor să
fie inclusă în clauza find({}) utilizată la încărcarea datelor din MongoDB.
În acest caz, setul de date încărcat în DataFrame-ul din pandas este redus și nu mai este
necesară localizarea datelor cu df.loc.
Fișierul excel salvat va conține doar autoturismele selectate.
import pymongo
import pandas as pd
from pprint import pprint
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
db = conn["daune_leasing"]
collection = db["clienti_daune"]
projection = {"_id": 0,
"AN_FABRICATIE": 1,
"MARCA": 1,
"COMPONENTA": 1,
"PRET_MANOPERA": 1
}
sort = [("MARCA", 1)]
cursor = collection.find({"COMPONENTA": "BATTERY",
"AN_FABRICATIE": {'$lt': 2010}}, projection=projection,
sort=sort)

df = pd.DataFrame.from_dict(list(cursor))
cursor.close()
pprint (df)
df['PRET_MANOPERA']=df['PRET_MANOPERA']*1.10
pprint(df)
df.to_csv('clienti_daune_mod.csv')

Exemplul 12. Folosind agregările din MongoDB încărcați într-un DataFrame marca
autoturismelor, valoarea totală a daunelor și pretul manoperei pe fiecare marcă.
Introduceți o nouă coloană în df denumită PROCENT_MANOPERA în care să calculați
ponderea manoperei din valoarea totală a daunelor pe fiecare marcă. Ordonați setul de date
în ordinea descrescătoare a acestui procent și salvați datele într-un fișier .csv
import pymongo
import pandas as pd
from pprint import pprint
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
db = conn["daune_leasing"]

11
collection = db["clienti_daune"]
pipeline=[{'$group' : {
"_id" : "$MARCA",
"VALOARE_MANOPERA": { '$sum': "$PRET_MANOPERA" },
"VALOARE_DAUNA": { '$sum': "$VALOARE_DAUNA" }
}},
{ '$sort': {"_id": 1}}]
cursor = collection.aggregate(pipeline)

df = pd.DataFrame.from_dict(list(cursor))
cursor.close()
df['PROCENT_MANOPERA'] =df['VALOARE_MANOPERA'] / df['VALOARE_DAUNA']*100
pprint (df)

Exemplu 13. Reprezentare grafică cu bare.

Pe baza exemplului 5 de mai sus să se reprezinte mărcile și procentul manoperei doar dacă
acesta este mai mare decât 45%
import pymongo
import pandas as pd
import matplotlib.pyplot as plt
from pprint import pprint
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
db = conn["daune_leasing"]
collection = db["clienti_daune"]
pipeline=[{'$group' : {
"_id" : "$MARCA",
"VALOARE_MANOPERA": { '$sum': "$PRET_MANOPERA" },
"VALOARE_DAUNA": { '$sum': "$VALOARE_DAUNA" }
}},
{ '$sort': {"_id": 1}}]
cursor = collection.aggregate(pipeline)
#incarcam in dataframe inregistrarile din cursor
df = pd.DataFrame.from_dict(list(cursor))
cursor.close()
df['PROCENT_MANOPERA'] =df['VALOARE_MANOPERA'] / df['VALOARE_DAUNA']*100
df=df.sort_values(by='PROCENT_MANOPERA')
#extragem subsetul cu procentul >45%
df_plot=df.loc[(df['PROCENT_MANOPERA']>45)]
df_plot.plot.bar(x='_id', y='PROCENT_MANOPERA', rot=0)
plt.xlabel('MARCA')
plt.ylabel('PROCENT_MANOPERA')
plt.show()

12
Integrarea dintre MySQL și MongoDB.
Exemplul 14: Într-un df încărcați din tabela T_CLIENTI_LEASING din MySQL toți clientii
care au solicitat pentru creditare o suma mai mare decât o valoare introdusă de la tastatură.
În alt df încărcați din MongoDB daunele cu valoarea mai mare de 1000.
Realizați o joncțiune între cele două df pe coloana comună ID_CLIENT.
import pandas as pd
from pprint import pprint
#regasirea datelor din MySQL
import mysql.connector
#conexiunea cu baza de date MySQL
v_min = input("Introduceti limita pentru suma solicitata: ")
db_connection=mysql.connector.connect(
host="localhost",
user ="bdsa",
passwd="Bdsa_1234",

database="clienti_daune",port=3306,auth_plugin='mysql_native_passwor
d')

#regasire clienti si incarcare in df

sql_stm="""select * from clienti_daune.T_CLIENTI_LEASING WHERE
SUMA_SOLICITATA > %s"""
df_sql = pd.read_sql(sql_stm, con=db_connection,params={v_min})
db_connection.close()

#regasirea datelor din MongoDB

import pymongo
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
db = conn["daune_leasing"]
collection = db["clienti_daune"]
projection = {"_id": 0,
"AN_FABRICATIE": 1,

13
"MARCA": 1,
"COMPONENTA": 1,
"PRET_MANOPERA": 1,
"VALOARE_DAUNA":1,
"ID_CLIENT":1
}
sort = [("ID_CLIENT", 1)]
cursor = collection.find({"VALOARE_DAUNA": {'$gt': 1000}},
projection=projection, sort=sort)

df_m = pd.DataFrame.from_dict(list(cursor))
cursor.close()
df_m['PRET_COMPONENTE']=df_m['VALOARE_DAUNA']-df_m['PRET_MANOPERA']

#pd merge pentru cele doua surse

df = pd.merge(df_sql,df_m, left_on=df_sql['ID_CLIENT'].astype(int),
right_on=df_m['ID_CLIENT'])
pprint(df)

Exemplul 15:Transformați exemplul de mai sus într-un API Web. Introduceți suplimentar un
parametru pentru selectarea valorii minime a daunelor.
import pandas as pd
import flask
from flask import request, jsonify
import json

app = flask.Flask(__name__)
app.config["DEBUG"] = False

# home page
@app.route('/', methods=['GET'])
def home():
return '''<h1>Regasirea clientilor cu daune</h1>
<p>API pentru afisarea clientilor cu daune.</p>'''

@app.errorhandler(404)
def page_not_found(e):
return "<h1>404</h1><p>The resource could not be
foundTralala.</p>", 404

# pagina: http://127.0.0.1:5000/api/v1/resources/daune_clienti?
suma_solicitata=7000&valoare_dauna=1000

@app.route('/api/v1/resources/daune_clienti', methods=['GET'])
def api_daune_clienti():
# Verificarea parametrului introdus in URL.
if 'suma_solicitata' in request.args:
v_min = int(request.args['suma_solicitata'])
else:
return "Error: Nu a fost precizat suma minima ceruta pentru

14
creditate."
if 'valoare_dauna' in request.args:
v_dauna = int(request.args['valoare_dauna'])
else:
return "Error: Nu a fost precizat valoare minima a daunei."
# regasirea datelor din MySQL
import mysql.connector
# conexiunea cu baza de date MySQL
db_connection = mysql.connector.connect(
host="localhost",
user="bdsa",
passwd="Bdsa_1234",
database="clienti_daune", port=3306,
auth_plugin='mysql_native_password')

# regasire clienti si incarcare in df

sql_stm = """select * from clienti_daune.T_CLIENTI_LEASING WHERE
SUMA_SOLICITATA > %s"""
df_sql = pd.read_sql(sql_stm, con=db_connection, params={v_min})
db_connection.close()

# regasirea datelor din MongoDB

import pymongo
conn = pymongo.MongoClient("mongodb://37.120.249.57:27017/")
db = conn["daune_leasing"]
collection = db["clienti_daune"]
projection = {"_id": 0,
"AN_FABRICATIE": 1,
"MARCA": 1,
"COMPONENTA": 1,
"PRET_MANOPERA": 1,
"VALOARE_DAUNA": 1,
"ID_CLIENT": 1
}
sort = [("ID_CLIENT", 1)]

cursor = collection.find({"VALOARE_DAUNA": {'$gt': v_dauna}},

projection=projection, sort=sort)

df_m = pd.DataFrame.from_dict(list(cursor))
cursor.close()
df_m['PRET_COMPONENTE'] = df_m['VALOARE_DAUNA'] -
df_m['PRET_MANOPERA']

# pd merge pentru cele doua surse

df = pd.merge(df_sql, df_m,
left_on=df_sql['ID_CLIENT'].astype(int), right_on=df_m['ID_CLIENT'])
ljson = df.to_json(orient='records')
return jsonify(json.loads(ljson))

app.run()

15
Teme propuse:

1. Pe baza colecției clienti_leasing din MongoDB, încărcați într-un df numele, suma

solicitată, suma din depozite și fidelitatea clienților cu vârsta > 35 de ani care au solicitat un
credit mai mare de 15.000$. Verificați în df dacă suma din depozit este mai mare decât suma
solicitată și pentru acești clienți modificați fidelitatea în 5. Salvați setul de date într-un
fișier .csv (clienti_leasing.csv).
2. Pe baza colecției clienti_leasing din MongoDB, încărcați într-un df profesia, venitul
anual, suma din depozite și suma solicitată pe fiecare profesie. În df adăugați o nouă coloană
pentru a calcula gradul de îndatorare pe fiecare profesie
(suma_solicitata/(venit_anual+suma_depozit)*100). Reprezentați grafic gradul de îndatorare
pe fiecare profesie.
3. Pe baza colecției clienti_daune din MongoDB, încărcați într-un df marca, modelul,
valoarea totală și numărul de daune pe fiecare model și marcă fabricate între 2010 și 2012.
Afișați numărul de autoturisme pentru care valoarea totală depășește 30.000$. Reprezentați
grafic modelele care au înregistrat mai mult de 100 de daune.
4. Pe baza colecției clienti_daune din MongoDB, într-un df marca, modelul, anul de
fabricație, componenta, prețul total și prețul manoperei pentru autoturismele din mărcile
AUDI, BMW, FORD, FIAT. Calculați procentul manoperei din prețul total.
5. Modificați exemplele 5 și 15 astfel încât tabela T_CLIENTI_DAUNE din MySQL să fie
înlocuite cu tabela similară din baza de date Oracle din schema student_ps utilizată în
seminarul 2.

16
Pași pentru configurarea utilizatorului bdsa și a tabelei T_CLIENTI_LEASING utilizată
în seminar
Descărcați și instalați MySQL Community Server: https://dev.mysql.com/downloads/mysql/ .
Versiunea curentă este 8.0.19

Pentru configurarea și interacțiunea cu MySQL instalați MySQL Workbench

https://dev.mysql.com/downloads/workbench/ O altă opțiune este PhP MyAdmin:
https://www.phpmyadmin.net/downloads/

1. Creare utilizator nou:

Ne conectam in MySQL Workbench cu utilizatorul root si parola stabilita la instalare.
Din meniul Server→User Priviledges click pe butonul Add Account. Introducem detaliile
pentru noul utilizator:

user: bdsa
Password: Bdsa_1234

17
Click Apply.

2. Pentru utilizatorul nou creat, adaugam o noua schema BD pentru a putea crea in aceasta
tabelele de lucru. Click pe simbolul Create a New Schema….. sau click dreapta in zona
corespunzatoare schemelor. In fereastra aparuta completam numele schemei clienti_daune.

Click Apply.

3. Pentru utilizatorul bdsa acordam drepturi de acces pentru schema nou creata:

18
Din menul Server→User Proviledges→tab-ul Schema Priviledges, selectam utilizatorul bdsa
si butonul Add Entry. Din fereastra aparuta selectam schema clienti_daune:

Click OK. Din fereastra aparuta. acordam toate drepturile asupra acestei scheme si apoi click
Apply:

In schema noua cream tabela T_CLIENTI_LEASING:

CREATE TABLE clienti_daune.T_CLIENTI_LEASING (ID_CLIENT VARCHAR(20), NUME_CLIENT VARCHAR(150), PROFESIA
VARCHAR(150),

19
SEX VARCHAR(3), MONEDA VARCHAR(5), VENIT_ANUAL NUMERIC(12,2), CONT_CURENT NUMERIC(12,2), VENIT_ANUAL_RON
NUMERIC(12,2),
VAL_CREDITE_RON NUMERIC(12,2), DATA DATE, VARSTA NUMERIC, CATEGORIE VARCHAR(100), DESCRIERE VARCHAR(255),
PRESCORING NUMERIC,
SUMA_DEPOZIT NUMERIC, FIDELITATE NUMERIC, STARE_CIVILA VARCHAR(1), PROBABILITATE_CONTRACTARE_N NUMERIC
, SUMA_SOLICITATA NUMERIC, PRAG_SUMA_ACORDATA NUMERIC);

S-ar putea să vă placă și

Curs 2 BigData (Spark)
100% (1)
Curs 2 BigData (Spark)
71 pagini
IE-ID-2-2-SC-ELR0348-Tehnologii Web Front-End
Încă nu există evaluări
IE-ID-2-2-SC-ELR0348-Tehnologii Web Front-End
100 pagini
Curs SGBD
Încă nu există evaluări
Curs SGBD
155 pagini
S3 - Analiza Datelor Organizate in MongoDB Utilizand Python
Încă nu există evaluări
S3 - Analiza Datelor Organizate in MongoDB Utilizand Python
15 pagini
Grile Eabd Final
Încă nu există evaluări
Grile Eabd Final
46 pagini
MBDC MAI 211M Echipa 5 Lab 2
Încă nu există evaluări
MBDC MAI 211M Echipa 5 Lab 2
18 pagini
Stocarea Datelor in BD NOSQL-1
Încă nu există evaluări
Stocarea Datelor in BD NOSQL-1
26 pagini
Baze de Date Access Curs Mocian Ioan
Încă nu există evaluări
Baze de Date Access Curs Mocian Ioan
241 pagini
Python 4
Încă nu există evaluări
Python 4
18 pagini
Instrumente Utilizate Pentru Integrarea Datelor 6 PDF
100% (1)
Instrumente Utilizate Pentru Integrarea Datelor 6 PDF
35 pagini
Curs 3 - Python Datasources
Încă nu există evaluări
Curs 3 - Python Datasources
24 pagini
Curs 3 - Python Oracle
100% (1)
Curs 3 - Python Oracle
21 pagini
S2 - Python - Oracle
Încă nu există evaluări
S2 - Python - Oracle
14 pagini
Big Data
Încă nu există evaluări
Big Data
21 pagini
Curs 3 Nosql
Încă nu există evaluări
Curs 3 Nosql
32 pagini
Big Data Analysis
Încă nu există evaluări
Big Data Analysis
13 pagini
Curs 1-8 BD
Încă nu există evaluări
Curs 1-8 BD
111 pagini
Aplicatii SQL
Încă nu există evaluări
Aplicatii SQL
5 pagini
Tema Seminar3 MongoDB
Încă nu există evaluări
Tema Seminar3 MongoDB
5 pagini
BIG DATA IN MRU
Încă nu există evaluări
BIG DATA IN MRU
48 pagini
SQL Proiect For People
100% (4)
SQL Proiect For People
2 pagini
Proiect Soc@
Încă nu există evaluări
Proiect Soc@
28 pagini
Curs 4 - Introducere Big Data
Încă nu există evaluări
Curs 4 - Introducere Big Data
23 pagini
Baze de Date - SQL
Încă nu există evaluări
Baze de Date - SQL
39 pagini
1 - SGBD Si Integritatea Datelor
Încă nu există evaluări
1 - SGBD Si Integritatea Datelor
19 pagini
Proiect
50% (2)
Proiect
36 pagini
Tehnologia Data Warehouse
Încă nu există evaluări
Tehnologia Data Warehouse
70 pagini
Clase Abstracte Si Interfete PDF
Încă nu există evaluări
Clase Abstracte Si Interfete PDF
6 pagini
Crearea Tabelelor SQL
Încă nu există evaluări
Crearea Tabelelor SQL
28 pagini
Baze de Date Cu C#
Încă nu există evaluări
Baze de Date Cu C#
43 pagini
Big Data
Încă nu există evaluări
Big Data
11 pagini
Temă Seminar 2 - Cazacu Andrei Daniel
Încă nu există evaluări
Temă Seminar 2 - Cazacu Andrei Daniel
5 pagini
Laborator Wireshark 1
100% (2)
Laborator Wireshark 1
9 pagini
Programare Orietata Obiect
Încă nu există evaluări
Programare Orietata Obiect
60 pagini
1 - UTILIZAREA PHP CU MYSQL Pas Cu Pas
Încă nu există evaluări
1 - UTILIZAREA PHP CU MYSQL Pas Cu Pas
23 pagini
Analiza Volumelor Mari de Date
Încă nu există evaluări
Analiza Volumelor Mari de Date
26 pagini
Curs Oracle Bun
Încă nu există evaluări
Curs Oracle Bun
189 pagini
Proiectarea BD Limb SQL
Încă nu există evaluări
Proiectarea BD Limb SQL
95 pagini
SGBD An3 Idd Sem2-1
Încă nu există evaluări
SGBD An3 Idd Sem2-1
105 pagini
Proiect - SGBD
Încă nu există evaluări
Proiect - SGBD
23 pagini
Interogări SQL
Încă nu există evaluări
Interogări SQL
7 pagini
Curs PHP
Încă nu există evaluări
Curs PHP
54 pagini
Baze de Date (NOSQL)
Încă nu există evaluări
Baze de Date (NOSQL)
17 pagini
CURS Programare-2017-Partea I PDF
Încă nu există evaluări
CURS Programare-2017-Partea I PDF
37 pagini
! Help Java
Încă nu există evaluări
! Help Java
50 pagini
Mega Shop DOCS
Încă nu există evaluări
Mega Shop DOCS
24 pagini
Website Informatii
Încă nu există evaluări
Website Informatii
61 pagini
Curs Baze de Date Platforma ID Actual
Încă nu există evaluări
Curs Baze de Date Platforma ID Actual
111 pagini
Postgresql: Pregătit de Ion Apostol
Încă nu există evaluări
Postgresql: Pregătit de Ion Apostol
15 pagini
Raport Practica
Încă nu există evaluări
Raport Practica
27 pagini
SQL Vs NoSQL
Încă nu există evaluări
SQL Vs NoSQL
20 pagini
Intr BD 2016.Ex1.RO Raspunsuri
Încă nu există evaluări
Intr BD 2016.Ex1.RO Raspunsuri
16 pagini
CO202 - Introducere in Programarea Liniara
Încă nu există evaluări
CO202 - Introducere in Programarea Liniara
24 pagini
SQL
Încă nu există evaluări
SQL
19 pagini
Auditul Sistemelor de Gestiune A Bazelor de Date
Încă nu există evaluări
Auditul Sistemelor de Gestiune A Bazelor de Date
9 pagini
SQL - Proiect Final Rev.55
Încă nu există evaluări
SQL - Proiect Final Rev.55
4 pagini
Aplicatie Client Server Java
Încă nu există evaluări
Aplicatie Client Server Java
8 pagini
Modulul 2
Încă nu există evaluări
Modulul 2
30 pagini
Teoria Bazelor de Date
Încă nu există evaluări
Teoria Bazelor de Date
43 pagini