Chap1 Intropython - DS - 25

Ce chapitre introduit Python comme un langage de choix pour la data science, en soulignant ses caractéristiques telles que sa syntaxe claire, sa portabilité et sa forte communauté. Il présente également des bibliothèques essentielles comme NumPy, pandas, matplotlib et scikit-learn, qui facilitent le calcul numérique, la manipulation de données et l'apprentissage automatique. Enfin, il aborde les étapes nécessaires pour installer Python et les outils associés pour commencer à travailler en data science.

Transféré par

Seydina Aioune Mboup

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

7 vues10 pages

Chap1 Intropython - DS - 25

Transféré par

Seydina Aioune Mboup

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Vous êtes sur la page 1/ 10

Chapitre 1 : Introduction à

Python pour la Data Science

Dr N. BAME
Introduction
• Plusieurs langages de programmation
• Le choix d’un langage pour la realisation d’un projet depend des besoins et des
possibilités disponibles.

• Différentes raisons pour lesquelles le langage Python est considéré des meilleurs
langages à utiliser pour la data science.
Présentation de python
• Python est un langage :
• créé en 1989 par Guido van Rossum
• Première version en 1991
• conçu pour produire du code de qualité :
• syntaxe claire, cohérente et concise,
• indentation significative
• portable,
• facile à intégrer :
• Un programme écrit en Python s’intègre très facilement avec d’autres composants logiciels. Il est possible
par exemple d’utiliser directement des bibliothèques externes ou encore d’intégrer du code C ou C++
• de haut niveau,
• orienté objet
• Tous les mécanismes objet essentiels sont implémentés et toutes les données manipulées sont des instances
de classes
• et totalement libre avec une importante communauté de développeurs;
• hautement productif ;
• La conception d’applications en Python est très rapide car certains aspects de programmation sont gérés
automatiquement, comme la gestion des ressources mémoire et le typage des données,…
• dynamique.
• dans la plupart des implémentations, le code source n’est pas compilé contrairement à des langages
comme C ou Pascal, mais exécuté à la volée. On parle alors de langage interprété.
Quelques usages de Python
• Administration système :
• pour automatiser certaines tâches;
• conception de scripts système.
• Des API simples et efficaces
• manipuler des fichiers et des dossiers ;
• manipuler des programmes ;
• envoyer et recevoir des e-mails ;
• échanger des informations avec d’autres systèmes.
• Prototypage rapide d’applications ;
• Statistiques, Machine Learning, Deep Learning, calcul scientifique :
• Modélisation, data science,…
• numpy, sklearn, pandas, scipy,…
• Applications de gestion ;
• Applications web;
• django, Flask …
Pourquoi utiliser Python pour la data science ?
• Le langage de programmation Python a un fort attrait.
• Un des langages de programmation interprétés les plus populaires, avec Perl, Ruby et
d'autres.
• Python et Ruby sont devenus particulièrement populaires pour la création de sites Web à l'aide de leurs
nombreux frameworks Web, tels que Rails (Ruby) et django (Python).
• Python a développé une vaste et active communauté de calcul scientifique et d'analyse de
données.
• Python est passé d'un langage informatique scientifique de pointe à l'un des
langages les plus importants pour la data science, l'apprentissage automatique
et le développement de logiciels généraux dans les universités et l'industrie.
• Pour l'analyse des données et le calcul interactif et la visualisation des données, Python
établit inévitablement des comparaisons avec d'autres langages de programmation open
source et commerciaux et des outils largement utilisés, tels que R, MATLAB, SAS, Stata et
autres.
• L’amélioration de la prise en charge par Python des bibliothèques (telles que pandas et
scikit-learn) en a fait un choix populaire pour les tâches d’analyse de données avancées.
Pourquoi utiliser Python pour la data science ?
Modules python essentiels
numPy
• numPy a longtemps été une pierre angulaire du calcul numérique en Python.
• Il fournit les structures de données, les algorithmes et la collection de bibliothèques nécessaires à la
plupart des applications scientifiques impliquant des données numériques en Python.
• NumPy contient, entre autres:
• Un objet tableau multidimensionnel rapide et efficace ndarray
• Fonctions pour effectuer des calculs élément par élément avec des tableaux ou des opérations mathématiques
entre des tableaux
• Outils pour lire et écrire sur disque des ensembles de données basés sur des tableaux
• Opérations d'algèbre linéaire, transformée de Fourier et génération de nombres aléatoires
• Une API C mature pour permettre aux extensions Python et au code C ou C ++ natif d'accéder aux structures de
données et aux installations de calcul de NumPy
• Au-delà des capacités de traitement de tableau rapide que NumPy ajoute à Python, l'une de ses
principales utilisations dans l'analyse de données est en tant que conteneur pour les données à
transmettre entre les algorithmes et les bibliothèques.
• Pour les données numériques, les tableaux NumPy sont plus efficaces pour stocker et manipuler des
données que les autres structures de données Python intégrées.
• Ainsi, de nombreux outils de calcul numérique pour Python supposent des tableaux NumPy comme
structure de données principale ou ciblent une interopérabilité transparente avec NumPy.
Pourquoi utiliser Python pour la data science ?
pandas
• pandas fournit des structures de données et des fonctions de haut niveau conçues pour
rendre le travail avec des données structurées ou tabulaires rapide, facile et expressif.
• Depuis son émergence, il a permis à Python d'être un environnement d'analyse de données
puissant et productif.
• Les principaux objets des pandas sont le DataFrame, une structure de données tabulaire
orientée colonne avec des étiquettes de ligne et de colonne, et le Series, un objet de
tableau étiqueté unidimensionnel.
• pandas associe les idées de calcul par matrice hautes performances de NumPy aux
capacités flexibles de manipulation des données des feuilles de calcul et des bases de
données relationnelles (telles que SQL).
• Il fournit une fonctionnalité d'indexation sophistiquée pour faciliter le remodelage,
effectuer des agrégations et sélectionner des sous-ensembles de données.
• Étant donné que la manipulation, la préparation et le nettoyage des données sont une
compétence si importante dans l'analyse des données, les pandas sont l'un des principaux
objectifs de ce cours.
Pourquoi utiliser Python pour la data science ?
matplotlib
• matplotlib est la bibliothèque Python la plus populaire pour la production de graphiques et
d'autres visualisations de données bidimensionnelles.
• Il est conçu pour créer des graphiques adaptés à la diffusion.
• Bien qu'il existe d'autres bibliothèques de visualisation disponibles pour les programmeurs
Python, matplotlib est la plus largement utilisée et, en tant que telle, s'intègre
généralement bien avec le reste de l'écosystème.
Pourquoi utiliser Python pour la data science ?
scikit-learn
• Depuis le lancement du projet en 2010, scikit-learn est devenu la première boîte à outils
d'apprentissage automatique à usage général pour les programmeurs Python.
• Il comprend des sous-modules pour des modèles tels que:
• Classification: SVM, KNN, Random Forest, régression logistique, etc.
• Régression: Lasso, régression des crêtes, etc.
• Clustering: k-means, clustering spectral, etc.
• Réduction de dimensionnalité: PCA, sélection de caractéristiques, factorisation matricielle, etc.
• Sélection du modèle: recherche de grille, validation croisée, métriques
• Prétraitement: extraction de caractéristiques, normalisation
• Avec les pandas et les statsmodels, scikit-learn a été essentiel pour permettre à Python
d'être un langage de programmation productif pour la data science.
Mise en route Python
• Installation de python 3.1x

• Installation de jupyter notebook

python -m pip install --upgrade pip
python -m pip install jupyter
• Ou anaconda

• Ou

• PyCharm Commuity Edition

• Ou
• Avec vscode

Vous aimerez peut-être aussi

Cours Python - Element I & Element II COMPLET
Pas encore d'évaluation
Cours Python - Element I & Element II COMPLET
277 pages
Mathématiques: de La
100% (1)
Mathématiques: de La
26 pages
Intelligence Artificielle: Pr. Hiba Chougrad Année-Universitaire: 2021-2022
Pas encore d'évaluation
Intelligence Artificielle: Pr. Hiba Chougrad Année-Universitaire: 2021-2022
63 pages
Initiation À Python CERADEI 2024-2025
Pas encore d'évaluation
Initiation À Python CERADEI 2024-2025
44 pages
Programmation Python Pour La Data Science - Vickler, Andy
Pas encore d'évaluation
Programmation Python Pour La Data Science - Vickler, Andy
206 pages
NLTK FR
Pas encore d'évaluation
NLTK FR
16 pages
ADG Cours1 Python 2020-2021 Jusqu'Aux Ensembles
Pas encore d'évaluation
ADG Cours1 Python 2020-2021 Jusqu'Aux Ensembles
110 pages
Python - 1 An - Unité-1
Pas encore d'évaluation
Python - 1 An - Unité-1
106 pages
Pre Traitement Donnees 24 Handout
Pas encore d'évaluation
Pre Traitement Donnees 24 Handout
103 pages
PROGRAMMATION OOP PYTHON - 28-Fevrier 2022
100% (1)
PROGRAMMATION OOP PYTHON - 28-Fevrier 2022
27 pages
La Statistique Avec Python: Université de Bretagne Sud
Pas encore d'évaluation
La Statistique Avec Python: Université de Bretagne Sud
151 pages
Python Pour Les SHS - Emimien Schultz
Pas encore d'évaluation
Python Pour Les SHS - Emimien Schultz
41 pages
Installez OpenCV 4 Sur Raspberry Pi (Récupération Automatique)
Pas encore d'évaluation
Installez OpenCV 4 Sur Raspberry Pi (Récupération Automatique)
42 pages
2) Science Des Données Avec Python
Pas encore d'évaluation
2) Science Des Données Avec Python
71 pages
Python Pour La Data
Pas encore d'évaluation
Python Pour La Data
647 pages
Emmanuel Jakobowicz - Python Pour Le Data Scientist
100% (13)
Emmanuel Jakobowicz - Python Pour Le Data Scientist
300 pages
Matplotlib
Pas encore d'évaluation
Matplotlib
10 pages
Machine Learning 1-1
100% (1)
Machine Learning 1-1
364 pages
Les Matrices Avec Numpy - Python 2
Pas encore d'évaluation
Les Matrices Avec Numpy - Python 2
11 pages
Seance 2 2025
Pas encore d'évaluation
Seance 2 2025
45 pages
Une Introduction À La Conception Et À L'analyse de L'ingénierie Structurelle À L'aide de Python
Pas encore d'évaluation
Une Introduction À La Conception Et À L'analyse de L'ingénierie Structurelle À L'aide de Python
182 pages
Wa0046
Pas encore d'évaluation
Wa0046
127 pages
Bibliotheques Python
Pas encore d'évaluation
Bibliotheques Python
14 pages
MPRA Paper 76653
Pas encore d'évaluation
MPRA Paper 76653
364 pages
Cours Python P1
Pas encore d'évaluation
Cours Python P1
82 pages
Formation Python Coursera
Pas encore d'évaluation
Formation Python Coursera
85 pages
PrÃ©sentation Des Bibliothã©ques de Python v2
Pas encore d'évaluation
PrÃ©sentation Des Bibliothã©ques de Python v2
88 pages
Presentation Cours ML Licence Excellence Seance Python Seance 3
Pas encore d'évaluation
Presentation Cours ML Licence Excellence Seance Python Seance 3
40 pages
Programmer en Python Pour La DS
Pas encore d'évaluation
Programmer en Python Pour La DS
57 pages
Cours Python Data Sciences - 2021 - 2022 Seance 2
Pas encore d'évaluation
Cours Python Data Sciences - 2021 - 2022 Seance 2
68 pages
Algorithmique Et Programmation (Python)
Pas encore d'évaluation
Algorithmique Et Programmation (Python)
73 pages
TP4 Python
Pas encore d'évaluation
TP4 Python
3 pages
Langage de Programmation Objet Python-2
Pas encore d'évaluation
Langage de Programmation Objet Python-2
43 pages
Support de Cour - Fondamentaux de Python
Pas encore d'évaluation
Support de Cour - Fondamentaux de Python
74 pages
Chap1 Python
Pas encore d'évaluation
Chap1 Python
72 pages
Python Overview 3
Pas encore d'évaluation
Python Overview 3
55 pages
Cours Python MIT Pro - Partie 1
Pas encore d'évaluation
Cours Python MIT Pro - Partie 1
25 pages
Slides
Pas encore d'évaluation
Slides
32 pages
Cours Python - L2 ECO
Pas encore d'évaluation
Cours Python - L2 ECO
49 pages
Python-Partie 6 Compressed
Pas encore d'évaluation
Python-Partie 6 Compressed
45 pages
QCM Corrige
Pas encore d'évaluation
QCM Corrige
17 pages
Initiation Python I
Pas encore d'évaluation
Initiation Python I
31 pages
Programmation Avec Python S1
Pas encore d'évaluation
Programmation Avec Python S1
24 pages
Introduction TP 1 Et 2
Pas encore d'évaluation
Introduction TP 1 Et 2
30 pages
Lecture 02
Pas encore d'évaluation
Lecture 02
18 pages
Sciences Des Données Appliquées (Fondamentales) : Cours 2
Pas encore d'évaluation
Sciences Des Données Appliquées (Fondamentales) : Cours 2
21 pages
Cours
Pas encore d'évaluation
Cours
54 pages
Lecture 02
Pas encore d'évaluation
Lecture 02
18 pages
3.+syllabus Data Analyst PDF
Pas encore d'évaluation
3.+syllabus Data Analyst PDF
22 pages
Lect 02
Pas encore d'évaluation
Lect 02
18 pages
Programmation Python Cours 1 - 230226 - 144412
Pas encore d'évaluation
Programmation Python Cours 1 - 230226 - 144412
17 pages
Python Inter B3 - 1
Pas encore d'évaluation
Python Inter B3 - 1
18 pages
TP 1 Paython
Pas encore d'évaluation
TP 1 Paython
10 pages
Python Des Bases A La Maitrise-Chap1
Pas encore d'évaluation
Python Des Bases A La Maitrise-Chap1
14 pages
Python Pour La Data Science - Les Bases Du Langage - Le Data Scientist
Pas encore d'évaluation
Python Pour La Data Science - Les Bases Du Langage - Le Data Scientist
12 pages
Python 1
Pas encore d'évaluation
Python 1
5 pages
2 Python
Pas encore d'évaluation
2 Python
29 pages
Slidesgo Maitriser Python Presentation Complete Pour Lentretien Avec Le Directeur de Lecole Dinformatiqu 20240918104812787J
Pas encore d'évaluation
Slidesgo Maitriser Python Presentation Complete Pour Lentretien Avec Le Directeur de Lecole Dinformatiqu 20240918104812787J
14 pages
Chap1 Python Introduction 2023
Pas encore d'évaluation
Chap1 Python Introduction 2023
6 pages
Programme Programmation Python (Préparation Des Pré-Requis Au Développement dIA)
Pas encore d'évaluation
Programme Programmation Python (Préparation Des Pré-Requis Au Développement dIA)
5 pages
chp1 Apprendre Python
Pas encore d'évaluation
chp1 Apprendre Python
8 pages
TP1 - Traitement D'images 2024 - 2025
Pas encore d'évaluation
TP1 - Traitement D'images 2024 - 2025
2 pages
Les Structures de Données
Pas encore d'évaluation
Les Structures de Données
6 pages
Python
Pas encore d'évaluation
Python
2 pages
TP - Graph - 2020 - 2021.pdf Version 1
Pas encore d'évaluation
TP - Graph - 2020 - 2021.pdf Version 1
5 pages
Apprendre Le Langage de Programmation Python
Pas encore d'évaluation
Apprendre Le Langage de Programmation Python
5 pages
Python
Pas encore d'évaluation
Python
2 pages
Introduction Python
Pas encore d'évaluation
Introduction Python
2 pages
Exercice 1
Pas encore d'évaluation
Exercice 1
14 pages
Mpi 4 Py
Pas encore d'évaluation
Mpi 4 Py
6 pages
Resumé LPE BI
Pas encore d'évaluation
Resumé LPE BI
6 pages
TP2 Thermique
Pas encore d'évaluation
TP2 Thermique
4 pages
Ebook Capeo TM Bot Trading MT5
Pas encore d'évaluation
Ebook Capeo TM Bot Trading MT5
5 pages
Programmation Objet - TD - Sujet
Pas encore d'évaluation
Programmation Objet - TD - Sujet
10 pages
Projet Image Processing 2024 2025
Pas encore d'évaluation
Projet Image Processing 2024 2025
5 pages
Lesmodulesenpythone 1
Pas encore d'évaluation
Lesmodulesenpythone 1
11 pages
Informatique Tsi 2025 CCINP
Pas encore d'évaluation
Informatique Tsi 2025 CCINP
12 pages
Econométrie Sous R Et Python
Pas encore d'évaluation
Econométrie Sous R Et Python
2 pages
Recherche GPT Du Projet D'algebretensoriel
Pas encore d'évaluation
Recherche GPT Du Projet D'algebretensoriel
27 pages
Rapport Face Recognization
Pas encore d'évaluation
Rapport Face Recognization
7 pages
TD Numpy Matplotli Corrigé
Pas encore d'évaluation
TD Numpy Matplotli Corrigé
6 pages
Chapitre 12 Ondes Mécaniques Activité 2 Python
Pas encore d'évaluation
Chapitre 12 Ondes Mécaniques Activité 2 Python
3 pages
TD NUMPY Image
Pas encore d'évaluation
TD NUMPY Image
2 pages
Examen Python Avance
Pas encore d'évaluation
Examen Python Avance
3 pages
Python Pour Les Débutants
D'Everand
Python Pour Les Débutants
TUDOR MARCIANTI
Pas encore d'évaluation
Maîtriser Python: Guide Complet: La collection informatique
D'Everand
Maîtriser Python: Guide Complet: La collection informatique
Christopher Ford
5/5 (1)
Python Pour Débutants
D'Everand
Python Pour Débutants
Alex Coder
Pas encore d'évaluation
Python pour les Débutants
D'Everand
Python pour les Débutants
Alex Wilson
Pas encore d'évaluation
MAITRISER Python : De l'Apprentissage aux Projets Professionnels
D'Everand
MAITRISER Python : De l'Apprentissage aux Projets Professionnels
YVES SITBON
Pas encore d'évaluation