Data Livre Blanc Data Sciance Intelligence Artificielle Guide Dune Ia Decomplexee Pour Votre Entreprise

Intelligence artificielle
Guide d’une IA décomplexée

pour votre entreprise
R E T O U R S D’ E XPÉ R I E NCE DE N OS CO N SULTAN TS MERITIS
Charbel El Fakhry Antony Arslanyan Abdelkader Hamadi Amady Ba
Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 1

[Sommaire]
Bio de l’auteur ___________________________________________________________________________ PAGE 03

Introduction ________________________________________________________________________________ PAGE 04
Partie 1 Comment créer un modèle IA efficient ? ___________________________________________ PAGE 05
#1 Pourquoi intégrer un modèle intelligent ? _________________________________________________ PAGE 06
#2 Quels types de données ai-je en ma possession ? _________________________________________ PAGE 08
#3 Quel type d’IA mettre en place ? ________________________________________________________ PAGE 10
#4 Quelle application et quel algorithme associer à quel type d’apprentissage ? ___________________ PAGE 12
Partie 2 Comment implémenter son modèle? ______________________________________________ PAGE 14
#1 Préparer ses données ________________________________________________________________ PAGE 15
#2 Trouver quel type de modèle tester _____________________________________________________ PAGE 17
#3 Le prototype ________________________________________________________________________ PAGE 19
Conclusion _____________________________________________________________________________ PAGE 21

[Bio des auteurs]
Charbel EL FAKHRY Data Scientist

Charbel est un spécialiste d’Intelligence Artificielle et Data science.
Il est diplômé d’un Master en IA de l’UPMC spécialisé en données, apprentissage et connaissances.
Il dispose également d’un diplôme d’ingénieur en Informatique de la Lebanese American University.
Charbel a travaillé sur de nombreux projets innovants en Machine / Deep Learning et Intelligence Artificielle, dont un système de reconnaissance d’émotions grâce à
la reconnaissance vocale et faciale, la reconnaissance des émotions de la parole et la classification de l’âge et du genre.
Il intervient sur divers projets d’IA innovants chez des grands clients principalement dans le secteur financier tels que le Crédit Agricole et la Société Générale.
Antony ARSLANYAN Ingénieur Intelligence Artificielle

Anthony est Data Scientist spécialisé dans l’entraînement de modèle Deep Learning.
Au cours de ses différents projets il a acquis une expertise dans le domaine du NLP (traitement du langage) principalement en utilisant Bert et HuggingFace,
mais également de l’expérience en Computer Vision.
Passionné, Anthony s’intéresse à tout ce qui touche à l’Intelligence Artificielle et plus particulièrement à la technologie des Transformers.
Abdelkader HAMADI Ingénieur Chercheur en Data-Science

Abdelkader est spécialisé dans les domaines de l’intelligence artificielle, la recherche d’information, la vision par ordinateur et de la data. Ingénieur, puis Docteur en
Informatique depuis 2014 ; il a rejoint Meritis 2019 en tant qu’ingénieur-conseil en Recherche et Développement.
Actuellement, il collabore avec la SNCF sur un projet innovant visant à développer des solutions de surveillance automatique du réseau ferroviaire par la fibre optique.
Précédemment, il a occupé un poste d’Attaché Temporaire d’Enseignement et de Recherche à l’université de Lorraine de 2013 à 2015. Puis a assuré un poste de
Maître de Conférence à l’université de Mostaganem (Algérie) de 2015 à 2019.
Amady BA Data Scientist et ingénieur Machine Learning

Féru de la Data, Amady est titulaire d’un Master en Ingénierie Mathématique option Data Science. Par la suite, il a eu une première expérience de 3 ans dans
une entreprise spécialisée en assurance santé en tant que Data Scientist.
Sa volonté de relever de nouveaux défis est en effervescence permanente. Ainsi en 2021, il rejoint Meritis en tant que Consultant en Data Science.
Aujourd’hui, Amady accompagne nos clients à mettre en place des projets R&D allant de la conception jusqu’à l’industrialisation.

[Introduction]
Introduction
Le 8 novembre 2021, le Gouvernement lançait la Une proportion alarmante mais néanmoins étonnant quand on sait
deuxième phase de sa stratégie nationale pour l’IA. qu’en 2021, 71 % des entreprises exploraient ou exploitaient déjà
Objectif : accroître le nombre de talents formés dans ce le potentiel de l’IA ! L’IA n’est aujourd’hui plus une chimère ou un
domaine, et transformer le potentiel de recherche et fantasme hollywoodien, mais bel et bien une technologie de plus en
développement en succès économiques. Une ambition à plus mature et surtout un levier de création de valeur hors norme…
laquelle l’État prévoit de consacrer au total 2,22 milliards à condition de réussir sa mise à l’échelle. En effet, passer du PoC à
d’euros sur cinq ans. la phase d’industrialisation implique de maîtriser les algorithmes et
surtout de ne pas brûler les étapes.
Pourquoi un tel plan en faveur de l’intelligence artificielle ? Parce
que le constat est aujourd’hui sans appel : 85 % des projets d’IA C’est là que les entreprises bloquent le plus souvent, faute de
échouent et aboutissement à des résultats erronés en raison ressources et de moyens en interne, mais aussi de « savoir faire ». Par
de préjugés dans les données, des algorithmes ou des équipes où commencer ? Quels prérequis pour réussir son passage à l’IA ?
responsables. Résultat, seuls 15 % des cas d’utilisation tirant parti Quelles sont les best practices et les erreurs à éviter ? Comment
des techniques d’IA impliquant des environnements Edge et IoT faire de l’IA un facteur d’aide à la décision stratégique ? Autant de
parviennent à passer en production. questions auxquelles elles ont souvent du mal à répondre et qui
affectent les performances de leurs modèles intelligents.
Sur la base des retours d’expérience terrain de nos experts, découvrez

toutes les étapes pour réussir la mise en place de modèles efficients
jusqu’à leur mise en production.

[Partie 1]
Comment créer
un modèle IA efficient ?

[Question #1]
Pourquoi intégrer Selon les prévisions d’IDC, le volume de
données mondiales devrait dépasser 180
un modèle intelligent ? zettaoctets à l’horizon 2025, soit une croissance
annuelle moyenne de près de 40 % sur cinq ans.
Une masse exponentielle impossible à exploiter
sans l’aide de l’IA.
Les avantages majeurs de l’IA
1 Apporter une aide à la prise de décision stratégique

Comment tirer le meilleur parti de ses données lorsque l’on doit composer avec
[Partie 1]
des milliers voire des millions de données ? Voilà l’atout n°1 de l’IA : faciliter et Les principaux cas d’usage de l’IA
accélérer les prises de décision en triant les données selon leur pertinence et en
apportant rapidement aux décideurs une information qualifiée.
La liste est loin d’être exhaustive, mais certains
secteurs sont déjà bien avancés dans l’utilisation de
l’IA. Par exemple :
2 Exploiter les données de façon optimale è La finance avec la détection des fraudes ou la
prédiction du stock market pour les jours à venir ;
Collecter les données, c’est bien, mais savoir les exploiter, c’est mieux. Or
impossible désormais de traiter les Téraoctets de data qui transitent sur l’ensemble
è La médecine pour trouver des anomalies dans les
molécules, détecter des facteurs à risque dans
des canaux de l’entreprise (réseaux sociaux, objets connectés, service client,
certaines maladies…
site e-commerce...). Le risque pour l’organisation ? Passer à côté d’informations
stratégiques. Un agent intelligent permettra alors d’identifier de nouvelles pistes è Le retail via la recommandation automatique :
d’exploration auxquelles n’auront pas accès vos concurrents. suggestion de visites à effectuer ou de contenus
à visionner, services associés à un achat, produits
complémentaires…
3 Automatiser les process

In fine, l’intelligence artificielle permet surtout d’automatiser les tâches
chronophages et à faible valeur ajoutée. À la clé : un gain de temps précieux et
la possibilité pour les équipes de se concentrer sur leur cœur métier. L’IA permet
ainsi de réaliser certaines tâches jusqu’alors impossibles à réaliser manuellement.

[Question #1]
L’avis de l’expert
Les entreprises les plus matures
Nous faisons face aujourd’hui à de en IA ont vu leur chiffre d’affaires
très gros volumes de données. Pour Amady Ba
Consultant
augmenter jusqu’à
effectuer des analyses prédictives,
50
Data Scientist
%
les entreprises n’ont désormais & Machine
Learning
plus le choix et doivent recourir à Engineer
des modèles IA, notamment dans
des campagnes de prévention
santé. Pour accompagner au mieux leurs adhérents,
des mutuelles anticipent ainsi leurs potentiels
problèmes de santé par le biais de campagnes de par rapport
prévention faisant appel à des modèles IA. À la clé :
la capacité à détecter les pathologies à risque pour
à celui de leurs pairs.
l’adhérent et lui proposer un accompagnement adapté.
Source : Rapport de recherche Accenture, juin 2022
Asset management : guidel’ESG
: pourquoi d’uneest
IA devenu
décomplexée
un passage
pour votre
obligéentreprise 7
[Question #2]
Quels types de données Avant de mettre en place un modèle intelligent,
la première étape consiste à dresser un état des
ai-je en ma possession ? lieux précis des différents types de données
disponibles afin d’opter par la suite pour le
modèle le plus adapté.
Les différents types de données

Les étapes de traitement des données
[Partie 1]
1 Les données structurées Que souhaitez-vous faire de vos données ? Quel est l’objectif
Il s’agit des données disponibles dans les bases de données souhaité ? Quel est le cas d’usage associé ? Vos données sont-elles
relationnelles, bien organisées sous forme de ligne de table étiquetées ou non ? Pour mettre en place un modèle d’intelligence
artificielle efficient, vous devez au préalable décider quelles données
(par exemple : nom, prénom, âge…).
utiliser et dans quel contexte.
Ensuite, suivez le guide pour parvenir à des données de qualité :
Les données semi-structurées è D’abord, il importe de comprendre le métier autant que vos données :
2
si vous souhaitez construire un modèle, vous devez d’abord connaître le
Ces données font écho à un format particulier de type clé- domaine concerné et son contexte. Dans un environnement médical par
valeur le plus souvent utilisé pour envoyer des messages exemple, seul un expert sera capable de dire quelle donnée est fausse,
entre serveurs et clients. incomplète…
è Puis, vous pouvez collecter, nettoyer et enrichir les données.
è Enfin, vous pouvez passer à la construction des indicateurs (ou des
features) selon les différents scénarios établis.
3 Les données non structurées
Un travail souvent négligé alors qu’il représente 80 % de la performance
De quoi s’agit-il ? Tout simplement de tous les autres types
d’un modèle. De la qualité de vos données découle l’efficacité de
de format de données : images, vidéos, PDF, documents,
votre agent intelligent. La préparation et l’exploration des données
e-mails, etc. constituent ainsi la première phase de construction de votre modèle.

[Question #2]
Je travaille principalement sur des

données non-structurées souvent Antony
Arslanyan Les lacunes dans la gestion
difficiles à aborder. C’est pourquoi,
avant de commencer le travail de
Ingénieur
Intelligence des données empêchent
78
Artificielle
structuration, il est nécessaire de
prendre le temps d’analyser les
données pour éviter de créer des biais dans le modèle.
Dans le cadre d’une mission chez un assureur, nous
avions créé un agent intelligent afin d’automatiser le
%
processus d’intégration des informations issues des
documents d’identité de leurs adhérents. La première
étape consistait à reconnaître le type de document des entreprises
dont il s’agissait : passeport, permis de conduire, carte de tirer pleinement parti
d’identité... Or nous n’avions entraîné le modèle que sur de leurs données.
des papiers français. Par conséquent, les documents
étrangers n’étaient pas reconnus. Dans ce processus,
il est important de savoir que d’autres types de sources Source : ‘‘State of Enterprise CRM Data Management’’,
de données existent même si on ne les traitera jamais. réalisé par Forrester pour Odaseva, 2021
IA devenu
décomplexée
un passage
pour votre
obligéentreprise 9
[Question #3]
Quel type d’IA Maintenant que vous avez une vision claire sur la nature de
vos données, que souhaitez-vous que la machine prédise ?
mettre en place ? La question peut paraître simple, mais dont la réponse aura
un impact direct sur le mode d’apprentissage retenu.
Quel type d’apprentissage choisir ? Les étapes

pour choisir le bon type d’apprentissage
Il existe plusieurs types d’apprentissages spécifiques, mais deux
[Partie 1]
d’entre eux sont le plus souvent utilisés par les data scientists.
Attention de ne pas choisir le modèle avant les données ! Vous devez
au contraire définir le mode d’apprentissage le plus adapté selon les
données vous avez à disposition. Voici les questions à vous poser
1 L’apprentissage supervisé pour pouvoir créer le modèle adéquat :
Cette méthode s’emploie avec des données étiquetées, è Quelle tâche souhaitez-vous que le modèle intelligent exécute ?
c’est-à-dire qui contiennent déjà une valeur observée. Ici, è Quelle architecture de modèle sera la plus fonctionnelle ?
vous connaissez précisément le type d’information ou de
è Souhaitez-vous faire du deep learning ou du machine learning ?
résultat que vous voulez obtenir en sortie. Prenez alors le
(Voir section suivante pour plus de précisions sur ce point).
temps de labelliser correctement les données, c’est ce qui
vous permettra d’avoir des résultats cohérents, et de tester
Pour vous aider dans vos choix, il est important de mener une veille
ensuite. active sur les techniques déjà existantes, de lire des articles, de vous
renseigner sur ce qui se fait dans d’autres langues… pour savoir
comment ça va marcher et s’il sera facile de faire ingérer la donnée
L’apprentissage non supervisé par le modèle.
2
Autre option : le mode non supervisé lorsque vous ne savez
pas ce que vous souhaitez faire de vos données, ni comment
les exploiter. Des données qui, ici, ne sont pas étiquetées.
L’idée est alors de construire un modèle reposant sur des
habitudes de comportement pour détecter les anomalies
ou recommander un contenu similaire.

[Question #2]
Il existe un modèle intermédiaire qui

repose sur des cas semi-supervisés Abdelkader
Hamadi
pour lesquels seule une partie des Ingénieur
1entreprise2
données est étiquetée. Prenons Chercheur en
Data Science
l’exemple d’un détecteur de navette
spatiale : vous devez disposer de
suffisamment de photos pour la différencier d’un avion.
Ici, seule une partie des données est étiquetée et on
risque très certainement de se heurter à un problème de
manque de données. En effet, une méthode supervisée
imposerait de classifier les images étiquetées « non- est dans l’incapacité d’exploiter
navette spatiale » et les photos de « navette spatiale »
pour lesquelles peu de données sont disponibles.
ses propres données clients.
Certaines méthodes dites semi-supervisée existent
alors pour contourner la problématique, comme la Source : Rapport ‘‘State of Enterprise CRM Data
méthode SVM 1-class qui permet d’apprend malgré le Management’’, réalisé par Forrester pour Odaseva, 2021
manque de données.
IA devenu
décomplexée
un passage
pour votre
obligéentreprise 11
[Question #4]
Quelle application Un seul algorithme ne peut pas répondre
à toutes les problématiques. Quel modèle
et quel algorithme associer algorithmique alors mettre en œuvre selon
l’application souhaitée, le type de données
à quel type d’apprentissage ? et les objectifs souhaités ?
Les modèles liés à l’apprentissage

Des modèles liés à l’apprentissage supervisé
non supervisé
1 La classification
1 Le clustering
Ce problème se pose quand on a au moins deux voire plusieurs
L’apprentissage non supervisé est principalement utilisé
[Partie 1]
catégories en sortie. Par exemple : reconnaître si l’image est celle d’un
en matière de clustering (également appelé clusterisation chat ou d’un chien, si une donnée représente une personne malade ou
ou association). L’idée est d’associer au sein d’un même en bonne santé, etc.
dataset des données qui se ressemblent en regroupant un
On peut également y associer la notion de segmentation qui consiste
ensemble d’éléments hétérogènes sous forme de sous-
à identifier tous les pixels associés à l’objet de la recherche dans une
groupes homogènes ou aux caractéristiques similaires.
image. On classifie alors par rapport aux pixels et non à l’image entière.
Algorithmes
Algorithmes
K-Means / Isolation Forest / DB Scan / Local Outlier
Factor (LOF) Régression logistique / Support Vector Machine (SVM) / Arbre de
décision / Random Forest / GBM / Naïve Bayes
2 La réduction de dimensions 2 La régression

L’apprentissage non supervisé peut aussi permettre Ce problème permet de prédire une valeur continue. Par exemple : quel
d’améliorer les performances de l’apprentissage supervisé est le prix d’une maison. La régression linéaire, très simple à mettre en
dans le cas d’un grand nombre de paramètres en entrée. place, est souvent le premier algorithme que l’on apprend quand on
La technique du regroupement ou de réduction est alors manipule du machine learning.
utilisée pour réduire le nombre total de dimensions.
Algorithmes
Régression linéaire / Arbre de décision / Random Forest / GLM :
modèle linéaire généralisé / Gradient Boosting Machine (GBM)

[Question #4]
Le choix d’un algorithme dépend de la

Seulement
50
problématique et du type de données, Abdelkader
%
Hamadi
et impose de bien connaître l’état de Ingénieur
l’art. Certains modèles algorithmiques Chercheur en
Data Science
fonctionnent très bien pour certaines
problématiques données. Cette
connaissance peut vous faire gagner beaucoup de
temps. Essayez donc toujours d’observer la performance
de vos modèles sur des données similaires ou à partir des décideurs déclarent que leur
de problématiques semblables. Si votre modèle n’a organisation est engagée dans
jamais été traité, élaborez des hypothèses et testez des
une démarche de valorisation des
modèles différents pour voir quelle catégorie donne la
meilleure performance. données.
Source : Étude OpenDataSoft, décembre 2021
IA devenu
décomplexée
un passage
pour votre
[Partie 2]
Comment
implémenter son modèle ?

[Question #1]
Préparer Maintenant que vous avez une vision 360 de vos données, il est temps
de préparer vos données. Comment ? Tout dépend des objectifs liés à
ses données votre cas d’usage.
Comment préparer vos données ?

4 Labéliser les données
1 Bien comprendre ce qui est attendu (en apprentissage supervisé)
C’est la première étape incontournable de votre IA. Pour chaque nouvelle tâche, fonctionnalité, N’oubliez pas de prendre en compte l’évolution
projet… il importe d’échanger avec les métiers pour comprendre précisément ce qu’ils des données dans le temps : vous devez donc
[Partie 2]
attendent. Dès lors, à vous d’identifier les cas complexes et de les checker avec la MOA travailler avec des données actuelles et passées,
pour être certain de bien cadrer les objectifs souhaités. et prévoir comment elles peuvent évoluer dans
les années à venir.
2 S’assurer de la qualité des données

A-t-on du bruit dans nos données (c’est-à-dire des informations dont on n’a pas besoin pour
Un exemple de préparation
construire le modèle), des doublons, des informations incomplètes, des erreurs… ? Les big
data imposent de filtrer pour avoir les bonnes performances au risque de rencontrer des
des données
problèmes de classification. Ce qui est informatif, c’est ce qu’on ne sait pas. En ce sens, la
sélection des features, c’est-à-dire des informations utiles, permet de supprimer les données Il existe de nombreux exemples de préparation,
inutiles. comme la stratification qui permet de créer des
échantillons d’apprentissage équilibrés. En réalité,
tout dépend du type de données : texte, image,
vidéo, etc. Si on a des images, le risque majeur
3 Vérifier que l’on dispose de suffisamment de données est d’avoir des matrices qui font des centaines de
milliers de lignes, soit des giga-octets de données,
L’intelligence artificielle implique un grand volume de données. Dans le cas inverse, il est ce qui peut compliquer le traitement. Il faut alors
alors possible d’utiliser certaines techniques pour augmenter sa base de données, comme la redimensionner les données, prétraiter les images
Data Augmentation. Il est également possible, dans certains cas, d’affecter des valeurs sur de mauvaise qualité et les sauvegarder sur un
la base d’échantillons similaires, ou simplement de remplacer les données pour les projets format qui prend moins d’espace.
moins complexes.

[Question #1]
Le manque de données ou
Vous devez prendre soin de bien les problèmes de qualité des
Amady Ba
choisir à chaque fois les informations
Consultant données représentent
les plus pertinentes et de gérer les
20
Data Scientist
%
données manquantes. Si on prend & Machine
Learning
l’exemple de la santé : vous devez Engineer
identifier les variables qui influent
véritablement sur la maladie, comme
l’âge ou le statut socio-professionnel, pour ne retenir
que les données dont vous avez véritablement besoin.
C’est pourquoi il est intéressant de mener les deux des principaux goulots
étapes de préparation et d’analyse de front : dans la 1re,
j’identifie les informations manquantes, et dans la 2e, je
d’étranglement à l’adoption
sélectionne les plus pertinentes au regard de mon cas de l’IA.
d’usage.
Source : Rapport sur l’adoption de l’IA en entreprise,
O’Reilly, 2022
IA devenu
décomplexée
un passage
pour votre
[Question #2] Trouver quel type Le rôle du data scientist consiste à identifier le meilleur
modèle à utiliser pour un cas d’usage donné. Comment ?
de modèle tester À cette fin, plusieurs techniques sont possibles.
Comment choisir son modèle algorithmique ?

Selon Wikipédia
1 Choisir le modèle le plus simple La précision (ou valeur prédictive positive) est la
[Partie 2]
Pour choisir quel algorithme tester, optez toujours par le plus simple en premier proportion des items pertinents parmi l’ensemble
(par exemple, les arbres de décision, ou les modèles aléatoires et linéaires pour des items proposés ; le rappel1 (ou sensibilité)
est la proportion des items pertinents proposés
la régression) avant d’aller vers le plus complexe (la forêt aléatoire, les réseaux de
parmi l’ensemble des items pertinents. Ces deux
neurones) jusqu’à ce que vous trouviez le bon.
notions correspondent ainsi à une conception et
à une mesure de la pertinence.
2 Comparer les modèles

Un doute ? N’hésitez pas à mettre en place deux algorithmes ou plus, de les tester,
et de comparer les résultats pour choisir le plus performant.
3 Valider les métriques utilisées

Pour la classification, vous pouvez également utiliser
Pour déterminer quel modèle est le plus performant, vous devez au préalable vous les techniques de Spécificité et le F1 Score. Pour la
assurer que toutes les parties prenantes travaillent avec la même métrique de régression, il existe la technique R2 – coefficient de
scoring du modèle : soit la précision (accuracy), soit la sensibilité ou le rappel (recall). détermination –, le Root Mean Squared Error (RMSE
Plus la précision sera élevée, plus le modèle sera performant. ou Erreur Quadratique Moyenne - EQM), et le Mean
Absolute Error (MAE ou Erreur Absolue Moyenne).

Près de
1 000
[Question #2]
L’avis de l’expert milliards

d’opérations par seconde.
Tout d’abord, renseignez-vous sur les
Antony C’est la vitesse de calcul atteinte par
cas similaires déjà développés pour
voir quel modèle algorithmique a été
Arslanyan
Ingénieur la solution de contrôle qualité SIAS
utilisé. De la même manière, inutile Intelligence
Artificielle
Deeplearning de Clecim à base de
de faire une régression sur une image réseaux de neurones artificiels.
pour laquelle la classification sera bien
plus efficace. Il faut donc réfléchir à ce que l’on veut
faire. Le deep learning fonctionnera mieux pour des Source : L’Usine Nouvelle, juillet 2022
projets complexes. Mais pour des tâches plus simples,
le machine learning suffit amplement. Enfin, n’hésitez
pas à utiliser les modèles déjà entraînés par les GAFAM.
Vous ne disposerez jamais de la puissance de calcul
et du volume de données d’un Google. Ces modèles
sont faits pour être réentraînés et adaptés à des tâches
spécifiques, à l’image de CamemBERT et de FlauBERT
issus du modèle BERT et spécifiques au marché français. Les tips de Charbel Fakhry
Responsable du Centre de Compétences Data Science
è Pour des performances lentes mais plus précises, privilégiez les
réseaux de neurones, le random forest ou le SVM non linéaire.
è Pour des modèles rapides mais moins performants, optez plutôt pour
les arbres de décision, la régression logistique, ou le SVM linéaire.
Pour vous aider à choisir, sachez que pour les réseaux de neurones
sont majoritairement utilisés pour les données non structurées et
les big data.

[Question #3] Le prototype Avant de passer le modèle en production, vous devez tester ses
performances dans conditions les plus proches possibles de
la réalité. Objectif : détecter les erreurs avant de le déployer à
grande échelle.
Comment tester son modèle efficacement ?
Où effectuer son apprentissage :

1 sur un PC en local ou dans le cloud ? Les erreurs les plus fréquentes
Si vous possédez des machines puissantes, vous pouvez alors tester vos
[Partie 2]
modèles en local. Vous n’aurez pas de frais supplémentaires à payer. En revanche, è Céder à la facilité : les data scientists sont souvent tentés
si votre modèle est complexe et nécessite d’importants volumes de données, vous de choisir le dernier modèle tendance même s’il n’est
serez alors plus limités. pas aligné avec leurs besoins. Résultat, le test ne sera
pas probant et il faudra recommencer avec un algorithme
Si vous souhaitez en revanche bénéficier d’un environnement de travail plus différent.
configurable, plus rapide et plus flexible, privilégiez des machines virtuelles dans è Mettre en place une architecture avant le cas d’usage :
le cloud sur des serveurs dédiés. Mais attention au coût qui peut vite grimper selon c’est tout l’inverse qu’il faut faire.
la configuration souhaitée et à la sécurité des données sensibles.
è Tester le modèle sur des données non représentatives :
vous aurez alors des résultats décorrélés de la phase
d’apprentissage du modèle.
2 Tester la fonctionnalité du modèle algorithmique è Négliger la préparation et l’analyse des données :
beaucoup veulent aller trop vite et vont directement à
Quand un modèle semble suffisamment robuste, testez-le dans l’application finale
l’étape construction du modèle. Ils sont donc obligés
mais dans un environnement de préproduction pour corriger les bugs ou les biais.
d’itérer à chaque fois, soit une perte de temps énorme.
è Mal faire son jeu de test : attention à ce que votre jeu de
test soit suffisamment complet et équilibré pour s’appliquer
3 Comprendre les erreurs correctement à la vie réelle.
En cas d’erreur, il est indispensable de comprendre pourquoi le modèle les è Mélanger jeu de testing et jeu d’entraînement : si vous
a commises. Donc n’hésitez pas à retester et à réentraîner, voire à réinjecter de testez des images que le modèle connaît déjà, le résultat
sera nécessairement meilleur (et donc biaisé).
nouvelles données. Cette étape d’explicabilité du modèle est fondamentale à la fois
pour comprendre les décisions prises par le modèle.

[Question #3]
Dans certaines situations, il est très Seules
12
Abdelkader
%
difficile d’obtenir la vérité terrain : le
Hamadi
recueil de données peut s’avérer très Ingénieur
complexe car il implique des accords Chercheur en
Data Science
avec de multiples parties prenantes,
impose de nombreux déplacements,
etc. Résultat, certaines organisations
déploient parfois une vérité terrain… sans aller sur le
terrain ce qui rend les résultats approximatifs. Autre
des entreprises en 2022 utilisent
écueil fréquent : ne pas disposer de la puissante l’IA à un niveau de maturité
suffisante pour exploiter la masse de données à leur octroyant un avantage
disposition. Résultat, il est parfois nécessaire de retester
concurrentiel significatif.
sur une nouvelle plateforme plus performante, soit une
perte de temps conséquente. Les capacités matérielles
représentent un point critique de l’industrialisation de
l’IA. Source : ‘‘The Art of AI Maturity: Advancing from Practice to
Performance’’, Accenture, 2022
IA devenu
décomplexée
un passage
pour votre
Conclusion
Définir
votre stratégie de Cybersécurité
Les entreprises ont pris conscience de l’importance d’industrialiser leurs modèles IA pour
acquérir un atout concurrentiel majeur dans un contexte de plus en plus volatile, complexe
et incertain. Pour franchir ce cap de la mise à l’échelle et dépasser le stade des PoC,
elles doivent néanmoins encore progresser dans leur méthodologie et leur approche de
l’intelligence artificielle. Faut-il déployer le modèle sur un serveur local ou plutôt dans le
cloud ? Comment mettre en œuvre l’auto-apprentissage pour améliorer notre modèle au fur
et à mesure ? Où placer ce modèle dans l’architecture globale ? Peut-on faire confiance aux
GAFAM ?
Autant de questions qui freinent toujours l’adoption de l’IA malgré ses nombreux bénéfices. Heureusement,
les data scientists peuvent aujourd’hui compter sur des solutions performantes pour simplifier leurs tâches
et accélérer le passage en production, à l’image d’Hugginface qui permet d’entraîner facilement des NLP en
quelques lignes de codes, ou de Dall-e qui permet de générer des visuels très facilement et de manière très
poussée.
Reste néanmoins le problème de savoir comment adresser la complexité inhérente à l’intelligence artificielle.
Or la technologie ne peut suffire à résoudre à elle seule l’ensemble des points de difficulté. Sur la base des
démarches DevOps et DataOps, les équipes doivent repenser leur organisation pour tendre vers plus d’agilité, de
flexibilité et d’apprentissage continu. C’est toute la promesse portée par le MLOps.

Meritis, le talent Nos implantations en France
d’aller plus loin. Nous sommes présents à Paris, Nice Sophia Antipolis, Aix-en-Provence,
Nantes et Montpellier.
CONSEIL, PILOTAGE ET DÉVELOPPEMENT IT Nous intervenons également sur Bordeaux, Lille, Rennes, et Toulouse.
Meritis est une société de conseil en transformation des

Systèmes d’Information et Organisations.
è Notre approche ?
Accompagner nos clients sur l’ensemble de la chaîne de
valeur : cadrage personnalisé, pilotage & développement
applicatif pour les projets IT.
è Notre mission ?
Connecter les meilleurs talents au service de la
transformation numérique pour donner un temps
d’avance aux entreprises.
Nos +800 consultants vous accompagnent avec agilité dans

tous vos projets de transformation digitale. Un seul objectif :
vous emmener plus loin.

Nous contacter
Un projet, une question, vous souhaitez en savoir plus ?
Contactez-nous ! Nos équipes d’experts sont votre

disposition pour répondre toutes vos questions.
NOUS CONTACTER NOUS REJOINDRE
meritis.fr

Data Livre Blanc Data Sciance Intelligence Artificielle Guide Dune Ia Decomplexee Pour Votre Entreprise

Transféré par

Droits d'auteur :

Formats disponibles

Data Livre Blanc Data Sciance Intelligence Artificielle Guide Dune Ia Decomplexee Pour Votre Entreprise

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Data Livre Blanc Data Sciance Intelligence Artificielle Guide Dune Ia Decomplexee Pour Votre Entreprise

Transféré par

Droits d'auteur :

Formats disponibles

Intelligence artificielle

Guide d’une IA décomplexée

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 1

Bio de l’auteur ___________________________________________________________________________ PAGE 03

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 2

Charbel EL FAKHRY Data Scientist

Antony ARSLANYAN Ingénieur Intelligence Artificielle

Abdelkader HAMADI Ingénieur Chercheur en Data-Science

Amady BA Data Scientist et ingénieur Machine Learning

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 3

Sur la base des retours d’expérience terrain de nos experts, découvrez

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 4

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 5

Les avantages majeurs de l’IA

1 Apporter une aide à la prise de décision stratégique

3 Automatiser les process

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 6

Les différents types de données

Ensuite, suivez le guide pour parvenir à des données de qualité :

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 8

Je travaille principalement sur des

Quel type d’apprentissage choisir ? Les étapes

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 10

Il existe un modèle intermédiaire qui

Les modèles liés à l’apprentissage

2 La réduction de dimensions 2 La régression

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 12

Le choix d’un algorithme dépend de la

Source : Étude OpenDataSoft, décembre 2021

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 14

Comment préparer vos données ?

2 S’assurer de la qualité des données

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 15

Comment choisir son modèle algorithmique ?

2 Comparer les modèles

3 Valider les métriques utilisées

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 17

L’avis de l’expert milliards

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 18

Comment tester son modèle efficacement ?

Où effectuer son apprentissage :

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 19

Dans certaines situations, il est très Seules

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 21

Meritis est une société de conseil en transformation des

Nos +800 consultants vous accompagnent avec agilité dans

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 22

Contactez-nous ! Nos équipes d’experts sont votre

NOUS CONTACTER NOUS REJOINDRE

Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise 23

Vous aimerez peut-être aussi