DaTA Scientiste-WPS Office

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 10

DaTA scientiste

Compétence très recherchée sur le marché, le data scientist murmure à l’oreille des chiffres. Sa
mission ? Créer de la valeur pour l’entreprise, non seulement à travers l’analyse et la valorisation de
données dormantes – mais aussi par le développement d’algorithmes d’intelligence artificielle et de
modèles prédictifs. Créer ce poste dans votre entreprise peut être un avantage concurrentiel majeur. À
condition de miser sur les bonnes compétences et de bien définir les objectifs du poste en fonction de
vos enjeux métiers.

Selon l’APEC, le volume d’offres d’emploi pour un poste de data scientist a augmenté de 55 % depuis
2017. La progression de la demande est même supérieure pour le métier de data analyst, avec qui le
data scientist partage une grande partie de son champ d’intervention : celui du recueil, de l’analyse et
de l’exploitation des données existantes. Le data scientist va plus loin que le data analyst en créant si
besoin de nouvelles sources de données et en y associant de nouveaux modèles d’exploitation, comme
le ferait un chercheur.

Si ces profils ont tant la cote auprès des recruteurs, c’est qu’ils sont en capacité de transformer des
données brutes ou inexploitées en sources de revenu, aussi bien au profit du marketing, de la relation
clients que des activités de production.

Un contexte favorable au développement du métier de data scientist

Du secteur bancaire à l’énergie, en passant par les services ou le e-commerce, on sait depuis plusieurs
années que le big data est un levier de croissance pour les grands groupes. Aujourd’hui, c’est aussi le cas
pour les start-ups et même pour des PME plus traditionnelles. Pourtant, plus de la moitié de l’énorme
volume d’informations stocké par le secteur privé relève du « dark data ». Il s’agit de données
sauvegardées par les entreprises mais laissées à l’abandon dans le Cloud, faute de ressources pour les
organiser et les traiter. Parmi elles, on peut citer les données de géolocalisation des clients, les fichiers
d’archives nichés dans les serveurs ou autres données textuelles issues des .pdf, des emails et de leurs
pièces jointes, des échanges de messagerie instantanée…

Dès lors qu’elles sont structurées et traitées, ces données peuvent avoir une valeur ajoutée importante,
pour créer de nouveaux services, aider à la prise de décision en interne ou identifier de nouvelles
opportunités commerciales. À l’inverse, abandonner cette gigantesque masse de données dans les
disques durs des data centers n’est pas sans risque pour l’entreprise, notamment en matière de
conformité réglementaire ou de cybersécurité. Sans compter les millions de tonnes de CO2 qu’elles
génèrent. Innovation, gestion des risques, transition écologique…c’est dans ce contexte que le métier de
data scientist prend tout son sens.

Preuve de ce besoin d’organisation de la data, selon le Data Report 2021 de Véritas, parmi les
informations stockées et traitées par les entreprises :

53 % sont des données dites obscures (dark data) ;

19 % sont considérées comme stratégiques pour le business ;

28 % sont redondantes, obsolètes ou inutiles.

Concrètement, quel est le rôle du data scientist ?

En fonction du secteur d’activité et des objectifs stratégiques de l’entreprise, la feuille de route du data
scientist est très variable. S’il est rattaché au service marketing, il peut être chargé de définir le profil des
meilleurs clients actifs selon divers indicateurs, puis de développer des modèles pour les identifier
automatiquement et leur proposer des recommandations, grâce à l’intelligence artificielle (IA). S’il
intervient au sein d’autres services opérationnels (DSI, DAF…), il s’agira peut-être d’automatiser des
processus pour détecter des fraudes, de gérer une maintenance prédictive dans le secteur industriel…
Ou de faire des projections de ventes selon diverses hypothèses, dans le cadre du lancement d’un
nouveau service ou d’une nouvelle fonctionnalité.

Pour ce faire, il extrait et structure des jeux de données disparates puis élabore et teste des algorithmes
de machine learning (des modèles d’apprentissage automatiques, fondés sur l’IA), avant de les déployer
dans les applications informatiques en interne (CRM, logiciels de gestion, etc.).

Data scientist : quel profil, quelles compétences ?

Généralement issu d’une école d’ingénieur ou d’un cursus universitaire de haut niveau en
mathématiques ou en statistiques appliquées, le data scientist a une double casquette d’informaticien et
de mathématicien. Autrement dit, il sait coder à l’aide des principaux langages de programmation déjà
utilisés dans l’entreprise (Python, Java, SQL…), tout en maîtrisant les méthodologies statistiques
complexes et la modélisation de données. Face au boom du métier depuis quelques années, de
nombreuses formations spécialisées ont vu le jour. La demande demeure toutefois supérieure à l’offre,
même si 32 000 personnes environ basées en France se présentent aujourd’hui comme data scientist
sur LinkedIn. Alors que les grandes entreprises internalisent de plus en plus ce type de postes, beaucoup
de data scientists continuent d’officier en freelance : une configuration à envisager pour vos projets
ponctuels. À condition toutefois de définir très précisément la mission et la gouvernance en amont.

Si les compétences tech sont fondamentales, c’est bien sur l’expertise métier et sur les soft skills que se
jouent aujourd’hui les recrutements des data scientists. Une grande partie de leur valeur ajoutée tient
en effet à leur capacité à échanger avec les équipes en interne, pour comprendre leurs besoins métiers
et leur apporter des solutions utiles et pérennes. Car il ne s’agit pas seulement de traiter des données
brutes, mais d’en comprendre les enjeux et d’en anticiper les usages potentiels, au service de la
stratégie d’entreprise. Esprit critique, communication, créativité et sens des affaires sont donc de mise.

L’IA (intelligence artificielle) représente une solution d’avenir pour les experts-comptables. En effet, d’un
côté, 79 % des experts-comptables constatent une augmentation de la part de conseil dans les attentes
de leurs clients1. D’un autre côté, 86 % relèvent un besoin d’une plus grande flexibilité dans la gestion
des contrats, alliant des pics de demandes avec des périodes moins chargées1. Conseil, anticipation,
flexibilité : l’IA accompagne la profession comptable !

Ainsi, l’IA, et l’automatisation digitale d’une façon générale, sont appelées à révolutionner les méthodes
de travail au sein des cabinets d’expertise-comptable. Et, de ce fait, donner aux experts-comptables des
perspectives nouvelles dans la façon de faire leur métier.

Pour bien comprendre :

L’IA, un outil de productivité et de fiabilité pour les cabinets

L’IA, à la source d’une approche nouvelle du service rendu aux clients

L’expertise comptable connaît depuis quelques années une transformation forte, induite par des
facteurs internes et externes. Le besoin d’enrichissement des tâches des collaborateurs, les évolutions
réglementaires et l’instabilité de l’environnement des entreprises induisent de nouvelles façons de
travailler.

Sage Advice publie régulièrement des articles qui rendent compte de cette révolution silencieuse. Par
exemple :
Comptabilité sociale et environnementale : un rôle majeur pour l’expert-comptable

Comment la crise a réaffirmé le rôle de conseiller stratégique de l’expert-comptable

Les nouvelles missions pour accompagner le développement de la TPE

L’IA, un outil de productivité et de fiabilité pour les cabinets comptables

tâches manuelles répétitives. Cette élimination des gestes qui rebutent de plus en plus vos
collaborateurs, en dehors de coûter du temps et de l’argent à votre cabinet, est en marche depuis déjà
quelques années, intégrées dans les solutions digitales avancées. La saisie de données et même l’export
de fichiers sont désormais maîtrisés sans erreur et sans fatigue par des applications IA basiques, que l’on
appelle les outils de RPA (Robotics Process Automation)

Désormais, l’intelligence artificielle sait même reconnaître les chemins qui permettent d’obtenir les
meilleurs résultats ou encore télécharger automatiquement des documents, comprendre les saisies et
les classer dans les bons codes comptables. L’IA ne dort jamais et ne fait pas d’erreurs.

Une deuxième application de l’IA au sein du cabinet d’expertise comptable est la perception de
corrélations ou de tendances dissimulées dans la masse de données. L’IA a bien compris que dans un
contexte donné, les mêmes causes produisent les mêmes effets !

Enfin, l’IA apparaît de plus en plus comme un outil flexible, non plus robot infatigable dédié à une tâche
unique mais plutôt comme un assistant multi-missions. Par exemple :

Extraire des données de facturation de plateformes de fournisseurs d’énergie ou de téléphonie.

Commander des formats réglementés, comme un extrait Kbis ou un RIB.

Trier des pièces comptables (factures, devis, bons de commande, bons de livraison…) au sein d’un fichier
transmis par un client.

Analyser un contrat normalisé (assurance, fourniture de services…) et extraire les informations de


gestion : échéances, clauses de révision…

Relancer un client en vue d’une échéance (TVA, clôture, paiement…).

L’IA, à la source d’une approche nouvelle du service comptable rendu aux clients
L’automatisation de tâches administratives donne aux experts-comptables la possibilité de consacrer
plus de temps et d’énergie aux tâches qui demandent de la créativité. L’analyse et l’interprétation des
données importantes, à la fois pour votre cabinet et pour vos clients, se trouvent évidemment
renforcées par une meilleure disponibilité de vos équipes.

Le recours à l’IA et autres technologies digitales avancées est ainsi perçu par 43 % des experts-
comptables comme un levier majeur de productivité1. Et 40 % d’entre vous déclarent avoir lancé un
plan d’investissement dans ce type de solution1.

Votre plus forte disponibilité à l’égard de vos clients se traduit également, et c’est une réponse adaptée
à leurs attentes, par la mise en place dans les enreprises d’indicateurs désormais prédictifs, à vocation
d’alerte, par exemple.

Ainsi, vous pouvez aider vos clients, en appliquant l’IA à leurs historiques de données en votre
possession, à :

Établir des prévisions de trésorerie

Anticiper le moment où l’entreprise pourrait manquer de liquidités

Prendre des mesures pour pallier ce problème

Globalement, vous disposez avec l’IA de ressources inédites pour aider vos clients à relever les défis
financiers avant qu’ils ne surviennent – en ajustant les dépenses ou les processus selon leurs besoins.
Regarder devant et non plus seulement derrière représente clairement une contribution stratégique de
grande valeur pour vos clients !

Conformément à l’évolution du rôle des professions du chiffre à l’intérieur des entreprises, votre
mission pourra demain sortir du strict registre de la comptabilité. Ainsi, la capacité des solutions de
comptabilité avancées à intégrer et à analyser des flux d’informations commerciales – grâce à l’IA – vous
offre l’opportunité d’élargir votre activité de conseil prédictif au-delà de la simple planification
financière, pour concerner d’autres domaines de l’entreprise.

Par exemple, si un fabricant constate une augmentation des coûts de ses fournisseurs, il pourra, grâce à
l’IA, calculer rapidement l’impact sur son activité à court terme. Ou vous pour lui. Vos
conseils seront plus précis et basés sur des données factuelles, permettant d’éviter à vos clients de se
retrouver au pied du mur.

En conclusion, l’IA permet aux experts-comptables de donner de la consistance au rôle de coach attendu
par les entreprises. La sortie de crise Covid tout juste achevée, les tensions dans l’accès aux ressources
et aux biens intermédiaires continuent de peser sur les perspectives des entreprises, en particulier les
plus petites d’entre elles. C’est le bon moment pour aborder avec l’IA une approche plus stratégique
dans l’accompagnement de vos clients !

    e

Nombreux parmi nous se retrouvent un jour en fin de master/thèse ou postdoc de bioinformatique. A ce


moment là, dans les difficultés de la recherche d'emplois on vient à se demander : "Et si je postulais à
toutes ces offres de data scientist ?"

Dans ces lignes, je vais donner mon avis de manière libre, sur pourquoi à mon sens c'est possible.

Petite provocation volontaire fortement inspirée d'autres dessins qui permet d'illustrer mon propos

Il n'existe pas un seul profil de bioinformaticien

On va se poser une petite minute et réfléchir tous ensemble à nos amis bioinformaticiens, nos collègues
et sur nous même. En quoi somme-nous des bioinformaticiens ? Nous avons tous des compétences en
statistiques, en représentation des données (le mot clef sur le CV c'est 'data vizualisation'), en analyse
big data (merci les données OMICS), en programmation/base de donnée et en biologie.

Dans votre formation avez-vous vu un seul parcours standard ?

Surprise, je crois que non, au moins sur les anciennes générations. Peut être que les nouvelles
générations de formations sortent des centaines de jeunes qui ont tous fait la même Licence et le même
Master. Mais de mon temps de petit vieux de 30 ans (cherchez l'erreur), personne n'avait la même
Licence arrivé en Master. Certains avaient des Licences de mathématiques, d'autre de biologie, d'autre
d'informatique, voire des Licences directement de biostat/biomath/bioinfo**.

Dans cette GRANDE palette de profils, nous avons tous nos sensibilités : être plus proche des stats, de la
biologie, du code à toujours tester un nouveau langage. Mais OUI, nous sommes tous un peu statisticien
(ASSUMEZ LE !), un peu informaticien et un peu modélisateur, un peu ! Certains auteurs de ce blog ont
des compétences en visualisation de donnée exceptionnelles***, et ce sont des bioinformaticiens !

Si rien que dans notre corps de métier nous avons du mal à nous définir, alors imaginez un peu a quel
point cela doit être dur pour tous ces métiers de la data relativement récents (data scientist, data
engineer).

Donc le seul conseil que j'aurais à donner est le suivant : si vous avez fait pendant un stage des analyses
statistiques sur des données en grande dimension, vous avez le droit de valoriser cette expérience
comme une expérience de 'data analyst' ! Ce conseil peut sembler simple, mais les mots clefs entre les
deux communautés comme le format de CV ne sont pas toujours les mêmes, à vous de mettre en valeur
votre expérience avec des mots qui au fond veulent dire la même chose.

Nombreux parmi nous se retrouvent un jour en fin de master/thèse ou postdoc de bioinformatique. A ce


moment là, dans les difficultés de la recherche d'emplois on vient à se demander : "Et si je postulais à
toutes ces offres de data scientist ?"

Dans ces lignes, je vais donner mon avis de manière libre, sur pourquoi à mon sens c'est possible.

Petite provocation volontaire fortement inspirée d'autres dessins qui permet d'illustrer mon propos

Il n'existe pas un seul profil de bioinformaticien

On va se poser une petite minute et réfléchir tous ensemble à nos amis bioinformaticiens, nos collègues
et sur nous même. En quoi somme-nous des bioinformaticiens ? Nous avons tous des compétences en
statistiques, en représentation des données (le mot clef sur le CV c'est 'data vizualisation'), en analyse
big data (merci les données OMICS), en programmation/base de donnée et en biologie.

Dans votre formation avez-vous vu un seul parcours standard ?

Surprise, je crois que non, au moins sur les anciennes générations. Peut être que les nouvelles
générations de formations sortent des centaines de jeunes qui ont tous fait la même Licence et le même
Master. Mais de mon temps de petit vieux de 30 ans (cherchez l'erreur), personne n'avait la même
Licence arrivé en Master. Certains avaient des Licences de mathématiques, d'autre de biologie, d'autre
d'informatique, voire des Licences directement de biostat/biomath/bioinfo**.

Dans cette GRANDE palette de profils, nous avons tous nos sensibilités : être plus proche des stats, de la
biologie, du code à toujours tester un nouveau langage. Mais OUI, nous sommes tous un peu statisticien
(ASSUMEZ LE !), un peu informaticien et un peu modélisateur, un peu ! Certains auteurs de ce blog ont
des compétences en visualisation de donnée exceptionnelles***, et ce sont des bioinformaticiens !

Si rien que dans notre corps de métier nous avons du mal à nous définir, alors imaginez un peu a quel
point cela doit être dur pour tous ces métiers de la data relativement récents (data scientist, data
engineer).

Donc le seul conseil que j'aurais à donner est le suivant : si vous avez fait pendant un stage des analyses
statistiques sur des données en grande dimension, vous avez le droit de valoriser cette expérience
comme une expérience de 'data analyst' ! Ce conseil peut sembler simple, mais les mots clefs entre les
deux communautés comme le format de CV ne sont pas toujours les mêmes, à vous de mettre en valeur
votre expérience avec des mots qui au fond veulent dire la même chose.

Tous les métiers de la data ont des compétences communes (on est tous des datas trucs)

Si l'on jouait à définir les métiers de data scientist, data manager, data engineer, data analyst,
bioinformaticien, computationnal biologist, biostatisticien ? Nous verrions un point simple : chacun de
ces métiers se base sur des briques communes.

On parle statistique, mathématique, algorithmique, modélisation (physique ?), et informatique. La


différence réside sur à quel point nos compétences sont avancées dans ces différentes briques. Cela va
définir les grands types de postes sur lesquels il est possible de candidater. A cela il faut bien sûr ajouter
une expertise données TRÈS forte selon les profils.

Nos connaissance de la Biologie sont des connaissances dans un certain système de données.
Cependant, les outils utilisés peuvent parfaitement être appliqués dans d'autres contextes. Cela nous
donne une capacité à évoluer professionnellement qu'il ne faut pas négliger.

On pourrait même pousser le vice et se dire que un bioinformaticien est une fusion d'un statisticien et
d'un informaticien gestionnaire de big data (data engineer / data scientist). La partie statistique nous
sert pour les représentations de nos données, les modélisations, et la gestion de big data pour ramasser
tout ce que les biologistes ont récolté comme data. Donc en fait, nous sommes les hybrides de plusieurs
compétences. Celles-ci sont les mêmes que l'on retrouve chez les data scientist. Par essence nous
sommes donc tous, un peu data scientist et data engineer, statisticien, et biologiste de formation.

Dans le texte 'Statistical Modeling: The Two Cultures' de Léo Breiman on retrouve le message suivant :
un scientifique pour faire de la Science se doit d'utiliser une large palette d'outils.
Les outils de data scientist et statisticien sont à mon sens les mêmes, seule la culture des communautés
change. Il suffit de taper sur son moteur de recherche préféré 'statistician vs data scientist' pour
comprendre que le débat ne converge pas vers une seule réponse.

La culture de bioinformaticien est quelque part dans cette zone la preuve avec l'excellent billet de
OMGenomics sur le sujet. Le data scientist fait du machine learning (des stats chuuut) ou du deep
learning, le bioinformaticien aussi et de plus en plus, donc nous sommes des collègues voir les mêmes
personnes selon les endroits.

Conclusion : je suis un rédacteur très biaisé !

Un lecteur bien avisé comprendra que ma perception est biaisée par un jugement très simple. Je ne me
considère ni data scientist ni bioinformaticien, ni statisticien d'ailleurs, mais un peu tout à la fois. Je me
fiche profondément de quelle étiquette me mettre et elle change selon l'humeur du moment. Pour moi
une seule chose compte : les compétences pour exécuter les missions que l'on souhaite réaliser****.

Chaque métier est on évolution constante, ce qui inclue le notre. Il faut CONSTAMMENT apprendre de
nouveaux langages, améliorer ses compétences en R / Python / le nouveau langage à la mode. Celui qui
dira le contraire et qui refuse d'apprendre une nouvelle technologie de temps en temps prend des
risques certains pour sa suite professionnelle. Dans cette perspective, nous pouvons parfaitement
candidater à tout ce que l'on veut ! La condition c'est que nos compétences correspondent aux
demandes de l'offre qui est devant nous. Nos métiers sont des métiers techniques avec une palette
d'outils assez large pour ne pas correspondre à une seule étiquette. Il faut seulement garder la
motivation pour toujours apprendre de nouvelles techniques et savoir suivre l'évolution de ce qui est
fait. Pour ça, les formations en ligne sont légions en cette époque. De plus, c'est un atout de taille pour
montrer sa motivation !

En fait, si il y avait une seule question à se poser se serait : "Est ce que je fais de la bioinformatique car
j'aime la biologie de toute mon âme? Ou car j'aime modéliser des systèmes et être proche des données?
Est ce que je pourrais très bien travailler sur d'autres sujets et que finalement ce que j'aime, c'est être
interdisciplinaire?" Si vous restez accroché a votre animal préféré 'blabla la biologie des insectes c’est
important !' c'est que vous n’êtes qu’un biologiste déguisé ;).

Petite note de fin pour les petits curieux. Après une thèse et un post doc en bionformatique, j'ai trouvé
une place en tant que data scientist dans une entreprise. Première semaine de boulot, premier sujet qui
me tombe dessus, le problème consistait à faire du clustering sur une matrice de distance, ça vous
rappelle quelque chose amis bioinformaticiens? Ca ressemble aux parties techniques de votre métiers?
OUI CAR NOUS SOMMES TOUS DES DATAS TRUCS!

Merci à nos bons relecteurs désignés volontaires de la semaine : Yo, Guillaume Devailly et Sebastien
Gradit.

Merci à nos bons admins de toujours supporter ma plume et mon caractère de bisounours mielleux et
grognons. Kumquatum, Zazo0o et Yo :).

Vous aimerez peut-être aussi