Fiche métier : Data scientist
Le big data est une richesse à condition de donner du sens et de la valeur aux données collectées. C’est le rôle du data scientist de les trier et de les interpréter pour qu’elles servent au pilotage de l’entreprise.
Pour rappel, le big data est l’ensemble des données numériques récupérées par les sites web, les applications, les capteurs physiques, les réseaux sociaux… Il peut s’agir d’informations écrites mais aussi de vidéos, d’images. L’intelligence artificielle se nourrit de la data pour accroitre ses performances.
Présentation et missions du Data scientist
Le data scientist est le profil le plus large dans les métiers de la data. On l’appelle aussi chief data scientist ou dataminer. Sa vocation est d’exploiter les mégadonnées une fois récupérées, stockées et nettoyées par le data engineer : les trier, les structurer, en extraire les plus utiles et faire des prévisions. Il s’occupe de choisir les outils d’acquisition des données, les algorithmes de tri et d’interprétation, ainsi que les solutions de conservation (data warehouse).
Son travail est absolument utile à la direction d’une entreprise puisque la data donne des orientations fonctionnelles et stratégiques (RH, gestion, marketing…).
Par exemple, dans le secteur des télécommunications, grâce aux indicateurs de consommation et aux prévisions, le service commercial est en mesure de proposer des forfaits personnalisés.
Souvent confondu avec le data analyst - spécialisé dans une catégorie de données autour d’une question business ou stratégique - le data scientist a une vision plus globale et un rôle plus transversal.
Implications business
Le data scientist intervient sur de nombreux sujets et dans des domaines divers et variés : énergie, télécommunications, médias, musique, mode, banque, assurance, tourisme, médical, transport, finance, agriculture… Le big data est un véritable raz de marée pour tous les secteurs, qui ont bien compris ses enjeux stratégiques et financiers.
Implications éthiques
La RGPD, loi qui encadre la conservation et la protection des données, a fait grand bruit. Les questions éthiques liées à la data sont effectivement nombreuses (fuites d’informations, cybercriminalité, incitations commerciales, impacts sur l’environnement…). Le data scientist doit évidemment les connaître et les prendre en compte lors de son travail. Les juristes en data et IA et les responsables de l’éthique constituent un appui solide pour des cas spécifiques et sensibles.
Les programmes d’aivancity intègrent dans leurs apprentissages toutes les composantes de l’intelligence artificielle et ses enjeux, qu’ils soient techniques, technologiques, commerciaux, éthiques ou légaux. Ce sont des formations globales et hybrides qui permettent aux futurs ingénieurs de bénéficier d’un niveau de connaissances maximal et d’un large savoir-faire.
Compétences clés
Le data scientist est un excellent statisticien et un très bon analyste. Il maîtrise au moins un langage de programmation (Python, Java, Perl, C/C++…) et le machine learning. Les algorithmes sont sa tasse de thé.
En data science, la curiosité n’est pas un vilain défaut : se poser des questions augmente le niveau d’expertise. Cerner les problèmes à résoudre et les possibilités que les données peuvent offrir sont des compétences indispensables. Patient et agile, le data scientist sait démocratiser ses conclusions pour qu’elles soient compréhensibles à tous ses interlocuteurs. La veille technologique est nécessaire et l’expérimentation contribue à l’évolution des pratiques dans son métier.
Tendances et facteurs d’évolution
Dans de petites entreprises, le data scientist est amené à tenir d’autres rôles comme celui de data miner et de data analyst. Il peut également faire partie d’une société de services, comme une SSII.
Dans une entreprise de plus grande taille, il travaille avec l’équipe big data. Devenir scrum master, c’est à dire chef de projet en big data est une des évolutions possibles. L’encadrement d’une équipe et d’un service est une suite logique dans sa carrière. L’entrepreneuriat en tant que consultant en est une autre.
L’automatisation systématique des processus de collecte et de tri devrait économiser 80 % du temps des data scientist. Une mutation de leurs tâches qui devrait leur laisser plus de place pour la créativité et la stratégie.
Entre énorme potentiel et gros enjeux, le big data est une ressource sensible. Seuls des experts comme les data scientist peuvent la manipuler en faisant cohabiter avancées technologiques et respect de l’éthique.