La science des données ou data science en anglais a émergé avec l’apparition d’Internet et l’augmentation du volume de données numériques disponibles, dans des domaines très divers. Alors que le stockage et la conservation de ces données étaient les principales questions au départ, c’est maintenant les problématiques de leur exploitation et de leur analyse qui apparaissent comme des enjeux primordiaux.
Les emplois engendrés par l’essor de ces nouvelles sciences des données nécessitent des compétences techniques et stratégiques pluridisciplinaires. Les étudiants en data science peuvent accéder à une large variété de métiers, aussi bien dans le domaine de la recherche, que dans les secteurs privés et publics.
La science des données, ou data science, est l’étude des données et de la manière dont nous pouvons en extraire des connaissances. Fondée sur des techniques et des théories émanant de plusieurs disciplines et champs d’expertise, elle utilise : les mathématiques, l’informatique (recours aux outils de programmation R et Python), les sciences statistiques et les probabilités, la data engineering, l’intelligence artificielle (IA), le machine learning et la programmation.
Cette discipline est issue de l’apparition et du développement des bases de données et d’Internet et répond aussi à la complexité croissante et au volume en croissance exponentielle du nombre de données numériques disponibles dans le monde (infobésité).
Elle a reçu beaucoup d’attention dernièrement grâce à l’intérêt grandissant pour les « données massives ». Cependant, la science des données (datasciences) ne se limite pas à l’étude de bases de données pouvant être qualifiées de « données massives ».
Par ailleurs, l’essor de techniques d’apprentissage automatique et d’intelligence artificielle a également participé à la croissance de cette discipline et à son ouverture, vers de nouveaux champs d’application en passant, par exemple, de l’analyse statistique pure de données fortement structurées à l’analyse en données semi-structurées connectée et vers l’agencement et la présentation de ces données.
Cette dernière étape est relativement plébiscité par la discipline nommé data-visualisation. À la croisée des mathématiques, de l’informatique et des technologies de l’information, La data science, ou science des données, est la collecte, la gestion et l’analyse de connaissances d’un ensemble de données. Face à l’augmentation du volume de données numériques, de nombreux métiers spécialisés dans la data science ont fait leur apparition.
Datascientest, LebigData proposent leurs définitions ici.
Si vous souhaitez observer le contenu d’un dataset, nous mettons à disposition nos données liées à la publicité en ligne ici