MDK Project

Dans différents domaines d'applications, les données manipulées atteignent une échelle sans précédent, au point où il devient impossible de les traiter avec les outils classiques. Ceci a conduit à l’émergence du phénomène Big Data nécessitant de nouveaux outils pour la collecte, la valorisation et l’interrogation des données.

Les données hétérogènes collectées de façon massive ou à la volée, doivent en effet être nettoyées, croisées et enrichies, filtrées et agrégées, visualisées, analysées et fouillées pour constituer in fine des produits riches en sémantique et stratégiques pour l’analyse et la prise de décision ou la compréhension des phénomènes sous jacents. Nous passons d’un déluge de données à des océans de connaissances avec, au cœur de cette transition, de nouvelles avancées scientifiques et technologiques, porteuses d’innovations dans le monde socio-économique et scientifique. Offrir un support au continuum «données-informations-connaissances-décisions» nécessite :

  • de gérer, organiser, accéder à des masses de données issues de nombreuses sources différentes (Volume), présentant de grandes différences en terme de contenu, de structure et de sémantique (Variété),  dont le taux de variation est élevé (Velocity) et dont la qualité est plus ou moins garantie/attestée (Veracity),

  • d’en extraire des connaissances pertinentes et de la valeur ajoutée par analyse et fouille. La présence  d'imprécisions, d'incohérences, d'erreurs, d’expression d'opinions, ... rend difficile la découverte de connaissances ou la prise de décision.

Dans le domaine des STIC, les principales communautés scientifiques concernées par ces défis sont celles de la gestion de données (ou bases de données), de la recherche d’information, des  statistiques et de l’analyse de données, de la découverte de connaissance à partir de données, de l’apprentissage, de l’intelligence artificielle, ou encore de la visualisation.

Le réseau MDK a pour objectif de donner un cadre à une réflexion collective, par l’ensemble de ces communautés, sur la recherche et l’innovation dans le domaine des Masses de Données et Connaissances. Il s’agit de produire des études prospectives, de donner des recommandations et de proposer des Actions concrètes.

Données Massives & Connaissances