Modélisation et utilisation de ressources et services Web et indexation de données dans un contexte d’incertitude.

15 octobre 2018

Asma Omri (LIRIS - UCBL)

Il est communément admis que la production de données connait, depuis plusieurs années, un développement spectaculaire en raison de la multiplication des nouvelles technologies telles que les réseaux sociaux, les nouveaux appareils mobiles, les compteurs intelligents, les capteurs et le cloud computing. De fait, cette explosion de données devrait se poursuivre et même accélérer. S’interroger sur la façon dont on devrait traiter cette masse de qui devient de plus en plus variée, complexe et moins structurée, est alors essentiel. DaaS ( Data As A Service) peut être définie comme l’approvisionnement, la gestion et la fourniture de données présentées dans un format immédiatement consommable aux utilisateurs professionnels des organisations en tant que service. Les données retournées par ces services se caractérisent généralement par l’incertitude et l’hétérogénéité.
Nombreux sont les approches qui traitent les données selon le cycle de vie du service Web qui repose sur 6 phases à savoir la création, la sélection, la découverte, la modélisation, l’invocation et la composition des services, dans le but de résoudre le problème de volume de données, de son hétérogénéité ou de sa vitesse d’évolution. En revanche, il y a très peu d’approches qui s’intéressent à la qualité de données et au traitement de son incertitude dans le Web.
Nous nous sommes naturellement intéressés, dans cette thèse, à la question des services Web dans un contexte de systèmes distribués et hétérogènes. La principale contribution à apporter dans le cadre de ce travail de recherche est d’étudier la composition de services et/ou de ressources Web et l’indexation de données dans un contexte incertain.
Dans un premier temps, au travers des apports de la littérature, le cadre théorique relatif aux spécificités du concept de service DaaS incertain, est présenté en adoptant la théorie possibiliste. Le problème de la composition de services Web et l’impact de l’incertitude, qui peut être associée à la sortie d’un service, sur les processus de sélection et de composition des services sont explicités. Pour ce faire, nous avons proposé une approche possibiliste afin de modéliser l’incertitude des données renvoyées par des services incertains. Plus précisément, nous avons étendu les normes de description de service Web (par exemple, WSDL) pour représenter les degrés d’incertitude des sorties. Nous avons également étendu le processus d’invocation de service pour prendre en compte l’incertitude des données d’entrée. Cette extension est basée sur la théorie des mondes possibles utilisée dans les bases de données possibilistes. Nous avons également mis en avant un ensemble d’opérateurs de composition, sensibles aux valeurs d’incertitude, dans le but d’orchestrer des services de données incertains.
Dans un deuxième temps, nous avons étudié l’impact de l’incertitude sur la représentation et la manipulation des ressources Web. Nous avons défini le concept de ressource Web incertaine et proposé des mécanismes de composition de ressources. Pour ce faire, un modèle de description de l’incertitude à travers le concept de ressource Web incertaine a été présenté. Celui-ci est basé sur un modèle probabiliste où chaque ressource peut avoir plusieurs représentations possibles, avec une certaine probabilité.
Enfin, et dans un dernier temps, nous avons proposé des méthodes d’indexation documentaire des données de type Big Data. Au commencement, nous avons adopté une approche d’indexation syntaxique de données incertaines, ensuite, nous avons suivi une méthode d’indexation sémantique incertaine. Enfin, et pour booster cette démarche, nous avons proposé une méthode hybride d’indexation dans un contexte incertain.