SC22 - Méthode générique d’amélioration de l’interopérabilité des bases de données médicales et écologiques et application sur données françaises

Thème : Méthodes et outils de la recherche

Introduction

La disponibilité de bases de données de grandes dimensions et le développement important de la réutilisation de données et du géoréférencement ont ouvert des perspectives dans l’analyse spatiale en santé. Cependant, les études à fine échelle avec des données écologiques et médicales sont limitées par le change of support problem et le manque d’interopérabilité entre unités spatiales. Les méthodes de désagrégation spatiale pour résoudre ce problème introduisent des erreurs dans l’estimation spatiale. De plus, il existe un manque de cadre d’étude dans ces situations. Nous présentons ici une méthode générique d’agrégation à 2 étapes permettant de fusionner des bases de données médicales et écologiques avec un schéma standard sans utiliser de modèles de désagrégation spatiale tout en maximisant la résolution spatiale

Méthodes

Premièrement, une table de correspondance est construite après identification d’une ou plusieurs matrices de passage. Cette table relie les unités spatiales des bases de données originales avec les unités spatiales de la base de données finale.

Deuxièmement, la table de correspondance est validée par la comparaison de variables contenues dans les 2 bases de données initiales et la vérification de la validité spatiale avec un critère de continuité spatiale et un critère de résolution spatiale.

Résultats

Nous avons utilisé cette méthode pour fusionner une base de données médicales (le programme médicalisé des systèmes d’information contenant 5 644 unités spatiales) avec une base de données écologiques (issue de l’Institut National de la Statistique et des Etudes Economiques contenant 36 594 unités spatiales). La table de correspondance finale aboutit à 5 632 unités spatiales. Elle a été validée par la comparaison du nombre de naissances dans la base de données médicales et dans la base de données écologiques pour chaque unité spatiale finale. La médiane [intervalle inter-quartile] de la différence relative était de 2,3% [0 ; 5,7]. Le critère de continuité spatiale était faible (2,4%) et l’indice de résolution spatiale était meilleur que pour la plupart des unités administratives françaises.

Discussions

Notre approche innovante améliore l’interopérabilité entre bases de données médicales et écologiques et facilite l’analyse spatiale à fine échelle. Nous avons montré que les modèles de désagrégation et les larges agrégations n’étaient pas nécessairement les meilleures façons de répondre au change of support problem.

Auteurs

  • GHENASSIA Adrien
  • BEUSCART Jean-Baptiste
  • FICHEUR Grégoire
  • BABYKINA Evgenia
  • CHAZARD Emmanuel
  • GENIN Michaël

Mots-clés

  • Méthodologie
  • Recherche en santé publique
  • Recours aux bases de données médico-administratives