Type d'accès

Le cas des données à risque de réidentification

Pour les données présentant un risque de ré-identification, plusieurs types d’accès sont possibles :

Des accès sur projet qui nécessitent de déposer une demande d’autorisation auprès de l'INDS, avec un processus fluide et des délais courts.

En savoir plus sur les accès sur projet

Les traitements de données à caractère personnel réalisés à des fins d’étude, évaluation ou recherche dans le domaine de la santé peuvent être mis en œuvre sans autorisation préalable de la CNIL dès lors qu’ils sont conformes à une « méthodologie de référence » publiée par la Commission.

Les projets qui ne rentrent pas dans ce cadre sont soumis à une procédure d’autorisation qui diffère selon qu’ils relèvent de l’une ou l’autre des catégories suivantes :

  • Les recherches impliquant la personne humaine (au sens des articles L.1121-1 et R.1121-1 du Code de la santé publique) : elles doivent être soumises à un comité de protection des personnes puis à la CNIL avant d’être mises en oeuvre. L’INDS n’intervient pas.
  • Les études, évaluations et recherches n’impliquant pas la personne humaine : elles doivent être soumises à l’INDS qui assure le rôle de secrétariat unique de ce type de projets.
    L’Institut les transmettra ensuite au CEREES pour avis (comité d’expertise pour les recherches, les études et les évaluations dans le domaine de la santé) puis à la CNIL, pour autorisation. 

Aller sur la plateforme de dépôt

Pour le SNDS, des accès permanents accordés à certains organismes (services de l'Etat, établissements publics et organismes chargés d'une mission de service public), avec des périmètres fixés par décret.

En savoir plus sur les accès permanents

Le décret relatif au SNDS du 26 décembre 2016 accorde en fonction des exigences des missions de service public des accès permanents aux données du SNDS à plusieurs services de l’Etat, établissements publics et organismes chargés d’une mission de service public.

Ces accès sont définis par :

  • La profondeur d’historique des données utilisées ;
  • L’aire géographique : champ de compétence territoriale pour les organismes locaux et régionaux d’Assurance maladie, les agences régionales de santé et les observatoires régionaux de santé ;
  • Les caractéristiques d’une population déterminée au regard des finalités sanitaires ou sociales du traitement ;
  • La possibilité de croiser les identifiants potentiels (= variables sensibles du SNIIRAM) :
    • mois et année de naissance ;
    • code de la commune de résidence et données infracommunales de localisation (n’existent pas actuellement dans le SNIIRAM) ;
    • date des soins ;
    • date du décès ;
    • code de la commune de décès (nouvel identifiant potentiel lié à l’intégration des causes de décès).

Liste des organismes avec accès autorisés et périmètres

Accès permanents au SNDS - rappels

Des procédures simplifiées (méthodologies de référence, autorisations uniques, échantillons et données agrégées). L’élaboration de ces procédures revient à l’INDS, en concertation avec la CNIL, en fonction des besoins de chacun.

Il existe des procédures permettant d’alléger le circuit de droit commun (INDS-CEREES-CNIL), sans contourner pour autant la nécessité pour la recherche, l’étude ou l’évaluation de présenter un intérêt public. S’agissant des données du SNDS, l’interdiction de poursuivre certaines finalités et les impératifs de transparence (sur les méthodes et les résultats) devront également être mis en œuvre et respectés.

Trois types de procédures simplifiées sont prévus par l’article 193 de la loi de modernisation du système de santé et constituent une réelle opportunité pour fluidifier le processus d’accès aux données de santé.

Il s'agit des :

1 - Méthodologies de référence

Quand les recherches, études ou évaluations sont conduites dans le cadre d’exigences législatives et réglementaires strictes, et selon des méthodologies standardisées, la Commission peut consulter le CEREES et les organismes publics et privés représentatifs afin d’adopter une « méthodologie de référence ».

Elle permet au responsable de traitement, dès lors que son projet satisfait à l’ensemble des conditions prévues par la Méthodologie de référence, de n’adresser à la CNIL qu’un simple engagement de conformité en lieu et place d’une demande d’autorisation. Cet engagement sera aussi valable pour tous ses autres traitements qui seront conformes à la méthodologie.

En contrepartie de cet allégement des formalités, le responsable de traitement doit tenir à jour une liste des traitements qu’il réalise sous couvert de son engagement de conformité et s’engage à les enregistrer dans un répertoire public (tenu par l’INDS concernant les recherches n’impliquant pas la personne humaine).

Il existe à ce jour six méthodologies de référence :

  • la MR-001, relative aux traitements de données à caractère personnel mis en œuvre dans le cadre des recherches dans le domaine de la santé nécessitant le recueil du consentement de la personne concernée;
  • la MR-002, relative aux traitements de données à caractère personnel mis en œuvre dans le cadre des études non interventionnelles de performances en matière de dispositifs médicaux de diagnostic in vitro;
  • la MR-003, relative aux traitements de données à caractère personnel mis en œuvre dans le cadre des recherches dans le domaine de la santé ne nécessitant pas le recueil du consentement de la personne concernée;
  • la MR-004, relative aux traitements de données à caractère personnel mis en œuvre dans le cadre des recherches, études et évaluations n’impliquant pas la personne humaine;
  • la MR-005, relative au traitement de données nécessitant l’accès par les établissements de santé et des fédérations aux données du PMSI et des résumés de passage aux urgences centralisées et mises à disposition sur la plateforme sécurisée de l’ATIH;
  • la MR-006, relative au traitement de données nécessitant l’accès pour le compte des personnes produisant ou commercialisantes produits mentionnés au II de l’article L. 5311-1 du Code de la santé publique, aux données du PMSI centralisées et mises à disposition par l’ATIH par l’intermédiaire d’une solution sécurisée.

Consulter sur le site de la CNIL les différents formulaires

Consulter le Répertoire public

2 - Décisions uniques

Quand la CNIL délivre à un organisme une autorisation couvrant plusieurs traitements répondant à une même finalité, portant sur des catégories de données identiques et ayant des catégories de destinataires identiques, on parle de « décision unique ».

Son principal avantage par rapport à la méthodologie de référence est que la décision unique est adaptée aux besoins d’un responsable de traitement et de lui uniquement. Elle autorise, sans limitation de volumétrie, un responsable de traitement à mettre en œuvre tous les projets qui respectent le cadre défini dans cette décision unique.

Formellement, l’obtention d’une telle décision doit passer par le circuit normal de demande d’autorisation (INDS et CEREES avant la CNIL) et les pièces constitutives du dossier sont les mêmes.

En contrepartie, le responsable de traitement s’engage à tenir la liste et les caractéristiques des traitements qu’il met ainsi en œuvre et à communiquer annuellement cette liste à la CNIL.

3 - Procédures homologuées pour l’accès à des jeux de données agrégées ou des échantillons.

Nouveauté issue de l’article 193 de la loi de modernisation de notre système de santé, la possibilité d’homologuer des procédures d’accès à certaines données est fondée sur l’idée que les échantillons, parce qu’ils ne comportent qu’une partie d’une population, ont un potentiel de ré-identification plus faible qu’une base exhaustive et peuvent donc être mis à disposition selon des procédures plus souples.

Par exemple, l’échantillon généraliste de bénéficiaires du SNIIRAM (ou « EGB ») qui est un échantillon représentatif nationalement, sur l’âge et le sexe, au 1/97ème des données du SNIIRAM présente moins de risques de réidentification que la base SNIIRAM complète. Il permet néanmoins de disposer d’informations sur le parcours de soins (ville et hôpital) de plus de 600 000 bénéficiaires sur une longue période et est donc utile aussi bien pour les institutions publiques, les chercheurs universitaires que les acteurs privés. La procédure d’homologation lui semble particulièrement adaptée et c’est pourquoi la mise en œuvre d’une telle mesure a été considérée comme une priorité par le ministère et le comité stratégique de filière (rapport du 29 mars 2017 – fiche 7).

Des travaux ont été entamés au second semestre 2017 pour élaborer une telle procédure homologuée dédiée à l’EGB. L’objectif est de la mettre en application d’ici l’été 2018.

Le cas des données sans risque de réidentification

Accès en open data

Les données pour lesquelles aucune ré-identification n’est possible, donc strictement « anonymes », sont accessibles et réutilisables par tous, en open data. A titre d'exemple, vous trouverez ci-dessous des exemples d'Open data mis à disposition par le SNDS.

Les données mises à disposition en accès libre par l’assurance maladie (Cnam)

L’Assurance Maladie propose en libre accès des bases brutes extraites du SNIIRAM permettant une exploitation détaillée des données sur les thématiques de dépenses d’assurance maladie, de médicaments, de biologie médicale ou de prescriptions hospitalières.

Les dépenses d’assurance maladie :

La base complète inter-régimes Open Damir rassemble 55 variables et 6 axes d’analyse. Ce jeu de données est une extraction du système national inter-régimes de l'Assurance Maladie (Sniiram) portant sur l'ensemble des remboursements de l'Assurance Maladie tous régimes confondus.

Consulter l'Open DAMIR 

Les dépenses du médicament :

  • Les données Medic'AM présentent des données mensuelles et annuelles détaillées sur les médicaments remboursés par l'Assurance maladie. Le fichier présente pour chaque médicament, par code CIP, la base de remboursement, le montant remboursé, le dénombrement (nombre de boites remboursées), la base de remboursement des prescripteurs de ville, la base de remboursement des autres prescripteurs.

 Consulter l'Open Medic'AM

  • Les données Open Medic sont issues du système national inter-régimes de l'Assurance maladie (SNIIRAM). Ces données présentent notamment par niveau de classe anatomique et thérapeutique et par code CIP, par caractéristique du bénéficiaire et par spécialité du prescripteur : le nombre de consommants, les montants remboursés et remboursables ainsi que le nombre de boîtes délivrées. Elle fournit des informations complémentaires au fichier Medic’AM.

Consulter l'Open Medic

 

  • Les données  Open PHMEV  proposent des informations détaillées sur les prescriptions hospitalières de médicaments délivrés en ville, avec une déclinaison par établissement prescripteur. 

Consulter l'Open PHMEV

 

Les dépenses de biologie médicale inter-régimes

  • Open Bio : base complète sur les dépenses de biologie médicale inter-régimes

L’offre de données Open Bio est constituée d’un ensemble de bases annuelles portant sur les remboursements et le nombre de bénéficiaires d’actes de biologie médicale. Les données sont extraites du système national interrégimes de l'assurance maladie (Sniiram).

Consulter l'Open bio

Les données mises à disposition en accès libre par l’ATIH

L’Agence technique de l’information hospitalière (ATIH) met à disposition des données de synthèse en accès libre, via la plateforme de restitution des données des établissements de santé Scan santé.

Consulter Scan santé

Les données mises à disposition en accès libre des Causes médicales de décès du CépiDc

Le Centre d'épidémiologie des causes médicales de décès (CépiDC), est un laboratoire de l'INSERM. Ses missions portent sur la production annuelle de la statistique des causes médicales de décès en France, ainsi que la diffusion des données et des études et recherches sur les données de mortalité.

Les données de mortalité sont diffusées via l'interface d'interrogation de données du site internet. Les effectifs de décès, les taux de mortalité bruts et standardisés, par département, région, et grandes villes depuis 1979 sont disponibles. 

Consulter l'Interrogation des données de mortalité CépiDC/INSERM