RGPD & IA Générative : ce que dit la CNIL
Sommaire
- Qu’est-ce qu’un système d’IA générative ?
- Quels sont les avantages de l’IA générative ?
- Quels sont les risques de l’IA générative au regard du RGPD ?
- Quels types de systèmes d’IA générative peut-on utiliser ?
- Comment choisir un système d’IA générative conforme au RGPD ?
- On-premise, cloud ou API : quel mode de déploiement est le plus conforme au RGPD ?
- Comment encadrer l’usage d’une IA générative en entreprise ?
- Comment former les utilisateurs d’un système d’IA générative ?
- Quel rôle pour le DPO dans la gouvernance de l’IA générative ?
- Comment garantir la conformité au RGPD et au règlement IA européen ?
- Ressources utiles
Qu’est-ce qu’un système d’IA générative ?
L’IA générative désigne les systèmes capables de produire automatiquement du contenu : texte, image, audio, code, vidéo… Ces modèles, comme les LLM (Large Language Models), sont qualifiés d’IA à usage général. Leur fonctionnement repose sur l’analyse de grandes quantités de données, souvent issues d’internet, de bases de données sous licence ou de conversations utilisateurs.
Quels sont les avantages de l’IA générative ?
- Créer rapidement du contenu (textes, visuels, code…)
- Traduire, reformuler ou améliorer des contenus existants
- Analyser de grandes quantités de données (ex. : résumés, catégorisation)
- Améliorer la productivité des collaborateurs
Quels sont les risques de l’IA générative au regard du RGPD ?
- Hallucinations : contenus faux mais crédibles
- Boîte noire : manque d’explicabilité des résultats
- Biais algorithmiques : discrimination possible
- Usages malveillants : deepfakes, phishing, création de malware
- Risque juridique : si des données personnelles sont utilisées sans base légale
Quels types de systèmes d’IA générative peut-on utiliser ?
- Modèle sur étagère : déjà entraîné, prêt à l’emploi (ex. : API GPT, LLaMA, Mistral)
- RAG (Retrieval-Augmented Generation) : connecté à une base de données interne
- Fine-tuning : réentraînement du modèle sur des données internes
- Modèle développé en interne : réservé aux acteurs disposant de fortes ressources
Comment choisir un système d’IA générative conforme au RGPD ?
- Sa sécurité (rejet des requêtes illégales, pas de fuite de données)
- Sa robustesse (peu d’hallucinations, citations de sources)
- L’existence d’une documentation et d’une évaluation RGPD
- La conformité de sa licence et des données d’entraînement
On-premise, cloud ou API : quel mode de déploiement est le plus conforme au RGPD ?
- On-premise : plus sécurisé, pas de transfert vers des tiers
- Cloud sécurisé : acceptable si encadré par un contrat de sous-traitance RGPD
- API publique : à éviter pour les données personnelles ou confidentielles
Pour les données sensibles, le déploiement sur site (on-premise) est à privilégier.
Comment encadrer l’usage d’une IA générative en entreprise ?
- Rédiger une charte d’usage interne
- Former les utilisateurs à la vérification des résultats
- Restreindre les données fournies au système (pas de données sensibles)
- Désactiver la réutilisation des prompts par le fournisseur
- Effectuer une analyse d’impact (AIPD) si nécessaire
Comment former les utilisateurs d’un système d’IA générative ?
- Sensibilisés aux limites de l’IA (hallucinations, biais, confidentialité)
- Formés à vérifier la qualité des réponses
- Incités à ne jamais copier-coller une sortie sans relecture
- Informés sur les prompts types autorisés par l’entreprise
Quel rôle pour le DPO dans la gouvernance de l’IA générative ?
- Il participe à l’analyse de risques (AIPD)
- Il encadre les traitements de données personnelles
- Il forme les utilisateurs et peut alerter la direction en cas de problème
Un comité éthique IA ou un référent peut être utile pour les usages sensibles.
Comment garantir la conformité au RGPD et au règlement IA européen ?
RGPD
- Vérifiez si des données personnelles sont traitées
- Interrogez le fournisseur sur l’origine et la base légale de ses données
- Réalisez un AIPD si le système a un impact significatif sur les personnes
Règlement IA (à partir du 1er août 2024)
- Respectez les exigences de transparence (ex. : mentionner si un contenu est généré par l’IA)
- Évaluez si le système est à haut risque, auquel cas des obligations supplémentaires s’appliquent
- Évitez les systèmes interdits (ex. : surveillance biométrique à distance en temps réel dans l’espace public)
Ressources utiles
- Recommandations de la CNIL sur l’IA générative
- Guide sécurité IA générative – ANSSI
- Définition du DPO