IA air-gapped : la confidentialité maximale pour votre entreprise
IA air-gapped : la confidentialité maximale pour votre entreprise
L'IA générative n'est plus une curiosité de laboratoire : c'est un outil productif qui rédige des contrats, classe des dossiers, résume des rapports techniques et assiste des opérateurs en usine. Mais chaque fois qu'une requête voyage vers le cloud, les données quittent le périmètre de l'entreprise. Pour de nombreuses organisations, c'est une limite inacceptable.
La réponse la plus radicale — et la plus sûre — n'est pas seulement d'installer un modèle sur un serveur local. C'est de créer une architecture air-gapped : un environnement d'IA physiquement et logiquement isolé d'internet et de tout réseau externe. C'est l'option qui fait de l'intelligence artificielle un actif entièrement sous contrôle interne.
Qu'est-ce qu'une architecture air-gapped pour l'IA ?
En cybersécurité, air-gapped signifie qu'un système n'a aucune connectivité réseau avec l'extérieur. Pas de Wi-Fi, pas de câble vers le LAN corporate avec sortie internet, pas de VPN, pas de DNS. La seule façon de déplacer de l'information est de façon physique et contrôlée : clés USB scannées, stations de transfert blindées ou data diode qui ne permet le passage que dans un seul sens.
Appliqué à l'IA, le modèle de langage, sa base de données vectorielle, les documents d'entreprise et les agents d'exécution résident sur un serveur ou un cluster interne. Quand un employé pose une question, l'inférence se produit à l'intérieur de ce périmètre. Aucune donnée ne sort, aucun appel API n'atteint un fournisseur distant et aucun journal de télémétrie ne franchit la frontière de l'air. C'est, littéralement, une IA isolée du réseau.
Air-gapped ne signifie pas seulement "on-premise" : la différence clé
On confond souvent "local" et "air-gapped". Un modèle on-premise peut s'exécuter dans le data center de l'entreprise et, malgré tout, avoir accès à internet pour valider des licences, télécharger des mises à jour, synchroniser des dépôts ou envoyer de la télémétrie au fabricant. C'est déjà un grand progrès par rapport au SaaS, mais cela reste un vecteur d'attaque : une vulnérabilité, un compte compromis ou une erreur de configuration peuvent ouvrir une porte.
Une architecture air-gapped ferme cette porte par conception. La machine qui héberge le modèle ne connaît pas internet. Elle ne résout pas de noms de domaine, n'accepte pas de connexions entrantes et n'établit pas de connexions sortantes. Les mises à jour s'introduisent manuellement après vérification ; les données n'entrent ou ne sortent que par des canaux physiques audités. La surface d'attaque distante est réduite à zéro.
En résumé : on-premise, c'est "à la maison" ; air-gapped, c'est "dans un coffre-fort à l'intérieur de la maison".
Quand votre entreprise a-t-elle besoin d'une IA air-gapped ?
Toutes les organisations n'ont pas besoin de ce niveau. Mais lorsque ces conditions se présentent, l'air-gapped passe de luxe technique à exigence opérationnelle :
- Données extrêmement sensibles : dossiers médicaux, dossiers judiciaires, dessins industriels, informations de défense ou secrets commerciaux.
- Cadres réglementaires stricts : RGPD en Europe, référentiels nationaux en France et en Espagne, normes sectorielles qui interdisent ou limitent le transfert transfrontalier de données.
- Confiance zéro envers les tiers : l'entreprise ne veut pas dépendre des politiques de rétention ou des accords de confidentialité d'un fournisseur externe.
- Réputation et continuité : une fuite, même indirecte, aurait un coût réputationnel ou légal insupportable.
Si ce que vous traitez ne peut pas sortir de vos locaux, l'IA non plus ne doit pas le faire.
Secteurs où l'air-gapped est indispensable
Santé. Les hôpitaux, cliniques et laboratoires gèrent des dossiers médicaux, des résultats de tests génétiques et des données de santé mentale. Intégrer l'IA pour résumer des dossiers ou assister des diagnostics sans air-gapping exposerait des informations protégées.
Secteur juridique. Les cabinets d'avocats, études et services juridiques travaillent avec des données clients, des stratégies contentieuses et des contrats confidentiels. Le devoir de secret professionnel et les lois sur la protection des données font de l'air-gapped une option naturelle.
Défense, sécurité et secteur public. Les institutions qui gèrent des informations classifiées ou restreintes ont besoin d'infrastructures conformes aux schémas nationaux de sécurité ou à des standards internationaux comme NATO Restricted. Ici, l'air-gapped est la norme, pas l'exception.
Industrie critique et OT. Les usines de fabrication, centrales électriques, réseaux de transport et systèmes SCADA combinent des technologies opérationnelles (OT) avec des systèmes d'information. Un modèle d'IA qui aide à interpréter des logs ou prédire des pannes ne doit pas offrir de pont entre le réseau industriel et l'extérieur.
Banque, assurance et fintech. Même si de nombreuses banques utilisent le cloud privé, l'air-gapped prend sens pour les modèles internes de détection de fraude, d'analyse de risque crédit ou d'investigation de blanchiment de capitaux.
Comment déploie-t-on une IA air-gapped en pratique ?
Monter un environnement air-gapped exige de la planification, mais ce n'est pas de la science-fiction. Les composants habituels sont les suivants.
Matériel et logiciel
On part d'un serveur interne avec un GPU adapté à la taille du modèle. Pour Llama 3, Mistral ou des modèles spécialisés plus petits, on peut utiliser des workstations avec une ou plusieurs GPUs, ou un petit cluster si la charge d'utilisateurs est élevée. Le système d'exploitation s'installe depuis des médias vérifiés ; on désactive tous les adaptateurs réseau sans fil et on configure un réseau interne isolé, sans passerelle par défaut vers internet.
Le logiciel d'IA inclut généralement un moteur d'inférence local (Ollama, vLLM, TGI), une base vectorielle locale (pgvector, Chroma ou Milvus déployé en interne), un système RAG pour consulter ses propres documents et, si l'on utilise des agents, une plateforme d'orchestration comme n8n configurée sans sortie internet. Chez Neurosint, nous ajoutons souvent du sandboxing pour l'exécution de code, de sorte que même un agent local ne puisse pas déplacer des données en dehors de sa cellule.
Transfert de données
Le flux d'information doit être unidirectionnel et contrôlé. Le plus simple est une station d'importation : un PC intermédiaire sans connexion au réseau productif, où les fichiers sont scannés, où les métadonnées inutiles sont supprimées et où seuls ensuite ils sont copiés vers l'environnement air-gapped via des médias physiques propres. Dans des environnements très exigeants, on emploie des data diodes : des dispositifs matériels qui ne permettent de transmettre des bits que dans une direction, empêchant tout retour.
Les résultats de l'IA sortent de la même façon : impression sur papier, export vers une clé USB auditée ou, dans des organisations plus flexibles, via une seconde station intermédiaire contrôlée par l'équipe de sécurité.
Mises à jour et maintenance
Un système sans internet ne se maintient pas tout seul. Il faut concevoir un dépôt de correctifs offline : l'équipe de sécurité télécharge les mises à jour du système d'exploitation, des bibliothèques et des modèles depuis une machine connectée, les vérifie par checksums et signatures, et les introduit dans l'environnement air-gapped selon une procédure documentée.
Les modèles de langage se mettent aussi à jour. Quand une nouvelle version d'un modèle open source apparaît, on la télécharge, on la quantifie si nécessaire et on la déploie sur le serveur isolé. Les tests se font d'abord dans un environnement de staging air-gapped avant de passer en production.
Limitations à connaître avant de se décider
L'air-gapped offre une confidentialité extrême, mais il n'est pas gratuit ni universellement confortable :
- Investissement initial plus élevé. Il faut acheter du matériel propre, configurer le réseau et consacrer du temps de spécialistes.
- Mises à jour plus lentes. Il n'y a pas de correctifs automatiques à deux heures du matin ; chaque changement exige un flux manuel.
- Pas de RAG en temps réel sur le web. Si votre cas d'usage dépend d'informations en ligne, l'air-gapped ne les couvrira pas à moins d'importer périodiquement des datasets figés.
- Plus de friction pour l'utilisateur. Uploader des documents ou sortir des résultats exige de suivre des protocoles ; ce n'est pas aussi fluide qu'une app dans le cloud.
- Dépendance à l'équipe interne. Vous avez besoin de personnes capables de gérer Linux, les réseaux, les conteneurs et les modèles d'IA, ou d'un partenaire qui le fait pour vous.
C'est pourquoi nous recommandons d'évaluer d'abord si un modèle local connecté ou un cloud privé couvre le risque. Si ce n'est pas suffisant, alors le saut vers l'air-gapped se justifie.
Conclusion : souveraineté absolue sur l'IA
L'IA air-gapped est l'extrême le plus sûr du spectre de la souveraineté technologique. Ce n'est pas l'option la moins chère ni la plus rapide, mais c'est la seule qui garantit que vos données, vos modèles et vos processus de raisonnement ne traversent jamais une ligne réseau vers l'extérieur.
Pour les hôpitaux, les cabinets, l'industrie critique, la défense ou toute entreprise qui gère un savoir stratégique, c'est une alternative réelle et mature. Et pour les PME du Pays basque et du nord de l'Espagne, qui cherchent de plus en plus à se différencier par la confiance qu'elles offrent à leurs clients, cela peut devenir un avantage compétitif tangible.
Chez Neurosint, nous concevons et implémentons des architectures d'IA open source adaptées au niveau de sécurité dont votre entreprise a besoin, y compris des déploiements totalement air-gapped. Si vous pensez que votre entreprise a besoin d'une IA isolée du réseau, contactez-nous et nous étudierons ensemble la solution la plus efficace.
Prêt pour le saut technologique ?
Ne laissez pas votre PME devenir obsolète. Nous implémentons l'infrastructure IA qui vous donnera l'avantage compétitif.
Réserver Votre Audit Gratuit