Seguretat en IA: què és un sandbox i per què la teva pime necessita un
Tens un model d'IA corrent al teu servidor. Li dones accés a la base de dades de clients. Li dones accés al sistema de facturació. Li dones accés al correu electrònic. I després et preguntes: "I si fa alguna cosa que no hauria?"
Bona pregunta. La resposta es diu sandbox.
Què és un sandbox
Un sandbox és un entorn aïllat on un programa pot executar-se sense afectar la resta del sistema. És com una habitació folrada: el que passa dins, es queda dins.
Si el model intenta accedir a un fitxer que no hauria, el sandbox el bloqueja. Si intenta connectar-se a internet, el sandbox el talla. Si intenta executar una ordre del sistema operatiu, el sandbox l'ignora. El model pot pensar el que vulgui, però només pot fer el que tu li permetis.
No és un concepte nou. Els navegadors web fan servir sandboxes des de fa dècades. Els mòbils executen cada aplicació en el seu propi sandbox. Les caixes de sorra literals existeixen perquè els nens juguin sense sortir del parc. El principi és el mateix: delimitar l'espai d'acció.
Per què la teva pime el necessita
Si fas servir ChatGPT o Claude al navegador, ja estàs fent servir un sandbox. És el proveïdor qui decideix què pot i no pot fer el model. No pots executar codi arbitrari des de la interfície web. No pots accedir al sistema de fitxers del servidor. Això és seguretat per disseny — però és el seu sandbox, no el teu. És lock-in: depens de les seves regles, no de les teves.
El problema apareix quan desplegues IA a la teva pròpia infraestructura. Allà no hi ha ningú que et protegeixi per defecte. Tu decideixes quins permisos té el model. I si li dones permisos de més, les conseqüències són teves.
Exemples concrets:
- Un agent que gestiona devolucions. Li dones accés a la passarel·la de pagaments per processar reemborsaments. Què evita que processi un reemborsament de 50.000 € a un compte arbitrari? Només les instruccions que li has donat. Si aquestes instruccions tenen un forat, el forat s'explotarà.
- Un assistent que llegeix correus. Li dones accés al correu per classificar sol·licituds. Què evita que enviï correus en nom de la teva empresa? Només una capa de permisos que potser no has configurat.
- Un model que consulta el teu ERP. Li dones accés de lectura a la base de dades. I si un prompt enginyós aconsegueix que executi una consulta DELETE? Les bases de dades no distingeixen entre un usuari i un model si tots dos tenen les mateixes credencials.
Com funciona en la pràctica
Un sandbox per a IA no és només "limitar permisos". Té capes:
1. Aïllament de xarxa
El model no necessita internet. Si està corrent localment, les seves respostes es generen a partir de les dades que ja té. Talla l'accés a la xarxa i elimines la possibilitat d'exfiltració de dades o que el model es descarregui alguna cosa que no hauria.
2. Sistema de fitxers de només lectura
El model llegeix documents, no els modifica. Munta el directori de dades com a només lectura. Si el model necessita escriure resultats, escriu en un directori separat que no afecti les dades d'origen.
3. Permisos mínims
L'agent que classifica correus no necessita accés a la facturació. El que processa factures no necessita accés a RRHH. Cada agent, els permisos estrictament necessaris. Ni un més. Això s'anomena principi de mínim privilegi i és seguretat 101.
4. Registres i auditoria
Tot el que fa el model es registra. Cada consulta, cada acció, cada accés a dades. No només per detectar problemes després dels fets, sinó per poder auditar que el sistema es comporta com hauria. Aquesta traçabilitat és indispensable per a una estratègia de compliment del RGPD seriosa.
5. Capa de validació
Abans que qualsevol acció del model s'executi realment (enviar un correu, processar un pagament, modificar un registre), passa per una capa de validació que comprova que l'acció està dins dels paràmetres permesos. El model proposa, la validació disposa.
El mite del "si és local, ja és segur"
Córrer IA localment és més segur que enviar les teves dades a un proveïdor del núvol. Això és veritat. Però no és el mateix que segur.
Local significa que les teves dades no surten de la teva xarxa. Però un model local amb permisos excessius és com tenir una porta blindada a l'entrada i deixar les finestres obertes. El model no enviarà les teves dades a OpenAI, però sí pot fer coses dins del teu sistema que no volies que fes.
La combinació guanyadora és IA local + sandbox. Dades al teu servidor, permisos sota control, accions auditades. Això és sobirania de dades real.
L'analogia que ho aclareix
Imagina que contractes algú per classificar documents a la teva oficina. Opció A: li dones les claus de tot l'edifici, el codi de la caixa forta i la contrasenya del sistema informàtic. Opció B: li dones accés només a la sala de documents, un escriptori, i una regla: "classifica aquests papers, però no toquis res més".
Ambdues opcions funcionen. L'opció A és més ràpida perquè no has de configurar permisos. L'opció B és més segura perquè si aquella persona comet un error —o si algú l'enganya perquè faci alguna cosa que no hauria—, el dany està contingut.
Un sandbox és l'opció B. Per a la teva IA.
Què fer ara
- Audita els permisos. Si ja tens IA corrent, revisa quin accés té. Et pot sorprendre.
- Implementa el mínim privilegi. Cada agent, només els permisos que necessita. Res més.
- Aïlla la xarxa. Si el model no necessita internet, no li donis.
- Afegeix registres. Si no pots veure el que fa, no pots millorar el que fa.
- Crea una capa de validació. Abans de qualsevol acció irreversible, un humà o una regla confirme.
No necessites fer-ho tot a l'hora. Comença per auditar permisos. És el que més impacte té amb menys esforç.
A Neurosint dissenyem desplegaments d'IA amb seguretat per defecte. Sandboxes, permisos mínims, auditoria integrada. Si vas a introduir IA a la teva empresa, que sigui segura des del primer dia. Parlem.
Preparat per al salt tecnològic?
No deixis que la teva pime quedi obsoleta. Implementem la infraestructura d'IA que et donarà l'avantatge competitiva.
Reserva la teva Auditoria Gratuïta