La protección de los datos sintéticos logra acelerar los desarrollos de las IA

CONECTADOS

La generación de información y datos digitales aporta grandes avances en inteligencia artificial y seguridad online, pero también conlleva riesgos para las empresas y usuarios.

Los datos generados de manera sintética abren nuevas puertas al aprendizaje IA.
Los datos generados de manera sintética abren nuevas puertas al aprendizaje IA. | EP

Los datos sintéticos son datos artificiales creados por algoritmos para imitar datos reales, sin contener información personal o sensible. Son datos no generados en un mundo “real”, y su función principal es utilizarlos para entrenar modelos de inteligencia artificial, probar programas y aplicaciones de software, o probar la eficacia de sistemas de seguridad en las que existen situaciones donde la privacidad o el acceso a datos reales pueden ser un problema.

La Agencia Española de Protección de Datos (AEPD) publicó esta semana la traducción al español de la “Guía sobre generación de datos sintéticos”, un documento elaborado por la Autoridad Nacional de Protección de Datos de Singapur (PDPC) y que, una obra que destaca por su valor didáctico y especial interés para responsables, encargados de tratamientos y delegados de protección de datos.

El uso de datos virtuales permite proteger información sensible a la hora de desarrollar, probar y validar el aprendizaje automático

Los datos sintéticos son un elemento clave para la innovación y la protección de datos en el desarrollo de sistemas y modelos de Inteligencia Artificial. Los datos sintéticos son generados artificialmente con el fin de simular datos reales y deben conservar sus características estadísticas esenciales para resultar útiles sin comprometer la información personal. Su generación debe planificarse cuidadosamente, situándose en un espectro que va desde los datos completamente aleatorios hasta los datos reales.

Esta tecnología se presenta como una herramienta de gran utilidad para promover la economía del dato, siempre que se valore adecuadamente su idoneidad según el caso de uso y se garantice un equilibrio entre su utilidad y los riesgos para la privacidad. El uso de datos sintéticos no solo puede acelerar la investigación, la innovación, la colaboración y la toma de decisiones, sino que también puede mitigar el impacto de las brechas de datos.

Contenido patrocinado

stats