OpenAI está acelerando nuestro desarrollo de perspectivas automatizadas de seguridad de datos

Hoy anunciamos nuestra integración de Azure OpenAI con la Plataforma de Seguridad de Datos de Cyera. El equipo de investigación de datos de Cyera ha estado implementando modelos de aprendizaje automático desde nuestros inicios, utilizando datos de entrenamiento públicos y nuestra propia experiencia para crear perspectivas de datos impulsadas por IA. Esta integración nos permite incorporar modelos de IA generativa a gran escala para habilitar nuevas capacidades de razonamiento y comprensión sobre los datos. Esto brindará a los clientes resultados más rápidos, una clasificación aún más precisa, un contexto empresarial más profundo sobre el uso previsto de los datos y detección de anomalías.
Cyera detecta, clasifica y comprende automáticamente los datos en los entornos de datos de nuestros clientes. Hacemos esto utilizando modelos de vanguardia (SOTA) ajustados finamente y entrenados para realizar tareas de reconocimiento de entidades con nombre (NER). NER es una función del procesamiento de lenguaje natural (NLP) que identifica y clasifica entidades con nombre en categorías predefinidas como nombres de personas, organizaciones y ubicaciones. Esto le permite a Cyera identificar y aprender automáticamente los datos únicos de un cliente con una precisión extremadamente alta, a gran velocidad y escala.
Pongamos la velocidad y la escala en contexto con un ejemplo sencillo. Supongamos que tienes datos en el almacenamiento de objetos AWS S3. Para entender cualquier exposición de seguridad de datos que exista con esos datos, podrías usar la herramienta de prevención de pérdida de datos (DLP) nativa de la nube de Amazon, Macie. Macie representa el enfoque heredado de clasificación de datos basado en coincidencia de patrones. Esto significa que tienes que saber que los buckets existen, apuntar Macie a los buckets y luego depender de la coincidencia básica de patrones y reglas basadas en firmas para identificar exposiciones de seguridad. Usando un conjunto de datos de muestra de 2057 archivos estructurados y no estructurados en un bucket de S3, Macie presentó un resultado muy generalizado.

Cuando abordamos este mismo desafío con Cyera, nuestra plataforma sin agentes descubre automáticamente todos los buckets y otros almacenes de datos de AWS. Luego, el aprendizaje automático no supervisado identifica patrones de datos y presenta grupos de archivos similares al aprendizaje automático supervisado para su clasificación. Se realizan extracción de temas y reconocimiento de entidades (NER), lo que proporciona no solo clases de datos, sino también contexto adicional sobre el rol, la región, la identificabilidad y la protección de cada clase. Cyera ofrece una imagen mucho más completa, descubriendo
- Datos de propiedad intelectual y secretos que Macie pasó por alto
- 80 clases de datos adicionales
- Clases a nivel de objeto que Macie no pudo interpretar
- Millones de clases de datos sensibles (incluidos números de teléfono, números de tarjetas de crédito y contraseñas) que Macie no detectó (representando falsos negativos)
- Contexto sobre el papel, la región, la identificabilidad y la protección de los datos

Luego, la plataforma aplica las políticas correctas de seguridad, privacidad y cumplimiento para detectar y remediar exposiciones donde sea que se gestione la información. Este nivel de detalle y precisión está disponible actualmente en entornos de nube IaaS, PaaS y SaaS.
Incorporar la enorme cantidad de datos de entrenamiento a nuestros modelos de aprendizaje automático existentes acelerará la capacidad de la plataforma para identificar patrones y ofrecer recomendaciones personalizadas. Cyera utilizará esta capacidad para adaptar aún más las políticas de seguridad de datos con el fin de ayudar a los equipos de seguridad a tomar decisiones más informadas sobre seguridad de datos, privacidad y gobernanza.
Los modelos de lenguaje grande (LLMs) de OpenAI también acelerarán cómo Cyera gobierna el acceso a datos sensibles. Aplicar modelos de extracción de temas y de agrupamiento a las identidades permitirá a Cyera agrupar a los usuarios para mejorar la gestión de accesos. La detección de anomalías resalta patrones de acceso inusuales, por ejemplo, cuando un usuario que normalmente accede a los datos a través de una aplicación comienza a extraer grandes volúmenes de datos de forma masiva. También permitirá que la plataforma prediga acciones basadas en objetos similares y entienda la causalidad. El motor de políticas unificado de Cyera aprovechará los LLMs para identificar configuraciones incorrectas, recomendar controles de acceso específicos y generar nuevas políticas para la gobernanza del acceso a datos.
La visión de Cyera es que todas las empresas aprovechen al máximo el potencial de los datos —colaboración, conexión con los clientes, información que impulsa la innovación— para potenciar una nueva era de desarrollo, crecimiento y productividad. Para hacer realidad este potencial, las empresas necesitan la capacidad de aprovechar la tecnología transformacional de manera responsable mientras protegen su activo más valioso: los datos.
Obtén visibilidad total
con nuestra Evaluación de Riesgos de Datos.

.png)

