A OpenAI está Acelerando nosso Desenvolvimento de Insights Automatizados de Segurança de Dados

Hoje anunciamos nossa integração do Azure OpenAI à Plataforma de Segurança de Dados Cyera. A equipe de pesquisa de dados da Cyera vem implementando modelos de aprendizado de máquina desde o início, usando dados de treinamento públicos e nossa própria expertise para criar nossos insights de dados alimentados por IA. Esta integração nos permite adicionar modelos de IA generativa em larga escala para habilitar novas capacidades de raciocínio e compreensão sobre dados. Isso fornecerá aos clientes resultados mais rápidos, classificação ainda mais precisa, contexto de negócios mais profundo sobre o uso pretendido dos dados e detecção de anomalias.
A Cyera detecta, classifica e compreende automaticamente os dados em toda a paisagem de dados de nossos clientes. Fazemos isso usando modelos de última geração (SOTA) ajustados e treinados para executar tarefas de Reconhecimento de Entidades Nomeadas (NER). O NER é uma função do Processamento de Linguagem Natural (PLN) que identifica e classifica entidades nomeadas em categorias predefinidas, como nomes de pessoas, organizações e localizações. Isso permite que a Cyera identifique e aprenda automaticamente os dados exclusivos de um cliente com precisão extremamente alta, em velocidade e escala.
Vamos colocar velocidade e escala em contexto, usando um exemplo simples. Digamos que você tenha dados no armazenamento de objetos AWS S3. Para entender quaisquer exposições de segurança de dados que existam com esses dados, você pode usar a ferramenta nativa de nuvem de prevenção contra perda de dados (DLP) da Amazon, o Macie. O Macie representa a abordagem legada de correspondência de padrões para classificação de dados. Isso significa que você precisa saber que os buckets existem, apontar o Macie para os buckets e então confiar em correspondência básica de padrões e regras baseadas em assinatura para identificar exposições de segurança. Usando um conjunto de dados de amostra de 2057 arquivos estruturados e não estruturados em um bucket S3, o Macie apresentou uma saída muito generalizada.

Quando abordamos esse mesmo desafio usando a Cyera, nossa plataforma sem agentes descobre automaticamente todos os buckets e outros armazenamentos de dados da AWS. O aprendizado de máquina não supervisionado então identifica padrões de dados e apresenta clusters de arquivos semelhantes ao aprendizado de máquina supervisionado para classificação. A extração de tópicos e o NER são realizados, fornecendo não apenas classes de dados, mas também contexto adicional sobre a função, região, identificabilidade e proteção de cada classe. A Cyera apresenta um panorama muito mais rico, descobrindo
- Dados de IP e segredos que o Macie não detectou
- 80 classes de dados adicionais
- Classes de nível de objeto que o Macie não pôde interpretar
- Milhões de classes de dados sensíveis (incluindo números de telefone, números de cartão de crédito e senhas) que o Macie não detectou (representando falsos negativos)
- Contexto sobre o papel, região, identificabilidade e proteção dos dados

A plataforma então aplica as políticas corretas de segurança, privacidade e conformidade para descobrir e remediar exposições onde quer que os dados estejam sendo gerenciados. Este nível de detalhe e precisão está atualmente disponível em ambientes de nuvem IaaS, PaaS e SaaS.
Adicionar as vastas quantidades de dados de treinamento aos nossos modelos de aprendizado de máquina existentes acelerará a capacidade da plataforma de identificar padrões e fornecer recomendações personalizadas. A Cyera usará essa capacidade para personalizar ainda mais as políticas de segurança de dados, a fim de ajudar as equipes de segurança a tomar decisões mais informadas sobre segurança de dados, privacidade e governança.
Os Modelos de Linguagem de Grande Escala (LLMs) da OpenAI também acelerarão a forma como a Cyera governa o acesso a dados sensíveis. A aplicação de modelos de extração de tópicos e agrupamento a identidades permitirá que a Cyera agrupe usuários para melhorar o gerenciamento de acesso. A detecção de anomalias destaca padrões de acesso incomuns, por exemplo, quando um usuário que normalmente acessa dados por meio de um aplicativo começa a extrair grandes volumes de dados em massa. Isso também permitirá que a plataforma preveja ações com base em objetos semelhantes e compreenda a causalidade. O mecanismo de políticas unificado da Cyera aproveitará os LLMs para identificar configurações incorretas, recomendar controles de acesso específicos e gerar novas políticas para governança de acesso a dados.
A visão da Cyera é que todas as empresas realizem o pleno potencial dos dados — colaboração, conexão com clientes, insights que impulsionam a inovação — para impulsionar uma nova era de desenvolvimento, crescimento e produtividade. Realizar esse potencial requer que as empresas tenham a capacidade de aproveitar tecnologia transformacional de forma responsável, ao mesmo tempo em que protegem seu ativo mais valioso - os dados.
Obtenha visibilidade completa
com nossa Avaliação de Risco de Dados.

.png)

