A pressa de adotar a IA generativa reacendeu um problema de segurança herdado que há muito atormentou empresas: expansão de dados. À medida que as organizações correm para implementar soluções de IA, estão enfrentando os mesmos desafios que atormentavam o setor há uma década, mas com apostas significativamente mais altas.
Diante de uma explosão de dados de novos dispositivos móveis e IoT e mais pessoas com atividades aumentadas on -line, os líderes de segurança reconheceram naquela época que estavam sobrecarregados em tentar gerenciar tudo. Alguns anos depois, a maioria deles levantou as mãos na derrota. O problema parecia intransponível: os dados estavam em toda parte e se multiplicando mais rápido que as equipes de segurança poderiam acompanhar.
Avanço rápido para 2025, e esse problema não resolvido nos olha novamente, e com um renovado senso de urgência. Para que as organizações obtenham valor de soluções de IA generativas, elas devem fornecer dados corporativos e esses dados corporativos podem conter e provavelmente faz informações muito sensíveis. Isso está forçando as organizações a finalmente enfrentar seu problema de expansão de dados.
O desafio organizacional por trás da expansão de dados
No coração do histórico problema de expansão de dados está um colapso organizacional. As organizações reconheceram a necessidade de diretores de dados e governança abrangente de dados, mas a maioria das iniciativas nunca se materializou, ou rapidamente parou. Os sistemas de categorização de dados prometidos não foram implementados e os horários estratégicos não foram estabelecidos.
O fracasso não foi devido à falta de intenção ou motivação. A liderança entendeu o problema e os recursos alocados, mas a intensidade manual necessária para o gerenciamento de dados se mostrou esmagadora. As organizações normalmente atribuíam apenas algumas pessoas para categorizar e gerenciar volumes de dados que estavam crescendo exponencialmente.
Essas pequenas equipes foram confrontadas com uma tarefa impossível: processando e organizando manualmente dados que estavam sendo criados mais rapidamente do que os humanos poderiam gerenciá -los.
Ai como um mecanismo de criação de dados
O desafio se intensificou além do mero consumo de dados. Os próprios sistemas de IA geram vastos novos fluxos de dados que exigem gerenciamento e proteção. A IA cria novas versões de documentos, relatórios e análises, e cada interação com ferramentas generativas de IA produz logs e artefatos que se acumulam rapidamente nos sistemas.
Os processos de treinamento e ajuste de modelos geram metadados que geralmente não são gerenciados. Os sistemas AI-UG-BEMENTED CRIGEM EXPONCIAMENTE MAIS SAUTRAS ANÁLICAS que fluem para o armazenamento sem classificação adequada.
Os departamentos de TI agora lutam para gerenciar essa explosão de novos dados criados em todos os pontos de contato corporativos – desde dispositivos de funcionários e sistemas díspares até ambientes em nuvem e híbridos. Sem a governança adequada, as empresas podem se afogando em um mar de dados novos e legados sem saber o que é valioso e o que não é.
Dados não gerenciados é um ponto cego de segurança
Essa crescente expansão de dados se tornou um alvo cada vez mais atraente para os cibercriminosos. Os dados mal gerenciados representam riscos críticos de segurança. Os dados herdados geralmente contêm informações confidenciais, mas não têm controles de segurança modernos, o que facilita a chegada dos invasores. Os repositórios de dados desconhecidos e não gerenciados são pontos cegos na arquitetura de segurança, impedindo medidas abrangentes de proteção.
Os sistemas de IA também podem expor dados confidenciais em seus resultados a indivíduos que normalmente não teriam acesso a esse material, criando novos vetores para vazamento de dados. As equipes de segurança fundamentalmente não podem proteger o que não sabem, tornando particularmente vulneráveis os armazenamentos de dados invisíveis.
Os dados recentes da pesquisa ilustram o quão generalizado o problema é. Um relatório de 2025 que encomendamos mostrou que 74% dos tomadores de decisão de TI e segurança relataram que os atacantes acessaram e prejudicaram seus dados com sucesso, enquanto 86% pagavam resgates. Enquanto isso, 68% dos tomadores de decisão de segurança pesquisados para o relatório da paisagem de segurança de identidade Cyberark 2025 reconheceram que eles não têm controles de segurança para suas implementações de IA.
Consequências do mundo real
O problema de expansão de dados nas organizações permitiu que um ataque cibernético particularmente malicioso florescesse. O ransomware evoluiu para uma sofisticada indústria criminal direcionada especificamente organizações com pouca segurança e higiene de dados. A propriedade intelectual em bancos de dados há muito esquecida geralmente representa as jóias da coroa de uma organização, tornando-o um alvo principal.
Informações pessoais e financeiras em lojas de dados abandonadas fornecem aos atacantes recursos valiosos para roubo de identidade e fraude. Arquivos de email contendo comunicações sensíveis oferecem informações sobre operações comerciais e potencial alavancagem para extorsão. Sistemas de backup que não foram adequadamente garantidos por atacantes apresentam oportunidades para destruir as capacidades de recuperação, aumentando a alavancagem de resgate.
A realidade é acentuada: se as equipes não têm visibilidade em todos os dados organizacionais – o que está nele, onde é armazenado e quem o está usando – eles não podem entender adequadamente seu valor como um ativo nem o protege de maneira eficaz.
Como mitigar a expansão de dados
O desafio fundamental que atrapalhou os esforços anteriores de governança de dados permanece: as abordagens manuais tradicionais não podem escalar para corresponder ao ritmo moderno da criação de dados. As soluções de hoje devem abordar essa incompatibilidade de recursos por meio de automação e comprometimento organizacional estratégico. As equipes de segurança com visão de futuro estão implementando essas soluções práticas:
- Realizar descoberta e classificação de dados: Use ferramentas automatizadas para encontrar, categorizar e marcar dados com base na sensibilidade e valor dos negócios em todos os ambientes. Isso inclui dados estruturados, não estruturados e semiestruturados e até dados de TI de sombra.
- Implantar sistemas robustos de backup e recuperação: Verifique se os dados críticos estão protegidos, mantendo a visibilidade do que está sendo preservado e por quê. Implemente backups imutáveis e execute exercícios regulares de recuperação.
- Estabeleça controles de acesso a dados de dados de confiança zero: Implementar princípios de menor privilégio para acesso a dados, garantindo que apenas usuários autorizados possam recuperar informações específicas. Isso se estende além do perímetro da rede a objetos de dados individuais.
- Crie práticas de minimização de dados: Revise regularmente e limpe dados desnecessários para reduzir os riscos de superfície e conformidade de ataque. Isso inclui dados pessoais, registros desatualizados e cópias redundantes.
- Implementar políticas estratégicas de retenção de dados: Quando trabalhei no Departamento de Estado, implementamos um cronograma de retenção para ajudar a reduzir o risco associado às participações de dados herdados que não tinham mais valor comercial. Os dados antigos representam uma responsabilidade significativa e nossa análise histórica mostrou que era cada vez mais obsoleto e inútil após os anos subsequentes.
Quebrando o ciclo
Os custos de armazenamento por si só devem motivar a ação. Cada peça de dados não utilizados representa uma carga financeira contínua por meio de infraestrutura de armazenamento, sistemas de backup e sobrecarga administrativa. No entanto, as organizações continuam acumulando dívidas digitais porque nunca implementaram com sucesso as abordagens sistemáticas necessárias para quebrar esse ciclo.
O sucesso exige reconhecer que a governança de dados não pode ser delegada a uma pequena equipe que trabalha com processos manuais. A escala de criação de dados hoje exige comprometimento com a descoberta automatizada, classificação e aplicação da retenção. Sem uma abordagem sistemática, as organizações se encontrarão tendo a mesma conversa em mais uma década, enfrentando desafios ainda mais complexos com apostas mais altas.
A era de ignorar a expansão de dados acabou. Com a AI acelerando a criação e o consumo de dados, as organizações devem implementar a governança abrangente de dados ou enfrentar consequências cada vez mais graves. As empresas que prosperarão são aquelas que tratam os dados como um ativo estratégico e um passivo potencial que exige um gerenciamento cuidadoso.
Apresentamos o melhor curso on -line de segurança cibernética.
Este artigo foi produzido como parte do canal especialista da TechRadarPro, onde apresentamos as melhores e mais brilhantes mentes do setor de tecnologia hoje. As opiniões expressas aqui são as do autor e não são necessariamente as do TechRadarpro ou do Future Plc. Se você estiver interessado em contribuir, descubra mais aqui:
Fique conectado