Dados sintéticos: o brigadeiro de whey protein da proteção de dados

Dados sintéticos: o brigadeiro de whey protein da proteção de dados

Publicado em 28 de Julho de 2023 em Artigos

Junto com o boom das discussões envolvendo Inteligência Artificial (IA), vem crescendo o interesse pelas diferentes aplicações dos dados sintéticos, que se apresentam como uma solução barata e eficaz para várias situações. No campo da Proteção de Dados, eles apresentam o potencial de enfrentar vários dos desafios de conformidade.

 

Dados sintéticos são dados gerados a partir de dados da vida real, dentro de um sistema treinado para reproduzir e preservar as mesmas características e estrutura dos dados originais. Isso significa que os dados sintéticos e os dados originais devem ser capazes de fornecer resultados idênticos ou ao menos muito semelhantes quando submetidos à mesma análise estatística.

 

Geração dos dados sintéticos

 

O processo de geração dos dados sintéticos, a chamada "síntese", pode envolver diferentes técnicas, como simulações feitas por computador, árvores de decisão e modelos de IA (deep learning).

 

Para que se possa trabalhar com dados sintéticos excluindo a possibilidade de serem, em qualquer grau, considerados dados pessoais reais, deverá ser conduzida uma avaliação de proteção de dados que conclua se titulares de dados poderão ser identificados mediante o uso de qualquer técnica disponível.

 

Desse modo, um dos pontos mais relevantes quanto ao uso de dados sintéticos será o tratamento de dados não pessoais para finalidades antes possíveis apenas mediante o uso de tais informações. Com isso, titulares de dados serão retirados da situação de vulnerabilidade e de violação de direitos, e agentes de tratamento não serão submetidos a rígidas normas de proteção de dados.

 

Para que usar dados sintéticos

 

Assim, dados sintéticos são considerados uma alternativa promissora ao tratamento de dados pessoais, sendo uma ferramenta que estimula a inovação tecnológica e respeita os requisitos da Proteção de Dados, já que a síntese de dados pode ser usada como uma técnica de anonimização eficaz. Desse modo, se um agente trata dados sintéticos de forma que o titular dos dados não possa ser identificado, as normas de proteção de dados (como General Data Protection Regulation – GDPR – e Lei Geral de Proteção de Dados – LGPD) não serão aplicáveis.

 

Com relação a situações práticas, dados sintéticos seriam extremamente relevantes, por exemplo, em transferências internacionais de dados. Não sendo considerados dados pessoais, não haveria a preocupação da transferência para uma jurisdição considerada não adequada, ou a preocupação em se utilizar o instrumento contratual adequado requerido pelas normas aplicáveis de proteção de dados.

 

Como a IA se beneficia

 

Ademais, treinamentos de modelos de IA se beneficiariam dos dados sintéticos, que podem contribuir para mitigar viés discriminatórios mediante o uso de bases de dados justas, tais como bases que consideram parcelas representativas da população, considerando a realidade como ela de fato é, e não como a sociedade gostaria que fosse. Entretanto, é claro que também podemos nos deparar com situações de dados sintéticos imprecisos e discriminatórios, a depender da qualidade da base de dados original, já que eles refletirão os seus vieses.

 

Ainda, soluções médicas poderiam ser criadas mediante as análises estatísticas de doenças e perfis de pacientes sem a sua identificação, soluções financeiras como a averiguação de fraudes poderiam ser desenvolvidas sem o uso indevido de dados de titulares inocentes e políticas públicas poderiam ser criadas para atender parcelas da população sem identificar cidadãos específicos.

 

Brigadeiros de whey protein

 

Assim sendo, o tratamento de dados sintéticos configura uma solução incrível para uma série de iniciativas. De forma alguma, agentes de tratamento estarão livres de cumprimento às normas de proteção de dados, uma vez que dados pessoais continuarão sendo necessários para grande parte das atividades – uma empresa não poderia, por exemplo, processar a folha de pagamento de empregados usando dados sintéticos. Contudo, para cenários como pesquisas e análise de dados, os dados sintéticos certamente configuram uma ferramenta poderosa que pode proteger os titulares de dados e contornar as incertezas jurídicas hoje existentes.

 

Seriam como os brigadeiros de whey protein, que imitam os brigadeiros de chocolate e leite condensado e, se bem-feitos, podem executar muito bem o papel. Mas, em algumas situações, a receita original será absolutamente insubstituível.


Artigo inicialmente publicado no portal TI Inside no dia 21 de julho de 2023.

Publicação produzida pela(s) área(s) Cybersecurity & Data Privacy