Inovação Digital e Tecnologia na Centralidade do Cliente

O que são dados sintéticos e como eles ajudam os negócios?

O uso de dados sintéticos pode ser uma alternativa às restrições ao uso de dados pessoais impostas por normas como a LGPD — e isso é fundamental. Mas você sabe o que são dados sintéticos?

É inegável que o mundo dos negócios tem se pautado em dados, especialmente aqueles originários de pessoas comuns. No entanto, em algum momento dos últimos anos, houve um descontrole no uso dessas informações, incluindo desrespeito aos direitos individuais. Então, surgem normas como a brasileira Lei Geral de Proteção de Dados (LGPD) com a seguinte narrativa: a pessoa é a principal autoridade sobre os próprios dados. Sem autorização, o número de telefone não pode ser utilizado por um terceiro estranho. Sem consentimento, via de regra, um dado bancário não é visualizado por um estranho.

Para alguns, esses empecilhos podem representar uma barreira para negócios orientados a dados e até mesmo para o treinamento de inteligências artificiais. No entanto, há um tipo de dado que pode auxiliar empresas em decorrência das barreiras legais: são os dados sintéticos.

Em entrevista à Inovativos, Lyse Nogueira, Customer Advisor do SAS, empresa global em inteligência artificial e dados, explicou o significado dos dados sintéticos e como eles poderiam ser utilizados no cotidiano de um negócio. A seguir, a entrevista:

Inovativos – O que são dados sintéticos e como funcionam?

Lyse Nogueira – Dados sintéticos são dados gerados artificialmente que imitam o comportamento dos dados reais e, portanto, não contêm informações de indivíduos do mundo real. Eles preservam as propriedades estatísticas e padrões dos dados originais sem revelar detalhes sensíveis. São criados para serem usados em cenários onde os dados reais são insuficientes, sensíveis ou inacessíveis.

Lyse Nogueira, da SAS

Inovativos – Quais são as vantagens dos dados sintéticos em relação aos dados reais?

Lyse Nogueira – Os dados sintéticos oferecem vantagens significativas em relação aos dados reais, especialmente nas áreas de privacidade, pois eliminam o risco de violações de dados e o uso indevido de informações pessoais, o que garante a conformidade com regulamentações como a LGPD. Outras vantagens estão nos custos, pois reduzem os gastos associados à coleta, armazenamento e gerenciamento de dados; em vieses, pois permitem a criação de novos conjuntos de dados para aprimorar o balanceamento e a representatividade, mitigando vieses presentes em dados reais; e em disponibilidade, pois democratizam o acesso a dados para pesquisa, desenvolvimento e inovação, superando silos de dados e processos de aprovação lentos.

Inovativos – Quais são os casos de uso práticos?

Lyse Nogueira – Os dados sintéticos encontram aplicações práticas em diversos setores: no setor bancário, por exemplo, são utilizados para viabilizar o desenvolvimento de modelos de detecção de fraude e avaliação de risco de crédito onde não há informações suficientes. Já no setor público, esse tipo de dado permite a simulação de cenários para planejamento urbano, otimização de serviços públicos e resposta a emergências. Na saúde, possibilitam o treinamento de modelos de IA para diagnóstico de doenças e descoberta de medicamentos sem acessar dados sensíveis de pacientes. Na indústria, contribuem para a otimização de cadeias de suprimentos, desenvolvimento de novos produtos e para a manutenção preditiva.

Inovativos – Qual é o impacto dos dados sintéticos na evolução da IA?

Lyse Nogueira – Os dados sintéticos têm se tornado um catalisador para a evolução da IA. Com a crescente demanda por dados para treinar modelos de IA cada vez mais complexos, os dados sintéticos oferecem uma solução escalável e segura para superar as limitações dos dados reais. Eles permitem que as organizações acelerem o desenvolvimento de modelos de IA, explorem novas aplicações e inovem sem comprometer a privacidade ou a segurança dos dados. A pesquisa da Gartner prevê que 75% das empresas usarão IA generativa para criar dados sintéticos de clientes até 2026, um aumento significativo em relação aos menos de 5% em 2023. Isso demonstra o crescente reconhecimento do valor dos dados sintéticos para impulsionar a inovação em IA.

+ ÚLTIMAS NOTÍCIAS