Futuro da IA generativa? Ser uma versão resumida do ChatGPT

O ChatGPT, da OpenAI, possui um modelo de linguagem em um conhecimento grande e genérico. Para o mundo corporativo, o ideal seria uma versão resumida. Entenda

Desde seu lançamento em novembro de 2022, o ChatGPT conquistou diversos setores, tornando-se um recurso essencial tanto para empresas quanto para usuários comuns. Sua capacidade de gerar conteúdo instantaneamente é inegável, mas alguns especialistas apontam desafios quanto à sua aplicabilidade corporativa.

Com um custo diário de aproximadamente US$ 700 mil para operar, a sustentabilidade financeira do sistema é questionável, especialmente considerando que apenas uma fração de seus 100 milhões de usuários ativos mensais paga pelo serviço.

Nesse contexto, a proposta de uma versão simplificada do ChatGPT, como defendida pelo professor João Paulo Papa, professor, doutor em ciência da computação e atualmente pesquisador na Fundação Humboldt na Alemanha, uma das instituições mais prestigiadas no desenvolvimento de inteligência artificial, pode representar uma solução viável para ampliar o acesso à tecnologia, inclusive para empresas de menor porte e usuários domésticos. Essa abordagem promete uma discussão relevante sobre o futuro da inteligência artificial e sua aplicação prática. Em entrevista a Inovativos, ele falou sobre os problemas com alucinações da IA e até o futuro da tecnologia. Confira.

João Paulo Papa, professor e pesquisador

Inovativos: Na sua avaliação, como foi o primeiro ano de lançamento massificado do ChatGPT? Houve benefícios de fato ou o lançamento apenas serviu mais para divulgar o assunto para o grande público?

João Paulo Papa: Foi um pouco dos dois. Quem era da comunidade científica já conhecia a OpenAI por conta dos trabalhos que a empresa vinha fazendo com o motor do ChatGPT, o GPT. Por outro lado, muitas pessoas, principalmente da área de negócios, não tinham conhecimento e ficaram sabendo (neste último ano).

Eu penso que isso chamou mais a atenção pelo poder da área de processamento de linguagem natural, que é algo que existe há muito tempo. Com o avanço das técnicas de IA, várias startups foram criadas e que utilizam o serviço do ChatGPT, porém refinado para um problema específico. Por exemplo, eu soube recentemente de uma empresa usando o ChatGPT para fins jurídicos, para auxiliar advogados, para fazer sumarização de peças, criar peças, geração de peças.

Por fim, quero dizer que a questão da IA, por muitos anos, figurou mais no contexto discriminativo, ou seja, utilizamos a IA para classificar as coisas. Agora, a IA generativa gera conteúdo, seja imagem, música, textos e outros. Ela está muito em voga hoje, chamando mais a atenção pela IA generativa do que a própria IA discriminativa, com a qual estávamos acostumados.

Inovativos: O uso da IA no customer experience ganhou força e deixou o “hype” para trás? Quais outros setores devem massificar este ano ou nos próximos?

João Paulo Papa: Não tem como retroceder nesse sentido. Acho que a tendência é sempre aumentar (o uso da IA generativa). Tenho falado com muitos empresários e eles, obviamente, não têm muita ideia do que o ChatGPT pode fazer, mas querem ter em seu negócio. Afinal, é a vibe do momento. Então, muitas vezes, a IA tenta resolver um problema que a empresa tem ou é encaixada em algum canto da empresa. Então, procuramos um problema para a IA ser encaixada para dar uma vantagem competitiva no mercado.

Entendo que a tendência é aumentar, porém mais na área de processamento de linguagem natural e em aplicações que envolvam texto. Mas, por exemplo, existem usos na medicina ou nas áreas de engenharia.

Inovativos: Hoje, especialistas como você apontam o problema da alucinação da IA generativa. Como enxerga a tecnologia a serviço da saúde?

João Paulo Papa: De fato, o problema da alucinação, que é gerar uma informação que não é verídica, é um problema que vai acontecer. Por isso, é interessante o ser humano interagir com a máquina para corrigir e refinar os resultados.

Há ainda um detalhe interessante nessa história. Antigamente, e quando digo antigamente eu cito algumas décadas atrás, o homem alimentava o modelo com os algoritmos inteligentes com uma base de dados. Agora, percebemos que o ser humano consegue aprender com a máquina. Hoje, há uma área chamada Inteligência Artificial Explicável (um conjunto de ferramentas e técnicas usadas pelas organizações para ajudar as pessoas a entender melhor por que um modelo toma certas decisões e como ele funciona), onde, a partir de uma imagem médica, tomografia e outras informações, a técnica de IA cria mapas de calor para identificar quais os pontos mais relevantes se baseou para falar se uma pessoa tem ou não uma doença. Obviamente, um médico pode olhar isso e acrescentar algo.

Outro exemplo no contexto de medicina é quando eu alimento a IA generativa com uma imagem e ela me gera um laudo automaticamente. Temos ainda uma iniciativa com a Fapesp (Fundação de Amparo à Pesquisa do Estado de São Paulo) sobre câncer pediátrico. Qual é a nossa ideia? Quando a pessoa vai no pronto-socorro, dificilmente haverá um oncologista pediátrico ou um especialista. A ideia é que o médico, ao digitar as queixas do paciente, a chamada anamnese, o sistema identifica as palavras-chave do texto, processa e calcula a probabilidade de encaminhamento dessa criança para um oncologista.

Em regiões periféricas, é difícil ter no pronto-socorro um equipamento de tomografia computadorizada ou uma ressonância para fazer diagnóstico por imagem. E, mesmo que tenha, a criança ou o paciente precisa agendar o exame. Propomos uma coisa mais rápida e barata, pois estamos falando de informação textual.

Inovativos: Ainda falando desse projeto de diagnóstico por IA de texto, quais seriam os desafios?

João Paulo Papa: Criando uma startup chamada IAssist. Por enquanto, a ideia é focar no câncer pediátrico e estamos atuando no Hospital do Câncer de Barretos e no Hospital do Câncer de Brasília. Neles, o nosso sistema funciona bem, com cerca de 98% de acerto. O problema, no entanto, é validá-lo no atendimento primário. Os dados que temos hoje, que são anamneses, são descritivos escritos por especialistas. Ocorre que eles sabem as principais queixas e o que eles vão colocar naquele descritivo.

Agora, uma pessoa que não é oncologista e que possui outra especialidade no atendimento primário não vai colocar as mesmas palavras-chave. Esse é o nosso desafio. O sistema funciona bem para um especialista ou um oncologista pediátrico. Procuramos parcerias para termos uma base de dados de atendimento primário e daí treinar o modelo.

Inovativos: O lançamento do ChatGPT aberto e gratuito seria uma forma de solucionar a alucinação, uma vez que os humanos ajudam a treinar as máquinas?

João Paulo Papa: Temos sempre que tomar cuidado com o uso do ChatGPT, que deve ser usado para auxiliar. Por exemplo: pense em alunos que ficam dias tentando resolver um problema de programa de computador, obtêm a ajuda da tecnologia e solucionam a questão. Isso é legal. Agora, temos outro exemplo bem interessante: se perguntarmos, quem inventou o avião para o ChatGPT, ele vai responder que foram os irmãos Wright. Nós, brasileiros, vamos para o lado do Santos Dumont. E por que ele respondeu os irmãos Wright? Obviamente porque ele foi treinado em uma base com conteúdo massivo em língua inglesa, muito provavelmente dos EUA. É preciso que as pessoas não tomem essas respostas como 100%.

Inovativos: E como solucionar essa questão?

João Paulo Papa: O ChatGPT possui o que o pessoal chama de LLM, large language model ou um modelo de linguagem grande. Estamos falando de um modelo que exige milhões de totens para você treinar, isso se você quiser ter essa tecnologia do zero. Para as empresas e entidades de pesquisa não é uma coisa simples. Agora, a tendência na academia é o que eles chamam de SLM, o small language model*, ou seja, será que eu consigo fazer um modelo ou mesmo consigo treinar a partir do meu computador caseiro e que dê resultados próximos do ChatGPT? Então, essa é a linha que a gente está seguindo hoje em dia.

OBS: Modelos de linguagem são sistemas de IA treinados em grandes conjuntos de dados de texto que permitem recursos como geração de texto, resumo de documentos, tradução entre idiomas e resposta a perguntas. Modelos de linguagem pequena preenchem grande parte do mesmo nicho, mas com tamanhos menores. Os pesquisadores normalmente consideram os modelos de linguagem com menos de 100 milhões de parâmetros relativamente pequenos. Para efeito de comparação, os modelos considerados enormes na escala atual ultrapassam os 100 bilhões de parâmetros, como o já mencionado modelo GPT-3 da OpenAI.

Inovativos: Esse seria o modelo mais apropriado para os negócios?

João Paulo Papa: Sim. Podemos usar uma versão paga do ChatGPT, obter um modelo e refiná-lo para o meu problema. Eu faço um novo treinamento dele, porém não do zero. Eu pego o que o ChatGPT e o que ele já aprendeu, faço um novo treinamento a partir da minha base de dados.

A outra vertente é o próprio SLM que comentei. A ideia é tentar enxugar uma IA como o GPT, de tal forma que eu consiga, se eu quiser, treiná-lo do zero, fazer coisas diferentes, ter uma maleabilidade melhor do que o modelo engessado da OpenAI.

Inovativos: O senhor citou rapidamente sobre o uso da IA generativa no mundo jurídico. O senhor tem visto outros usos igualmente interessantes?

João Paulo Papa: A questão das perguntas e respostas, o Q&A, é um bom exemplo. Eu alimento o modelo com um PDF, como uma nota fiscal, e eu posso fazer perguntas: “Pode me falar o preço do produto? Quantos produtos foram comprados? Qual é a empresa que vendeu? Essa empresa é idônea?” O algoritmo vai e identifica o CNPJ da empresa. Essa questão do Q&A é muito interessante.

Inovativos: No Brasil, estamos iniciando o processo de regulação da IA, inclusive com a promessa de que isso poderá ocorrer em 2024. Na sua avaliação, a discussão está sendo conduzida de maneira adequada?

João Paulo Papa: É fundamental a gente regulamentar a IA, pois tem iniciativas surgindo no mundo inteiro. Porém, não será fácil e o Brasil pode tomar a dianteira nesse sentido.

Sobre a regulação em si, eu acho fundamental termos uma regulamentação para casos, por exemplo, em que, suponhamos, um consultório médico faça uso de uma técnica de inteligência artificial para auxiliar no diagnóstico e a técnica deu um diagnóstico errado. É óbvio que o médico ou especialista não deve se abster ou culpar a OpenAI, do ChatGPT. Não se pode colocar a culpa no algoritmo, que não é uma pessoa física ou jurídica. Penso que isso deva ser regulamentado.

Além disso, eu sinto um pouco a falta do envolvimento da comunidade acadêmica, dos especialistas em diversas áreas do conhecimento e de diversas regiões do País, entre outros, nesse processo junto com o poder legislativo, além, claro dos empresários. Mesmo porque precisamos de uma lei que não trave os negócios e as pesquisas no Brasil.

Inovativos: O senhor falou da falta da academia no debate. Há algo que incomode o senhor no PL que chegou a ser apresentado?

João Paulo Papa: Não necessariamente, mas vai chegar um ponto que precisaremos discutir coisas mais específicas. Então, eu acho que devemos envolver a todos, escutar os especialistas na área. O meu medo é essa questão prejudicar o desenvolvimento da pesquisa, dependendo do que for posto nessas regulamentações.

Inovativos: Falando de futuro, qual é a sua avaliação do que deve acontecer em até 10 anos com base nas evidências?

João Paulo Papa: Hoje, um dos grandes problemas é que temos muitos dados não rotulados. Por exemplo, eu posso ter milhões de imagens de uma aplicação médica só que, no final do dia, eu preciso que esses dados sejam rotulados para identificar se ela mostra ou não uma doença. Não temos essa informação. Temos informações clínicas, histórico da família, exame de sangue, queixas, descritivo descritivo textual, tomografia, ressonância e outros. A questão é: como é que eu agrego tudo isso sem descartar nenhuma informação? Esse é o grande desafio que iremos endereçar melhor no futuro.

Outra questão é a interação com o robô, a interação textual. Penso que a IA generativa vai melhorar bastante. Por exemplo, eu posso tentar submeter um vídeo para um modelo e fazer uma pergunta: “Do que se trata esse vídeo?”. O modelo, então, faz uma resenha para mim. Eu posso pedir ainda: “vá para aquela cena onde um carro explode”. Daí ele automaticamente encontra aquela cena. Então, a tendência é termos mais dados a partir da interação e fusão entre vídeo, texto, imagem e áudio. Essa é a tendência do negócio.

Para isso, obviamente, precisaremos de máquinas mais potentes. De certa forma elas estão acompanhando, mas até certo ponto, pois

elas estão ficando mais caras. E, hoje, em muitos congressos científicos, a gente percebe que quem leva a melhor, no sentido de melhores resultados, são empresas, pois têm poder computacional melhor. Eles conseguem treinar o modelo com mais dados, do que nós, academia. Décadas atrás o truque estava no modelo em si, alguma artimanha que a gente propunha no modelo. Hoje, o modelo importa, mas os dados importam muito mais. A questão financeira influencia muito.