OpenAI treinou o CriticGPT, baseado no GPT-4, para gerar respostas e sugestões de feedback aos treinadores na aprendizagem de IA.
A OpenAI desenvolveu uma nova ferramenta chamada CriticGPT, baseada no GPT-4, com o objetivo de identificar falhas em respostas produzidas pelo ChatGPT. Segundo a empresa, ao utilizar o CriticGPT para revisar os textos gerados pelo ChatGPT, os usuários conseguem resolver os possíveis equívocos sem assistência extra em 60% das situações. O conjunto de modelos GPT-4 que alimenta o ChatGPT é aprimorado por meio do ‘aprendizado de reforço a partir do feedback humano’ (RLHF, em inglês), o que significa que a plataforma aprimora seu desempenho conforme os treinadores de inteligência artificial classificam as respostas do ChatGPT e apontam eventuais falhas.
O CriticGPT se destaca como uma importante ferramenta para aprimorar a qualidade das respostas geradas pelo ChatGPT. Com a ajuda do CriticGPT, os usuários podem identificar e corrigir erros de forma mais eficiente, contribuindo para uma experiência aprimorada de interação com a inteligência artificial. A OpenAI destaca a importância da colaboração entre humanos e máquinas para o aperfeiçoamento contínuo dos modelos de linguagem, evidenciando a relevância do CriticGPT no processo de correção e aprimoramento das respostas do ChatGPT.
CriticGPT: A Ferramenta de Correção e Aprendizagem
À medida que o ChatGPT evolui, os erros se tornam mais sutis e específicos, o que pode dificultar a detecção por parte dos treinadores de IA. É nesse ponto que o CriticGPT se destaca como uma ferramenta valiosa. A empresa planeja integrar modelos semelhantes ao CriticGPT ao processo de RLHF, permitindo que os feedbacks humanos sejam aprimorados com as contribuições da IA. Embora as sugestões do CriticGPT nem sempre estejam corretas, elas podem auxiliar os treinadores de IA a identificar problemas que poderiam passar despercebidos.
Assim como o modelo GPT-4, o CriticGPT também melhora à medida que mais usuários utilizam a ferramenta e fornecem feedback. Um exemplo prático do CriticGPT em ação é sua capacidade de apontar possíveis erros do ChatGPT, como destacado pela OpenAI.
De acordo com a OpenAI, os testes comparativos entre os dois modelos revelaram que as correções feitas pelo CriticGPT superaram as do ChatGPT em 63% das vezes. Além disso, a nova ferramenta mostrou menos casos de alucinações, onde a IA inventa informações falsas. No entanto, o CriticGPT tem suas limitações e só pode auxiliar até certo ponto de especialização.
Se uma tarefa ou resposta for extremamente complexa, mesmo um especialista com o suporte de um modelo pode enfrentar dificuldades para avaliá-la com precisão. O CriticGPT destaca a importância do aprendizado contínuo e da colaboração entre humanos e inteligência artificial para aprimorar a qualidade das respostas geradas.
Fonte: © CNN Brasil
Comentários sobre este artigo