26.8 C
Teresina

OpenAI anuncia novos modelos o3

Published:

OpenAI apresenta o modelo o3: um grande passo rumo à AGI?

Na última etapa do evento de 12 dias conhecido como “shipmas”, a OpenAI revelou sua maior novidade: o lançamento do modelo o3, um sucessor do já conhecido o1. Mais do que um único modelo, o o3 é uma família, composta pelo o3 principal e sua versão reduzida, o o3-mini, otimizada para tarefas específicas.

O o3 chega com promessas ambiciosas, incluindo a possibilidade de se aproximar da chamada inteligência geral artificial (AGI), pelo menos sob condições específicas. No entanto, a OpenAI enfatizou que ainda existem limitações significativas para atingir tal marco.


Por que o nome o3, e não o2?

Uma curiosidade que chamou atenção durante o anúncio foi a escolha do nome. Em vez de seguir a sequência e nomear o modelo como o2, a OpenAI decidiu pular diretamente para o o3. De acordo com informações do site The Information, isso se deve a uma possível disputa de marca com a operadora britânica de telecomunicações O2.

Durante uma transmissão ao vivo, Sam Altman, CEO da OpenAI, mencionou o assunto de forma implícita, confirmando a peculiar razão por trás dessa decisão. Isso mostra como questões externas, como direitos de marca, podem influenciar até mesmo a nomenclatura de avanços tecnológicos.


Quando o o3 da OpenAI estará disponível?

Atualmente, nem o o3 nem o o3-mini estão amplamente disponíveis. Contudo, a OpenAI já abriu um programa de inscrição para que pesquisadores de segurança possam ter acesso antecipado ao o3-mini. A previsão é que ele seja lançado oficialmente até o final de janeiro. Já o o3 principal terá uma prévia liberada posteriormente, em uma data ainda não confirmada.

Essa linha do tempo, no entanto, contrasta com declarações recentes de Altman. Em entrevistas recentes, ele afirmou que prefere esperar por uma estrutura regulatória federal que oriente e monitore os riscos associados a modelos de raciocínio antes de liberar esses sistemas de maneira mais ampla.


O que torna o o3 da OpenAI tão inovador?

Modelos de raciocínio, como o o3, se destacam por sua capacidade de validar suas próprias respostas, algo que os diferencia das inteligências artificiais tradicionais. Essa habilidade de “auto-verificação” permite que esses modelos evitem muitos dos erros comuns que outros sistemas cometem.

O o3 foi treinado por meio de aprendizado por reforço, com um foco no que a OpenAI chama de “cadeia de pensamento privada”. Isso significa que ele pode planejar e executar uma série de ações para resolver problemas complexos. Ao receber uma solicitação, o modelo faz uma pausa para considerar diversos aspectos relacionados ao problema, explicando internamente seu raciocínio. Em seguida, fornece a resposta mais precisa com base nessa análise.

Outra novidade do o3 é a possibilidade de ajustar o tempo de raciocínio, permitindo que os usuários escolham entre níveis baixos, médios ou altos de computação. Quanto maior o nível, melhor o desempenho do modelo em tarefas complexas.


Os limites do o3

Embora o o3 represente um avanço significativo, ele não é perfeito. Assim como seu antecessor, o o1, o novo modelo ainda apresenta falhas em tarefas aparentemente simples para humanos, como jogos de “jogo da velha”.

Além disso, o processo de raciocínio detalhado do o3 exige mais tempo para gerar respostas. Em comparação com modelos convencionais, ele pode levar de segundos a minutos a mais para responder a uma solicitação. Essa troca entre precisão e velocidade é algo que os usuários devem considerar ao utilizar o sistema.

Mesmo com sua capacidade de reduzir erros e alucinações, o o3 ainda não elimina completamente esses problemas. Isso mostra que, embora esteja avançando na direção certa, há um longo caminho a ser percorrido para alcançar a verdadeira AGI.


O desempenho do o3 em benchmarks

A grande pergunta é: o o3 realmente se aproxima da AGI? Inteligência geral artificial, ou AGI, refere-se a sistemas altamente autônomos capazes de superar os humanos em tarefas economicamente valiosas. De acordo com a definição da OpenAI, isso significa superar humanos na maioria dos trabalhos.

No teste ARC-AGI, projetado para avaliar se um sistema de IA pode aprender novas habilidades fora dos dados em que foi treinado, o o3 alcançou uma impressionante pontuação de 87,5% no nível mais alto de computação. Para comparação, no nível mais baixo de computação, o desempenho ainda foi três vezes melhor que o do o1.

Entretanto, o ARC-AGI tem limitações. François Chollet, co-criador do teste, destacou que o o3 ainda falha em tarefas consideradas fáceis para humanos, demonstrando que o modelo possui diferenças fundamentais em relação à inteligência humana. Segundo Chollet, um verdadeiro marco da AGI será alcançado quando modelos de IA conseguirem realizar tarefas fáceis para humanos sem dificuldade.

Ainda assim, o o3 se destacou em outros benchmarks importantes:

  • No SWE-Bench Verified, focado em programação, superou o o1 em 22,8 pontos percentuais.
  • Em avaliações de matemática avançada, como o American Invitational Mathematics Exam de 2024, acertou 96,7% das questões.
  • No GPQA Diamond, um conjunto de questões avançadas de biologia, física e química, atingiu 87,7%.

Esses resultados mostram o potencial do modelo, mas é importante lembrar que todos esses dados vêm de avaliações internas da OpenAI. Para ter uma visão mais clara, será necessário aguardar análises independentes.


A corrida por modelos de raciocínio

O sucesso do o1 desencadeou uma onda de interesse em modelos de raciocínio por parte de outras empresas. Gigantes como Google e Alibaba já lançaram suas próprias versões, enquanto startups como DeepSeek também entraram na disputa.

Essa explosão de inovação reflete a busca por abordagens mais sofisticadas para o desenvolvimento de IA, já que métodos tradicionais, como o aumento do tamanho dos modelos, não estão mais gerando avanços significativos.

No entanto, os modelos de raciocínio enfrentam desafios. Eles são caros, devido ao grande poder computacional necessário para operá-los, e ainda não está claro se poderão manter o ritmo de progresso observado até agora.


Perguntas frequentes sobre o o3

1. O que é o modelo o3 da OpenAI?
O o3 é um modelo de raciocínio avançado, projetado para realizar análises complexas e fornecer respostas mais confiáveis em áreas como ciência e matemática.

2. Qual é a diferença entre o o3 e o o3-mini?
O o3-mini é uma versão menor e mais acessível do modelo principal, otimizada para tarefas específicas e menos exigente em termos de computação.

3. O o3 pode ser considerado AGI?
Embora tenha se aproximado da AGI em alguns benchmarks, o o3 ainda não atende à definição completa de inteligência geral artificial.

4. Quando o o3 estará disponível para o público?
O o3-mini deve ser lançado no final de janeiro de 2024, enquanto o o3 principal será disponibilizado em uma data posterior ainda não definida.

5. Por que o modelo foi chamado de o3?
A OpenAI optou por pular o nome o2 para evitar possíveis conflitos de marca com a operadora britânica O2.


O lançamento do o3 representa um marco na evolução da inteligência artificial. Com avanços notáveis em raciocínio e precisão, o modelo reflete a ambição da OpenAI de aproximar-se cada vez mais da AGI. No entanto, desafios como custo, velocidade e limitações técnicas ainda precisam ser superados.

À medida que mais empresas entram na corrida por modelos de raciocínio, a competição deve trazer inovações e acelerar o progresso na área. O futuro da IA está se desenhando de forma empolgante e cheia de potencial, mas também com grandes responsabilidades.

Leia também: Blockchain:

A Tecnologia que Está Transformando o Futuro Digital

O Universo Está Repleto de Moléculas Orgânicas Complexas

Artigos relacionados

Artigos recentes