Notícias em alta
Categorias
Fique conectado
Notícias em alta
Ao utilizar nosso site, você concorda com o uso de nossos cookies.

Notícias

Opeenai Reivindicações de avanço na razão LLM em problemas complexos de matemática
Tecnologia

Opeenai Reivindicações de avanço na razão LLM em problemas complexos de matemática 



Resumo
Resumo

Owenai diz que o Modelo de Modelo de Modelo de Modelo de Modelo de Modelo de Modelo da Experiência OSTS Molympira Olympira (IMO) Problemas no nível da medalha de ouro, avanço pós -capaz de IA com Skilms de razão geral. Os resultados não foram confirmados independentemente.

Acumulando para OPEAI RESOMAR ALEXANDER WEI e Noam BrownO modelo abordou a Comvunição da IMO 2025, resolvendo os cinco primeiros dos seis problemas oficiais e ganhando 35 dos pontos 42 pontos.

A IMO está com a MOT Dift Math Comprative para os alunos do ensino médio, exigindo criatividade e raciocínio lógico. Wei afirma que este é o primeiro modelo de IA que pode “criar instrutor de artesanato, argumentos de Waterst, argumentos a acidentes no nível dos matemoans humanos”.

Solução de passo a passo deitada pelo formulário de modelo do OpenAI para um problema de IMO. | Imagem: Screenshot via x

O modelo Gamested Is Solutions Us User Standard Compotion: TS 4,5 horas sessões, sem inferno externo, um anns-grethene laualaagense e sem tempo de ferramenta. Ex -IMO Mitalins classificou os RESPs anonimamente. O Soluções completas estão disponíveis no Gitub.

Anúncio

Ainda espaço para escalar

A alfageometria UNDEKE FINDRY, que é construída especificamente para matemática, o modelo de Opeenai é um modelo de idioma de linguagem da razão de propósito geral. “Atingimos essa alia de capailidade não via Nastrow, especificada por tarefas no teste de teste geral de puro-explica Wei.

Brown confirma que esse é o modelo de “novas técnicas experimentais de uso geral” e escalleiras de seu teste, o Tyt compartilha os detalhes técnicos.

“O1 embora por segundos. Pesquisa profunda por minuto. O Thinkle pensa por horas”. Notas marronsApontar esse modelo novo é mais eficiente e o STIL tem o poteninal de ciências. Ele arrasa que mesmo um pequeno avanço sobre o desempenho humano pode ser suficiente para impulsionar grandes progs científicos.

Wei diz que Zenenai não tem planos de liberar o modelo ou similar nos próximos meses, enfatizando que são estritas do projeto de pesquisa. Ele também esclareceu que o Shap-5 está planejado “em breve”, eu sou Isrled by IMO Model, que é desenvolvido pela pequena equipe liderada por Wei.

Brown aponta Isso é o Tounnology Coudedy se movendo tão rápido que as versões futuras podem ser mais avançadas. Ele acrescenta, isso é de resultados surpreendidos até mesmo as pessoas dentro do Openi, chamando -o de “um marco que conheceu muitos anos considera os anos”.

Recomenda -se

Metarena.ai A plataforma testou os modelos líderes Sevalal 2.5 Pro, Grok-4, Deepiseek-R1 e Event OBEENI O3 e O4-Mini-ON IMO 2025 Tarefas. Nenhum deles conseguiu marcar os 19 pontos necessários para a medalha de bronzo. O Gemini 2.5 Pro ficou no topo, mas com apenas 13 dos 42 pontos, enquanto os outros realizam o evento Wirese.

As lojas de gráficos da Martharena.ai são os principais modelos de idiomas que ficam aquém dos problemas de 2025 da IMO. | Imagem: Captura de tela via Metarena.ai

Eveen com os extensos testes, que incluíram um processo de seleção e erealações de 32 dos especialistas da IMO, os modelos mostram falhas sherior. Os resultados foram preenchidos com erros lógicos, argumentos incompletos e até teores inventados.

Vieweed neste contexto, o anúncio de Opeenai parece Lya um retoma direto dos UMITs expostos pelo teste de Metharesa. Embora a conquista seja significativa, seu verdadeiro valor selvagem depende de Whatetets pode ser serendd e aplicado a problemas arrependidos.

Notícia Original

Postagens relacionadas

Deixe um comentário

Os campos obrigatórios estão marcados *