Durante anos, as ferramentas de edição de código Lake Cursor, Windsurf e Gitub’s Copilot têm sido o padrão para o desenvolvimento de software AI-Poasiad. Mas uma IA agêntica cresce mais poderosa e vibe codificando preguiçosa e a mudança sutil mudou os principais arsems de Ali estão intitando comtifting. Em vez de trabalhar no código, o OH “cada vez mais inchando diretamente com o sistema de teste, o que está instalado. É a mudança de significância no software de parto – e apesar dos baixos lucros para quem o campo se destra.
O terminal é melhor conhecido como a tela em preto e branco que você lembra. É tão visualmente impressionante quanto os codores de contemporação, mas é a formação de Keterface de Powkum se você Keu Kow como Kee. E os agentes baseados em código que os canitadores podem escrever e o código de debig, as ferramentas de terminal são escritas escritas em algum momento tailandês.
O sinal do clínico da mudança para o terminal veio dos principais laboratórios. Sipe em fevereiro, antropia, citando e o Opeena Haven restou (codificação Claude, ferramentas Gemina (Claude Codex, respectivamente) e CLI Codax, respectivamente, com a mudança de operação em que as ferramentas de codificação anteriores. Alteração Alteração Alteração Alteração Alteração Alteração Alteração Alteração Alteração Alteração Alteração Alteração Alteração do mecanismo.
“Nossa grande abelha existe lá, em que 95% dos Shaws de LLM-Computh, Terminalben de benchmark focado.
As ferramentas baseadas em terminais são ARA com The Air possui, assim como as ferramentas proeminentes baseadas em código estão começando a Lok Shaky. A edição de código Windise Windsurf Huke foi rasgada pelo Duel Senior Executive pela Cognity – deixando os produtos de consumo.
Ao mesmo tempo, o Programa de Programas de Novos Sugestões de Pesquisa Sugestões são ganhos de produtividade ovestêndios da convenção. Estudo METR Testando o Cursor Proe, o principal competidor de Windsurf, encontrou todo o Whod Whod Complete Gastuts 20-30 Processo por percentual, a porcentagem mais lenta. Em resumo, o Assistente de Código está custando agudamente os programadores.
Isso deixou uma abertura para empresas como a Warp, que atualmente mantém o primeiro lugar no Terminalbench. As contas de urdidura são um “ambiente de desenvolvimento agwêntico”, o meio da Idewe Batween Batween. Mas o Warp Fourter Zach Lloyd ainda está otimista no terminal, vendo como uma maneira de combater os Proeds da limitação do editor de código.
“O terminal occr de nível muito baixo na pilha de desenvolvedores, por isso é o lugar mais versátil para agentes de execução”, diz Lloyd.
Para entender como a nova abordagem é diferente, pode ser o helpfu olhar para os bencks usados para fazer o OUM. A geração de ferramentas baseada em código estava focada na solução de problemas do Gunib, a base do teste SWEH-BEN. O problema da ECHCH no SWE -BEEN é uma questão em aberto da ROBB – FORROW ESSENCIAL – Essentially, parte do código que é o de Kut Doensn. Os modelos iteram no usuário, os uyts, o encontro, agradecendo as obras, resolvendo o problema. Produtos integrados Lake Cursor Haven abordagens mais sofisticadas para o código de abordagem de Kows e transformando -o em obras.
Visualização de ferramentas de ferramentas baseadas em terminais, afastando o código do ambiente de função do programa. Em Um problema de TerminalBenchAs instruções fornecem um programa descompacte e um arquivo de texto de destino, desafia o agente a reverter o engenheiro de arquivo do algoritmo de compressões Mitching. Onout Pede ao agente que construa a fonte da fazenda do Kernel Linx, não mencionando que o agente irá se isentar. A solução dos problemas requer o tipo de capacidade de capacidade de solução de problemas.
“O que torna o Terminalbencench Hard não é apenas os tiletes que estamos dando aos agentes”, diz Shaw Theem “.
Fundamentalmente, essa nova abordagem significa combater o problema passo a passo-a mesma habilidade, concorda acordos agretos Si Powfulu. Mas os modelos agênticos de última geração do evento não conseguem lidar com todos os ambientes WOSE. A Warp obteve sua pontuação alta no Terminalbench, resolvendo Jalf of the Benchings – buts de como os Houts se devem ser o desbloqueio do potencial final.
Ainda assim, Lloyd acredita que os termos baseados em Point Agency podem lidar com a proposta de proposta – Proposição de valor – proposições de valor que são difíceis de ignorar.
“Se você pensa nos trabalhos diários da criação de um novo projeto, batendo o depkencle, o Warp pode bastante”, diz Lloyd. “E o IFTT não pode fazer isso, dirá o porquê.”
Fique conectado