A empresa francesa AI Mistral UpsRals Voxral, um modelo de discurso de campo aberto que substitui soluções proprietárias em LEs da metade do custo.
Os modelos Voxtral vêm em duas versões: uma variante de 24b para aplicações de produtos e um modelo Compat 3b para implantações locais e de borda. Ambos suportam a janela de contexto de 32.000 toques, que Mistral diz que pode lidar com arquivos de áudio até 30 minutos para transcrição ou 40 minutos para tarefas de abrangência.
As ferramentas de transcrição básica do Undeke, as construções voxtrais nas perguntas e respostas e na Summatation Whoithouts Wepouting Sepirações e modelos de realização. Ele também permite que os usuários tenham as funções de back -end diretamente através dos comandos de voz, traduzindo automaticamente as solicitações de speakeen INO API calds.

Compartilhar
Recomendar nosso artigo
Os modelos suportam o reconhecimento automático da discurso, Hanish, Português, Holandês, Alemão, Dutrol Small 3.1. ‘Backbone do modelo de idioma.
Anúncio
O boletim do decodificador
A notícia mais importante para sua caixa de entrada.
✓ Semanalmente
✓ Free
✓ Cancelar no horário
Compromissão de desempenho de desempenho de referência
Os testes de Mistral mostram um pequeno ponto de devista de votos de votos de chumbo-v3, transcross de aligi e gemi tsted provado provado provado provado provado provado provado. Para as tarefas inglesas de forma de Shorrt e a Benchmard de voz de Admon Mozillacial, relatou ter sido o ASTTS Elevenlbs Stribe – atualmente nos Perfímeros Stronest.

No reconhecimento de fala multicaal de Fleurs, Benmark, Small Voxtral supostamente supera o sussurro em todos os nove idiomas testados. Para tarefas de ingestão de áudio, o desempenho de TI comparativamente ao GPT-4O-Mini e Gemi que fornece resultados de ponta em tradução especial.
Preços reduzem as alternativas do propretário
Posição Mistral Vextral como um Open Filme, com preços de AP a partir de US $ 0,001 por minuto. O mini transcrito de Voxtral de Voxtral de Clemy Voxtral supera o OpenCri de Lesper que metade do custo do preço.
Recursos corporativos Incluir opções de implantação privada para indústrias coletadas e ajuste fino específico do domínio. As atualizações próximas serão o segmento de alto-falante, as marcas de áudio para detecção de idade / emocção e registro de data e hora no nível da ala.
Chegando ao modo de voz de Le Chat
As versões vextrais do Booth estão disponíveis Ultimate Apache – 2.0 Licença para download em Abraçando o rostocom miktrais, a oferta de acesso à IA. Os modelos alimentam o modo de voz no Le Chat, que é lançado para todos os usuários nas próximas semanas.
Postagens relacionadas
Deixe um comentário Cancelar resposta
Você precisa fazer o login para publicar um comentário.
Fique conectado