A Albaba lançou o WAN2.2, a versão mais recente do seu modelo de geração de vídeo de código aberto. A menor versão canata vídeos 720p na GPU RTX 4090.
A empresa diz que o WAN2.2 traz melhorias na qualidade da geração na qualidade da geração e na capacidade do modelo em comparação com o WAN2.1. O modelo está disponível Licença Upjache 2.0 e COMs nas versões principais: T2V-A1V-A1V-A1V-A14B-A14B.
O A14B modela os melhores vídeos de 5 segundos em 720p e 16fps. Para o modelo T2V-5V-5V, o Albaba especifica a resolução especial de 720p de 1280 × 704 × 1280 pixels.
MO Artsacture aumenta a eficácia
A maior mudança em Wan2.2 é o intreduto do maltrato da Artercture Mistrure-of-Experts (MOE) em sua. Os modelos A14B usam um design de TWE-Expert, parâmetros de TLINION, mas com apenas 14 bilhões de parâmetros pessoais ativos por etapa da inferência.
Anúncio
O boletim do decodificador
A notícia mais importante para sua caixa de entrada.
✓ Semanalmente
✓ Free
✓ Cancelar no horário
A primeira experiência concentra -se nos estágios iniciais de denoising, o ruído dos brancos é alto e os Lyuts de oversal são estabelecidos. O segundo especialista lida com estágios posteriores para recuperar a refinar os vidoils.
Aligaba diz que Hasssed o conjunto de dados de treinamento para WAN2.2, usando 65,6 % mais imagens e 83,2 % mais vídeos do que2.1.
https://www.youinthob.com/watch?v=utrdwopm7hac
Modelo 5b compacto para hardware de consumidor
Juntamente com os modelos MOE de 27b, novamente desenvolve um modelo 5B mais compacto chamado Ti2V-5b. Esta versão pode bandmar vídeos de 5 segundos 720p em menos de 9 minutos em um único Litx de GPU de consumidor para atingir essa qualidade nesse hardware.
O TI2V-5B-5B suporta uma estrutura geral de texto para video e imagem para video, vídeos de produto 720p do produto a 24fps. Para os modelos A14b maiores, o Albaba recompa pelo menos 80 GB de VRAM para inferência de GPU único.
Integração e disponibilidade
Os modelos estão Availle através Abraçando o rosto e Modelscope. Wan2.2 já está integrado a CLERI e Difusores.
UM Abraçando o espaço do rosto É Availle para uso direto do modelo Ti2v-5b.
Fique conectado