Gate News: Últimas Notícias de Cripto e Preços de Criptomoedas

Kimi lançou um novo modelo básico de áudio universal, Kimi-Audio.

Jin10 dados 26 de abril, hoje, Kimi lançou um novo projeto de Código aberto — o novo modelo básico de áudio genérico Kimi-Audio. De acordo com a introdução, este modelo suporta reconhecimento de voz, compreensão de áudio, conversão de áudio em texto, diálogo por voz e diversas outras tarefas.

Mais

03:22 GoldenOctober2024

阿里通义Código aberto音频语言模型Qwen2-Audio，相关论文入选顶会ACL 2024

Dados de Jinshi, 13 de agosto, a equipe da Alibaba continua a abrir código. A família Qwen2 adicionou o modelo de linguagem de áudio Qwen2-Audio. O Qwen2-Audio pode responder a perguntas por voz sem a necessidade de entrada de texto, compreendendo e analisando os sinais de áudio fornecidos pelos usuários, incluindo voz humana, sons naturais e música. Esse modelo superou significativamente os melhores modelos anteriores em várias avaliações autorizadas. A equipe da Alibaba também lançou simultaneamente uma nova avaliação de modelo de compreensão de áudio Referência, cujo artigo relacionado foi selecionado para a conferência internacional de ponta ACL2024 que está ocorrendo esta semana.

Mais