06:18jin10Kimi发布全新通用音频基础模型Kimi-Audio金十数据4月26日讯,今日,Kimi发布新的开源项目——全新通用音频基础模型 Kimi-Audio。据介绍,该模型支持语音识别、音频理解、音频转文本、语音对话等多种任务。展開
03:22jin10阿里通义开源音频语言模型Qwen2-Audio,相关论文入选顶会ACL 2024金十数据8月13日讯,阿里通义大模型继续开源,Qwen2系列开源家族新增音频语言模型Qwen2-Audio。Qwen2-Audio可以不需文本输入,直接进行语音问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。该模型在多个权威测评中都显著超越先前的最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准,相关论文已入选本周正在举办的国际顶会ACL2024。展開3