Gate News: Tin tức tiền điện tử mới nhất và Giá tiền điện tử

Kimi phát hành mô hình âm thanh cơ bản đa năng hoàn toàn mới Kimi-Audio

Jin10 dữ liệu ngày 26 tháng 4, hôm nay, Kimi phát hành dự án mã nguồn mở mới - mô hình âm thanh cơ bản đa năng Kimi-Audio. Theo thông tin, mô hình này hỗ trợ nhận diện giọng nói, hiểu âm thanh, chuyển đổi âm thanh thành văn bản, đối thoại giọng nói và nhiều nhiệm vụ khác.

Xem thêm

03:22 GoldenOctober2024

阿里通义Mã nguồn mở音频语言模型Qwen2-Audio，相关论文入选顶会ACL 2024

Tin tức từ Jinshi Data ngày 13 tháng 8, mô hình lớn của Alibaba Tiếp tục Mã nguồn mở, gia đình Qwen2 Mã nguồn mở đã thêm mô hình ngôn ngữ âm thanh mới Qwen2-Audio. Qwen2-Audio có thể trả lời bằng giọng nói trực tiếp mà không cần nhập văn bản, hiểu và phân tích tín hiệu âm thanh mà người dùng nhập, bao gồm cả giọng nói, âm thanh tự nhiên, âm nhạc, v.v. Mô hình này đã vượt xa các mô hình tốt nhất trước đó trong nhiều bài đánh giá uy tín. Nhóm Tiếp tục cũng đồng thời giới thiệu một Mã nguồn mở mới về đánh giá mô hình hiểu âm thanh Điểm chuẩn, và bài báo liên quan đã được chọn vào Hội nghị top quốc tế ACL2024 diễn ra trong tuần này.

Xem thêm