Gate News: آخر مستجدات العملات الرقمية وأسعار العملات الرقمية

أصدرت كيمي نموذج الصوت الأساسي العام الجديد Kimi-Audio

جين10 بيانات 26 أبريل، اليوم، أصدرت Kimi مشروع مفتوح المصدر جديد - نموذج Kimi-Audio الأساسي الصوتي العام الجديد. ووفقًا لما تم تقديمه، فإن هذا النموذج يدعم التعرف على الصوت، وفهم الصوت، وتحويل الصوت إلى نص، والحوار الصوتي، وغيرها من المهام المتنوعة.

المزيد

03:22 GoldenOctober2024

تم اختيار ورقة البحث المتعلقة بنموذج لغة الصوت Qwen2-Audio المفتوح المصدر لتوليف الصوت والنص الخاص بها ضمن مؤتمر ACL الرفيع المستوى لعام 2024.

أخبار بوابة جيتيو: في 13 أغسطس، قام فريق تونجي تشونغ الخاص بـ Alibaba بإطلاق نموذج Qwen2-Audio المفتوح المصدر، وهو جزء من عائلة Qwen2 المفتوح المصدر. يتيح Qwen2-Audio القدرة على الإجابة على الأسئلة من خلال الصوت دون الحاجة إلى إدخال النص، حيث يمكنه فهم وتحليل الإشارات الصوتية المدخلة من المستخدم، بما في ذلك الأصوات البشرية والصوت الطبيعي والموسيقى وما إلى ذلك. هذا النموذج تفوق بشكل ملحوظ على أفضل النماذج السابقة في العديد من التقييمات الرسمية. كما قام فريق التونجي تشونغ بإطلاق تقييم جديد لفهم الصوت بالكامل، وهو يتضمن بحثًا مختارًا في مؤتمر ACL2024 الدولي الذي يعقد هذا الأسبوع.

المزيد