Categories: أخبار الإنترنتاخر الاخبارالأخبار التقنية

من النص إلى الصوت.. ميتا تعتزم إطلاق مساعد صوتي مستند إلى الذكاء الاصطناعي

يسعى مارك زوكربيرج الرئيس التنفيذي لشركة ميتا إلى تعزيز القدرات الصوتية للذكاء الاصطناعي في شركته خلال عام 2025، في إطار مساعي الشركة العملاقة إلى تحقيق عائدات من هذه التقنية المتطورة بسرعة، وفقًا لما ذكرته وكالة “فايننشال تايمز” البريطانية.

ووفقًا لمصادر مطلعة، فإن ميتا تستعد لإضافة تحسينات إلى مزايا الصوت في نموذجها اللغوي الكبير المفتوح المصدر Llama 4، المتوقع إصداره في الأسابيع المقبلة، إذ تراهن الشركة على أن وكلاء الذكاء الاصطناعي المستقبليين سيكونون قائمين على المحادثات الصوتية بدلًا من النصوص فقط.

وتركّز ميتا بنحو خاص على جعل المحادثة بين المستخدم ونموذج الذكاء الاصطناعي الصوتي أكثر طبيعية وتفاعلية، مما يسمح للمستخدم بالمقاطعة في أثناء الحديث، بدلًا من الاقتصار على أسلوب السؤال والإجابة التقليدي، وفقًا لأحد المصادر.

ويأتي هذا التوجه في وقت أعلن فيه زوكربيرج، الرئيس التنفيذي، خططًا طموحة لجعل ميتا “الشركة الرائدة في الذكاء الاصطناعي”، واصفًا سنة 2025 بأنها ستكون “سنة الحسم” للعديد من منتجات الذكاء الاصطناعي الخاصة بالشركة، في ظل المنافسة المتزايدة مع OpenAI ومايكروسوفت وجوجل لتسويق هذه التقنيات.

وفي هذا السياق، تبحث ميتا إمكانية إطلاق اشتراكات مأجورة لمساعدها الذكي “Meta AI”، مما يتيح للمستخدمين الوصول إلى مهام متقدمة مثل حجز المواعيد وإنشاء مقاطع الفيديو، وفقًا لمصادر مُطلعة.

وتفكر الشركة أيضًا في إدراج إعلانات مأجورة أو منشورات ممولة داخل نتائج البحث الخاصة بالمساعد الذكي، وفقًا لأحد المصادر.

وفي وقتٍ سابق من هذا العام، كشف زوكربيرج عن خطط لبناء وكيل ذكاء اصطناعي هندسي يتمتع بقدرات برمجية، وقدرة على حل المشكلات بمستوى مهندس متوسط الخبرة، وهو مشروع يرى أن له سوقًا ضخمة محتملة.

وتحدث كريس كوكس، رئيس المنتجات في ميتا، عن بعض خطط الشركة المتعلقة بنموذج Llama 4 القادم، مشيرًا إلى أنه سيكون نموذجًا “شاملًا” يسمح بالتعامل مع الكلام مباشرةً، دون الحاجة إلى تحويله إلى نص، ثم معالجته، ثم الرد صوتيًا مرة أخرى.

ووفقًا لمصدرين مطلعين، فإن ميتا تبحث إمكانية تعديل القيود المفروضة على مخرجات النموذج الجديد من Llama، وسط موجة من الإصدارات الجديدة من الشركات المنافسة.

وكانت OpenAI قد أطلقت وضع المحادثة الصوتية في ChatGPT العام الماضي، كما أطلقت جوجل وضع Gemini Live الصوتي، في حين بدأت شركة xAI المملوكة لإيلون ماسك اختبار مزايا الصوت في نموذجها Grok 3 الشهر الماضي.

Aitspot

Next تسريبات.. آبل تعتزم طرح آيفون 17 آير كأنحف هاتف في العالم »

Previous « إنستاجرام تختبر ميزة “الدردشة المجتمعية” على غرار ديسكورد