من النص إلى الصوت.. ميتا تعتزم إطلاق مساعد صوتي مستند إلى الذكاء الاصطناعي

يسعى مارك زوكربيرج الرئيس التنفيذي لشركة ميتا إلى تعزيز القدرات الصوتية للذكاء الاصطناعي في شركته خلال عام 2025، في إطار مساعي الشركة العملاقة إلى تحقيق عائدات من هذه التقنية المتطورة بسرعة، وفقًا لما ذكرته وكالة “فايننشال تايمز” البريطانية.

ووفقًا لمصادر مطلعة، فإن ميتا تستعد لإضافة تحسينات إلى مزايا الصوت في نموذجها اللغوي الكبير المفتوح المصدر Llama 4، المتوقع إصداره في الأسابيع المقبلة، إذ تراهن الشركة على أن وكلاء الذكاء الاصطناعي المستقبليين سيكونون قائمين على المحادثات الصوتية بدلًا من النصوص فقط.

وتركّز ميتا بنحو خاص على جعل المحادثة بين المستخدم ونموذج الذكاء الاصطناعي الصوتي أكثر طبيعية وتفاعلية، مما يسمح للمستخدم بالمقاطعة في أثناء الحديث، بدلًا من الاقتصار على أسلوب السؤال والإجابة التقليدي، وفقًا لأحد المصادر.

ويأتي هذا التوجه في وقت أعلن فيه زوكربيرج، الرئيس التنفيذي، خططًا طموحة لجعل ميتا “الشركة الرائدة في الذكاء الاصطناعي”، واصفًا سنة 2025 بأنها ستكون “سنة الحسم” للعديد من منتجات الذكاء الاصطناعي الخاصة بالشركة، في ظل المنافسة المتزايدة مع OpenAI ومايكروسوفت وجوجل لتسويق هذه التقنيات.

وفي هذا السياق، تبحث ميتا إمكانية إطلاق اشتراكات مأجورة لمساعدها الذكي “Meta AI”، مما يتيح للمستخدمين الوصول إلى مهام متقدمة مثل حجز المواعيد وإنشاء مقاطع الفيديو، وفقًا لمصادر مُطلعة.

وتفكر الشركة أيضًا في إدراج إعلانات مأجورة أو منشورات ممولة داخل نتائج البحث الخاصة بالمساعد الذكي، وفقًا لأحد المصادر.

وفي وقتٍ سابق من هذا العام، كشف زوكربيرج عن خطط لبناء وكيل ذكاء اصطناعي هندسي يتمتع بقدرات برمجية، وقدرة على حل المشكلات بمستوى مهندس متوسط الخبرة، وهو مشروع يرى أن له سوقًا ضخمة محتملة.

وتحدث كريس كوكس، رئيس المنتجات في ميتا، عن بعض خطط الشركة المتعلقة بنموذج Llama 4 القادم، مشيرًا إلى أنه سيكون نموذجًا “شاملًا” يسمح بالتعامل مع الكلام مباشرةً، دون الحاجة إلى تحويله إلى نص، ثم معالجته، ثم الرد صوتيًا مرة أخرى.

ووفقًا لمصدرين مطلعين، فإن ميتا تبحث إمكانية تعديل القيود المفروضة على مخرجات النموذج الجديد من Llama، وسط موجة من الإصدارات الجديدة من الشركات المنافسة.

وكانت OpenAI قد أطلقت وضع المحادثة الصوتية في ChatGPT العام الماضي، كما أطلقت جوجل وضع Gemini Live الصوتي، في حين بدأت شركة xAI المملوكة لإيلون ماسك اختبار مزايا الصوت في نموذجها Grok 3 الشهر الماضي.

Aitspot

Recent Posts

ChatGPT يستطيع تحويل المحتوى إلى عروض تقديمية بشكل ذكي باستخدام الذكاء الاصطناعي في PowerPoint.

بدأت شركة OpenAI اختبار إدماج روبوت الذكاء الاصطناعي ChatGPT داخل برنامج مايكروسوفت PowerPoint، وهو أحد…

أسبوعين ago

OpenAI تمكن Codex من العمل داخل متصفح Google Chrome

أطلقت OpenAI إضافة جديدة لمتصفح “جوجل كروم” تحمل اسم “Codex for Chrome”، تتيح لمساعد البرمجة…

4 أسابيع ago

ميتا تطوّر وكيل ذكاء اصطناعي لتحسين تجربة التسوق داخل إنستاجرام.

تعمل شركة ميتا بتطوير وكلاء ذكاء اصطناعي جديدة مُخصّصة للمستخدمين والشركات عبر منصاتها؛ وكشف تقرير…

4 أسابيع ago

Gemini يقوم بإنشاء الملفات وتغيير تجربة العمل باستخدام الذكاء الاصطناعي

هناك لحظات تتجاوز فيها التكنولوجيا كونها مجرد "أداة" لتصبح جزءًا لا يتجزأ من عملية العمل.…

4 أسابيع ago

ماك بوك برو الجديد: قفزة نوعية في الذكاء الاصطناعي وأسعار تلامس 6000 دولار

كشفت شركة آبل عن أحدث إصداراتها من حواسيب "ماك بوك برو" المحمولة، والتي زودتها بشرائح…

3 أشهر ago

مايكروسوفت تُدمج محرر صور متقدم في تطبيق بوربوينت

كشفت شركة مايكروسوفت عن إضافة أداة متكاملة لتحرير الصور داخل برنامج “بوربوينت”، بهدف توفير تجربة…

3 أشهر ago