أوامر نصية تنقلنا إلى عوالم افتراضية… النموذج Genie 3 من شركة جوجل يفتح بابًا جديدًا للألعاب والتعليم.

أعلنت شركة ديب مايند DeepMind التابعة لجوجل عن إطلاق الجيل الثالث من نموذجها الثوري لتوليد العوالم الافتراضية بالذكاء الاصطناعي، والذي يحمل اسم Genie 3. يسمح هذا النموذج للمستخدمين ووكلاء الذكاء الاصطناعي بالتفاعل مع بيئات ثلاثية الأبعاد يتم إنشاؤها بشكل فوري بناءً على الأوامر النصية، ضمن إطار تجريبي محدود يستهدف الباحثين والمبدعين.
يعتبر Genie 3 تطويراً لتقنية “نماذج العوالم” التي تهدف إلى محاكاة بيئات واقعية أو خيالية لأغراض التعليم والتدريب والترفيه، وتستخدم أيضاً في تدريب الروبوتات ووكلاء الذكاء الاصطناعي على فهم السياقات البيئية واتخاذ القرارات فيها.
بالمقارنة مع Genie 2 السابق، الذي كان يوفر تفاعل محدود لفترة لا تتجاوز 20 ثانية، يقدم نموذج Genie 3 تجربة أكثر استدامة حيث يمكن التفاعل داخل العالم الافتراضي لعدة دقائق متواصلة، ويمكنه أن يتذكر المواقع والعناصر المرئية لمدة تصل إلى دقيقة كاملة، مما يسمح للمستخدم بالعودة إلى المشهد الذي تركه كما هو.
Genie 3 ينتج عوالم بدقة 720 بكسل وبمعدل 24 إطار في الثانية، كما يوفر “أحداث العوالم القابلة للتخصيص عبر الأوامر”، حيث يمكن للمستخدم تغيير حالة الطقس أو إضافة شخصيات جديدة بسهولة عبر تعديل نص الأمر.
لا يزال Genie 3 غير متاح للجمهور حالياً، إذ تم طرحه كنسخة بحثية محدودة مخصصة لمجموعة صغيرة من الباحثين والمبدعين، بهدف فهم التحديات وتطوير آليات التفاعل الآمن مع هذه التقنية.
هذه الخطوة تأتي في سياق جهود جوجل المكثفة في مجال الذكاء الاصطناعي التوليدي، وتحديداً في مجال محاكاة الفيديو والعوالم الافتراضية، حيث يقود فريق تطوير Genie 3 أحد القادة السابقين لأداة “Sora” في شركة OpenAI التي تعمل على إنتاج مقاطع فيديو بالذكاء الاصطناعي.
Genie 3 قد يمثل بداية تحول في تصميم وتطوير الألعاب الرقمية، ويعزز مفهوم “العوالم القابلة للتوليد حسب الطلب”، مما يفتح آفاقاً جديدة في الترفيه والتعليم والمحاكاة.