دراسة حديثة.. نماذج الذكاء الاصطناعي المتطورة غير قادرة على حل معظم المشكلات البرمجية

كشف باحثون في شركة OpenAI أنه حتى نماذج الذكاء الاصطناعي الأكثر تطورًا ما تزال غير قادرة على التفوق على المبرمجين البشر، مع أن الرئيس التنفيذي سام ألتمان صرّح سابقًا بأن هذه النماذج قد تتفوق على مهندسي البرمجيات المبتدئين بحلول نهاية العام الحالي.

اختبار كفاءة نماذج الذكاء الاصطناعي في البرمجة

في دراسة حديثة أجراها باحثون في شركة OpenAI، أظهرت النتائج أن النماذج المتقدمة من الذكاء الاصطناعي ما تزال غير قادرة على حل الغالبية العظمى من المهام البرمجية.

واعتمد الباحثون في تقييمهم على معيار جديد يُدعى SWE-Lancer، طُوّر باستخدام أكثر من 1400 مهمة برمجية مستمدة من منصة العمل الحر Upwork.

واختبر الباحثون ثلاثة نماذج متطورة من الذكاء الاصطناعي، هي:

  • نموذج o1 الخاص بشركة OpenAI.
  • نموذج GPT-4o الرائد من OpenAI.
  • نموذج Claude 3.5 Sonnet من شركة Anthropic.

وركز الاختبار في نوعين من المهام البرمجية، هما:

  • إصلاح الأخطاء البرمجية.
  • اتخاذ قرارات على مستوى عالٍ لإدارة المشاريع البرمجية.

ولضمان دقة التقييم، لم يُسمح للنماذج بالوصول إلى الإنترنت؛ مما منعها من الوصول إلى حلول جاهزة أو الاعتماد على أمثلة سابقة منشورة على الإنترنت.

النتائج:

واجهت نماذج الذكاء الاصطناعي صعوبة في التعامل مع المهام المطلوبة منها، ولم تتمكن من إصلاح سوى الأخطاء البرمجية البسيطة، وعجزت عن اكتشاف الأخطاء في المشاريع البرمجية الكبيرة أو تحليل أسبابها الجذرية.

ومع أن النماذج أظهرت سرعة أكبر من البشر في تنفيذ المهام، فإنها أخفقت في فهم الأخطاء، مما أدى إلى حلول غير دقيقة أو غير شاملة.

تفوق نسبي لنموذج Claude 3.5 Sonnet

بحسب الدراسة، أظهر نموذج Claude 3.5 Sonnet أداءً أفضل من نماذج OpenAI الأخرى، لكن معظم إجاباته كانت غير صحيحة. وأكد الباحثون أن أي نموذج ذكاء اصطناعي يحتاج إلى مستوى أعلى من الدقة والموثوقية قبل أن يُعتمد عليه في المهام البرمجية الحقيقية.

الخلاصة: الذكاء الاصطناعي لم يصل بَعد إلى مستوى مهندسي البرمجيات

تُشير هذه الدراسة إلى أن نماذج الذكاء الاصطناعي يمكنها أداء المهام البرمجية البسيطة بسرعة، لكنها ما تزال غير قادرة على التعامل مع المشاريع البرمجية المعقدة بكفاءة مماثلة لكفاءة المبرمجين البشر.

ومع أن مجال الذكاء الاصطناعي يتطور بسرعة، فإنه ما يزال غير قادر على العمل مثل المبرمجين البشريين. ومع ذلك، لم يمنع هذا بعض الشركات من التوجه نحو تقليص عدد المبرمجين البشريين لصالح نماذج الذكاء الاصطناعي، حتى مع عدم تفوقها في هذه المهام بَعد.

Aitspot

Recent Posts

iPhone Pocket – حافظة جديدة مثيرة للجدل من شركة آبل لحمل هواتف الآيفون.

كشفت شركة آبل عن إكسسوار جديد يحمل اسم "iPhone Pocket"، والذي يُعتبر حافظة فاخرة للهاتف…

4 أشهر ago

أعلنت شركة أدوبي عن إطلاق أدوات ذكاء اصطناعي تجريبية واعدة لتحرير المحتوى الرقمي.

في مؤتمرها السنوي Adobe Max، قدّمت شركة أدوبي مجموعة من أدوات الذكاء الاصطناعي التجريبية التي…

4 أشهر ago

يعتقد بيل غيتس أن الذكاء الاصطناعي يوفر فرصًا هائلة وتحديات إنسانية معقدة.

أكد بيل غيتس، مؤسس شركة مايكروسوفت وأحد أبرز رواد صناعة التقنية في العالم، أن الذكاء…

4 أشهر ago

بعد سنوات من الانغلاق، تبنت شركة آبل نهجاً منفتحاً في مجال الذكاء الاصطناعي.

أكّد الرئيس التنفيذي لشركة آبل "تيم كوك" أن الشركة تخطط لإدماج مزيد من أدوات الذكاء…

4 أشهر ago

مقارنة بين هاتفي Pixel 10 و iPhone 16

أطلقت جوجل سلسلة الهواتف الجديدة Pixel 10 رسمياً في الأسواق، ويعتبر الطراز الأساسي في السلسلة…

6 أشهر ago

تجربة مشاهدة ذكية.. توفر ميزة Copilot من مايكروسوفت الآن على أجهزة تلفاز سامسونج.

كشفت شركة مايكروسوفت عن نية دمج مساعدها الذكي Copilot في أجهزة التلفاز والشاشات الذكية من…

6 أشهر ago