Categories: اخر الاخبارالأخبار التقنيةدراسات وتقارير

دراسة حديثة.. نماذج الذكاء الاصطناعي المتطورة غير قادرة على حل معظم المشكلات البرمجية

كشف باحثون في شركة OpenAI أنه حتى نماذج الذكاء الاصطناعي الأكثر تطورًا ما تزال غير قادرة على التفوق على المبرمجين البشر، مع أن الرئيس التنفيذي سام ألتمان صرّح سابقًا بأن هذه النماذج قد تتفوق على مهندسي البرمجيات المبتدئين بحلول نهاية العام الحالي.

اختبار كفاءة نماذج الذكاء الاصطناعي في البرمجة

في دراسة حديثة أجراها باحثون في شركة OpenAI، أظهرت النتائج أن النماذج المتقدمة من الذكاء الاصطناعي ما تزال غير قادرة على حل الغالبية العظمى من المهام البرمجية.

واعتمد الباحثون في تقييمهم على معيار جديد يُدعى SWE-Lancer، طُوّر باستخدام أكثر من 1400 مهمة برمجية مستمدة من منصة العمل الحر Upwork.

واختبر الباحثون ثلاثة نماذج متطورة من الذكاء الاصطناعي، هي:

نموذج o1 الخاص بشركة OpenAI.
نموذج GPT-4o الرائد من OpenAI.
نموذج Claude 3.5 Sonnet من شركة Anthropic.

وركز الاختبار في نوعين من المهام البرمجية، هما:

إصلاح الأخطاء البرمجية.
اتخاذ قرارات على مستوى عالٍ لإدارة المشاريع البرمجية.

ولضمان دقة التقييم، لم يُسمح للنماذج بالوصول إلى الإنترنت؛ مما منعها من الوصول إلى حلول جاهزة أو الاعتماد على أمثلة سابقة منشورة على الإنترنت.

النتائج:

واجهت نماذج الذكاء الاصطناعي صعوبة في التعامل مع المهام المطلوبة منها، ولم تتمكن من إصلاح سوى الأخطاء البرمجية البسيطة، وعجزت عن اكتشاف الأخطاء في المشاريع البرمجية الكبيرة أو تحليل أسبابها الجذرية.

ومع أن النماذج أظهرت سرعة أكبر من البشر في تنفيذ المهام، فإنها أخفقت في فهم الأخطاء، مما أدى إلى حلول غير دقيقة أو غير شاملة.

تفوق نسبي لنموذج Claude 3.5 Sonnet

بحسب الدراسة، أظهر نموذج Claude 3.5 Sonnet أداءً أفضل من نماذج OpenAI الأخرى، لكن معظم إجاباته كانت غير صحيحة. وأكد الباحثون أن أي نموذج ذكاء اصطناعي يحتاج إلى مستوى أعلى من الدقة والموثوقية قبل أن يُعتمد عليه في المهام البرمجية الحقيقية.

الخلاصة: الذكاء الاصطناعي لم يصل بَعد إلى مستوى مهندسي البرمجيات

تُشير هذه الدراسة إلى أن نماذج الذكاء الاصطناعي يمكنها أداء المهام البرمجية البسيطة بسرعة، لكنها ما تزال غير قادرة على التعامل مع المشاريع البرمجية المعقدة بكفاءة مماثلة لكفاءة المبرمجين البشر.

ومع أن مجال الذكاء الاصطناعي يتطور بسرعة، فإنه ما يزال غير قادر على العمل مثل المبرمجين البشريين. ومع ذلك، لم يمنع هذا بعض الشركات من التوجه نحو تقليص عدد المبرمجين البشريين لصالح نماذج الذكاء الاصطناعي، حتى مع عدم تفوقها في هذه المهام بَعد.

Aitspot

Next هل يعزز الذكاء الاصطناعي قدراتنا في الرياضيات أم يتجاوزها؟ »

Previous « يوتيوب تقلل الإعلانات المزعجة وسط مقاطع الفيديو

ChatGPT يستطيع تحويل المحتوى إلى عروض تقديمية بشكل ذكي باستخدام الذكاء الاصطناعي في PowerPoint.

بدأت شركة OpenAI اختبار إدماج روبوت الذكاء الاصطناعي ChatGPT داخل برنامج مايكروسوفت PowerPoint، وهو أحد…

شهرين ago

اخر الاخبار

OpenAI تمكن Codex من العمل داخل متصفح Google Chrome

أطلقت OpenAI إضافة جديدة لمتصفح “جوجل كروم” تحمل اسم “Codex for Chrome”، تتيح لمساعد البرمجة…

شهرين ago

اخر الاخبار

ميتا تطوّر وكيل ذكاء اصطناعي لتحسين تجربة التسوق داخل إنستاجرام.

تعمل شركة ميتا بتطوير وكلاء ذكاء اصطناعي جديدة مُخصّصة للمستخدمين والشركات عبر منصاتها؛ وكشف تقرير…

شهرين ago

اخر الاخبار

Gemini يقوم بإنشاء الملفات وتغيير تجربة العمل باستخدام الذكاء الاصطناعي

هناك لحظات تتجاوز فيها التكنولوجيا كونها مجرد "أداة" لتصبح جزءًا لا يتجزأ من عملية العمل.…

شهرين ago

اخر الاخبار

ماك بوك برو الجديد: قفزة نوعية في الذكاء الاصطناعي وأسعار تلامس 6000 دولار

كشفت شركة آبل عن أحدث إصداراتها من حواسيب "ماك بوك برو" المحمولة، والتي زودتها بشرائح…

5 أشهر ago

اخر الاخبار

مايكروسوفت تُدمج محرر صور متقدم في تطبيق بوربوينت

كشفت شركة مايكروسوفت عن إضافة أداة متكاملة لتحرير الصور داخل برنامج “بوربوينت”، بهدف توفير تجربة…

5 أشهر ago

دراسة حديثة.. نماذج الذكاء الاصطناعي المتطورة غير قادرة على حل معظم المشكلات البرمجية

اختبار كفاءة نماذج الذكاء الاصطناعي في البرمجة

النتائج:

تفوق نسبي لنموذج Claude 3.5 Sonnet

الخلاصة: الذكاء الاصطناعي لم يصل بَعد إلى مستوى مهندسي البرمجيات

Related Post

Recent Posts

ChatGPT يستطيع تحويل المحتوى إلى عروض تقديمية بشكل ذكي باستخدام الذكاء الاصطناعي في PowerPoint.

OpenAI تمكن Codex من العمل داخل متصفح Google Chrome

ميتا تطوّر وكيل ذكاء اصطناعي لتحسين تجربة التسوق داخل إنستاجرام.

Gemini يقوم بإنشاء الملفات وتغيير تجربة العمل باستخدام الذكاء الاصطناعي

ماك بوك برو الجديد: قفزة نوعية في الذكاء الاصطناعي وأسعار تلامس 6000 دولار

مايكروسوفت تُدمج محرر صور متقدم في تطبيق بوربوينت