أعلنت شركة OpenAI بالأمس عن
إطلاق أحدث نماذجها والأكثر ذكاءً وهو GPT-4.5؛ المعروف بالاسم الرمزي Orion والذي تصفه
الشركة بأنه أضخم النماذج التي أنتجتها حتى الآن من حيث
حجم البيانات والموارد الحاسوبية
حيث يقع في مكانًا ما بين
GPT-4o و GPT-4. ولكن يَخلُف هذا النموذج سلسلة من الإصدارات التي نجحت في قلب الموازين
التقنية بدايةً من GPT-2 وحتى o3-Mini، لكن على الرغم من أن OpenAI أكدت أنه
يتمتع بقدرات مُعززة مثل "المعرفة الأعمق بالعالم" و"الذكاء العاطفي الأعلى"، فإن
نتائجه في بعض
الاختبارات والمقاييس المتعلقة بالمنطق
كانت مُخيبة للآمال نوعًا ما، على الأقل بالمقارنة مع النماذج العملاقة الموجودة
حاليًا والمتخصصة في المنطق، وعلى رأسها
DeepSeek-R1. عمومًا، دعونا نشارك معكم كل التفاصيل عن نموذج GPT-4.5
حتى الآن.
كل شيء عن نموذج GPT-4.5
مبدئيًا، من يمكنه استخدام GPT-4.5؟
أعلنت OpenAI
أن نموذج جي بي تي-4.5 أصبح متاحًا لمشتركي
خدمة ChatGPT Pro، التي يبلغ سعر الاشتراك فيها 200 دولار شهريًا، بدءًا من أمس الخميس، كما أصبح
مطورو واجهات البرمجة التطبيقية (API) ممن لديهم خطط مدفوعة قادرين على استخدام
النموذج أيضًا في اليوم ذاته. أما مشتركو ChatGPT Plus و ChatGPT Team فسيُتاح
لهم الوصول إلى النموذج خلال الأسبوع القادم، وفق ما صرّح به متحدث باسم OpenAI.
في المقابل، تؤكد الشركة أن GPT-4.5 لا يُعد بديلًا مباشرًا لنموذجها الأساسي
GPT-4o الذي تعتمد عليه معظم تطبيقاتها وخدماتها حاليًا، إذ إن النموذج الجديد
يفتقر إلى بعض الميزات الموجودة في ChatGPT، مثل
ميزة الصوت المتقدم
Advanced Voice Mode. غير أن GPT-4.5 يدعم وظائف مهمة مثل رفع الملفات والصور
واستخدام الـ Canvas، وهو ما قد يجذب فئة من المستخدمين المهتمين بتجارب أكثر
تفاعلًا.
هل يتفوق GPT-4.5 على النماذج الأخرى؟
تشير نتائج الاختبارات الأولية التي أجرتها OpenAI وغيرها GPT-4.5 يحقق أداءً
جيدًا في بعض المهام، لا سيما المهام الإبداعية والمهام التي تتطلب ذكاءً
عاطفيًا. فعلى سبيل المثال، عندما طُلب من النماذج رسم شكل وحيد القرن بصيغة SVG،
تفوق GPT-4.5 وأنتج صورة أقرب كثيرًا إلى وحيد القرن مقارنة بالنماذج الأخرى مثل
GPT-4o وo3-mini. وفي مجالات السؤال والإجابة المباشرة SimpleQA، تبين أن جي بي
تي-4.5 أقل عرضة للهلوسة (Hallucination) وأكثر قدرة على تقديم إجابات دقيقة، ما
يجعله مرشحًا قويًا للتطبيقات التي تتطلب موثوقية أكبر في الحقائق والمعلومات.
رُغم ذلك، يعترف خبراء الشركة 4.5GPT- خيّب الآمال في اختبارات صعبة مثل
SWE-Bench Verified وSWE-Lancer Diamond، التي تقيس مدى مهارة النماذج في كتابة
الأكواد البرمجية أو تطوير خصائص برمجية كاملة. ففي تلك الاختبارات، عجز النموذج
الجديد عن التفوق على نماذج أخرى مثل Claude 3.7 Sonnet في بعض النواحي. الأمر
يزداد وضوحًا في المهام الأكاديمية أو المعقدة في الرياضيات، مثل اختباريّ AIME
وGPQA، حيث برزت حاجة ملحة إلى نماذج التفكير المنطقي التي لا يعتمد أداؤها على
حجم البيانات بقدر ما يقوم على مدى قدرتها على التحليل المتعمق والاستدلال
المطوّل.
إذًا، وبشكلٍ واضح، لا يصل نموذج GPT-4.5 إلى مستوى أداء نماذج الذكاء الاصطناعي
المتقدمة في جزئية المنطق والاستدلال، مثل DeepSeek-R1 وClaude 3.7 Sonnet
وo3-mini، في الاختبارات الأكاديمية المستعصية، لكن بالمقارنة مع النماذج العادية
غير المتخصصة في الاستدلال، فإن GPT-4.5 يضاهيها أو حتى يتفوق عليها. وبالنسبة
للجوانب التي لا تستطيع الاختبارات قياسها بدقة مثل القدرة على فهم نوايا
الإنسان، تدّعي OpenAI أن GPT-4.5 يتفوق بشكل نوعي على غيره من النماذج. وتقول
OpenAI إن نموذجها الجديد يُجيب بنبرةٍ أكثر دفئًا وطبيعية ويبلي بلاءً حسنًا في
المهام الإبداعية مثل الكتابة والتصميم.
النماذج المنطقية هي المستقبل
من اللافت للنظر أن GPT-4.5 يُقدَّم في
وثائق OpenAI
بوصفه أقصى ما يمكن بلوغه حاليًا في إطار التعلم غير الخاضع للإشراف Unsupervised
Learning، وهو النهج الذي أمكن للشركة أن تحصد بفضله نجاحات مدوية في الأجيال
السابقة. لكن تصريحات إيليا سوتسكيفر (Ilya Sutskever)، الشريك المؤسس وكبير
العلماء السابق لدى OpenAI، التي أشار فيها إلى أننا قد وصلنا إلى "حد البيانات
الأقصى" Peak Data تؤكد أن التدريب الموسع ربما يواجه تحديات بنيوية في المستقبل،
مما سيجبر الشركات الرائدة في الذكاء الاصطناعي على إعادة التفكير في الأساليب
المعتمدة على ضخامة الحجم فقط.
في الوقت ذاته، تعكف OpenAI وشركات أخرى مثل Anthropic وDeepSeek على دمج مفاهيم
التفكير المنطقي في نماذجهم، بحيث تتمكن النماذج من معالجة المشكلات على مراحل،
وتستغرق وقتًا أطول في التحليل والتفكير قبل الخروج بالنتائج. وتُرجّح الشركة أن
الخطوة المحورية القادمة ستكون الجمع بين قدرات سلسلة GPT الواسعة وأداء نماذج
"o" المنطقية، تمهيدًا لإطلاق GPT-5.0 في مرحلة لاحقة من هذا العام. إذا صحت هذه
التوقعات، فقد يكون GPT-4.5 تمهيدًا لنموذج هجين أقوى من كل ما رأيناه حتى الآن،
خصوصًا فيما يتعلق بتحسين تماسك الإجابات والتقليل من الأخطاء المنطقية.
نستنتج من هذا أن حجم البيانات لم يعد كافيًا وحده، أو بمعنى آخر، تفوق نموذج
ذكاء اصطناعي على آخر لم يعد مقتصرًا على حجم البيانات الذي يُدرَّب عليها؛ الأمر
يحتاج إلى الجمع بين البيانات والحلول المتخصصة التي تجعل نماذج الذكاء الاصطناعي
قادرة على تعزيز التفكير المنطقي وحل المشكلات "بعقلانية".