GPT-5.2: هذا هو النموذج الجديد الذي تسعى OpenAI من خلاله إلى استعادة مكانتها المفقودة

  • إطلاق متسارع لـ GPT-5.2 بعد تقدم جوجل في Gemini 3 وإعلان OpenAI الداخلي "الرمز الأحمر".
  • ثلاثة أنواع رئيسية (الفورية، والتفكيرية، والاحترافية) موجهة نحو مستويات مختلفة من السرعة، والتفكير المنطقي، والدقة المهنية.
  • تحسينات ملحوظة في الاستدلال والبرمجة والتعامل مع السياقات الطويلة والرؤية واستخدام الأدوات، مع نتائج فائقة في العديد من المعايير.
  • يتم نشرها بشكل تدريجي للمستخدمين المدفوعين وعبر واجهة برمجة التطبيقات، بأسعار أعلى من GPT-5.1 ولكنها موجهة نحو الاستخدام التجاري المكثف.

GPT-5.2

السباق لقيادة الذكاء الاصطناعي التوليدي تصاعدت التوترات بشكل أكبر في الأسابيع الأخيرة. بعد إطلاق جيميني 3 قررت شركة OpenAI التابعة لشركة جوجل التحرك بسرعة والتقدم للأمام الوصول يهدف GPT-5.2، وهو إصدار جديد من نموذجه الرائد، إلى تعزيز أداء ChatGPT في المهام المعقدة، وتحسين الاستقرار، وتقليل الأخطاء في الاستخدام اليومي.

لا يُقصد بهذا الإطلاق أن يكون قفزة نوعية جذرية، بل تحديثًا هامًا ضمن سلسلة الفئة الخامسة. ومع ذلك، فإن الجمع بين... تسريع عملية النشر، وتغييرات في خارطة الطريق الداخلية ويضع التركيز الأكثر فعالية على الاستدلال وإنتاجية مكان العمل GPT-5.2 في صميم استراتيجية OpenAI لتجنب خسارة مكانتها أمام جوجل وأنثروبيك. برنامج DeepSeek الإصدار 3.2وغيرهم من الممثلين الذين وضعوا أنفسهم في قمة التصنيفات الفنية.

الكود الأحمر في OpenAI والإصدار المبكر: GPT-5.2

يأتي قرار تقديم GPT-5.2 في سياق أقصى ضغط تنافسيأدى الاستقبال الإيجابي لـ Gemini 3 - وخاصة في اختبارات التفكير والبرمجة المتقدمة - إلى قيام OpenAI بتفعيل حالة "الإنذار الأحمر" داخليًا. أرسل سام ألتمان، الرئيس التنفيذي للشركة، مذكرة يطلب فيها تركيز الموارد على تحسين ChatGPT وتعليق المبادرات الثانوية، مثل بعض تجارب تحقيق الدخل والميزات الأقل أهمية على المنصة.

بحسب تسريبات مختلفة، كان من المقرر في البداية إجراء التحديث في نهاية ديسمبر، لكن الإدارة قررت على ما يبدو تأجيله. تقديم موعد نشرها ببضعة أسابيع يهدف هذا إلى سد الفجوة في الأداء والتصور العام التي أحدثتها أحدث نماذج جوجل. ورغم أن التاريخ المحدد يخضع دائمًا لتعديلات تقنية محتملة في اللحظات الأخيرة، إلا أن المصادر تتفق على أن الجدول الزمني الداخلي قد تم ضغطه لضمان وصول GPT-5.2 إلى المستخدمين والمطورين المشتركين في أسرع وقت ممكن.

هذا التحول في الأحداث يُذكّرنا، وإن كان على نطاق مختلف، بما حدث عام ٢٠٢٢، حين أجبر إطلاق ChatGPT شركة جوجل على تسريع خطة تطوير منتجاتها. والآن انقلبت الأدوار، وأصبحت OpenAI هي التي تحاول... تؤكد مكانتها المرجعية في سوق تتغير فيه تصنيفات الأداء وأدوات مقارنة النماذج بشكل شبه يومي.

GPT-5.2، وهو تطور ضمن سلسلة GPT 5 يركز على العمل المعرفي

يُقدَّم GPT-5.2 على أنه امتداد مباشر لـ GPT-5.1، وليس جيلاً جديداً كلياً. ومع ذلك، تُصرّ الشركة على أن التحديث يُمثّل تقدماً كبيراً لما يُسمى بـ العمل المعرفي: البرمجة، تحليل الوثائق، النمذجة المالية، البحث العلمي، أو إعداد التقارير المعقدة.

تزعم شركة OpenAI أن النموذج يدير السياقات الطويلةيقلل هذا من أخطاء الاستدلال ويحسن القدرة على تنسيق تسلسل الإجراءات والأدوات الخارجية. هذا المزيج أساسي للمهام التي تتجاوز مجرد الإجابة على سؤال بسيط، مثل المشاريع متعددة الخطوات، أو مراجعات الوثائق الشاملة، أو الأتمتة الجزئية لسير العمل في الشركات.

عملياً، يعد GPT-5.2 بتحقيق تقدم في إنشاء جداول بيانات مفصلة، ​​وعروض تقديمية منظمة، ومخططات تشغيلية، ووثائق فنية، بهدف تمكين الشركات من تفويض المزيد من العمل "العملي" إلى النموذج دون إضاعة الكثير من الوقت في التصحيح وإعادة الكتابة.

ثلاثة أنواع: فوري، تفكير، واحترافي

تم تنظيم عائلة GPT-5.2 الجديدة في ثلاث طبقات استخدام متميزة، بهدف تعديل النموذج ليناسب الاحتياجات المختلفة ومستويات التكلفة:

  • GPT-5.2 الفوريتُعطي هذه النسخة الأولوية للسرعة، وهي مصممة للاستفسارات اليومية، والكتابة العامة، والترجمة، واسترجاع المعلومات، والمهام التي يكون فيها وقت الاستجابة أهم من التحليل المتعمق. كما تتميز هذه النسخة بتفسيرات أكثر استقرارًا وأخطاء أقل مقارنةً بالإصدارات السابقة.
  • تفكير GPT-5.2هل النسخة موجهة نحو التفكير متعدد الخطوات والتعامل مع الوثائق الواسعةتتخصص هذه التقنية في البرمجة المعقدة، وتحليل البيانات، والمهام الرياضية المتقدمة، والنمذجة المالية، ومراجعة العقود، والتخطيط طويل الأجل للمشاريع. وهنا تحديداً تركز OpenAI جهودها لتحسين الاتساق واستخدام الأدوات المتكاملة.
  • GPT-5.2 برويُصنّف هذا الجهاز ضمن الفئة الراقية للاستخدامات التي تتطلب دقة عالية، مع التركيز على تحقيق أعلى دقة ممكنة ضمن القيود التقنية الحالية. إنه النموذج المُوجّه لأولئك الذين يُفضّلون جودة الاستدلال على زمن الاستجابة، والذين هم على استعداد لتقبّل... تكلفة حسابية أعلى، مثل فرق البحث والتطوير، والمكاتب المتخصصة، أو المشاريع العلمية المعقدة.

لا يقتصر هدف هذا التقسيم على مجرد تقديم "نموذج أكثر قوة"، بل يسعى إلى تخصيص الكتالوج ليناسب مختلف فئات المستخدمين، بدءًا من المستخدمين الذين يرغبون في الحصول على إجابات سريعة في ChatGPT وصولًا إلى الشركات الأوروبية التي تقوم بنشر وكلاء داخليين على بياناتها الخاصة من خلال واجهة برمجة التطبيقات (API).

الأداء في معايير GPT-5.2: الاستدلال، والبرمجة، والعلوم

تُرفق OpenAI عملية الإطلاق بمجموعة كبيرة من البيانات التي تضع GPT-5.2 أعلى من GPT-5.1 في جميع الفئات التي اختارت نشرها تقريبًا. في تقييمات مثل GDPval، التي تقارن نتائج النموذج مع نتائج المحترفين البشريين في 44 مهنة، يحقق GPT-5.2 نتائج متفوقة أو متعادلة في حوالي 70,9% من الحالات، مع تحسينات ملحوظة في المهام التي تتضمن إنشاء العروض التقديمية والوثائق التشغيلية والمواد المالية.

اختبارات متخصصة مثل اختبار GPQA Diamond - الذي يركز على أسئلة على مستوى الدراسات العليا في الفيزياء والكيمياء والأحياء - يحقق GPT-5.2 Pro دقة تقارب 93%يلي ذلك مباشرةً نموذج التفكير، الذي يقلّ قليلاً عن هذا الحدّ ولكنه يحوم حوله. في الرياضيات المتقدمة، ترتفع نتيجة النموذج في اختبار FrontierMath (المستويات 1-3) إلى ما يزيد قليلاً عن 40%، وهو رقم لا يزال بعيداً عن الكمال ولكنه يشير إلى تقدّم مطّرد في القدرة على تتبّع السلاسل المنطقية الطويلة والمنظمة.

يشهد قسم البرمجة أيضًا قفزة نوعية. في برنامج SWE-Bench Pro، الذي يقيم حل الحوادث الحقيقية في مستودعات البرامج وبفضل تقليل مخاطر اطلاع النموذج على البيانات مسبقًا، يتفوق GPT-5.2 Thinking على سابقه بعدة نقاط، محققًا معدل حل المشكلات بنحو 55,6%. أما بالنسبة للمهام التي تم التحقق منها، فيرتفع هذا الرقم إلى ما يقارب 80%، وهو ما يعني عمليًا تقليل التدخل اليدوي في مراجعة التصحيحات وإعادة هيكلة الكود والمكونات بأكملها.

عند إجراء المزيد من التقييمات التقنية، مثل ARC-AGI (الاستدلال المجرد واكتشاف الأنماط) أو مجموعات العلوم والبرمجة المحددة، يحتل النموذج مرتبة أعلى من GPT-5.1، ووفقًا للرسوم البيانية التي نشرتها OpenAI، يتقدم على Gemini 3. جروك 4 فاست وحصل كلود أوبوس على 4.5 في العديد من اختبارات الاستدلال المعقدة. هذه الأنواع من المقاييس، على الرغم من أنها موضع نقاش دائم من حيث تمثيلها، إلا أنها تُعدّ إحدى الحجج المركزية التي تحاول الشركة من خلالها إقناع المستثمرين وكبار العملاء إن الريادة التقنية لمنافسيهم، على أقل تقدير، موضع نقاش.

التأثير على مهام العالم الحقيقي: التمويل، وتحليل المستندات، والوكلاء

وبعيدًا عن الأرقام، تؤكد OpenAI أن التحسينات ملحوظة في المهام اليوميةفي عمليات المحاكاة الداخلية التي تحاكي مهام المحللين الماليين - مثل بناء نماذج ثلاثية الحالات أو عمليات الاستحواذ بالرافعة المالية - كان من الممكن أن ينتقل التفكير في GPT-5.2 من متوسط ​​​​درجة قريبة من 59٪ إلى درجة أعلى من 68٪، مما يقلل من أخطاء الحساب والحاجة إلى التصحيحات اللاحقة.

أفادت التقارير أن شركات مثل Notion وBox وShopify وHarvey وTriple Whale، التي سبق لها استخدام نماذج سابقة من الشركة، قد شهدت تقدماً في هذا المجال. استقرار العوامل القائمة على الأدواتينتج عن ذلك تنسيق أفضل بين استدعاءات واجهة برمجة التطبيقات المتعددة، وخطوات وسيطة أكثر اتساقًا، وتقليل حالات التعطل في العمليات الطويلة. في بعض الحالات، وفقًا لهذه الشهادات، أمكن استبدال بنى متعددة الوكلاء الهشة بوكيل واحد مدعوم بـ GPT-5.2، مع أكثر من عشرين أداة متصلة وتقليل الحاجة إلى المراقبة المستمرة.

بالنسبة لفرق المنتجات والدعم والتطوير داخل المؤسسات الأوروبية، تُترجم هذه الأنواع من التغييرات إلى إمكانية بناء مساعدين داخليين يقومون بمعالجة العقود المطولة والتقارير التنظيمية والوثائق الفنية. دون فقدان الخيط بعد مئات الصفحات أو الملفات المتعددة ذات الصلة، وهو أمر ذو أهمية خاصة في القطاعات الخاضعة للتنظيم مثل التمويل أو الرعاية الصحية أو الطاقة.

عرض وواجهات رسومية وفهم المستندات الطويلة في GPT-5.2

كما شهد المكون متعدد الوسائط تقدماً ملحوظاً. ففي تقييمات مثل CharXiv Reasoning - التي تركز على الشخصيات العلمية - قلل GPT-5.2 أخطاء التفسير إلى النصف مقارنةً بـ GPT-5.1. وفي ScreenSpot-Pro، وهو اختبار يقيس القدرة على الفهم واجهات رسومية معقدةيزيد النموذج من دقته إلى أرقام تقارب 86٪، وهو أمر مفيد بشكل خاص لقراءة لوحات التحكم أو لوحات المعلومات أو مخططات البرامج.

فيما يتعلق بذاكرة السياق، يقترب أداء GPT-5.2 من الأداء المثالي على متغيرات MRCRv2 عبر مئات الآلاف من الرموز. عمليًا، هذا يعني أنه يستطيع التعامل مع كميات كبيرة من النصوص —تقارير الاستشارات والملفات وعمليات التدقيق الفني أو الوثائق الأكاديمية— الحفاظ على المراجع الداخلية والاتساق بين الأقسام، وهو أمر تعتبره العديد من المنظمات الأوروبية شرطًا أساسيًا لإسناد العمليات الحساسة إلى نموذج الذكاء الاصطناعي.

هذا المزيج من تحسين الرؤية وزيادة القدرة على فهم السياق يفتح الباب أمام استخدامات أكثر طموحًا، مثل: مراجعة مشتركة للعروض التقديمية وجداول البيانات وملفات PDF ضمن نفس التدفق، أو فحص واجهات الويب والأدوات الداخلية لتسهيل الدعم الفني وتحليل سهولة الاستخدام.

أخطاء أقل، ولكن مع الحاجة إلى إشراف بشري

من أكثر الوعود التي تكررها الشركة باستمرار هو تقليل الأخطاء في الاستجاباتتشير OpenAI إلى أن GPT-5.2 Thinking يولد حوالي 30٪ أقل من الاستجابات الخاطئة مقارنة بـ GPT-5.1، وأن معدل الاستجابات التي تحتوي على بعض عدم الدقة ينخفض ​​بشكل عام من حوالي 8,8٪ إلى حوالي 6,2٪.

ومع ذلك، تؤكد الشركة أن النموذج يبقى احتماليًا، وأن أي خطأ في عبارة واحدة قد يستدعي مراجعة يدوية للمخرجات بأكملها، لا سيما في السياقات الحساسة أو الخاضعة للتنظيم. ولهذا السبب، تصر على ضرورة النظر إلى GPT-5.2 على أنه أداة دعم الاستدلالليس كبديل عن الحكم البشري، خاصة في مجالات مثل الصحة، والمالية، والقانون، أو البحث الأكاديمي.

في المجالات الحساسة - على سبيل المثال، المحادثات المتعلقة بالصحة النفسية أو الضيق العاطفي - تدعي الشركة أنها قامت بتحسين ضوابط لتقليل الاستجابات غير المناسبةومع ذلك، فهو يُقرّ بوجود مجالٍ للتحسين. وتكتسب هذه الاعتبارات أهميةً خاصةً في أوروبا، حيث يُضيف الإطار التنظيمي الجديد للذكاء الاصطناعي التزاماتٍ إضافيةً فيما يتعلق بالشفافية والأمن وإدارة المخاطر.

المساهمة في العمل العلمي والرياضي

كما تقدم OpenAI نموذج GPT-5.2 كأداة مصممة لـ لتعزيز التطور العلميوتؤكد الشركة أن السلسلة 5 كانت لها بالفعل تطبيقات في الرياضيات والفيزياء وعلم الأحياء وعلوم الكمبيوتر وعلم الفلك وعلوم المواد، وأن هذه الحالات أصبحت أكثر اتساقًا مع الإصدار الجديد.

في برنامج GPQA Diamond، وهو أحد المعايير المرجعية لتقييم الفهم العلمي المتقدم، تتجاوز دقة GPT-5.2 Pro و Thinking نسبة 92%تُفسّر الشركة هذه النتيجة على أنها مؤشر على قدرة النموذج على مساعدة الباحثين في استكشاف الأفكار، ومراجعة الأدبيات، أو صياغة البراهين. وفي إحدى الحالات الموثقة، يُقال إن GPT-5.2 Pro ساهم في معالجة مشكلة مفتوحة في نظرية التعلم الإحصائي، مع العلم أن هذا الأمر يخضع دائمًا للتحقق البشري اللاحق.

لكن شركة OpenAI نفسها توضح أنه ينبغي فهم هذه الأنظمة على أنها مساعدون للمرحلة الاستكشافية في العمل العلمي: مفيد لتوليد التخمينات، وإعادة صياغة الفرضيات أو اقتراح خطوات وسيطة، ولكن دون إزاحة الدور المركزي للخبراء عندما يتعلق الأمر بالتحقق من صحة النتائج، وتفسير الأدلة، ووضع الاستنتاجات في سياقها.

النشر في ChatGPT والوصول عبر واجهة برمجة التطبيقات (API).

بدأ نشر GPT-5.2 على مراحل في ChatGPT للمستخدمين المدفوعينيشمل ذلك باقات Plus وPro وGo وBusiness وEnterprise. لن يرى جميع المشتركين النموذج الجديد في الوقت نفسه، حيث تفضل OpenAI تفعيل الوصول على مراحل لتجنب مشاكل السعة، وهو ما قد يكون ملحوظًا في أوروبا كطرح تدريجي على مدى عدة أيام.

خلال الأشهر الثلاثة القادمة، سيظل GPT-5.1 متاحًا كنموذج قديم ضمن ChatGPT قبل إيقافه نهائيًا، حتى تتمكن المؤسسات التي تعتمد على سير العمل المُعتمد من التخطيط للانتقال دون انقطاعات مفاجئة. هذا التعايش المؤقت يسهل اختبار GPT-5.2 بالتوازي وتعديل المطالبات والضوابط الداخلية وعمليات التحقق.

في واجهة برمجة التطبيقات، تحافظ التسمية على التوافق المعتاد: يظهر متغير Instant على النحو التالي: أحدث دردشة gpt-5.2يُعرف الإصدار المفكر باسم جي بي تي-5.2 والمحترف كـ gpt-5.2-proيمكن للمطورين تعديل مستوى التفكير في خيار Pro، مع مستوى xhigh جديد مصمم للمشاريع التي تكون فيها جودة السلسلة المنطقية أكثر أهمية من زمن الاستجابة أو التكلفة.

التسعير، وكفاءة GPT-5.2، والتركيز على عملاء المؤسسات

من الناحية الاقتصادية، يأتي GPT-5.2 مع رسوم أعلى لكل مليون رمز يُحدد نموذج GPT-5.1 من OpenAI السعر الأساسي بحوالي 1,75 دولار لكل مليون رمز إدخال و14 دولارًا لكل مليون رمز إخراج، مع خصومات تصل إلى 90% على المدخلات المخزنة مؤقتًا. أما النسخة الاحترافية (Pro) فتزيد التكلفة بشكل أكبر، حيث تصل الأرقام إلى عدة مئات من الدولارات لكل مليون رمز إخراج في أكثر إعدادات الاستدلال تطلبًا.

وتزعم الشركة أن الكفاءة الأكبر للنموذج تسمح بتقليل التكلفة الفعلية لكل مهمة، خاصة في السيناريوهات التي يستغرق فيها GPT-5.2 وقتًا أقل للوصول إلى إجابة صحيحة، ويتطلب عددًا أقل من المحاولات، ويرتكب أخطاء أقل. أخطاء أقل تتطلب إعادة العملومع ذلك، من الواضح أن هيكل التسعير مصمم للاستخدام المؤسسي والتطوير المكثف، بدلاً من التجارب الفردية.

في ChatGPT، تحافظ الاشتراكات Plus وما فوقها على أسعارها المعتادة، مما يحوّل جزءًا كبيرًا من التكلفة الإضافية إلى استخدام واجهة برمجة التطبيقات (API). بالنسبة للعديد من الشركات الأوروبية التي تدمج ChatGPT بالفعل في شبكاتها الداخلية، أو أدوات الإنتاجية، أو المساعدين الداخليين، قد يعني هذا إعادة ضبط الميزانيات وتحديد العمليات التي تستحق الانتقال إلى GPT-5.2 والعمليات التي يمكن أن تستمر في العمل باستخدام النماذج السابقة الأكثر اقتصادية.

ضغوط البنية التحتية والأمن والتنظيم

يعتمد نشر GPT-5.2، كما هو الحال في الأجيال السابقة، على البنية التحتية لـ مايكروسوفت أزور ووحدات معالجة الرسومات من إنفيديا (بما في ذلك عائلات H100 وH200 وGB200-NVL72). وقد خصصت OpenAI استثمارات بملايين الدولارات في القدرة الحاسوبية لدعم هذه النماذج الرائدة، وهي مخاطرة تنطوي على مخاطر مالية وتتطلب من الشركة البحث باستمرار عن مصادر دخل جديدة. كما أنها تستكشف نماذج الترجيح المفتوحة مثل... GPT OSS.

وفي الوقت نفسه، تقوم الشركة بتطبيق إجراءات إضافية فيما يتعلق سلامة وحماية القُصّرمن أبرز الخطوات تطبيق نظام قادر على تقدير أعمار المستخدمين، بهدف تكييف استجابات ChatGPT مع من هم دون سن 18 عامًا، وتمهيد الطريق لـ"وضع البالغين" مستقبلًا مع ضوابط مُحسّنة. تتوافق هذه الآليات مع المتطلبات التنظيمية التي تترسخ بشكل متزايد في كل من الاتحاد الأوروبي والولايات المتحدة.

تُقرّ OpenAI بأن أنظمتها قد تكون سلبية بشكل مفرط في بعض الأحيان، بمعنى أنها ترفض الطلبات التي لا تنتهك بالضرورة السياسات، وتقول إنها تعمل على ذلك. توازن أفضل بين السلامة والفائدةوتصر الشركة أيضًا على أنه سيتم الإعلان عن أي تغييرات ذات صلة بتوافر الإصدارات السابقة - مثل GPT-5.1 أو GPT-5 أو GPT-4.1 في واجهة برمجة التطبيقات - قبل وقت كافٍ، وهو ما يمثل علامة على استمرارية الخدمة للعملاء الذين ما زالوا يعتمدون على تلك النماذج.

يُقدَّم GPT-5.2 كتحديث دوري يسعى إلى الجمع بين تحسينات في الاستدلال والسرعة والاستقرار، مع استراتيجية أكثر تركيزًا على الاستخدام المهني والتجاري. إذا ما تم ترسيخ التحسينات في البرمجة والعلوم وتحليل المستندات ومعالجة السياقات الواسعة في الممارسة اليومية، فقد يصبح النموذج أداةً فعّالة للمؤسسات الأوروبية الساعية إلى... أتمتة جزء من عملياتهم دون التخلي عن السيطرة البشرية الصارمةيبقى أن نرى إلى أي مدى ستترجم هذه الوعود إلى تغييرات حقيقية في الإنتاجية وفي طريقة عملنا مع الذكاء الاصطناعي في الأشهر المقبلة.

برنامج DeepSeek-V3.2
المادة ذات الصلة:
DeepSeek-V3.2: النموذج الصيني الذي يريد التنافس مع GPT-5 وGemini-3 Pro