
أصدرت OpenAI بيانًا جريئًا آخر مع إطلاق de GPT-5.5، النموذج الذي يضع أحدث جيل من ChatGPT في مستوى أعلى بكثير من الاستقلالية والاستدلال. بناءً على ما رأيناه حتى الآن، تقدم الشركة هذا النظام باعتباره نظامها الأكثر سهولة وقدرة على التعامل مع المهام المعقدة من البداية إلى النهاية، مما يقلل الحاجة إلى إشراف المستخدم المستمر.
تأتي هذه الخطوة في وقت سباق الريادة في مجال الذكاء الاصطناعي التوليديمع قيام كل من أنثروبيك وجوجل بتسريع نماذجهما الخاصة، يتم إطلاق GPT-5.5 أولاً على ChatGPT وCodex للمستخدمين المدفوعين، ويجمع بين التحسينات في البرمجة، والعمل المكتبي، والبحث العلمي، واستخدام الكمبيوتر في العالم الحقيقي، بتكلفة تحاول OpenAI تبرير الزيادة في الأسعار من خلال الكفاءة الملحوظة في استخدام الرموز..
ما هو GPT-5.5 وما هو الدور الذي يلعبه في استراتيجية OpenAI؟
بحسب شركة OpenAI، يمثل GPT-5.5 خطوة جديدة في مجال الاستدلال المستدام والعمل المستقل مع الحاسوبتم تصميم النموذج للقيام بمهام طويلة ومتعددة الخطوات: يمكنه تلقي تعليمات غير منظمة، وتقسيمها، والتخطيط لما يجب القيام به أولاً، واختيار الأدوات والتعامل معها، ومراجعة نتائجه الخاصة، والاستمرار حتى لو كانت هناك غموض في البيان.
تُعرّف الشركة ذلك بأنه ذكاؤها الاصطناعي الأكثر سهولة في الاستخدام حتى الآنبدلاً من مجرد الإجابة على أسئلة معزولة، يعمل GPT-5.5 كعامل: فهو يحافظ على السياق أثناء العمليات المطولة، ويتنقل بين المعلومات على الويب، وينفذ الأوامر، ويتعامل مع المستندات وتطبيقات المكتب، ويعيد نتائج منظمة مسبقًا، جاهزة للاستخدام في البيئات المهنية.
يشمل الإطلاق إصدار GPT-5.5 Pro، مصمم للمهام الأكثر تعقيدًا يضم التطبيق بالفعل مستخدمين يحتاجون إلى إجابات أكثر دقة في مجالات مثل القانون والأعمال والتعليم وتحليل البيانات المتقدم. كما يتميز ChatGPT بوضع خاص. تفكير GPT-5.5مصمم خصيصًا لحل المشكلات الصعبة في البرمجة أو البحث أو تحليل المعلومات.
الاستقلالية والاستخدام الواقعي للحاسوب: من روبوت الدردشة إلى وكيل العمل
أحد رهانات OpenAI الكبيرة هو قدرة GPT-5.5 على الأداء كـ وكيل مستقل على الكمبيوتر. يمكن للنموذج البحث عن المعلومات، وتحديد ما هو ذو صلة، ودمج المصادر، وتشغيل البرامج والأدوات بالتسلسل، وتحويل المواد المتناثرة إلى مخرجات مفيدة، دون أن يضطر المستخدم إلى تحديد كل خطوة بدقة.
في الحياة اليومية، يترجم هذا إلى مهام مثل إنشاء مستندات أو جداول بيانات أو عروض تقديمية معقدةمراجعة العقود، وإعداد التقارير، وتحليل قواعد البيانات، أو إنشاء ملخصات شاملة من ملفات متعددة. وتزعم الشركة أن GPT-5.5 يفهم احتياجات المستخدم بسرعة أكبر ويتولى جزءًا أكبر من العمل بنفسه مقارنةً بالإصدارات السابقة.
ولتوضيح هذا التغيير، تستشهد OpenAI بأمثلة داخلية: تستخدم فرق التمويل برنامج Codex و GPT-5.5 لمراجعة عشرات الآلاف من نماذج الضرائب في وقت أقل بكثير، تقوم أقسام الاتصالات بأتمتة أطر التقييم والمخاطر على كميات كبيرة من الطلبات، أو أن أقسام التسويق والمنتجات قد قللت بشكل كبير من الوقت الذي يقضيه في إعداد التقارير الدورية بفضل سير العمل الآلي.
الأداء في البرمجة الوكيلة وتطوير البرمجيات
يُظهر GPT-5.5 تحسينات في البرمجة وما يُطلق عليه OpenAI اسم "برمجة الوكيل" - أي استخدام الذكاء الاصطناعي كوكيل يكتب ويُصحح ويُحافظ على الكود من البداية إلى النهاية. في بيئات التطوير، يستطيع النموذج إدارة مستودعات ضخمة، واقتراح عمليات إعادة هيكلة معقدة، وتحديد مصدر الأخطاء، والتنبؤ بأجزاء النظام التي ستتأثر بالتغيير.
في المعيار محطة العمل الطرفية 2.0يحقق GPT-5.5، الذي يقيس سير العمل المعقد لسطر الأوامر، ما يلي: 82,7%، متفوقاً بشكل واضح على GPT-5.4، ويفعل ذلك مع استهلاك عدد أقل من الرموز. SWE-Bench Proيركز النموذج على حل مشكلات GitHub الواقعية، ويصل إلى 58,6%وفي التقييم الداخلي خبير في هندسة البرمجياتوبمهام يقدر وقت إنجازها البشري بحوالي 20 ساعة، فهي أيضاً أعلى من سابقتها.
يشير المهندسون الذين اختبروا الإصدارات المبكرة إلى أن يُحسّن GPT-5.5 فهم البنية العامة للأنظمة المعقدةفي الاختبارات الداخلية، يتم الاستشهاد بحالات مثل دمج الفروع مع مئات التغييرات التي تم حلها في حوالي عشرين دقيقة، وإعادة تصميم الأنظمة الفرعية بشكل شبه كامل (على سبيل المثال، نظام التعليقات في محرر تعاوني) أو الكشف المبكر عن الأخطاء التي كانت تتطلب سابقًا العديد من التكرارات.
في بيئة هندسة البرمجيات Codex التابعة لشركة OpenAI، يمتلك GPT-5.5 نافذة سياق تصل إلى 400.000 رمز، مما يسمح له بالعمل مع قواعد بيانات ضخمة للغاية. كما يتميز بوضع سريع يُولّد ما يقارب [عدد الرموز المطلوبة]. أسرع بـ 1,5 مرة، على الرغم من ارتفاع تكلفة الرمز المميز، إلا أنه مصمم لأولئك الذين يعطون الأولوية لسرعة الاستجابة.
العمل المعرفي، والأعمال التجارية، والاستخدام المكتبي اليومي
إلى جانب تطوير البرمجيات، صُمم GPT-5.5 كأداة للعمل الاحترافي في بيئات المكاتب والاستشارات وتحليل البيانات. وتؤكد OpenAI أن نفس الإمكانيات التي تُحسّن البرمجة تُتيح الآن إنجاز مهام التوثيق والتحليل بشكل أكثر فعالية.
في المعيار الناتج المحلي الإجمالي، والذي يقيم القدرة على إنتاج أعمال متخصصة محددة في 44 المهنيحصل GPT-5.5 على 84,9% من الإجابات الصحيحة أو التعادلات. في OSWorld-تم التحقق منهتم تصميم اختبار للتحقق مما إذا كان النموذج قادرًا على التعامل مع بيئات الحوسبة الواقعية بشكل مستقل، وقد تم التوصل إلى 78,7%. في تاو2-بينش للاتصالات، التي تركز على خدمة العملاء في قطاع الاتصالات، تصل إلى 98% دون الحاجة إلى تعديل الموجه، مما يشير إلى أداء عالٍ في سيناريوهات الدعم.
بالنسبة للاستخدام المؤسسي، تُبرز OpenAI ما يلي: يستخدم أكثر من 85% من موظفيهم نظام Codex أسبوعياً في مجالات مثل الهندسة والمالية والتسويق والبيانات والمنتجات. وتُظهر حالات مثل أتمتة التقارير الأسبوعية، التي توفر ما بين خمس إلى عشر ساعات لكل شخص أسبوعيًا، نوع الفوائد التي تُعزى إلى النموذج الجديد عند دمجه في عمليات الشركة.
البحث العلمي، وعلم الأحياء، والرياضيات المتقدمة
يُعد البحث العلمي موضوعًا محوريًا آخر في عرض GPT-5.5. وتستهدف OpenAI سير العمل حيثما دعت الحاجة. استكشاف الفرضيات، وجمع الأدلة، واختبار الافتراضات، وتفسير النتائج، واتخاذ القرار بشأن التجربة التاليةبيئة يكون فيها التفكير السياقي المستدام أمراً أساسياً.
في اختبارات مثل جين بنشيركز GPT-5.5 على مهام علم الأحياء وعلم الوراثة، وهو يحسن نتائج GPT-5.4، والمتغير GPT-5.5 برو بل إنها تحصل على درجات أعلى. بيكس بينشويركز النموذج الجديد على المعلوماتية الحيوية وعلم الأحياء الكمي، كما أنه يحقق أفضل أداء بين الأنظمة التي تم نشر بياناتها حتى الآن، وفقًا للمعلومات التي قدمتها الشركة.
بل وقد ذكرت OpenAI أمثلة على استخدامها في الرياضيات المتقدمة، حيث ساهمت نسخة داخلية من GPT-5.5 في البحث عن اختبار جديد يتعلق بأعداد رامزي غير القطريةتم التحقق من ذلك لاحقًا باستخدام مساعد Lean الرسمي. وتقدم الشركة هذه الحالة كمثال على كيفية قيام النموذج ليس فقط بتوليد التعليمات البرمجية أو التفسيرات، بل يمكنه أيضًا المساهمة في الحجج الرياضية في المجالات المعقدة.
من الناحية العملية، تم ذكر شهادات من باحثين استخدموا GPT-5.5 Pro لـ تحليل مجموعات بيانات التعبير الجيني التي تحتوي على عشرات الآلاف من المتغيرات وعدد كبير من العيناتالحصول على تقارير مفصلة، وزوايا تحليل جديدة، وأسئلة رئيسية في إطار زمني، وفقًا لحساباتهم، سيكون أطول بكثير إذا تمت معالجته حصريًا بالعمل البشري.
زمن الاستجابة، ووقت الاستدلال، وكفاءة الرمز المميز
وراء إطلاق GPT-5.5 تكمن رسالة مستمرة: يزيد ذلك من ذكاء النموذج دون التأثير سلبًا على سرعة الاستجابة.تدعي OpenAI أن النظام الجديد يطابق زمن الاستجابة لكل رمز مميز لـ GPT-5.4 في الخدمة الواقعية، على الرغم من كونه أكثر قدرة، وهو أمر غير معتاد في النماذج الأكبر والأكثر تعقيدًا.
أحد النقاط الرئيسية هي الوقت اللازم للتفكير لإكمال المهام المعقدةأفاد المستخدمون الأوائل الذين قارنوا السلوك بالإصدارات السابقة أن العمليات التي كانت تتطلب سابقًا ما بين 20 و 40 دقيقة من العمل يتم حلها الآن في ثلاث أو أربع دقائق فقط، مع الحفاظ على جودة الاستجابات بل وتحسينها.
لا تأتي هذه الزيادة من السرعة الخام فحسب، بل أيضاً من إدارة أفضل للرموز المميزةيتطلب GPT-5.5 عددًا أقل من الرموز لتحقيق نتائج مماثلة أو أفضل من GPT-5.4، مما يقلل من إجمالي وقت المعالجة والتكلفة المرتبطة بكل عملية. في الحالات التي تتسم بحجم استعلامات كبير أو أتمتة مكثفة، قد يكون هذا الفرق حاسمًا.
توضح شركة OpenAI أنه من أجل الحفاظ على زمن الاستجابة، كان عليها أن إعادة تصميم الاستدلال كنظام متكاملتم تصميم GPT-5.5 وتدريبه ونشره بشكل مشترك على بنية تحتية متطورة تعتمد على أجهزة NVIDIA (GB200 وGB300 NVL72)، وتم استخدام GPT-5.5 نفسه وCodex لتحسين موازنة الأحمال وتقسيمها، مع زيادة تزيد عن 20٪ في سرعة توليد الرموز على أنظمتهم.
الأسعار والتكلفة الفعلية والمقارنة مع GPT-5.4
على الرغم من أن GPT-5.5 موجود في نطاق سعر مرتفع لكل رمزتؤكد OpenAI أنه من الناحية العملية، يمكن أن يكون أكثر اقتصادية من سابقه وبعض منافسيه. والسبب هو مزيج من كفاءة أعلى في استخدام الرموز المميزة وتقليل الحاجة إلى إعادة المحاولات أو تصحيحات.
في واجهة برمجة التطبيقات، الأسعار المرجعية المُبلغ عنها لـ GPT-5.5 هي 5 دولارًا أمريكيًا لكل مليون رمز إدخال و30 دولارًا أمريكيًا لكل مليون رمز إخراجمع نافذة سياقية تصل إلى مليون رمز مميز. لـ GPT-5.5 برو، ترتفع المعدلات إلى تم إدخال 30 دولارات لكل مليون رمز وإخراج 180 دولارًا لكل مليون رمزاستهداف واضح للاستخدامات التي تفوق فيها القيمة المضافة للاستجابة التكلفة.
كما توفر OpenAI أوضاعًا مثل نظام الدفعات والمرونة، بأسعار تقارب نصف السعر القياسي.ووضع أولوية يُضاعف التكلفة بمقدار 2,5 مقابل أولوية أعلى في قائمة الانتظار وأوقات استجابة أقصر. تُقرّ الشركة بأنّ GPT-5.5 أغلى من GPT-5.4 من حيث القيمة الاسمية، لكنها تُبرّر التكلفة بانخفاض عدد الرموز المطلوبة لكل مهمة وقصر وقت الاستدلال. بإمكانها تقليل التكلفة الإجمالية للمشاريع المعقدة مقارنة بالنماذج الأخرى..
في السوق، تضع هذه السياسة GPT-5.5 فوق نماذج OpenAI السابقة وتحت البدائل المتطورة التي، وفقًا للتقديرات التي تمت مشاركتها خلال العرض التقديمي، يمكن أن تكون أغلى بخمسة إلى عشرة أضعاف من الناحية العملية عند النظر في مزيج السعر والرموز المستهلكة وجودة النتيجة.
السياق الطويل والأداء في معايير الاستدلال
ومن التحسينات الملحوظة الأخرى في GPT-5.5 قدرته على العمل مع سياقات واسعة النطاق دون فقدان الترابط. في اختبارات مثل Graphwalks BFS 1Mيصل النموذج إلى 45,4% مقارنةً بنسبة 9,4% لـ GPT-5.4، وفي OpenAI MRCR v2 مع سياقات تتراوح بين 512 ألف ومليون رمز مميز، يرتفع إلى 74,0%، مقارنة بنسبة 36,6% في الإصدار السابق.
في مجال الاستدلال المجرد، يسجل GPT-5.5 95,0% في ARC-AGI-1 و 85,0% في ARC-AGI-2مع تحسينات ملحوظة مقارنةً بـ GPT-5.4. في اختبارات المعرفة المتقدمة مثل الماس من GPQAيركز على الأسئلة الصعبة للغاية، ويحصل على 93,6%وفي تقييمات مثل آخر امتحان للإنسانية تتجاوز النسبة 50% عند السماح باستخدام أدوات خارجية.
تؤكد OpenAI أن العديد من هذه التقييمات قد أجريت في بيئات بحثية ذات تكوينات استدلالية على مستويات عالية جدًالذلك، قد تختلف النتائج قليلاً عن تلك التي يلاحظها مستخدمو ChatGPT في بيئة الإنتاج. ومع ذلك، ترغب الشركة في إيصال فكرة أن GPT-5.5 يمثل قفزة عملية في مهام العالم الحقيقي، وليست مجرد تحسين أكاديمي في جداول المقارنة المعيارية.
الأمن، والأمن السيبراني، والاستخدام المسؤول
يستلزم تعزيز القدرات الضمانات الأمنيةأعلنت شركة OpenAI أن GPT-5.5 يتم إطلاقه مع نظام الحماية الأكثر تقدماً حتى الآن، بعد خضوعه لتقييمات داخلية وخارجية، وأطر استعداد محددة، وعمليات اختبار الاختراق مع متخصصين في الأمن السيبراني وعلم الأحياء.
في إطار رسالته إطار الاستعدادتصنف الشركة قدرات GPT-5.5 على النحو التالي: علم الأحياء والكيمياء والأمن السيبراني على المستوى "العالي"دون الوصول إلى المستوى "الحرج". ومع ذلك، فإنه يُقر بأن النموذج أكثر فعالية من GPT-5.4 في اكتشاف الثغرات الأمنية واستغلالها، ولذلك تم نشره تصنيفات أكثر صرامة للطلبات الحساسة وآليات ضد الاستخدامات الخطرة المتكررة، وهو أمر قد يكون أكثر تقييدًا لبعض المستخدمين التقنيين.
وفي الوقت نفسه، تهدف OpenAI إلى توسيع نطاق الوصول إلى قدرات أكثر تقدماً لـ استخدامات دفاعية موثقة من خلال برامج مثل الوصول الموثوق به للأمن السيبرانيتستهدف هذه الأدوات تحديداً المؤسسات المسؤولة عن حماية البنية التحتية الحيوية. والفكرة هي توفير أدوات دفاعية فعّالة دون التهاون في الضوابط ضد الاستخدامات الهجومية المحتملة.
في مجال البحوث البيولوجية، أطلقت الشركة مبادرات مثل برامج مكافآت لاكتشاف الأخطاء البيولوجية في سلوك النموذج، بهدف مساعدة المجتمع العلمي في تحديد العيوب وتحسين الضمانات قبل النشر على نطاق أوسع.
توافر GPT-5.5 وتطبيقه في المنتجات
بدأ نشر GPT-5.5 لـ مستخدمو ChatGPT و Codex Plus و Pro و Business و Enterpriseفي كل من البيئات الشخصية والشركات. في شركة Codex، يتم دمج النموذج في سير عمل تطوير البرمجيات مع نافذة سياق موسعة وأنماط استجابة سريعة.
La إصدار GPT-5.5 الاحترافي يجري تفعيل هذه الميزة تدريجياً لمستخدمي باقات Pro وBusiness وEnterprise الذين يحتاجون إلى مستوى إضافي من التفصيل والدقة، لا سيما في المجالات الخاضعة للتنظيم أو ذات التأثير الكبير حيث يمكن أن تكون الأخطاء مكلفة. في ChatGPT، بدأ المستخدمون أيضاً برؤية خيارات محددة مثل تفكير GPT-5.5 لمشاكل البحث أو التحليل المعقدة.
فيما يتعلق بواجهة برمجة التطبيقات (API)، تعمل OpenAI على قم بتضمين GPT-5.5 و GPT-5.5 Pro في نقاط نهاية الردود وإكمال المحادثات. مع وصول عدد نوافذ السياق إلى مليون رمز مميز. وتشير الشركة إلى أنه سيتم توسيع نطاق الوصول بمجرد استيفاء متطلبات الأمن الداخلي وسعة البنية التحتية، بحيث يتمكن المطورون من دمج النموذج في تطبيقاتهم الخاصة بمجرد اكتمال هذه المرحلة.
يُرسّخ وصول GPT-5.5 مرحلة جديدة في تطور ChatGPT: يتحول التركيز من مجرد توليد النصوص إلى الأتمتة الشاملة للمهام الرقمية، مع نماذج أكثر استقلالية قادرة على التفكير لفترات أطول والعمل على أنظمة حقيقية، وذلك على حساب ارتفاع الأسعار وتزايد النقاش حول الأمن والحوكمة.في سياق أوروبي حيث يتقدم تنظيم الذكاء الاصطناعي وتسعى الشركات إلى تحقيق الكفاءة دون فقدان السيطرة، فإن الطريقة التي تتبنى بها المنظمات والمطورون والإدارات استخدام GPT-5.5 أو تحد منه قد تكون بنفس أهمية الأرقام المعيارية التي تصاحب هذا النموذج الجديد.
