GPT-5.4: نموذج OpenAI الجديد الذي يسعى للسيطرة على الحاسوب

  • يقدم GPT-5.4 استخدامًا أصليًا للحاسوب ونافذة سياق تصل إلى مليون رمز.
  • يعمل النموذج على تحسين أدائه في المهام المهنية، مع تقليل الأخطاء وتحسين الكفاءة في جداول البيانات والعروض التقديمية.
  • أطلقت OpenAI نسختين من GPT-5.4 Thinking و GPT-5.4 Pro، وهما أغلى ثمناً لكنهما أكثر كفاءة في استهلاك الرموز.
  • يأتي هذا الإطلاق وسط منافسة شديدة مع جوجل وأنثروبيك وفي خضم أزمة سمعة تواجهها شركة OpenAI.

GPT-5.4

OpenAI لقد اتخذ منعطفاً آخر إلى استراتيجيتها للذكاء الاصطناعي مع إطلاق GPT-5.4لا يقتصر هذا النموذج على وعده بقدرة حاسوبية أكبر ونتائج أفضل في الاختبارات المعيارية، بل يمثل أيضًا خطوة واضحة نحو أتمتة العمل في العالم الحقيقي. وتقدم الشركة هذا النظام باعتباره نموذجها الأكثر كفاءة وقدرة حتى الآن، مع التركيز على بيئات العمل الاحترافية، والمهام الطويلة، والأنظمة القادرة على العمل كما لو كانت شخصًا يجلس أمام جهاز كمبيوتر.

يأتي هذا الإعلان في وقت حرج لشركة سام ألتمان، التي تعاني من أزمة سمعة بسبب اتفاقياتها مع وزارة الدفاع الأمريكية وحملات المقاطعة مثل #QuitGPT. ويأتي الكشف عن GPT-5.4 بعد أيام قليلة من إطلاقها. GPT-5.3 الفوريإنها بمثابة خطوة تقنية وسياسية في آن واحد: استعراض للقوة التكنولوجية مع محاولة استعادة ثقة المستخدمين والعملاء الرئيسيين.

يتوفر إصداران مختلفان لأنماط استخدام متنوعة: GPT-5.4 Thinking و GPT-5.4 Pro

أصدرت شركة OpenAI نموذج GPT-5.4 في نسختين رئيسيتين. من جهة، تفكير GPT-5.4، متوفرة في خطط ChatGPT المدفوعة (Plus وTeam وPro)، والموجهة نحو التفكير العميق والمتعدد المراحليُظهر هذا النموذج للمستخدم معاينة لكيفية تنفيذ المهمة، مما يسمح له بالتدخل أثناء الاستجابة لإعادة توجيه التعليمات دون الحاجة إلى البدء من الصفر. هذه القدرة على "قطع وإعادة توجيه التفكير"، والتي تُطلق عليها OpenAI اسم القدرة على التوجيهتم تصميمه لحل المشكلات المعقدة التي يرغب المستخدم في أن يكون لديه المزيد من التحكم في العملية.

من ناحية أخرى، يبدو GPT-5.4 بروهذا النوع موجه للمؤسسات والمشاريع الكبيرة حيث يكون الأداء المستدام أمراً بالغ الأهمية. مهام مكثفة وسير عمل معقدمع التركيز بشكل خاص على الموظفين الذين يعملون لفترات طويلة، ويعالجون العديد من المستندات، ويتخذون قرارات متسلسلة. في واجهة برمجة التطبيقات (API)، يمكن استخدام كلا الإصدارين كمحركات للمنتجات المخصصة، كما يمكن دمجهما مع المنصة البرمجية، وهي خليفة منصة Codex.

ذكاء اصطناعي يُشغّل الحاسوب كما لو كان مستخدمًا بشريًا.

الميزة التي تتصدر عناوين الأخبار هي أن GPT-5.4 هو أول نموذج متعدد الأغراض من OpenAI إمكانيات استخدام الحاسوب الأصليةتستخدم الشركة مصطلح "استخدام الكمبيوتر" للإشارة إلى وضع لا يقتصر فيه النظام على توليد النصوص، بل إنه يفسر ما يراه على الشاشة (من خلال التقاط وعرض عالي الدقة) و يُصدر إجراءات الماوس ولوحة المفاتيح لإنجاز المهام.

عمليًا، يتيح لنا هذا النظر في سيناريوهات كانت تبدو حتى وقت قريب وكأنها من الخيال العلمي اليومي: مثل مطالبة الذكاء الاصطناعي بفتح رسائل البريد الإلكتروني، وتنزيل الفواتير، واستخراج البيانات الرئيسية ولصقها في جدول بيانات، أو التنقل عبر تطبيقات الأعمال المختلفة لملء النماذج، والاستعلام عن قواعد البيانات، أو إنشاء التقارير. وفقًا للمعايير الداخلية، في الاختبار OSWorld-تم التحقق منهوالذي يقيس بدقة تلك القدرة على التعامل مع بيئة سطح المكتب، يحقق GPT-5.4 نسبة نجاح 75%، فوق ال 47,3% من GPT-5.2 وكذلك متوسط ​​الأداء البشري، المحدد عند 72,4٪.

تتناسب هذه الأنواع من المهارات تمامًا مع الاتجاه نحو الذكاء الاصطناعي القائم على الوكلاءتستفيد أدوات مثل برنامج OpenClaw، المصمم للتحكم في حاسوب المستخدم لأتمتة المهام المتكررة، بشكل مباشر من نموذج مُهيأ مسبقًا لتفسير الشاشة وتنفيذ تسلسلات كاملة من الإجراءات. بالنسبة للشركات الأوروبية التي تختبر برامج الدردشة الآلية في أقسام الإدارة والمالية والدعم الفني، يُعدّ الفرق بين برنامج الدردشة الآلي الذي يكتفي بالرد ونموذج يتصرف فعليًا كبيرًا.

نافذة سياقية لما يصل إلى مليون رمز مميز

من أبرز مميزات GPT-5.4 الأخرى قدرته على تخزين البيانات على المدى القصير. يدعم النموذج ذلك في واجهة برمجة التطبيقات (API) وتكامله مع Codex. نوافذ سياقية تصل إلى مليون رمز مميزهذا يزيد عن ضعف الذاكرة التشغيلية المرتبطة بـ GPT-5.2، والتي كانت حوالي 400.000 رمز، ويمثل قفزة كبيرة لأولئك الذين يعملون مع كميات هائلة من المعلومات: عقود من مئات الصفحات، ومستودعات برمجية ضخمة، وقواعد بيانات العملاء، أو التقارير المالية السنوية.

بالنسبة للشركات الأوروبية ومكاتب المحاماة، المعتادة على التعامل مع اللوائح التنظيمية الواسعة، بدءًا من اللوائح المصرفية وصولًا إلى وثائق الامتثال مثل RGPDيُتيح هذا السياق الموسّع معالجة مجموعات كاملة من المستندات دون الحاجة إلى تجزئتها بشكل مصطنع. والنتيجة المباشرة لذلك هي أن يتم فقدان سياق أقل، وتقل أخطاء الإغفال، ويتم الحفاظ على التماسك بشكل أفضل. في المهام التي تتطلب اتباع تعليمات دقيقة عبر خطوات عديدة.

بالإضافة إلى الذاكرة، يقدم GPT-5.4 ما وصفته بعض المصادر بأنه نمط من "التفكير المتطرف"يُتيح هذا النهج تخصيص قدرة حاسوبية أكبر بكثير للمسائل المعقدة، وتنفيذ عمليات قد تستغرق ساعات بدلاً من ثوانٍ. لا يقتصر الأمر على الاستجابة السريعة فحسب، بل يتعلق بالقدرة على للحفاظ على تحليل مطول بمزيد من العمق والاتساقوهذا الأمر ذو أهمية خاصة للشركات الاستشارية أو المدققين أو فرق البحث العاملة في أوروبا والتي لديها مشاريع طويلة الأجل.

البحث عن الأدوات وكفاءة استخدامها

بالنسبة للمطورين الذين يعتمدون على واجهة برمجة التطبيقات (API)، فإن إحدى أكثر الميزات الجديدة العملية هي البحث عن الأدواتحتى الآن، كانت النماذج تحتاج إلى تلقي تعريفات جميع الأدوات المتاحة ضمن السياق، مما زاد بشكل ملحوظ من استهلاك الرموز في الأنظمة الغنية بالميزات. مع ميزة البحث عن الأدوات، أصبح بإمكان GPT-5.4 ابحث بشكل ديناميكي عن الأداة التي تحتاجها في جميع الأوقات، مع الحرص على الاطلاع على المعلومات الأساسية فقط.

في اختبارات أجريت على 250 مهمة معيارية من MCP Atlas، باستخدام 36 خادم أدوات مختلف، حقق هذا الشكل من الوصول الديناميكي خفض إجمالي استهلاك الرموز بنحو 47%مع الحفاظ على نفس مستوى الدقة. بالنسبة للشركات الأوروبية التي تصمم منصات وكلاء تضم عشرات الخدمات المصغرة، بدءًا من أنظمة الفوترة وصولًا إلى أنظمة إدارة علاقات العملاء وأنظمة تخطيط موارد المؤسسات الداخلية، فإن هذا التحسين يترجم إلى انخفاض تكاليف التشغيل وأوقات استجابة أسرعدون التضحية بتعقيد سير العمل.

الأداء الاحترافي: من المكتب إلى جداول البيانات

وبعيدًا عن العناوين التقنية، تم تصميم GPT-5.4 بشكل صريح لمهام المعرفة المهنيةفي الاختبار الناتج المحلي الإجمالي، والذي يقيس قدرة وكلاء الذكاء الاصطناعي على إنتاج عمل حقيقي في 44 مهنة مختلفة، النموذج الجديد يضاهي أو يتفوق على المحترفين البشريين في 83% من المقارناتتتراوح هذه الأنواع من المهام بين إعداد عروض الأعمال والتحليل المالي الأساسي أو صياغة المستندات القانونية.

تُسلط OpenAI الضوء بشكل خاص على التحسينات في التعامل مع جداول البيانات والعروض التقديمية. وفي اختبار معياري داخلي للنمذجة المالية، حقق GPT-5.4 النتائج التالية: حصل على درجة 87,3%، فى مواجهة 68,4% من GPT-5.2بالنسبة للبنوك الأوروبية أو شركات التأمين أو شركات التكنولوجيا المالية التي تتعامل مع نماذج معقدة في برنامج Excel أو أدوات مماثلة، يمكن أن يمثل هذا الاختلاف قفزة نوعية بين أداة دعم ومساعد قادر على أداء مهام محلل مبتدئ بإشراف محدود.

في مجال العروض التقديمية، فضل المقيمون البشريون ما يقارب تم إنشاء الشرائح بواسطة GPT-5.4 في 68% من الحالات بالمقارنة مع سابقه، يقدم هذا الإصدار تحسينات ملحوظة في كلٍ من الجوانب الجمالية والتنوع البصري. هذه التحسينات مناسبة تمامًا للعمل اليومي لفرق المبيعات والتسويق والاستشارات في إسبانيا، حيث قد يستغرق إعداد عرض تقديمي واضح ومنظم ساعات طويلة من العمل.

أخطاء أقل، وموثوقية أكبر في الإجابات المطولة

كان أحد الانتقادات الشائعة للنماذج السابقة ميلها إلى "التضليل"، أي اختلاق البيانات أو مزج المصادر بشكل غير موثوق. وتزعم OpenAI أن GPT-5.4 أقل عرضة بنسبة 33% للإدلاء بتصريحات كاذبة ذلك GPT-5.2، وأن استجاباته الكاملة قد احتمالية احتواء الأخطاء أقل بنسبة 18%تشير هذه الأرقام، على الرغم من أنها مستمدة من اختبارات داخلية، إلى أن الذكاء الاصطناعي أنسب للقطاعات الخاضعة للتنظيم مثل... المالية أو الصحيةحيث يمكن لأي معلومة غير صحيحة أن تشكل مشكلة خطيرة.

إن الجمع بين نافذة سياقية أوسع بكثير، ونمط تفكير موسع، والقدرة على مقاطعة العملية في منتصفها لتصحيح المسار، يُسهم في هذه الموثوقية العالية. بالنسبة لشركة محاماة في مدريد أو شركة استشارية في بروكسل، فإن القدرة على مراجعة "خطة العمل" للنموذج قبل الانتهاء من صياغة تقرير كامل تسمح للكشف عن الانحرافات أو الأساليب غير الفعالة في الوقت المناسبدون إهدار الموارد أو الوقت في المراجعة اللاحقة.

البرمجة والأداء في المعايير التقنية

في مجال تطوير البرمجيات، يرث GPT-5.4 قدرات GPT-5.3-Codex ووفقاً لشركة OpenAI، فإنها تضاهيها أو تتفوق عليها في الاختبارات الصعبة مثل SWE-Bench Pro مع زمن استجابة أقل. التحسينات في النتائج ليست مذهلة (نتحدث عن قفزة معتدلة في نسبة الحوادث التي تم حلها)، لكن الجمع بين البرمجة والاستدلال واستخدام الحاسوب الأصلي في نموذج واحد يطرح سيناريو مثيرًا للاهتمام: وكلاء يقومون بقراءة مستودعات التعليمات البرمجية، وتعديل الملفات، واختبار التغييرات في بيئات العالم الحقيقي.كل ذلك ضمن نفس التدفق.

بالنسبة للمطورين الأوروبيين الذين يدمجون GPT-5.4 عبر واجهة برمجة التطبيقات، ربما لا يكمن المفتاح في رقم المعيار الدقيق، بل في حقيقة أن يحل النموذج مهامًا مماثلة باستخدام عدد أقل من الرموز.تؤكد شركة OpenAI أن GPT-5.4 هو نظام الاستدلال الأكثر كفاءة من حيث استخدام الرموز حتى الآن، مما يعني أنه يمكنه الوصول إلى نفس النتيجة بعدد أقل من "الكلمات الداخلية". بالنسبة للشركات التي تدفع مقابل كل رمز، يمكن لهذه الكفاءة أن تعوض الرسوم المتزايدة لكل مليون رمز.

تصفح الإنترنت وعمليات البحث المعقدة

يُعدّ التفاعل مع الويب مجالًا آخر يتفوق فيه GPT-5.4 على سابقيه. في معايير الأداء مثل تصفحيركز النموذج الجديد على مهام البحث والاستكشاف عبر الإنترنت، ويصل إلى حوالي 82,7٪، فى مواجهة 65,8% من GPT-5.2تؤكد شركة OpenAI أن GPT-5.4 جيد بشكل خاص في... تحديد المعلومات ذات الصلة وسط كميات كبيرة من البيانات، ما يسمونه استعلامات "البحث عن إبرة في كومة قش".

بالنسبة للصحفيين الأوروبيين ومحللي السوق والباحثين، تعني هذه الإمكانية تفويض جزء من مهام فحص المعلومات إلى الذكاء الاصطناعي، مع الحفاظ على دور الإشراف والتحقق النهائي. يستطيع النموذج تتبع مصادر متعددة، واختيار المصادر الأكثر موثوقية، وتقديم ملخص منطقي، مما يقلل الوقت المستغرق في عمليات البحث المتكررة.

أسعار أعلى، ولكن أيضاً كفاءة أكبر

من حيث السعر، يأتي جهاز GPT-5.4 بسعر أعلى مقارنةً بجهاز GPT-5.2. أما سعر الطراز القياسي فيبلغ 2,50 دولارًا أمريكيًا لكل مليون رمز إدخال و15 دولارًا أمريكيًا لكل مليون رمز إخراجمقارنةً بـ 1,75 دولار و14 دولارًا على التوالي لـ GPT-5.2. الإصدار GPT-5.4 برو إنه أغلى بكثير: 30 دولارًا أمريكيًا لكل مليون رمز إدخال و180 دولارًا أمريكيًا لكل مليون رمز إخراج، أرقام موجهة بوضوح نحو مشاريع تجارية ذات قيمة مضافة عالية.

تدافع OpenAI عن هذه الرسوم بالاعتماد على زيادة الكفاءة في استهلاك الرموز وفي تقليل الأخطاء. إذا تطلب نموذج ما عددًا أقل بكثير من الرموز لأداء المهمة نفسها، وقلل أيضًا من الأخطاء التي تتطلب تصحيحًا يدويًا، فقد تنخفض التكلفة الإجمالية للمشروع حتى مع ارتفاع سعر الرمز. بالنسبة للحسابات الكبيرة في أوروبا، من البنوك ذات الأهمية النظامية إلى المجموعات الصناعية الكبرى، لم يعد النقاش يدور حول السعر الاسمي لكل مليون رمز، بل حول التكلفة الإجمالية لأتمتة العمليات بنتائج مضمونة.

إطلاق وسط جدل ومنافسة شرسة

لم يظهر GPT-5.4 من العدم، بل وصل في منتصف... منافسة شديدة مع أنثروبيك وجوجلوفي خضم الضجة الإعلامية المحيطة باتفاقيات OpenAI مع البنتاغون، وبينما حققت Anthropic تقدماً في قطاع المؤسسات بنماذج مثل Claude Opus 4.6 ونهجها الأكثر تركيزاً على الأمن، تتنافس جوجل مع عائلة Gemini وقدراتها المتقدمة متعددة الوسائط. وفي هذا السياق، يهدف GPT-5.4 إلى ترسيخ مكانته كنموذج مرجعي في القدرة الفاعلة، واستخدام الحاسوب، والسياق طويل الأجل.

وفي الوقت نفسه، تأتي هذه الحركة بعد حملات مثل #إلغاء_ChatGPT و #ترك_GPTدفعت هذه الإجراءات مئات الآلاف من الأشخاص إلى إلغاء اشتراكاتهم أو إعلان مقاطعة عبر وسائل التواصل الاجتماعي. وقد أدى الاعتقاد السائد بأن شركة OpenAI قبلت عقدًا عسكريًا دون ضمانات كافية، بينما رفضته شركة Anthropic، إلى تآكل جزء من سمعة الشركة. وفي أوروبا، حيث يتطور النقاش حول الاستخدام الأخلاقي للذكاء الاصطناعي وتنظيمه، مع وجود أطر مثل قانون الذكاء الاصطناعي المرتقب، تُراقب هذه الاتفاقيات باهتمام بالغ.

تكاليف البنية التحتية والضغط لتحقيق الربحية

وراء كل إصدار جديد من GPT تكمن حقيقة أقل وضوحًا: تكلفة تشغيل نماذج ضخمة بشكل متزايد مع نوافذ سياقية هائلة. تتعامل OpenAI مع أرقام بملايين الدولارات في الإنفاق على البنية التحتية والحوسبةمع توقعات بخسائر كبيرة في السنوات القادمة رغم النمو الملحوظ في الإيرادات. يتطلب نموذج مثل GPT-5.4، القادر على معالجة ما يصل إلى مليون رمز مميز وبأنماط استدلال تمتد لساعات، قدرة حاسوبية هائلة لكل طلب.

وللحد من هذه التكاليف، تراهن الشركة على أجهزة مملوكة أو متخصصة ومن خلال اتفاقيات مع كبرى شركات الحوسبة السحابية، تقوم الشركة بتقسيم فهرسها إلى عدة مستويات (فوري، تفكيري، احترافي، كودكس) لضبط مقدار قوة المعالجة المخصصة لكل نوع من أنواع الطلبات. ويتماشى إدخال الأوضاع القابلة للتكوين في GPT-5.4، والتي تتيح للمستخدمين الاختيار بين استجابات أسرع وأقل تكلفة أو تحليل أكثر تعمقًا، مع هذه المحاولة لتحقيق التوازن بين السعة والفعالية من حيث التكلفة. وفي أوروبا، حيث تخضع مراكز البيانات واستهلاك الكهرباء لتدقيق تنظيمي، يُعيد هذا النوع من النماذج إشعال النقاش حول تأثير الذكاء الاصطناعي على الطاقة.

نحو وضع طبيعي جديد: عملاء، وأمن، وتغييرات مستمرة

وبعيداً عن المواصفات التقنية، يعزز GPT-5.4 اتجاهاً كان قد بدأ بالظهور بالفعل: الانتقال من روبوتات الدردشة إلى الوكلاء المستقلينيشير الجمع بين الاستخدام الأمثل للحاسوب، وإدارة السياق على المدى الطويل، والأدوات الديناميكية، إلى أنظمة قادرة على إدارة العمليات الكاملة مع تدخل بشري محدود. وتتوقع شركات التحليل أنه بحلول نهاية عام 2026، سيستخدم جزء كبير من الشركات الكبرى بنى قائمة على الوكلاء من سلسلة GPT-5.x للمهام الحيوية، بدءًا من خدمة العملاء وصولًا إلى إدارة المستندات الداخلية.

وتثير هذه الخطوة تساؤلات محرجة حول الأمن والسيطرةإذا كان بإمكان نموذج ما العمل لساعات، مع الاطلاع على بيانات حساسة وتنفيذ إجراءات على أنظمة داخلية، فلا بد من أن تكون آليات المراقبة والحواجز الأمنية أكثر قوة. وقد حذرت جهات داخل وخارج القطاع، بما في ذلك مجتمع البحث الأوروبي، منذ فترة طويلة من أن سباق إطلاق نماذج أكثر قوة لا يمكن أن يتجاوز تطوير ضمانات فعالة.

مع GPT-5.4، تسعى OpenAI لإثبات قدرتها على توفير مزيد من القوة والاستقلالية والكفاءة دون المساس بالموثوقية. يُحسّن النموذج أداءه في الاختبارات المعيارية، ويقلل الأخطاء، ويستخدم عددًا أقل من الرموز، ويتعامل مع الحاسوب بسلاسة، ولكنه يأتي أيضًا وسط معضلات أخلاقية، وضغوط تنافسية، وشكوك حول الجدوى الاقتصادية لهذا الوتيرة السريعة من الابتكار. بالنسبة للشركات والمهنيين في إسبانيا وبقية أوروبا، لم يعد السؤال مجرد ما إذا كانت التكنولوجيا مثيرة للإعجاب، بل كيفية دمجها بشكل مسؤول في حياتك اليومية، مع فوائد واضحة ومخاطر يمكن التحكم بها.

وكيل ChatGPT
المادة ذات الصلة:
وكيل ChatGPT: قفزة OpenAI نحو الوكلاء المستقلين لأتمتة المهام المعقدة