BrowserOS، هو متصفح وكيل مفتوح المصدر يقوم بأتمتة الويب بهدف المنافسة مع Comet وAtlas.

  • يقوم BrowserOS بتشغيل وكلاء الذكاء الاصطناعي المحليين على شوكة من Chromium، مع الخصوصية بشكل افتراضي ودعم الامتداد.
  • دمج أتمتة المتصفح مع خوادم MCP وأي LLM (OpenAI، أو Anthropic، أو الخيارات المحلية مثل Ollama/LM Studio).
  • يقترح رؤية يكون فيها المتصفح بمثابة "مكتب" للوكلاء القابلين لإعادة الاستخدام للمهام الحقيقية في تطبيقات الويب الخاصة بالمؤسسة.
  • مشروع مفتوح المصدر بنسبة 100% (AGPL-3.0)، ومجتمع نشط، وتركيز واضح: الذكاء الاصطناعي العملي في المتصفح، وليس في السحابة.

متصفح OS

إذا كنت قد سمعت عن BrowserOS وتساءلت عن سبب حديث الكثير من الأشخاص عن "متصفح ذو عقل"، فإليك الصورة الكاملة. BrowserOS هو متصفح مفتوح المصدر يتضمن وكلاء الذكاء الاصطناعي القادرين على فهم التعليمات وتنفيذها باللغة الطبيعية.النقر والكتابة والتصفح نيابةً عنك، باستخدام جلسات تسجيل الدخول والوصول المحلي. كل هذا مع الحفاظ على الخصوصية افتراضيًا، ودون الاعتماد على البنية التحتية السحابية لحفظ بياناتك الشخصية.

إن الاقتراح ليس مجرد فكرة عشوائية أخرى في عالم المتصفحات: وُلِد BrowserOS كشوكة من Chromium، مع التوافق مع ملحقات Chrome الخاصة بك وهدف واضح: أن تكون بديلاً مفتوحًا ومركّزًا على الخصوصية للحلول مثل أطلس (ChatGPT)كوميت (بيربليكسيتي) أو ديا، بالإضافة إلى المتصفحات التقليدية. الفكرة بسيطة الشرح وفعّالة: تصف المهمة، وينفذها وكيل من جهاز الكمبيوتر الخاص بك، باستخدام بيانات اعتمادك، دون إرسال سجلّك إلى جهات خارجية.

ما هو BrowserOS وكيف يختلف؟

المضمون، BrowserOS هو متصفح يقوم بتشغيل وكلاء الذكاء الاصطناعي بشكل أصلي.يتيح لك كتابة التعليمات كما لو كنت تشرحها لزميل، ويتولى النظام تنفيذ تسلسل الإجراءات: فتح الصفحات، بدء عمليات البحث، ملء النماذج، أو استخراج البيانات. إنه ليس مساعدًا خارجيًا "ينظر" إلى متصفحك: الوكلاء موجودون داخل نظام تشغيل المتصفح نفسه.

لأنه مبني على الكروميوم، تبدو التجربة مألوفة منذ الدقيقة الأولىواجهة مألوفة، وتوافق مع الإضافات، واستيراد بيانات كروم، وتطبيق فوري تقريبًا لمن هم على دراية بالنظام. هذا الشعور "بالراحة" يُخفف من الاحتكاك عند بدء الأتمتة دون التضحية بالاستخدامات اليومية.

لماذا الآن: حان وقت الوكلاء في المتصفح

في الأشهر الأخيرة، أدت أدوات البرمجة المدعومة بالذكاء الاصطناعي إلى مضاعفة إنتاجية المطورين. ومع ذلك، لا يزال ملايين العاملين في مجال المعرفة عالقين في مهام المتصفح المتكررةالنسخ واللصق، وملء النماذج، وتصدير بيانات لوحة المعلومات، وإطلاق الحملات، وما إلى ذلك. إنه يشكل عنق زجاجة يومي.

يقترح فريق BrowserOS أنه للمرة الأولى منذ أيام Netscape، لدينا الفرصة لإعادة تصور المتصفح للعمل الحقيقيإذا كانت الذكاء الاصطناعي "يكتب" بالفعل مشاريع بأكملها، فلماذا لا يستطيع أيضًا الضغط على الأزرار، أو التنقل عبر واجهة الويب، أو ربط الإجراءات كما تفعل أنت، ولكن دون الحاجة إلى التحكم طوال الوقت؟

المشاكل التي يعالجها BrowserOS

قبل نظام التشغيل BrowserOS، فشلت عملية نشر الوكلاء في المهام الواقعية لأسباب محددة للغاية. حدد المشروع ثلاث عقبات رئيسية أعاقت اعتماده على نطاق واسع.وخاصة في الشركات:

  • الوصول إلى الجلسات المصادق عليهاتعمل العديد من حلول الوكلاء على أجهزة بعيدة، ولا يمكنها العمل مع حساباتك الحقيقية (Gmail وLinkedIn وأدوات الشركة). ونتيجةً لذلك، تفشل في أداء المهام العملية.
  • تجزئة الأدواتيتواصل بعض الوكلاء مع خوادم MCP، بينما يقتصر عمل بعضهم الآخر على أتمتة الويب، بينما يربط آخرون واجهات برمجة التطبيقات معًا مثل Zaps. ما ينقصنا هو "مجموعة أدوات" موحدة لبناء تدفقات معقدة.
  • الصندوق الأسود والقفلتعد العديد من المتصفحات الشائعة منتجات بحث أو إعلان. إنهم لا يفتحون مطالباتهم أو أعمالهم الداخليةيُخصصون لك شهادة ماجستير في القانون (LLM) مُحددة، ويُوجِّهون البيانات إلى خوادمهم. بالنسبة للعديد من الشركات، هذا رفضٌ قاطع.

يستجيب BrowserOS من الأساس: الوكلاء داخل متصفحك، الذين يعملون على جهاز الكمبيوتر الخاص بكمن خلال الجمع بين MCP والأتمتة، وتحت فلسفة مفتوحة بنسبة 100% تتيح لك التدقيق والتقسيم في أي وقت تريد، يحل هذا المزيج ما جعل تفويض العمل الجاد إلى الذكاء الاصطناعي في المتصفح أمرًا غير قابل للتنفيذ حتى الآن.

كيف يعمل نظام التشغيل BrowserOS والخطوات الأولى

التدفق مباشر: يمكنك تنزيل وتثبيت BrowserOS تمامًا مثل أي متصفح آخرتُسجِّل دخولك إلى المواقع التي تستخدمها يوميًا، ومن ثم تصف المهام بلغة طبيعية. يعمل الوكيل في سياقك الحقيقي، مستخدمًا أذوناتك وجلساتك النشطة، كما لو كنت أمام الشاشة.

  1. تحميل وتثبيت نظام تشغيل المتصفح (متوفر لأنظمة macOS وWindows وLinux). إذا كنت قلقًا بشأن التثبيت على Linux، فهو متوفر كصورة تطبيق. على جيثب.
  2. استيراد بيانات Chrome الخاصة بك إذا كنت مهتمًا بالاحتفاظ بالإشارات المرجعية أو السجل أو الإعدادات.
  3. قم بتوصيل مزود الذكاء الاصطناعي الخاص بك: OpenAIنماذج أنثروبية أو محلية عبر Ollama/LM Studio، مع مفاتيحك الخاصة.
  4. ابدأ الأتمتة:صياغة الأهداف في النص والسماح للوكيل بتنفيذ الخطوات على الويب.

أيضا ، يمكنك ذلك دمج أتمتة المتصفح مع خوادم MCP استدعاءات واجهة برمجة التطبيقات (API) في نفس المسار. يتيح لك هذا المزيج بناء مساعدين قادرين على جمع البيانات، ومعالجتها في نموذج، وتحديث جداول البيانات أو أدوات SaaS، وكل ذلك مترابط بواسطة وكيل واحد.

الميزات الرئيسية لنظام التشغيل BrowserOS التي تصنع الفارق

  • وكلاء البناء باللغة الطبيعيةقل ما تريد، دون برمجة.
  • حرية النماذجأحضر مفاتيحك وقم بالتبديل بين نماذج LLM، أو قم بتشغيل النماذج المحلية.
  • إنه متصفح "عادي": قاعدة الكروم، هل تعمل إضافات Chrome الخاصة بك؟.

الخصوصية هي ركيزة أساسية للتصميم: تظل بياناتك وسجلك وجلساتك على جهاز الكمبيوتر الخاص بك.بدون الحاجة إلى القياس عن بُعد أو الاعتماد على السحب الخارجية. إذا رغبت، يمكنك العمل حصريًا مع النماذج المحلية وإيقاف الصنبور تمامًا.

لجعل الأمور أسوأ ، إنهم يعملون على أداة حظر الإعلانات المدعومة بالذكاء الاصطناعي الذي يَعِد بتغطية سيناريوهات أكثر تعقيدًا من المرشحات الثابتة. وللمطورين والمستخدمين المحترفين، يتوفر دعم لاستخدام المتصفح كخادم MCP، ودمجه مع أدوات مثل claude-code o gemini-cli.

التكاملات وMCP والاستخدام من الأدوات الخارجية

أحد أقوى أصولها هو أنها يمكن أن يعمل BrowserOS كخادم MCPوهذا يعني أن التطبيقات الأخرى المتوافقة مع البروتوكول (مثل تلك المذكورة) claude-code o gemini-cliبإمكانهم "التحدث" إلى متصفحك وتفويض مهام واجهة الويب إلى وكلائهم.

الشيء المثير للاهتمام هو التوزيع الموسيقي: لا تحتاج إلى الاختيار بين أتمتة المتصفح أو استدعاء واجهة برمجة التطبيقات (API).يمكنك القيام بكلا الأمرين باستخدام نفس وصفة العميل. على سبيل المثال، استخرج البيانات من بوابة ذات واجهة مستخدم معقدة، وعالجها باستخدام نموذج، ثم حمّل النتيجة إلى جدول بيانات أو نظام إدارة علاقات العملاء (CRM)، دون الحاجة إلى دمج الأدوات يدويًا.

مقارنة سريعة مع Chrome وBrave وArc/Dia وPerplexity Comet

مقارنة مع كروم

بفضل المصدر المفتوح لـ Chromium، يرث BrowserOS الأساس، ولكن لقد مر على Chrome سنوات دون أي تقدم كبير في مجال الذكاء الاصطناعي الأصلي للأتمتة.بدون MCP، وبدون وكلاء محليين، وبدون طبقة التنسيق المتكاملة، فإنه يظل مجرد متصفح رائع... بدون "مساعد النقر من أجلك".

مواجهة الشجاعة

لقد مهد الشجاعة الطريق للخصوصية، ولكن يركزون اهتمامهم على التشفير والبحث وشبكات VPN والمزيد.يقوم BrowserOS بعمله الخاص: الذكاء الاصطناعي في المتصفح وأتمتة العمل الحقيقي.

مواجهة القوس/القطر

وقد أعجب كثير من الناس باقتراح آرك، ولكن لقد أوقفت الكود الخاص بها وتركت المستخدمين في حالة من النسيان.في BrowserOS، الأمر هو العكس تمامًا: مفتوح بنسبة 100%، وقابل للتدقيق، وقابل للتقسيم، مع مجتمع مشارك ودون الاعتماد على مزود واحد.

مواجهة مذنب الحيرة

في نهاية المطاف، تعتبر Perplexity شركة بحث وإعلان. يمكن أن يصبح تاريخك منتجًافي BrowserOS، الوعد واضح: البيانات المحلية والتحكم الكامل من جانبك.

الأمان والخصوصية والترخيص

الفلسفة هي "الخصوصية أولاً": يمكنك استخدام مفاتيح API الخاصة بك أو النماذج المحلية مع Ollama/LM Studioتختار ما يتم حفظه وما لا يتم حفظه على جهازك، وتحافظ على السجل والجلسات بعيدًا عن متناول الأطراف الثالثة.

وعلى المستوى القانوني والمجتمعي، BrowserOS هو برنامج مجاني مرخص بموجب AGPL-3.0يمكنك مشاهدة كيفية صنعه، ومراجعة مطالبات النظام، واقتراح التغييرات، وتقسيم المشروع، والمساهمة. كل هذا بروح "صُنع بحب من سان فرانسيسكو" التي ذكرها مبتكروه.

المجتمع والشخصيات وزخم المشروع

الاهتمام ملموس. يتمتع التطبيق بأكثر من 4,3 ألف نجمة على GitHub، وأكثر من 25.000 عملية تنزيل، ومجتمع Discord يضم أكثر من ألف عضو. من المشاركين النشطين. في جزء آخر، تظهر مقاييس مثل "6,3 ألف" و"558" (مرتبطة بالمستودع، ويفترض أنها نجوم/متابعون/فروع)، مما يشير إلى اتجاه تصاعدي.

من الناحية الفنية، يتميز المشروع بأساسه C++ على رأس العملاق Chromium، وهي رحلة تتطلب الكثير من العمل الجاد والحفاظ على التوافق مع التغييرات السابقة مع الاستمرار في الابتكار في طبقة الوكيل.

حالات الاستخدام والعروض التوضيحية

فكر في المهام الواقعية: حدد الملفات الشخصية التي تهمك بين تطبيقات LinkedIn وأضفها إلى ورقة بيانات Googleاملأ نماذج طويلة، أو اجمع بيانات من مواقع إلكترونية متعددة، أو حضّر ملخصًا تمهيديًا يتضمن معلومات أساسية لاجتماع. تصفه نصيًا، ويتولى الوكيل عملية التنقل والتصرف كما تفعل.

هناك مواد سمعية وبصرية تظهر المفهوم في العمل: عروض توضيحية مثل "HackerNews.top.3.mp4" أو "use-browserOS-to-chat.mp4" أو "use-browserOS-to-extract.mp4" إنهم يعلمون كل شيء بدءًا من المحادثات المساعدة وحتى استخراج البيانات في إعدادات العالم الحقيقي، مما يعزز حقيقة أن الأتمتة تحدث في سياقك الحقيقي.

الرؤية: المتصفح باعتباره "نظام تشغيل" للوكلاء

الشركات تعيش في المتصفح: Salesforce، SAP، Workday، الأدوات الداخلية… يقضي جيش من العاملين في مجال المعرفة ما بين 60% إلى 80% من يومهم على تطبيقات الويبإذا كان بإمكان الوكيل النقر والكتابة مثل أي شخص، فيمكنه أتمتة أي واجهة تقريبًا، بما في ذلك تلك التي لا تحتوي على واجهات برمجة التطبيقات.

الرؤية التي يقدمها المشروع هي أن يمكن لتكنولوجيا المعلومات نشر "وكلاء الموظفين" القابلين لإعادة الاستخدام"وكيل الإنفاق" الخاص بالشركة، و"وكيل إعلانات فيسبوك" المشترك مع المجتمع والذي يمكنك تعديله ليناسب سير عملك، وما إلى ذلك. مهام ميكانيكية أقل، وتركيز أكبر على ما يضيف قيمة.

من يقف وراء BrowserOS؟

يتولى قيادة المشروع شقيقان توأم يتمتعان بسجل حافل في مجال التكنولوجيا الكبرى. عمل نيخيل على الواجهة الخلفية لـ Reels وخلاصة Facebook باستخدام C++ والأنظمةكان نيثين مهندس تعلم آلي في يوتيوب، وشارك في أول نموذج توصية رئيسي (LRM) للمنصة. هذا المزيج من على مستوى منخفض وتمنحهم طبقة الذكاء الاصطناعي حرية التعامل مع Chromium، وفي الوقت نفسه بناء "عقل العميل" فوقه.

  • خبرة في C++ والأنظمة واسعة النطاق:صيانة الخدمات الهامة وعالية الأداء.
  • التخصص في أنظمة التعلم الآلي والتوصية: فهم عميق للنماذج الحديثة ونشرها.

أصوات من المجتمع والبدائل الأقل شهرة

بين المستخدمين المتقدمين هناك رغبة في متصفحات "مختلفة" ذات إمكانات. تم اختبار البدائل مثل Wavebox، وUlaa، وArc، وGhost Browser، أو Thoriumيُشاد بمتصفح Zen لكفاءته (مع أنه لا يعتمد على Chromium). تشير هذه الاختبارات إلى أن Wavebox شامل للغاية، ولكنه قد يكون مُرهقًا، وأن تفعيل كامل إمكاناته يستغرق وقتًا طويلاً؛ يتفاخر Ulaa بالخصوصية ولكنه يتضمن الكثير من الإضافات؛ أثار Arc ردود فعل متباينة؛ ولم يُقنع متصفح Ghost الجميع تمامًا.

وفيما يتعلق بالثوريوم، فقد سمع أن إنه سريع جدًا ولكن به بعض المخاوف الأمنية.لهذا السبب يؤجل البعض الأمر. وغالبًا ما يُنصح بعدم اختيار أشهرها، لأنهم جربوا بالفعل حوالي عشرين منها، والهدف هو اكتشاف النوادر التي تقدم شيئًا جديدًا تمامًا.

دليل موجز لاستخدام الوكلاء

بمجرد دخولك، تأتي "اللحظة السحرية" عندما تصف المهام الحقيقية. بدلاً من مطالبته "بالبحث عن كذا وكذا" وإرجاع الملخص، يقوم العميل بتنفيذ التفاعل في متصفحك.إذا لم يكن لدى موقع الويب واجهة برمجة تطبيقات، فلا يهم: هناك واجهة مستخدم، وهناك إجراءات يمكن للوكيل تكرارها بدقة.

  1. وصف هدفكعلى سبيل المثال، تحديد جهات اتصال محددة في شبكة مهنية ونقل معلوماتها إلى جدول بيانات.
  2. تأكيد الخطوات إذا اقترحها عليك الوكيل (مفيدة لتدقيق ما سيفعله).
  3. أشرف على المرة الأولى لتعديل الإرشادات أو القواعد، قم بإعادة استخدام الوصفة.

إن استخدام MCP والقدرة على "ربط" الأتمتة وواجهات برمجة التطبيقات والنماذج يسمح بذلك وكيل واحد يحل العمليات الكاملة من البداية إلى النهاية، وهو الأمر الذي كان يتطلب في السابق ربط عدة أدوات معًا بشريط لاصق.

الخصوصية من خلال التصميم والتحكم في النموذج

إن الميزة الأساسية هي حرية اختيار محرك الذكاء الاصطناعي. يمكنك العمل مع OpenAI أو Anthropic أو إبقاء كل شيء محليًا باستخدام Ollama/LM Studio.يتم تعديل المسار بناءً على التكلفة، أو زمن الوصول، أو حساسية المشروع. لمن يُعطون الأولوية للخصوصية المطلقة، مسارهم محلي بالكامل.

وبالإضافة إلى ذلك، ينشر المشروع ويسمح بتحرير مطالبات النظامهذا أمرٌ نادر. تُسهّل هذه الشفافية تعديل سلوك الوكيل بما يتناسب مع مؤسستك أو حالتك الخاصة، ومراجعة كيفية اتخاذه للقرارات.

خطوات المساهمة في مشروع BrowserOS

إذا كنت تؤمن بالفكرة وترغب في تقديم المساعدة، فهناك عدة طرق لدعمها. اترك نجمة على GitHub يساعد ذلك على زيادة الرؤية؛ حيث يوفر تنزيله واستخدامه قياسًا عن بعد مثيرًا للاهتمام (إذا قمت بتنشيطه) وردود الفعل؛ كما يتيح لك الانضمام إلى Discord اقتراح ميزات جديدة واكتشافها واختبارها.

وأخيرًا، يعرض الموقع الرسمي عادةً تذكيرًا بـ تنزيل المتصفح لنظامكيمكنك استيراد بيانات Chrome إذا رغبت في ذلك وربط مزوّد الذكاء الاصطناعي المُفضّل لديك. بعد ذلك، كل ما عليك فعله هو إنشاء وكلائك ومشاركة ما يناسبك.

بالنظر إلى الصورة الكاملة، فإن نظام التشغيل BrowserOS يثبت نفسه باعتباره متصفح مفتوح المصدر مع نهج يركز على الوكيل، ويعطي الأولوية للخصوصية، ويعتمد على Chromium، ويضم مجتمعًا متنامٍ.يجمع هذا التطبيق بين التوافق مع الإضافات، ومنصة MCP، ودعم النماذج المحلية (Ollama/LM Studio)، والالتزام المفتوح الذي يتضمن ترخيص AGPL-3.0 ومطالبات قابلة للتعديل. بخلاف Chrome وBrave وArc/Dia وغيرها من العروض التي تعتمد على الإعلانات والبحث، يهدف هذا التطبيق إلى جلب سحر الذكاء الاصطناعي مباشرةً إلى الموقع الذي تعمل فيه يوميًا. ورغم وجود بعض التفاصيل التي تحتاج إلى تحسين (مثل أداة حظر الإعلانات المدعومة بالذكاء الاصطناعي والتي ستصدر قريبًا، أو مشاكل التثبيت العرضية على نظام Windows)، إلا أن وتيرة العمل وتفاعل المستخدمين يشيران إلى مشروع متنامٍ، مُصمم بعناية في سان فرانسيسكو، مع رغبة في تحويل الويب من مجرد سلسلة نقرات إلى منصة للوكلاء الذين يعملون معك.