ديب سيكاتخذت شركة تيكنولوجك الصينية المتخصصة في الذكاء الاصطناعي خطوة أخرى في تطوير الأدوات التكنولوجية لتحسين معالجة البيانات بأحجام كبيرة. اقتراحه الجديد هو نظام الملفات Fire-Flyer (3FS)، وهو نظام ملفات موازٍ مصمم لتحسين الكفاءة في مهام تدريب نموذج الذكاء الاصطناعي والاستدلال.
يعد تخزين البيانات والوصول إليها من الجوانب المهمة في بيئات الذكاء الاصطناعي، وخاصة عند التعامل مع مجموعات كبيرة من البيانات وتتطلب نقل المعلومات بسرعة. لا تلبي الأنظمة التقليدية دائمًا المتطلبات الحالية، وفي هذا السياق، لقد طورت شركة DeepSeek نظام 3FS كحل قابل للتطوير وعالي الأداء.
الميزات الرئيسية لنظام الملفات Fire-Flyer
3FS هو نظام ملفات موزع يعتمد على Linux ومُحسَّن للاستخدام في بيئات الحوسبة عالية الأداء (HPC) والذكاء الاصطناعي. يتيح تصميمه إدارة تخزين فعالة، مما يقلل من زمن الوصول ويحسن الوصول إلى البيانات.
- التحسين للأجهزة الحديثة:يستفيد نظام 3FS بشكل كامل من أداء محركات أقراص SSD وشبكات RDMA، مما يتيح سرعات قراءة تصل إلى 6.6 تيرابايت/ثانية في تكوينات مجموعة مكونة من 180 عقدة.
- الهندسة المعمارية الموازية:يتيح تصميمه الموزع توسيع النظام دون المساس بالاستقرار أو سرعة الوصول.
- استنادًا إلى FUSE:يسمح هذا للنظام بالعمل في مساحة المستخدم دون الحاجة إلى تعديل نواة Linux، مما يسهل تنفيذه وتوافقه مع التوزيعات المختلفة.
- التركيز على سرعة القراءة:إعطاء الأولوية للقراءة العشوائية على التخزين المؤقت، وهو أمر بالغ الأهمية في نماذج الذكاء الاصطناعي التي تتطلب الوصول الفوري إلى كميات كبيرة من البيانات.
نظام تم اختباره في بيئات حقيقية
تستخدم DeepSeek نظام الملفات 3FS على خوادمها الخاصة منذ عام 2019، مما يسمح لها بتحسين أدائها في المواقف الواقعية. وفي الاختبارات الأخيرة، حقق النظام 3.66 تيرابايت/دقيقة في معايير فرز البيانات وأكثر من 40 جيجابايت/ثانية لكل عقدة لمهام البحث في KVCache.
علاوة على ذلك، تم استخدام هذا النظام في مجموعة Fire-Flyer 2 الخاصة بالشركة، حيث حقق أداءً مماثلاً لأداء الخوادم المتطورة مثل NVIDIA DGX-A100، ولكن بتكلفة أقل بكثير. وفقًا للبيانات التي قدمتها الشركة، فقد حققوا 80% من أداء DGX-A100 مع 50% من تكلفته و60% من استهلاكه للطاقة.
تعزيز النظام البيئي مفتوح المصدر
أحد الجوانب الأكثر لفتًا للانتباه في هذا الإصدار هو أن DeepSeek قررت إصدار كود 3FS تحت رخصة MIT، مما يسمح لمجتمع المطورين بالوصول إلى النظام وتعديله وتكييفه وفقًا لاحتياجاتهم الخاصة. وتعد استراتيجية الانفتاح هذه جزءًا من مبادرة أسبوع المصدر المفتوح للشركة، حيث أصدرت الشركة مشاريع أخرى مرتبطة بالذكاء الاصطناعي.
كود نظام ملفات Fire-Flyer هو متاح على جيثبمما يجعل من السهل على الباحثين والشركات اعتمادها، والراغبين في تحسين سير العمل في مجال الذكاء الاصطناعي والحوسبة عالية الأداء.
إن ظهور 3FS على مشهد نظام الملفات الموزع يوفر بديلاً للحلول الموجودة مثل Ceph، والذي حقق في اختبارات المعايير سرعة قراءة تبلغ 1.1 TiB/s فقط على تكوينات أصغر.
ومن خلال هذا الإطلاق، تثبت DeepSeek التزامها بالابتكار التكنولوجي المطبق في مجال الذكاء الاصطناعي. من خلال تقديم نظام تخزين فعال وبأسعار معقولة، تعمل الشركة على تعزيز مكانتها في القطاع وتوفر أدوات رئيسية لتطوير نماذج التعلم الآلي الجديدة والحوسبة المتقدمة.