ما هو نموذج DeepSeek R1

ما هو نموذج DeepSeek R1
أطلقت شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي نموذجًا جديدًا يُدعى R1، والذي يُقال إنه ينافس نموذج o1 من OpenAI في قدرات التفكير المنطقي. تأسست DeepSeek في عام 2023 على يد رائد الأعمال الصيني ليانغ وينفنغ، وتم تمويلها من قبل صندوق التحوط الكمي High Flyer. على الرغم من الجهود الأمريكية للحد من تقدم الذكاء الاصطناعي في الصين، تمكنت DeepSeek من مشاركة عدة نماذج تعلم آلي مفتوحة المصدر وذات تنافسية عالية.
ما يميز DeepSeek هو تحقيق هذه الإنجازات بتكلفة أقل بكثير من منافسيها. ففي نهاية العام الماضي، أطلقت المختبر نموذج DeepSeek V3، وهو نموذج لغوي كبير يعتمد على مزيج من الخبراء، ويُقال إنه يقدم أداءً مشابهًا لنماذج مثل Llama 3.1 من Meta وGPT-4o من OpenAI وClaude 3.5 Sonnet من Anthropic. والآن، أصدرت الشركة نموذج R1، وهو نموذج تفكير منطقي محسّن من V3.
بينما تنفق الشركات الكبرى في الغرب عشرات المليارات من الدولارات على ملايين وحدات معالجة الرسومات (GPUs) سنويًا، يُقال إن تدريب نموذج DeepSeek V3 تم باستخدام 2,048 وحدة Nvidia H800، واستغرق حوالي 2.788 مليون ساعة GPU، بتكلفة تقارب 5.58 مليون دولار.
يحتوي نموذج DeepSeek R1 على 671 مليار معلمة، يتم تفعيل 37 مليارًا منها لكل رمز أثناء الاستدلال. تم تدريب R1 بشكل أساسي باستخدام التعلم المعزز لتطبيق أسلوب “سلسلة الأفكار” (Chain-of-Thought) في التفكير. تختلف هذه النماذج عن النماذج التقليدية في أنها لا تقدم إجابة مباشرة للسؤال فحسب، بل تقوم أولاً بتقسيم الطلبات إلى سلسلة من “الأفكار”، مما يمنحها فرصة للتفكير في المدخلات وتحديد أو تصحيح أي أخطاء في المنطق أو الهلوسة في المخرجات قبل تقديم الإجابة النهائية. وبالتالي، يُفترض أن تقدم هذه النماذج نتائج أكثر منطقية ووضوحًا ودقة.
وفقًا لمعايير DeepSeek، يُقال إن R1 يحقق أداءً مماثلاً لنموذج o1 من OpenAI، بل ويتفوق عليه في اختبار MATH-500. كما تدعي الشركة أن النسخة المصغرة من النموذج، التي تحتوي على 32 مليار معلمة وتم تقطيرها من النموذج الأكبر باستخدام نموذج Qwen 2.5 32B من Alibaba كقاعدة، تتمكن من مطابقة أو في بعض الحالات التفوق على نموذج o1 mini من OpenAI.
جميع هذه النماذج متاحة مجانًا على منصة Hugging Face بموجب ترخيص MIT المفتوح، مما يعني أنه يمكنك تنزيلها وتجربتها بنفسك.
إرسال التعليق