ما هو نموذج DeepSeek R1

ما هو نموذج DeepSeek R1

أطلقت شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي نموذجًا جديدًا يُدعى R1، والذي يُقال إنه ينافس نموذج o1 من OpenAI في قدرات التفكير المنطقي. تأسست DeepSeek في عام 2023 على يد رائد الأعمال الصيني ليانغ وينفنغ، وتم تمويلها من قبل صندوق التحوط الكمي High Flyer. على الرغم من الجهود الأمريكية للحد من تقدم الذكاء الاصطناعي في الصين، تمكنت DeepSeek من مشاركة عدة نماذج تعلم آلي مفتوحة المصدر وذات تنافسية عالية.

ما يميز DeepSeek هو تحقيق هذه الإنجازات بتكلفة أقل بكثير من منافسيها. ففي نهاية العام الماضي، أطلقت المختبر نموذج DeepSeek V3، وهو نموذج لغوي كبير يعتمد على مزيج من الخبراء، ويُقال إنه يقدم أداءً مشابهًا لنماذج مثل Llama 3.1 من Meta وGPT-4o من OpenAI وClaude 3.5 Sonnet من Anthropic. والآن، أصدرت الشركة نموذج R1، وهو نموذج تفكير منطقي محسّن من V3.

بينما تنفق الشركات الكبرى في الغرب عشرات المليارات من الدولارات على ملايين وحدات معالجة الرسومات (GPUs) سنويًا، يُقال إن تدريب نموذج DeepSeek V3 تم باستخدام 2,048 وحدة Nvidia H800، واستغرق حوالي 2.788 مليون ساعة GPU، بتكلفة تقارب 5.58 مليون دولار.

يحتوي نموذج DeepSeek R1 على 671 مليار معلمة، يتم تفعيل 37 مليارًا منها لكل رمز أثناء الاستدلال. تم تدريب R1 بشكل أساسي باستخدام التعلم المعزز لتطبيق أسلوب “سلسلة الأفكار” (Chain-of-Thought) في التفكير. تختلف هذه النماذج عن النماذج التقليدية في أنها لا تقدم إجابة مباشرة للسؤال فحسب، بل تقوم أولاً بتقسيم الطلبات إلى سلسلة من “الأفكار”، مما يمنحها فرصة للتفكير في المدخلات وتحديد أو تصحيح أي أخطاء في المنطق أو الهلوسة في المخرجات قبل تقديم الإجابة النهائية. وبالتالي، يُفترض أن تقدم هذه النماذج نتائج أكثر منطقية ووضوحًا ودقة.

وفقًا لمعايير DeepSeek، يُقال إن R1 يحقق أداءً مماثلاً لنموذج o1 من OpenAI، بل ويتفوق عليه في اختبار MATH-500. كما تدعي الشركة أن النسخة المصغرة من النموذج، التي تحتوي على 32 مليار معلمة وتم تقطيرها من النموذج الأكبر باستخدام نموذج Qwen 2.5 32B من Alibaba كقاعدة، تتمكن من مطابقة أو في بعض الحالات التفوق على نموذج o1 mini من OpenAI.

جميع هذه النماذج متاحة مجانًا على منصة Hugging Face بموجب ترخيص MIT المفتوح، مما يعني أنه يمكنك تنزيلها وتجربتها بنفسك.

رابط المقالة

https://arab999.com/czikm0ue27

admin

Recent Posts

كيفية استخدام مهام ChatGPT المجدولة لكسب 1000 دولار أسبوعيًا

كيفية استخدام مهام ChatGPT المجدولة لكسب 1000 دولار أسبوعيًا استخدم ChatGPT لأتمتة المهام وخلق فرص…

شهرين ago

تحديث Deepseek-R1: نموذج الذكاء الاصطناعي المجاني الذي يعيد تعريف المصادر المفتوحة

تحديث Deepseek-R1: نموذج الذكاء الاصطناعي المجاني الذي يعيد تعريف المصادر المفتوحة Deepseek-R1 هو نموذج ذكاء…

شهرين ago

كيفية كسب المال باستخدام الذكاء الاصطناعي عبر Google Notebook LM—بدون الحاجة إلى مهارات تقنية!

كيفية كسب المال باستخدام الذكاء الاصطناعي عبر Google Notebook LM—بدون الحاجة إلى مهارات تقنية! في…

شهرين ago

من يقف وراء محرك الذكاء الاصطناعي ديبسيك Deepseek

من يقف وراء محرك الذكاء الاصطناعي ديبسيك Deepseek من هم القائمون على DeepSeek وكيف حققت…

شهرين ago

Deppseek جنون في عالم الذكاء الاصطناعي

Deppseek جنون في عالم الذكاء الاصطناعي الثورة الجديدة في عالم الذكاء الاصطناعي‼️🤯الذكاء الاصطناعي يتطور بوتيرة…

شهرين ago

كيفية تحقيق الربح من موقع ديبسيك (DeepSeek) باستخدام الذكاء الاصطناعي

كيفية تحقيق الربح من موقع ديبسيك (DeepSeek) باستخدام الذكاء الاصطناعي في العصر الرقمي المتطور، أصبح…

شهرين ago