ركزت شركة Deepseek الصينية المُعدِك مؤخرًا على عالم التكنولوجيا مع استخدامها المنخفض بشكل مدهش للموارد الحسابية لنموذج الذكاء الاصطناعي المتقدم الذي يسمى R1 ، وهو نموذج يفترض أنه منافس مع AI O1 المفتوح. ومع ذلك ، يذكر Semianalysis أن تكاليف Deepseek -hardware و 50000 من النطاط -GPUS احتاجت إلى 1.6 مليار دولار أمريكي لتطوير نموذجها التالي.
تدير Deepseek بنية تحتية واسعة الحاسوب مع ما يقرب من 50000 من النطاط ، كما يزعم التقرير. ويشمل ذلك 10000 H800 و 10،000 H100 مع عمليات شراء إضافية من وحدات H20 ، وفقا لشركة Semianalysis. يتم توزيع هذه الموارد في عدة مواقع وتخدم أغراض مثل تدريب الذكاء الاصطناعي والبحث والنمذجة المالية. يبلغ إجمالي الاستثمار الرأسمالي للشركة في الخادم حوالي 1.6 مليار دولار أمريكي ، مع ما يقدر بنحو 944 مليون دولار أمريكي لتكاليف التشغيل.
اجتذب Deepseek عالم الذكاء الاصطناعي في العاصفة عندما كشفت عن متطلبات الأجهزة الصغيرة لنموذج نموذج الذكاء الاصطناعي لمزيج Deepseek V3 (MEE) ، والتي تكون أقل بكثير مقارنة بموارد النماذج الموجودة في الولايات المتحدة الأمريكية. ثم هزت Deepseek عالم التكنولوجيا الفائقة بنموذج R1 AI Open AI. ولكن بعد ذلك كشفت الأنساج شبه لشركة معلومات السوق المحترمة عن نتائجها للإشارة إلى أن Deepseek المستخدمة حوالي 1.6 مليار دولار أمريكي للأجهزة لـ R1.
يأتي Deepseek من طرفي كبير ، وهو صندوق تحوط صيني قبل الذكاء الاصطناعي مبكرًا واستثمر بقوة في وحدات معالجة الرسومات. في عام 2023 ، بدأت Deepseek ذات الطفرات العالية كشركة منفصلة ركزت حصريًا على الذكاء الاصطناعي. على عكس العديد من المنافسين ، يظل Deepseek ممولة ويمنحها المرونة والسرعة عند اتخاذ القرارات. على الرغم من الادعاءات بأنها فرع صغير ، فقد استثمرت الشركة أكثر من 500 مليون دولار أمريكي في تقنيتها ، وفقًا لشركة Semianalysis.
تتمثل ميزة التمييز الكبيرة لـ Deepseek في القدرة على تشغيل مراكز البيانات الخاصة بك ، على عكس معظم الشركات الناشئة الأخرى التي تعتمد على مقدمي الخدمات السحابية الخارجية. يتيح هذا الاستقلال السيطرة الكاملة على التجارب وتحسينات نموذج الذكاء الاصطناعى. بالإضافة إلى ذلك ، فإنه يتيح التكرار السريع دون اختناقات خارجية ، مما يجعل Deepseek فعالة للغاية مقارنة بالجهات الفاعلة التقليدية في هذه الصناعة.
ثم هناك شيء لا تتوقعه من شركة صينية: Talentakquisition من البر الرئيسي الصيني ، دون الصيد الجائر من تايوان أو الولايات المتحدة الأمريكية Deepseek يتوقف فقط في الصين والتحليل شبه المركّز. تهدف جهود التوظيف إلى مؤسسات مثل جامعة بكين وجامعة تشجيانغ وتقدم رواتب تنافسية للغاية. وفقًا للبحث ، يكسب بعض باحثو الذكاء الاصطناعى من Deepseek أكثر من 1.3 مليون دولار ويتجاوزون المكافآت لشركات AI الصينية الرائدة الأخرى مثل Moonshot.
نظرًا لمستوى المواهب ، اجتذبت Deepseek ابتكارات مثل الاهتمام الكامن (الاهتمام الكامن متعدد الرأس) ، والتي تتطلب شهورًا من التطوير وشهور من التطوير واستخدام كبير. يؤكد Deepseek على الكفاءة والتحسينات الخوارزمية مقارنة بتوسيع نطاق توسيع نطاق القوة الغاشمة وإعادة تصميم التوقعات فيما يتعلق بتطوير نموذج الذكاء الاصطناعي. لأسباب عديدة ، أدى هذا النهج إلى افتراض أن التقدم السريع يمكن أن يقلل من الطلب على وحدات معالجة الرسومات الراقية والتأثير على شركات مثل Nvidia.
ادعاء حديث أن Deepseek قد دربت أحدث طراز لها مقابل 6 ملايين دولار أمريكي فقط ، قام بتسخين جزء كبير من الضجيج. ومع ذلك ، يشير هذا الرقم فقط إلى جزء من إجمالي تكاليف التدريب-وخاصة إلى وقت GPU المطلوب للتدريب الأولي. لا يأخذ في الاعتبار الأبحاث أو دباغة النماذج أو معالجة البيانات أو تكاليف البنية التحتية العامة. في الواقع ، أصدرت Deepseek أكثر من 500 مليون دولار أمريكي لتطوير الذكاء الاصطناعي منذ تأسيسها. على النقيض من الشركات الأكبر التي تحملها البيروقراطية ، فإن هيكل Deepseek الهزيل يمكّنها من أن تكون عدوانية في ابتكار الذكاء الاصطناعي ، كما يقول Semianalysis.
يؤكد تسلق ديبسيك كيف يمكن لشركة الذكاء الاصطناعى المستقلة الممولة والمستقلة تحدي قادة الصناعة. ومع ذلك ، كان الخطاب العام مدعومًا بالضجيج. الحقيقة أكثر تعقيدًا: يعتمد نجاح Deepseek على الاستثمارات الاستراتيجية للمليارات من الدولارات والتعثرات الفنية والقوى العاملة التنافسية. ما يعنيه هو أنه لا توجد معجزات. كما لاحظ Elon Musk قبل عام تقريبًا ، إذا أردت أن تكون قادرًا على المنافسة في الذكاء الاصطناعي ، فمن الواضح أنك أنفقت مليارات الدولارات في السنة.