مقالات عمومی

۱۰ نکته که باید در مورد دیپ سیک (DeepSeek) بدانید؛ انقلاب چینی‌ها در هوش مصنوعی!

استارتاپ چینی دیپ سیک (DeepSeek) هفته گذشته دستیار هوش مصنوعی رایگانی معرفی کرد که با استفاده از داده‌های کمتر و هزینه‌ای به مراتب پایین‌تر از رقبا، عملکردی قابل‌توجه دارد. طبق گزارش‌ها، این ابزار در مدت کوتاهی توانست چت جی‌پی‌تی (ChatGPT) را در میزان دانلود از فروشگاه اپل پشت سر بگذارد.

به گزارش میهن بلاکچین، در همین حال، بازارهای مالی آمریکا نیز تحت تأثیر این رویداد قرار گرفتند. در ۲۷ ژانویه، سهام شرکت انویدیا (Nvidia) با کاهش نزدیک به ۱۷٪، با رکوردی تاریخی بیش از ۶۰۰ میلیارد دلار از ارزش بازار خود را از دست داد. نگرانی از ظهور دیپ سیک (DeepSeek) به عنوان مدل هوش مصنوعی ارزان‌قیمت و توانمند که می‌تواند جایگاه غول‌هایی مانند اندویدیا (Nvidia) را تهدید کند، باعث افت شدید ارزش سهام شرکت‌های فناوری در وال‌استریت شد.

اما DeepSeek دقیقاً چیست و چه چیزی آن را به یکی از داغ‌ترین موضوعات فناوری تبدیل کرده است؟ در ادامه، ۱۰ نکته مهم درباره این شرکت را بررسی می‌کنیم:

۱. دیپ سیک DeepSeek چیست؟

دیپ سیک (DS) شرکتی کاملاً تحت مالکیت های فلایر (High-Flyer)، صندوق سرمایه‌گذاری کوانتومی در چین است. این شرکت ماه گذشته با انتشار مقاله‌ای اعلام کرد که هزینه‌ پردازشی آموزش نسخه ۳ دیپ سیکDeepSeek-V3، با استفاده از کارت‌های گرافیکی Nvidia H800 کمتر از ۶ میلیون دلار (این مقدار معمولاً بر اساس مدت‌زمان استفاده از کارت‌های گرافیکی، تعداد پردازنده‌ها، و هزینه‌ی اجاره یا خرید سخت‌افزارهای موردنیاز محاسبه می‌شود) بوده و موفقیتش تا حدی است که در مدت کوتاهی، ChatGPT را کنار زده و به برترین اپلیکیشن رایگان اپ‌استور آمریکا تبدیل شده است.

۲. موسس دیپ سیک (DeepSeek) کیست؟

دیپ سیک (DeepSeek) استارتاپی مستقر در هانگژو است و سهامدار اصلی آن لیانگ ونفنگ، یکی از بنیان‌گذاران صندوق سرمایه‌گذاری High-Flyer محسوب می‌شود. این صندوق در مارس ۲۰۲۳ در حساب رسمی وی‌چت خود اعلام کرد که قصد دارد فراتر از معاملات مالی حرکت کرده و روی ایجاد گروه تحقیقاتی جدیدی برای کشف جوهره هوش مصنوعی عمومی (AGI) تمرکز کند.

در همان سال، DeepSeek به عنوان نتیجه این تحقیقات متولد شد. اطلاعات دقیقی درباره میزان سرمایه‌گذاری High-Flyer در دیپ سیک وجود ندارد. اما طبق اسناد رسمی چین، دفتر این صندوق در همان ساختمانی قرار دارد که DeepSeek در آن فعالیت می‌کند. همچنین، High-Flyer مالک چندین پتنت مرتبط با خوشه‌های پردازشی مورد استفاده در آموزش مدل‌های هوش مصنوعی است. در ادامه نگاهی خواهیم داشت به خلاصه‌ای از صحبت‌های مدیرعامل های-فلایر در سال ۲۰۲۰! 

در مورد استراتژی سرمایه‌گذاری «های فلایر»، باید بگویم که از زمان تأسیس، استراتژی ما بر پایه‌ چارچوب بزرگ هوش مصنوعی شکل گرفته و تمام فرآیندها، از جمع‌آوری و پردازش داده گرفته تا ساخت پرتفوی و اجرای معاملات، کاملاً خودکار و مبتنی بر هوش مصنوعی هستند. مدل‌های ما از سه منبع داده‌ای استفاده می‌کنند:

  • داده‌های بازار (قیمت و حجم معاملات)
  • داده‌های اقتصاد کلان
  • داده‌های جایگزین که به‌صورت ساختاریافته پردازش می‌شوند.

ما از شبکه‌های عصبی عمیق برای پیش‌بینی نوسانات قیمت استفاده می‌کنیم و سعی داریم با شناسایی فرصت‌های نهفته در داده‌ها، بازدهی مازاد (Alpha) ایجاد کنیم.

درباره الگوهای پنهانی در نوسانات بازار هم اجازه دهید این‌طور توضیح بدهم که در بازاری کاملاً کارآمد، نوسانات قیمت تصادفی هستند. اما بازار چین، به دلیل تسلط سرمایه‌گذاران خرد، ناکارآمد است و رفتارهای احساسی در معاملات نقش مهمی دارند. این موضوع فرصت‌های زیادی را برای سرمایه‌گذاری فراهم می‌کند. بر خلاف سرمایه‌گذاری مبتنی بر تحلیل بنیادی که روی اصلاح ارزش در بلندمدت تمرکز دارد، ما روی نوسانات کوتاه‌مدت قیمت کار می‌کنیم.

برتری های-فلایر نسبت به سایر صندوق‌های سرمایه‌گذاری، قدرتش در تحقیق و توسعه (R&D) مداوم است، نه یک استراتژی خاص! ما ۱۲۰ متخصص داریم که بیش از نیمی از آن‌ها در AI، فناوری اطلاعات و تحقیقات مالی تخصص دارند. طی سه سال، بیش از ۲۰۰ میلیون یوان در زیرساخت‌های ابررایانش سرمایه‌گذاری کرده‌ایم که امکان توسعه‌ی مدل‌های پیچیده‌تر را فراهم می‌کند. برخلاف بسیاری از صندوق‌ها که به یک مدل خاص وابسته‌اند، ما طیف وسیعی از استراتژی‌های فرکانس بالا و میان‌فرکانس را پیاده‌سازی کرده‌ایم تا مقیاس‌پذیری بهتری داشته باشیم.

درباره دیدگاهم درباره آینده‌ سرمایه‌گذاری در چین باید بگویم که با افزایش نهادهای سرمایه‌گذاری و کاهش سرمایه‌گذاران خرد، فضای سودآوری صندوق‌ها محدودتر خواهد شد. در آینده، شاهد اثر متیو خواهیم بود؛ یعنی بازیگران بزرگ قدرت بیشتری کسب می‌کنند و رقبا را کنار می‌زنند. برای زنده ماندن در این شرایط، نوآوری و سرمایه‌گذاری در تحقیق و توسعه حیاتی است. همچنین، تحلیل بنیادی در سرمایه‌گذاری هم می‌تواند نقش پررنگ‌تری پیدا کند، چرا که دسترسی به داده‌های دقیق‌تر و فناوری‌های پردازش پیشرفته بهبود یافته است. ما در درازمدت دو هدف اصلی داریم:

  • ماندگاری: بسیاری از صندوق‌ها بعد از چند سال سقوط می‌کنند. ما با سرمایه‌گذاری در فناوری، تلاش داریم که در بلندمدت پیشرو باقی بمانیم.
  • استفاده از هوش مصنوعی برای سرمایه‌گذاری: بسیاری از شرکت‌های غربی این مسیر را طی کرده‌اند، اما در چین هنوز راه طولانی در پیش است. ما می‌خواهیم ثابت کنیم که سرمایه‌گذاری کاملاً مبتنی بر هوش مصنوعی یک مدل پایدار است.

این صحبت‌ها، آن هم در سال ۲۰۲۰، نشان می‌دهد که دیپ سیک از فلسفه‌ های فلایر نشأت گرفته است و با اینکه محدودیت‌های دولتی بر معاملات الگوریتمی در چین افزایش یافته‌اند، زیرساخت هوش مصنوعی قدرتمند های فلایر، به بقا و تکاملش در شرایط جدید کمک خواهد کرد.

۳. چرا دیپ سیک DeepSeek بازارهای مالی را متزلزل کرده است؟  

روز دوشنبه، سهام شرکت‌های فناوری در سراسر جهان با کاهش شدیدی مواجه شد. دلیل این اتفاق، افزایش محبوبیت مدل هوش مصنوعی ارزان‌قیمتی از چین بود که باعث شد سرمایه‌گذاران نسبت به تقاضای گسترده برای تراشه‌های پیشرفته که صنعت هوش مصنوعی بر آن متکی است، تردید کنند. 

استارتاپ DeepSeek دستیار هوش مصنوعی رایگانی را معرفی کرده که از تراشه‌های ارزان‌تر و داده‌های کمتر استفاده می‌کند. این موضوع، یکی از پیش‌فرض‌های کلیدی در بازارهای مالی را به چالش کشید: اینکه هوش مصنوعی تقاضا را برای مجموعه‌ای از تأمین‌کنندگان، از تولیدکنندگان تراشه گرفته تا مراکز داده، افزایش خواهد داد.

نگرانی‌های بازار درباره دیپ سیک (DeepSeek)  

مدل‌های جدید DeepSeek باعث شده‌اند سرمایه‌گذاران نگران تأثیرش بر رقابت‌پذیری شرکت‌های بزرگ فناوری آمریکا و روند سرمایه‌گذاری در بخش هوش مصنوعی شوند. در یادداشتی که بانک UBS در تاریخ ۲۷ ژانویه منتشر کرد، آمده:  

با موفقیت اولیه مدل‌های زبانی بزرگ دیپ سیک (DeepSeek)، سرمایه‌گذاران با نگرانی‌هایی مانند جنگ قیمت در هوش مصنوعی، هزینه‌های سرسام‌آور سرمایه‌ای در میان شرکت‌های بزرگ فناوری و نحوه تنظیم سرمایه‌گذاری در بخش‌های مختلف از جمله لایه‌های زیرساختی و کاربردی هوش مصنوعی مواجه شده‌اند.  

۴. تأثیر بر تقاضای توان پردازشی

یکی از نگرانی‌های اصلی بازار، کاهش رشد تقاضا برای توان پردازشی است. شرکت تحقیقاتی Jefferies در گزارشی نوشت:  

ما بارها نگرانی خود را درباره بازده سرمایه‌گذاری (ROI) در هوش مصنوعی اعلام کردیم. حجم سرمایه‌گذاری در پردازنده‌های گرافیکی (GPU) بسیار زیاد است – انویدیا در سال ۲۰۲۴ از فروش کارت‌های گرافیکی (GPU) خود، بیش از ۲۰۰ میلیارد دلار درآمد خواهد داشت – اما تاکنون نمونه‌های عملی از سودآوری هوش مصنوعی که این سرمایه‌گذاری‌ها را توجیه کند، دیده نشده است  

دپ سیک (DeepSeek) می‌تواند باعث شود سرمایه‌گذاران سؤال‌های جدی‌تری درباره این سرمایه‌گذاری‌های عظیم در پردازشگرهای هوش مصنوعی مطرح کنند. مدیران شرکت‌های فعال در زمینه هوش مصنوعی در آمریکا نیز ممکن است تحت فشار بیشتری قرار بگیرند تا افزایش هزینه‌های سرمایه‌ای خود را در سال ۲۰۲۶ توجیه کنند.  

۵. آیا دیپ سیک (DeepSeek) بر بازار گوشی‌های هوشمند تأثیر می‌گذارد؟   

اگر مدل‌های سبک‌تر DeepSeek به‌خوبی عمل کنند، می‌تواند برای بازار گوشی‌های هوشمند خبر خوبی باشد. شرکت Jefferies در گزارش خود اشاره کرده:  

ما نسبت به آینده گوشی‌های هوشمند مبتنی بر هوش مصنوعی بدبین هستیم، چرا که این فناوری تاکنون مورد استقبال مصرف‌کنندگان قرار نگرفته و مدل‌های بزرگ‌تر هوش مصنوعی به سخت‌افزارهای قوی‌تری نیاز دارند که هزینه گوشی‌ها را افزایش خواهد داد.  

اما اگر مدل‌های کم‌حجم DeepSeek بدون نیاز به سخت‌افزارهای گران‌قیمت روی گوشی اجرا شوند، ممکن است مسیر جدیدی برای استفاده از هوش مصنوعی در تلفن‌های هوشمند ایجاد شود.  

۶. آیا چین آینده روشن‌تری در هوش مصنوعی دارد؟  

بانک سرمایه‌گذاری UBS معتقد است که اگر روش توجه نهفته چندهدفی (MHA) و مدل ترکیبی متخصصان (MOE) که DeepSeek استفاده می‌کند، در سراسر صنعت هوش مصنوعی رایج شود، چشم‌انداز روشنی برای هوش مصنوعی در چین وجود خواهد داشت:

اگر هزینه‌های هوش مصنوعی کاهش پیدا کند، پذیرش آن سریع‌تر از حد انتظار افزایش خواهد یافت و توسعه هوش مصنوعی عمومی (AGI) زودتر از تصور فعلی محقق خواهد شد.

***

۱. توجه نهفته چندهدفی (MHA – Multi-Head Attention)

توجه نهفته چندهدفی یک تکنیک کلیدی در مدل‌های یادگیری عمیق، به‌ویژه ترانسفورمرها (Transformers) مانند GPT و BERT است. این تکنیک به مدل اجازه می‌دهد که توجه (Attention) را به چندین بخش مختلف ورودی به‌صورت هم‌زمان متمرکز کند. درواقع MHA چندین مکانیسم توجه (Attention Heads) را به‌صورت موازی اجرا می‌کند. هر Head اطلاعات را از زاویه‌ای متفاوت تحلیل می‌کند و درنهایت، این خروجی‌ها با هم ترکیب می‌شوند. این باعث می‌شود مدل بتواند روابط پیچیده بین کلمات یا داده‌های ورودی را بهتر درک کند. مزیت‌های این مدل عبارت‌اند از:

  • درک بهتر وابستگی‌ها بین بخش‌های مختلف یک جمله یا داده
  • یادگیری اطلاعات متنوع از طریق چندین سر توجه (Heads)
  • افزایش دقت مدل‌های NLP در کارهایی مانند ترجمه، خلاصه‌سازی و پردازش زبان طبیعی

۲. مدل ترکیبی متخصصان (MOE – Mixture of Experts)

مدل MOE، معماری پیشرفته در یادگیری ماشین است که از چندین مدل (متخصص یا Experts) برای انجام وظایف مختلف استفاده می‌کند. ایده‌ اصلی MOE این است که هر متخصص (Expert) روی یک بخش خاص از داده‌ها یا وظایف تمرکز کند و یک لایه‌ی مسیریاب (Router) تعیین می‌کند که کدام متخصص باید روی کدام ورودی کار کند. در این مدل: 

  • لایه‌ای مسیریاب (Router) تصمیم می‌گیرد که چه درصدی از ورودی به کدام متخصص ارسال شود.
  • متخصص‌ها (Experts) شبکه‌های عصبی مختلفی هستند که روی بخش‌های خاصی از داده‌ها آموزش دیده‌اند.
  • خروجی‌های متخصصان انتخاب‌شده ترکیب شده و به‌عنوان خروجی نهایی تولید می‌شود.

مزیت‌ها:

  • افزایش کارایی محاسباتی (چون فقط چند متخصص روی هر داده فعال می‌شوند، نه همه‌ی آن‌ها)
  • بهبود عملکرد مدل‌های بزرگ زبانی (LLMs) با کاهش هزینه‌ی پردازش
  • امکان استفاده‌ی بهینه از منابع محاسباتی

مدل‌های جدید مانند GPT-4 و DeepSeek-V3 از تکنیک MOE برای بهینه‌سازی پردازش استفاده می‌کنند.

***

بانک سرمایه‌گذاری UBS همچنین اشاره کرد که سرمایه‌گذاران باید نسبت به لایه‌های زیرساختی و پردازشی، وزن بیشتری به بخش‌های کاربردی و لایه‌های هوش در سبد سرمایه‌گذاری خود بدهند:  

  • ۲۵٪ تا ۳۰٪ سرمایه‌گذاری در بخش اپلیکیشن‌های هوش مصنوعی
  • ۱۵٪ تا ۲۰٪ در لایه‌های هوش و مدل‌های زبانی  
  • ۵۰٪ تا ۶۰٪ در لایه‌های پردازشی و زیرساختی  

ظهور دیپ سیک (DeepSeek) می‌تواند معادلات سرمایه‌گذاری در هوش مصنوعی را تغییر دهد. اگر مدل‌های سبک‌تر و ارزان‌تر مانند DeepSeek موفق باشند، نه‌تنها رقابت برای شرکت‌های فناوری آمریکایی سخت‌تر خواهد شد، بلکه تقاضا برای پردازنده‌های گران‌قیمت هم کاهش پیدا کرده و روند سرمایه‌گذاری در این صنعت هم تحولی عظیم را تجربه خواهد کرد.

۷. حمله سایبری به وب‌سایت DeepSeek

استارتاپ چینی DeepSeek روز دوشنبه اعلام کرد که به دلیل حمله سایبری، ثبت‌نام کاربران را به‌طور موقت محدود خواهد کرد. این اتفاق پس از آن رخ داد که دستیار هوش مصنوعی این شرکت، ناگهان با افزایش محبوبیت چشمگیری مواجه شد. در همان روز، وب‌سایت دیپ سیک هم دچار قطعی شد، چراکه دستیار هوش مصنوعی آن به برترین اپلیکیشن رایگان اپ‌استور آمریکا تبدیل شده بود.

طبق اطلاعیه وضعیت این شرکت، در حال حاضر مشکلات مربوط به رابط برنامه‌نویسی کاربردی (API) و عدم امکان ورود کاربران به وب‌سایت برطرف شده است. با این حال، این قطعی طولانی‌ترین اختلال DeepSeek در ۹۰ روز اخیر بود و هم‌زمان با افزایش شدید محبوبیت آن رخ داد.

۸. شرایط سهام هوش مصنوعی چگونه است؟

فیوچرز نزدک (NASDAQ) روز دوشنبه با کاهش ۳٪ بسته شد، این در حال بود که سهام انویدیا با کاهش شدید ۵۹۳ میلیارد دلاری در ارزش بازار، رکوردی تاریخی از نظر میزان افت در یک روز را به ثبت رساند.

  • انویدیا بزرگ‌ترین عامل افت شاخص نزدک بود و ۱۷٪ از ارزش خود را از دست داد. این بزرگ‌ترین افت یک‌روزه در ارزش بازار یک شرکت در تاریخ وال‌استریت محسوب می‌شود.
  • ارز سهام Broadcom Inc نیز ۱۷.۴٪ کاهش یافت.
  • سهام مایکروسافت، حامی ChatGPT، نیز ۲.۱٪ افت کرد.
  • آلفابتا (شرکت مادر گوگل) نیز با ۴.۲٪ کاهش بسته شد.

۹. واکنش دونالد ترامپ به دیپ سیک (DeepSeek)

رئیس‌جمهور آمریکا، دونالد ترامپ، روز دوشنبه اظهار داشت که پیشرفت فناوری DeepSeek باید زنگ خطری برای شرکت‌های آمریکایی باشد و اعلام کرد که رقابت با مدل‌های سریع‌تر و ارزان‌تر چینی، امری مثبت محسوب می‌شود. ترامپ در فلوریدا گفت:

عرضه هوش مصنوعی DeepSeek از سوی یک شرکت چینی، باید هشداری باشد که صنعت ما نیاز دارد تا با تمرکز بالا برای پیروزی در رقابت جهانی تلاش کند. چین و برخی از شرکت‌های چینی، به‌ویژه یکی از آن‌ها، روش‌های سریع‌تر و ارزان‌تری برای هوش مصنوعی ارائه کرده‌اند. این موضوع خوب است، چراکه هزینه‌های کمتری برای توسعه لازم خواهد بود. من این را یک فرصت و یک دارایی ارزشمند می‌بینم.

۱۰. واکنش سم آلتمن به DeepSeek

سم آلتمن، مدیرعامل OpenAI، در حالی که این رقیب کم‌هزینه بازارهای جهانی را دچار آشفتگی کرده و سهام شرکت‌های فناوری آمریکایی را تحت فشار قرار داده، روز سه‌شنبه از مدل جدید هوش مصنوعی DeepSeek-R1 به‌عنوان مدلی چشمگیر یاد کرد و در شبکه اجتماعی X درباره رشد DeepSeek اظهار نظر کرد:

این شرکت چینی در حال حاضر به چالشی جدی برای بازیگران اصلی صنعت، از جمله OpenAI، تبدیل شده است. مدل DeepSeek-R1 بسیار چشمگیر است، به‌خصوص از نظر توانایی‌هایی که با این قیمت ارائه می‌دهد.

او در عین حال تأکید کرد که OpenAI همچنان مدل‌های بسیار بهتری ارائه خواهد کرد و افزود:

ما قطعاً مدل‌های بسیار بهتری عرضه خواهیم کرد… اما مهم‌تر از همه، ما مشتاقانه در حال ادامه تحقیقات خود هستیم.

نوشته های مشابه

اشتراک
اطلاع از
0 دیدگاه
جدید ترین
قدیمی ترین محبوب ترین
Inline Feedbacks
View all comments
دکمه بازگشت به بالا