بحران در بازارهای مالی، سقوط تاریخی ارزش سهام در بخش نیمههادیها و فناوری؛ بازار سهام ایالات متحده یکی از بزرگترین سقوطهای یکروزه خود را در تاریخ ثبت کرد. این سقوط که عمدتاً در بخش فناوری و نیمههادیها رخ داده، به ترکیدن حباب هوش مصنوعی نسبت داده میشود؛ اتفاقی که پس از انتشار دیپ سیک (DeepSeek)، مدل هوش مصنوعی متنباز چینی، به وقوع پیوست.
به گزارش میهن بلاکچین، با اینکه این مدل چندی قبل منتشر شده بود، اما موج رسانهای اخیر که عملکرد دیپ سیک (DeepSeek) را با مدلهای o1 از OpenAI و Llama از متا مقایسه کرد و قدرت آن را به نمایش گذاشت، باعث ایجاد اثر دومینویی در بازارهای مالی شد. عامل دیگری که بر این وضعیت دامن زد، رایگان بودن دیپ سیک (DeepSeek) بود. این مدل بهجز دسترسی API که آن هم بسیار ارزانتر از رقباست، بهصورت کاملاً رایگان ارائه شده است. همین موضوع باعث نگرانی سرمایهگذاران شده که آیا مدل اقتصادی سنتی هوش مصنوعی، که مبتنی بر هزینههای هنگفت برای دسترسی به مدلهای قویتر است، در آستانه سقوط قرار دارد؟
سقوط ۱۷ درصدی بازار در چند روز، با نابودی ۵۸۸.۸ میلیارد دلار ارزش
در کمتر از چند روز، شاخصهای بازار شاهد سقوطی بیسابقه بودند که ارزش شرکتهای فناوری و نیمههادیها را ۵۸۸.۸ میلیارد دلار کاهش داد. اما آیا این بحران واقعاً به معنای ترکیدن حباب هوش مصنوعی است، یا تنها نشانهای از ورود به فصل جدیدی در رقابت مدلهای هوش مصنوعی؟ بسیاری از تحلیلگران بر این باورند که واکنشها به دیپ سیک (DeepSeek) احساسی بوده و در برخی موارد، سوءبرداشتهایی درباره تأثیر آن ایجاد شده است.
دیپ سیک (DeepSeek)؛ تغییر پارادایمی در مدلهای هوش مصنوعی؟
مدل دیپ سیک (DeepSeek) اولین مدل چینی مبتنی بر استدلال است که به سطح مدلهای خصوصی مانند سری o1 از OpenAI رسیده و برخلاف مدلهای زبانی سنتی مانند GPT-3، GPT-4، Claude و Gemini که پاسخهای خود را آنی تولید میکنند، این مدلهای جدید عملکرد خود را متناسب با افزایش زمان محاسباتی بهبود میبخشند — رویکردی که به Test Time Compute (TTC) معروف است. OpenAI اولین بار این رویکرد را با مدلهای o1-preview، o1 و o1 Pro معرفی کرد، اما حالا دیپ سیک (DeepSeek) نشان داده که چین نیز در این مسیر به سطحی رقابتی رسیده است.
جالب اینجاست که دیپ سیک (DeepSeek) از همان دسامبر ۲۰۲۳، تغییر مسیر خود را با معرفی دیپ سیک V3 اعلام کرده بود — مدلی که هنوز از استدلال پشتیبانی نمیکرد و عملکردی مشابه GPT-4 داشت. اما چیزی که توجه تحلیلگران را جلب کرد، نه صرفاً متنباز بودن، عملکرد قوی، یا رایگان بودن دیپ سیک (DeepSeek)، بلکه هزینههای پایین آموزش این مدل بود. گفته میشود OpenAI برای توسعه GPT-4 بیش از ۱۰۰ میلیون دلار هزینه کرده، اما خب طبق ادعای دیپ سیک (DeepSeek)، این مدل از هوش مصنوعی تنها با ۵.۵ میلیون دلار آموزش داده شده است! این اختلاف شدید در هزینههای توسعه، سرمایهگذاران را نگران کرده که آیا مدل سنتی کسبوکار هوش مصنوعی در آستانه فروپاشی قرار دارد؟
هزینههای پنهان دیپ سیک: سرمایهگذاری بیش از ۱.۳ میلیارد دلاری برای توسعه هوش مصنوعی
با وجود اینکه دیپ سیک ادعا میکند که مدل پیشرفته خود را با کمتر از ۶ میلیون دلار توسعه داده، کارشناسان این رقم را زیر سوال بردهاند. این مدل با استفاده از سوپرکامپیوتری متعلق به High-Flyer، که هزینهای حدود ۱۳۹ میلیون دلار داشته و از ۱۰ هزار پردازنده A100 انویدیا بهره میبرد، آموزش دیده است.
دولت آمریکا در حال بررسی احتمال دسترسی دیپ سیک به پردازندههای پیشرفته از طریق بازار سیاه، به ویژه در سنگاپور، است. سم آلتمن، مدیرعامل اوپنایآی، نیز برآوردهای دیپسیک درباره بازدهی انرژی مدلش را «بزرگنمایی شده» میداند.
دیپ سیک، تهدیدی برای مدل کسبوکار سنتی هوش مصنوعی؟
حتی اگر هیمانطور که مدیران دیپ سیک ادعا کردهاند، هوش مصنوعی دیپ سیک (DeepSeek) هزینههای پایینتری برای آموزش مدلهای خود خرج کرده باشد، باز هم میتوان گفت که این فناوری بلکه قیمتهای دسترسی به مدل را نیز بهشدت کاهش داده و در اکوسیستم متنباز، مدلهای فشردهشدهای را منتشر کرده که کاربران زیادی آنها را دانلود و آزمایش کردهاند. نتایج نشان میدهد که رویکرد مدلهای استدلالی (TTC) میتواند سطحی بالاتر از آنچه ChatGPT تاکنون ارائه داده است، در اختیار کاربران بگذارد. اما سؤال اصلی این است: چگونه دیپ سیک (DeepSeek) توانسته است با هزینهای تا این حد پایین، مدلهای رقابتی با OpenAI و متا ارائه کند؟
همزمانی عرضه دیپ سیک (DeepSeek) با تحولات کلیدی در ایالات متحده
این تحولات در زمانی حساس اتفاق افتاد. در هفتهای که ترامپ دوران قانونگذاری جدید خود را آغاز کرد، پروژه Stargate در ایالات متحده رونمایی شد و آینده هوش مصنوعی در صدر اخبار فناوری قرار گرفت. دیپ سیک (DeepSeek) دقیقاً در همین هفته بهعنوان جایگزینی کمهزینه از چین وارد رقابت شد و این موضوع سرمایهگذاران را بیش از پیش نگران کرد.
اگر دیپ سیک (DeepSeek) واقعاً بتواند مدل اقتصادی جدیدی را تعریف کند که در آن هزینههای آموزشی و اجرای مدلها بهشدت کاهش یابد، آنگاه ممکن است شاهد تغییری اساسی در صنعت هوش مصنوعی باشیم — تغییری که میتواند مدلهای سرمایهگذاری کلان فعلی را از بین ببرد.
در این بحبوحه، شرکتهایی که میلیاردها دلار برای راهاندازی مراکز داده مجهز به پردازندههای گرافیکی قدرتمند سرمایهگذاری کردهاند—مانند انویدیا، گوگل، مایکروسافت و آمازون—ممکن است با چالشی جدی روبهرو شوند. اگر دیپ سیک (DeepSeek) بتواند ثابت کند که رویکردش نهتنها کارآمدتر بلکه مقیاسپذیرتر و با هزینهای ناچیز در مقایسه با روشهای فعلی است، ممکن است مدل سنتی سرمایهگذاری در هوش مصنوعی به چالش کشیده شود.
مقیاسپذیری محصولات هوش مصنوعی با حداقل منابع
یکی از واقعیتهای پذیرفتهشده در دنیای هوش مصنوعی این است که هیچ مدلی ارزش اقتصادی بلندمدت ندارد. بهمحض اینکه مدلی مانند GPT-4 منتشر میشود، نسخههای بهینهتر و پیشرفتهتر جای آن را میگیرند. این روند در چند سال اخیر کاملاً مشهود بوده است—از GPT-4 به GPT-4 Turbo و سپس به GPT-4o—و این چرخه پایانناپذیر ادامه دارد. از سوی دیگر، افزایش رقابت در بازار هوش مصنوعی، هزینههای آموزش مدلها را بهشدت بالا برده و شرکتها هم مجبورند با این موج حرکت کنند و مدلهای قدیمیتر را کنار بگذارند. هیچ مدلی برای همیشه ارزشمند نیست—همیشه نسخهای جدیدتر در راه است. به همین دلیل، ممکن است در ماههای آینده دیپ سیک (DeepSeek) R1 نیز جای خود را به مدلهای پیشرفتهتر بدهد.
در دو سال گذشته، دنیای هوش مصنوعی با سرعتی بیسابقه پیشرفت کرده و هر روز شاهد انتشار مدلهای قدرتمندتری هستیم که تب تبلیغاتی زیادی پیرامون آنها ایجاد میشود. کاربران عملکرد آنها را مقایسه میکنند، بنچمارکهایشان را بررسی میکنند و قبل از آنکه حتی برسند تا نتیجهگیری قطعی کنند، مدل بعدی وارد صحنه میشود.
پس ارزش واقعی کجاست؟
ارزش واقعی در خود مدلهای هوش مصنوعی نیست، بلکه در توانایی توسعه و بهینهسازی مدلهای جدید در مقیاس گسترده نهفته است. بهبود مدلها نیازمند دسترسی به مراکز داده پیشرفته است، جایی که آزمایشهای گسترده و همزمان انجام میشود تا محققان بتوانند روشهای مختلف را بررسی و مدلهای آینده را اصلاح و بهینهسازی کنند.
نقش دادههای مصنوعی در آینده هوش مصنوعی
در این مسیر، دادههای مصنوعی نقشی اساسی دارند. شرکتها اکنون از قدرت پردازشی بالا برای تولید دادههای آموزشی بهصورت داخلی استفاده میکنند، که سپس برای آموزش مدلهای بهتر به کار گرفته میشود. در نتیجه، تقاضا برای قدرت محاسباتی در دو حوزه کلیدی افزایش یافته است:
- اجرای آزمایشهای پیچیدهتر برای توسعه مدلهای پیشرفتهتر
- ایجاد مجموعهدادههای مصنوعی گسترده و دقیقتر برای بهبود یادگیری مدلها
در نهایت، شرکتهایی که بیشترین دسترسی را به منابع محاسباتی دارند، برتری خواهند داشت و میتوانند سیستمهای هوش مصنوعی پیشرفتهتری را آموزش دهند.
این پرسش مطرح میشود که چگونه دیپ سیک (DeepSeek) توانسته است مدلی در حد مدلهای شرکتهای بزرگ ایجاد کند، آن هم با هزینهای بهمراتب کمتر؟ آیا این بدان معناست که دیگر نیازی به سرمایهگذاریهای کلان در هوش مصنوعی نیست؟ نه دقیقاً. آنچه دیپ سیک (DeepSeek) نشان داد، این است که شرکتهایی با منابع مالی بیشتر همچنان میتوانند پیشتاز باشند. هوش مصنوعی یک رقابت دائمی است و آنهایی که دسترسی بیشتری به قدرت پردازشی دارند، همیشه سعی خواهند کرد یک قدم جلوتر باشند.
هوش مصنوعی متنباز، تهدیدی برای مدلهای انحصاری؟
ارائه مدلهای رایگان و متنباز که هزینهها را کاهش داده و مدلهای کسبوکار سنتی را به چالش میکشد، اتفاق جدیدی نیست. مارک زاکربرگ نیز با Llama همین استراتژی را در پیش گرفته است. نمونه دیگر، Stable Diffusion است که صنعت تولید تصاویر هوش مصنوعی را متحول کرد. در زمان عرضه Stable Diffusion، بسیاری معتقد بودند که DALL·E 2 نقطه اوج مدلهای تولید تصویر است و اجرای چنین مدلهایی نیازمند قدرت محاسباتی عظیم است که فقط شرکتهایی مانند OpenAI از پس آن برمیآیند. اما Stable Diffusion ثابت کرد که میتوان مدلهای تصویرسازی باکیفیت را روی پردازندههای گرافیکی معمولی اجرا کرد.
تأثیر هوش مصنوعی متنباز بر کسبوکارهای کوچک
در یک سوی ماجرا، شرکتهای بزرگ فناوری از منابع خود برای آموزش مدلهای پیشرفتهتر استفاده کردهاند. اما در سوی دیگر، هوش مصنوعی متنباز به شرکتهای کوچکتر و کاربران فردی اجازه داده که به این فناوری دسترسی بیشتری داشته باشند. بسیاری از کسبوکارها، حتی اگر خودشان مدلهای هوش مصنوعی را توسعه ندهند، از این تغییرات بهرهبرداری کردهاند. برای مثال، Freepik و Krea مستقیماً مدلهای هوش مصنوعی را توسعه نمیدهند، اما با استفاده از هوش مصنوعی، پلتفرمهایی قدرتمند برای کاربران ایجاد کردهاند. این تغییرات باعث شده است که بازیکنان جدیدی وارد صنعت هوش مصنوعی شوند و چشمانداز رقابتی این حوزه دستخوش تحول شود.
ورود مدلهایی مانند استیبل دیفیوژن (Stable Diffusion) و بعدها Flux نهتنها باعث کوچکتر شدن بازار یا کاهش تقاضا برای قدرت پردازشی نشده، بلکه امروز بیشتر از سالهای ۲۰۲۲ و ۲۰۲۳ منابع پردازشی صرف تولید تصویر میشود. این پدیده را میتوان با پارادوکس ژونز توضیح داد — مفهومی که ساتیا نادلا اخیراً به آن اشاره کرده و فهوای آن این است که وقتی فناوری کارآمدتر میشود، هزینه ورود به آن کاهش مییابد و افراد بیشتری به آن دسترسی پیدا میکنند. اما در کمال شگفتی، همین کارآمدی باعث افزایش استفاده از فناوری شده و تقاضا را بیشتر میکند.
به همین دلیل، کاهش هزینه مدلهای زبان و استدلالی را نباید به معنای کاهش تقاضا در نظر گرفت. عامل اصلی که زیرساختهای هوش مصنوعی را هدایت میکند، همچنان قدرت محاسباتی است، بهویژه واحدهای پردازش گرافیکی (GPU) شرکت انویدیا که همچنان سهم عمده بازار را در اختیار دارد. تا زمانی که رقیبی قدرتمند ظاهر نشود، موقعیت انویدیا دستنخورده باقی خواهد ماند. در واقع، ارزانتر شدن آموزش و اجرای مدلهای هوش مصنوعی، میزان استفاده از آن را افزایش میدهد و در نهایت، وابستگی به سختافزارهای محاسباتی را بیشتر میکند.
هرچند دیپ سیک (DeepSeek) تأثیر خود را روی شرکتهایی مانند OpenAI گذاشته، اما این تغییرات کاملاً غیرمنتظره نبود. سم آلتمن پیشتر گفته بود که هزینههای هوش مصنوعی در نهایت کاهش پیدا کرده و این فناوری به کالایی عمومی تبدیل خواهد شد، به این معنا که هوش مصنوعی در همهجا در دسترس خواهد بود و با قیمتهای پایین ارائه میشود. اما او همچنین تأکید کرده بود که برتری رقابتی واقعی در میزان دسترسی به قدرت محاسباتی نهفته است. دقیقا با همین دیدگاه هم OpenAI در پروژه Stargate مشارکت کرده، چرا که این استراتژی با اهداف بلندمدت این شرکت همخوانی دارد. اما یک نکته مهم وجود دارد: سرمایهگذاری عظیم برای چنین پروژههایی باید از جایی تأمین شود. به همین دلیل، OpenAI محصولات خود را بهعنوان خدمات پولی عرضه کرده و آنها را بهصورت تجاری توسعه داده است.
این نکته را نباید از قلم انداخت که با ورود دیپ سیک (DeepSeek) بسیاری از کاربران برای اولین بار متوجه شدهاند که میتوانند مدلهای متنباز را رایگان اجرا کنند، بهجای پرداخت ۲۰ دلار اشتراک ماهانه OpenAI. اما باید به این مهم هم توجه داشت که OpenAI هنوز نتوانسته بهخوبی توضیح دهد که مدلهای استدلالی چه مزیتی دارند، و همین موضوع باعث شده کاربران نسبت به ارزش واقعی این مدلها آگاهی کمتری داشته باشند.
رقابت در دنیای هوش مصنوعی، عامل پیشرفت است
با توجه به تمام آنچه گفتیم، مشخص شد که شرکتهای فناوری بزرگ با زیرساختهای محاسباتی قدرتمند، در معرض خطر نیستند. دسترسی آنها به منابع پردازشی، برگ برنده آنهاست. ظهور مدلهای متنباز چینی احتمالاً پذیرش گستردهتری برای هوش مصنوعی ایجاد خواهد کرد، اما شرکتهایی مانند OpenAI و Anthropic ممکن است تحت فشار رقبایی قرار بگیرند که مدلهای مشابه را بهصورت رایگان ارائه میدهند. بااینحال، این نوع رقابت در نهایت به نفع بازار خواهد بود. این روند پیشرفت هوش مصنوعی را کند نخواهد کرد، و همچنین نشانهای از ترکیدن حباب فناوری نیست. برعکس، این تحولات مانند یک کاتالیزور عمل خواهند کرد و باعث توسعه سریعتر و دسترسی گستردهتر به مدلهای پیشرفته خواهند شد.
اوپنایآی از مدل استدلالگر جدید خود رونمایی کرد؛ سریعتر، دقیقتر و رایگان!
در راستای واکنش به انتشار نسخه رایگان دیپ سیک، اوپنایآی هم با معرفی o3-mini، گامی تازه در هوش مصنوعی استدلالگر برداشت. این مدل جدید سریعتر، هوشمندتر و بهینهتر از نسخههای پیشین است و هزینه پردازش را بهطور قابلتوجهی کاهش میدهد. قابلیتهای نسخه o3-mini اوپنایآی، عبارتاند از:
- دسترسی رایگان برای کاربران ChatGPT: برخلاف مدلهای قبلی، این نسخه برای کاربران رایگان نیز در دسترس است. مشترکان پولی، بسته به نوع اشتراک، محدودیتهای کمتری برای استفاده دارند.
- توانایی جستجوی اینترنتی و نمایش روند تفکر: o3-mini نهتنها میتواند پاسخهای دقیقتری ارائه دهد، بلکه تفکر خود را نیز توضیح میدهد و اطلاعات بهروز را از اینترنت دریافت میکند.
- بهبود عملکرد در آزمونهای سخت: این مدل در آزمون پیچیدهی «آخرین امتحان بشریت» ۱۳٪ دقیقتر از رقبا عمل کرده و توانسته جایگاه نخست را از آن خود کند.
- سرعت و دقت بیشتر: نسبت به نسخهی قبلی، ۲۴٪ سریعتر پاسخ میدهد و تا ۳۹٪ کمتر دچار اشتباهات بزرگ میشود.
- هزینهی پایینتر: o3-mini ۶۳٪ ارزانتر از مدلهای قبلی است و با مدل R1 دیپسیک رقابت میکند.
- دسترسی از طریق API: توسعهدهندگان نیز میتوانند از این مدل در پروژههای خود استفاده کنند، با امکان تنظیم سطح تفکر از معمولی تا عمیق.
اوپنایآی این مدل را هنوز در مرحلهی آزمایشی میداند، اما همین حالا نیز نشان داده که میتواند نحوه استفاده از هوش مصنوعی را دگرگون کند!
در کوتاهمدت، دیپ سیک (DeepSeek) ممکن است به دلیل محدودیت در دسترسی به پردازندههای قدرتمند با چالشهایی مواجه شود. اما این کمبود میتواند باعث نوآوری شود، زیرا شرکت را وادار میکند که بهجای افزایش سختافزار، روی بهینهسازی معماری مدلهای خود تمرکز کند. در چنین شرایطی، بهینهسازی نرمافزاری و الگوریتمی میتواند دیپ سیک (DeepSeek) را به بازیگری مهمتر در این رقابت تبدیل کند.
در نهایت، قدرت محاسباتی و منابع انرژی تعیین خواهند کرد که چه کسانی در این تحول فناورانه برنده خواهند شد. ظهور رقبای جدید در هوش مصنوعی نشانهای از فروپاشی حباب نیست—بلکه گامی بهسوی آیندهای است که هماکنون در حال شکلگیری است