یادتان هست تا چند سال پیش هر بار که صحبت از یک مدل هوش مصنوعی جدید میشد، همه فکر میکردند همین فردا قرار است «هوش شبیه انسان» ساخته شود؟ آن شور و هیجان حالا دیگر رنگ باخته است، حتی زمانی که چت جیپیتی ۵ عرضه شد، سروصدای چندانی به پا نکرد. دلیل این اتفاق ساده است؛ اینترنت دیگر منبع جدیدی برای یادگیری ندارد. مدلهای هوش مصنوعی تاکنون با تغذیه از متن، تصویر و ویدئوهای آنلاین رشد کردهاند؛ اما حالا تقریبا تمام محتوای محتوای باارزش اینترنت جمعآوری و به مدلها خورانده شده است. آنچه باقی مانده یا تکراری و بیکیفیت است یا یک محتوای مصنوعی است که ارزش چندانی ندارد. به همین دلیل نسخههای جدید هوش مصنوعی دیگر چندان شگفتانگیز بهنظر نمیرسند.
اگر قرار باشد هوش مصنوعی به مسیر پیشرفت ادامه دهد، به منبع جدیدی از دادهها نیاز دارد. منبعی که از دل زندگی روزمره، احساسات، تجربهها و تعاملهای واقعی نشات بگیرد. این همان چیزی است که مفهوم «هوش مصنوعی فیزیکی» را شکل میدهد؛ مدلی که با تکیه بر دادههای فیزیکی از حرکت بدن و حالات چهره گرفته تا اشیا و فضای پیرامون ما درک عمیقتری از انسان و جهان پیدا میکنند و دریچه جدیدی را برای پیشرفت هوش مصنوعی باز میکند. در این مطلب از میهن بلاکچین میخواهیم ببینیم هوش مصنوعی فیزیکی (Physical AI) چیست، چرا دادههای فیزیکی اهمیت دارند، هوش مصنوعی فیزیکی در چه محصولاتی نمود پیدا کرده است و آینده این فناوری به کدام سمت حرکت خواهد کرد. با ما همراه باشید.
هوش مصنوعی فیزیکی (Physical AI) چیست؟
هوش مصنوعی فیزیکی (Physical AI) شاخهای از هوش مصنوعی است که بر پایه دادههای بهدست آمده از دنیای واقعی ساخته میشود. این دادهها از طریق سنسورها، رباتها، خودروها، ابزارهای پوشیدنی و دستگاههای واقعیت ترکیبی جمعآوری میشوند. بر خلاف دادههایی که از محیط دیجیتال گرفته میشوند (مانند متن و تصاویر)، این دادهها ویژگیهایی همچون حرکت، عمق، لامسه و شرایط محیطی را هم در برمیگیرند. ویژگیهایی که اینترنت هیچوقت قادر به بازتولید آنها نیست.
دستگاههای مبتنی بر هوش مصنوعی فیزیکی بهطور مداوم جریانهای اطلاعات جدیدی تولید میکنند. به همین دلیل، شرکتهایی که این نوع سختافزارها را در اختیار دارند، در دهههای آینده صاحب ارزشمندترین دادهها خواهند شد.
چرا هوش مصنوعی به منبع داده جدیدی نیاز دارد؟
پیشرفت هوش مصنوعی همیشه متکی به دادههای بهتر است؛ اما منابع دیجیتال عملاً به پایان رسیدهاند. حالا دیگر مدلهای هوش مصنوعی نمیتوانند از طریق استخراج داده از وب به یک جهش بزرگتر برسند. گام بعدی از دادههای واقعی میآید؛ دادههایی که بازتابی از زندگی، رفتار و تعاملات انسانها در دنیای واقعی هستند.
موضوع فقط به «حجم داده» مربوط نمیشود؛ دادههای فیزیکی بسیار غنیتر، دقیقتر و از نظر محتوایی ریشهدارتر از میلیونها نمونه تکراری اینترنت هستند. این دادهها برآمده از تجربه زیسته هستند و از دل زندگی واقعی بیرون میآیند.
نمونههایی از هوش مصنوعی فیزیکی در دنیای واقعی
شاید «هوش مصنوعی فیزیکی» مفهوم جدیدی بهنظر برسد؛ اما همین حالا هم میتوانیم نمونههای آن را در صنایع و دستگاههای مختلف ببینیم:
رباتیک
شرکتهایی نظیر بوستون داینامیکس (Boston Dynamics)، تسلا (Tesla’s Optimus) و یونیتری (Unitree) در حال ساخت رباتهای انساننمایی هستند که توانایی حرکت، بلندکردن اجسام و مسیریابی در محیطهای انسانی را دارند. اپل هم در حال ورود به حوزه رباتهای شخصی است و قصد دارد با ارائه نسخه جدیدی از دستیار سیری (Siri)، رباتها را به اکوسیستم سختافزاری خود متصل میکند. اگرچه اپل در رقابت هوش مصنوعی عقبتر مانده است؛ اما توانایی آن در طراحی و سختافزار برگ برنده آن در این مرحله است. در حوزه پزشکی، ربات جراحی داوینچی (da Vinci) ساخته شرکت اینتویتیو سرجیکال (Intuitive Surgical) تاکنون بیش از ۱۱ میلیون عمل انجام داده و دادههای بینظیری را در مورد اقدامات و نتایج پزشکی ثبت کرده است که هیچ شبیهسازی با آن برابری نمیکند.
در مورد رباتهای خانگی باید گفت که اگرچه هنوز گران و در مراحل اولیه هستند؛ اما سرعت پیشرفت بالایی دارند. شرکت متا بخش جدیدی را در حوزه رباتهای انساننما در رئالیتی لبز (Reality Labs) راهاندازی کرده است که هدف آن ترکیب مدلهای لاما (Llama) با رباتهای فیزیکی است. استارتاپ فیگر ایآی (Figure AI) نیز با جذب سرمایهای بیش از ۸۵۰ میلیون دلار، با سرعت به سمت تجاریسازی رباتهای انساننما حرکت میکند. حالا دیگر رباتهای انساننما فقط در قلمرو داستانهای علمیتخیلی نیستند؛ آنها کمکم به واقعیت نزدیک میشوند.
عینکهای واقعیت ترکیبی
بازار عینکهای هوشمند بعد از سالها شک و تردید، بالاخره به واقعیت نزدیک شد. عینکهای هوشمند ریبن متا (Ray-Ban Meta) از زمان عرضه در اکتبر ۲۰۲۳ تاکنون بیش از ۲ میلیون واحد فروش داشته و درآمد خود را تا اوایل سال ۲۰۲۵ بیش از ۳ برابر کرده است. گوگل هم با سرمایهگذاری ۱۰۰ میلیون دلاری روی برند جنتل مانستر (Gentle Monster) دنبال این است که عینکهای هوشمند را مد روز کند. شرکت اپل نیز با تمرکز روی هدست واقعیت ترکیبی ویژن پرو (Vision Pro) گام بزرگی در این حوزه برداشته است. البته پذیرش ویژن پرو هنوز به دلیل قیمت بالا و اندازه بزرگ آن محدود است؛ اما قرار است نسلهای جدید سبکتر، ارزانتر و کاربردیتر شوند. همکاریگوگل با جنتل مانستر و متا با ریبن نشان میدهد که عینکهای واقعیت ترکیبی پس از سالها، بالاخره به سمت پذیرش انبوه پیش میروند.
در حوزه استارتاپها هم اقدامات بسیاری در حوزه محصولات مبتنی بر هوش مصنوعی فیزیکی در جریان است. هیلو اکس (Halo X) با جذب سرمایه اولیه یک میلیون دلاری در حال توسعه عینکهایی است که با موتورهای هوش مصنوعی جمینای گوگل و پرپلکسیتی (Perplexity) کار میکنند. این عینکها میتوانند تمام گفتگوها را ضبط کنند، تحلیل کنند و در زمان واقعی پاسخ دهند. استارتاپهای دیگری مانند مَد ویژن (Madvision) و مانترا (Mentra) هم در حال ساخت عینکهای مبتنی بر هوش مصنوعی هستند.
پس از چرخههای پرهیاهو و شکست شرکتهایی مانند مجیک لیپ (Magic Leap) در بازار محصولات واقعیت مجازی، این بار شرایط متفاوت به نظر میرسد. ممکن است عینکهای هوشمند واقعا وارد زندگی روزمره شوند و اگر این اتفاق بیفتد، جمعآوری حجم عظیمی از دادههای دنیای واقعی را امکانپذیر میکند.
ابزارهای پوشیدنیها و دستگاههای هوشمند
گجتهای سلامتی مانند دستنبد Whoop، حلقه اورا (Oura) و ساعت اپل در حال جمعآوری مجموعه دادههای بیومتریک در مقیاس بزرگ هستند. استارتاپ ایت اسلیپ (Eight Sleep) که در حوزه سرویس خواب فعالیت میکند، اخیرا در یک دور تامین مالی ۱۰۰ میلیون دلار سرمایه برای گسترش فناوری تشک هوشمند خود جذب کرده است. در کنار پوشیدنیها، ابزارهای جدید دیگری بهنام دستگاههای همراه اجتماعی درحال ظهور هستند. شرکت فرند دات کام (Friend.com) نخستین سری از این محصولات را روانه بازار کرده است و اوپن ایآی نیز جانی آیو (Jony Ive) طراح معروف و اسبق اپل را استخدام کرده تا یک «دستگاه دوست (friend device)» بسازد. این دستگاهها فراتر از یک گجت عادی، در نقش یک همراه دیجیتال، همدمِ هوشمند کاربر میشوند. اگرچه این محصولات خاص و محدود هستند؛ اما پس از آنکه تناسب بین محصول و بازار را پیدا کردند، بازارهای بزرگی را به دست میآورند.
در کنار همه این محصولات، گوشیها هوشمند همچنان پادشاه دستگاههای اسمارت هستند. گوگل اخیرا از نسل جدیدی از گوشیهای پیکسل (Pixel) رونمایی کرد که مدل هوش مصنوعی جمینای در سیستمعامل آنها ادغام شده است. این یعنی، دستیار هوش مصنوعی همیشه فعال است و متناسب با موقعیت کاربر واکنش نشان میدهد. اپل هم اگرچه آرامتر حرکت میکند؛ اما مشغول آمادهسازی یک تغییر بزرگ است و قصد دارد مدلهای هوش مصنوعی مختلف را در گوشیهای آیفون و iOS ادغام کند. این یعنی اپل میخواهد آیفون را به مرکز انتخاب و استفاده از انواع هوش مصنوعی تبدیل کند.
حرکت هر دو شرکت گوگل و اپل پیام روشنی دارد؛ گوشیها محور اصلی زندگی دیجیتال و فیزیکی ما هستند و حالا قرار است کلید ورود ما به هوش مصنوعی فیزیکی هم باشند.
خودرانها
شرکت ویمو (Waymo) تاکنون بیش از ۱۰۰ میلیون مایل رانندگی خودران را ثبت کرده است و در پنج شهر آمریکا سرویس تاکسی رباتیک را ارائه میدهد. تسلا هم از تابستان امسال سرویس ربوتاکسی را در آستین تگزاس (Austin) شروع کرده است؛ اما گسترش آن به کل کشور به تصمیم قانونگذاران و صدور مجوزها بستگی دارد. مطمئنا با اضافه شدن هر شهر جدید، دادههای متنوعتر و ارزشمندتری جمعآوری میشود. انتظار میرود ویمو و تسلا بهسرعت فعالیتهایشان را گسترش دهند؛ مثلا ویمو به فکر ورود به نیویورک و حتی توکیو است. در همین حین، شرکت اوبر (Uber) هم بیکار ننشسته است و اخیرا از استارتآپی بهنام “AV Nuro” در حوزه خودروهای خودران حمایت کرده است.
رباتها و سنسورهای تخصصی
هوش مصنوعی فیزیکی فراتر از دستگاههای مصرفی، در حوزههای صنعتی هم پیشرفتهای مهمی داشته است. همزمان، نوآوری در حسگرهای لمسی باعث شده ماشینها مهارتی نزدیک به انگشتان دست انسان پیدا کنند؛ بهطوری که قادر به تشخیص نیرو، لرزش و حتی دما هستند. شرکتهایی مانند اسکایدیو (Skydio) و پرسپتو (Percepto) از پهپادها برای نظارت بر خطوط انتقال برق، خطوط لوله و سایتهای صنعتی استفاده میکنند که نسبت به تیمهای انسانی دقت و ایمنی بیشتر دارد. در صنایع سنگین، رباتهای شرکت انیباتیکس (ANYbotics)، گکو (Gecko Robotics) و بوستون داینامیکس (Boston Dynamics) مسئولیت بازرسی و نگهداری را بر عهده دارند و دادههای عملیاتی بسیار ارزشمندی را تولید میکنند. شاید این کاربردها تخصصی به نظر برسند؛ اما مجموعه دادههای صنعتی ارزشمندی را تولید میکنند.
زیرساخت هوش مصنوعی برای دنیای فیزیکی
آینده هوش مصنوعی دیگر فقط به صفحه گوشی و رایانه محدود نمیشود، ظاهرا قرار است همه چیز از پایه تغییر کند. شرکت انویدیا (NVIDIA) با تمام توان وارد حوزه رباتیک و هوش مصنوعی تجسمیافته شده است. این شرکت بهتازگی پلتفرم پردازشی “Jetson Thor” و مدل بینایی-زبانی “Cosmos Reason” را معرفی کرده است. بر خلاف مدلهای زبانی (LLM) سنتی، این سیستمها برای درک و تعامل با جهان واقعی طراحی شدهاند و میتوانند از قوانین فیزیک گرفته تا رابطه علت و معلول و شرایط محیطی را بهتر درک کنند.
اما ماجرا فقط به سختافزار و مدل محدود نمیشود. دانشگاه امآیتی (MIT) با انجام یک تحقیق نشان داده است که مدلهای هوش مصنوعی میتوانند در یک محیط خاص آموزش ببینند و بعد خودشان را با یک محیط کاملا متفاوت وفق دهند. بهطور مثال، پهپادی که در یک جنگل تمرین کرده باشد، میتواند در خیابانهای شلوغ شهر هم پرواز کند و بهدرستی واکنش نشان دهد. این انعطافپذیری فقط از دل تجربه و تعامل مستقیم با محیطهای واقعی به دست میآید.
تحقیقات حوزه درک تجسمی (Embodied Cognition) موید همین حقیقت است. هوش، یک مفهوم انتزاعی نیست؛ بلکه از طریق «حس کردن» و «واکنش نشان دادن» در برابر محیط شکل میگیرد. اگر قرار است ماشینها واقعا باهوش شوند، باید همین مسیر را طی کنند و یاد بگیرند که چطور مانند انسانها در زمان واقعی با موقعیتهای مختلف سازگار شوند.
حرکت به سوی هوش مصنوعی فیزیکی از طریق جوامع غیرمتمرکز
تمام دادههای هوش مصنوعی فیزیکی لزوما در انحصار غولهای فناوری متمرکز نیست. بهلطف شبکههای زیرساخت فیزیکی غیرمتمرکز (DePIN) جوامع غیرمتمرکز هم میتوانند شبکههایی از دستگاهها را ایجاد و مدیریت کنند و مالک دادههای دنیای واقعی شوند. چند نمونه از پروژههایی که تاکنون در حوزه زیرساخت فیزیکی هوش مصنوعی حرکت کردهاند، عبارتنداز:
- هلیوم (Helium): شبکهای متشکل از هاتاسپاتهای بیسیم ایجاد کرده است.
- هایومپر (Hivemapper): از دوربینهای داشبورد خودروها برای نقشهبرداری استفاده میکند.
- دیمو (DIMO): دادههای خودروها را جمعاوری میکند و به صاحبان خورو اجازه میدهد از دادههای تولیدشده درآمد کسب کنند.
- ریبورن ایآی (Reborn AI): ایجنتهای هوش مصنوعی را با استفاده از داده و توان محاسباتی غیرمتمرکز تقویت میکند.
این پروژهها بهخوبی نشان مدهند که میتوان سنسورها، خودروها و سیستمهای توزیعشده را بدون یک مالک شرکتی متمرکز، در مقیاس بزرگ راهاندازی و مدیریت کرد.
اگرچه تمرکززدایی در مالکیت دادههای فیزیکی هنوز در مراحل اولیه قرار دارد؛ اما زیرساخت فیزیکی غیرمتمرکز یک مسیر موازی را برای توسعه هوش مصنوعی فیزیکی بهوجود میآورد. مسیری که در آن ارزشمندترین دادهها دیگر در انحصار شرکتهایی نظیر گوگل، تسلا یا متا نیستند؛ بلکه در بستر شبکههای غیرمتمرکز توزیع میشوند و تمامی مشارکتکنندگان میتوانند از آنها بهرهمند شوند.
چرا داده فیزیکی برنده است؟
دادههای فیزیکی، چیزی فراتر از متن و تصویر دیجیتال هستند. آنها حرکت، موقعیت فضایی، حس لامسه و زمینههای واقعی جهان را ثبت میکنند؛ عناصری که هیچوقت در محتوای ایستای وب دیده نمیشود. سنسورها و دستگاههای مبتنی بر داده فیزیکی هر روز جریان جدیدی از اطلاعات را تولید میکنند و همین باعث میشود که مدلها بهروز بمانند، نه اینکه مدام دادههای قدیمی و تکراری را بازنویسی کنند. دادههای غنی و دقیق دنیای واقعی، بسیار ارزشمندتر از میلیونها نمونه بیکیفیت یا مصنوعی است. مهمتر از همه اینکه هوش واقعی از دل «تجربه زیسته و تعامل فیزیکی» پدید میآید، نه از متنهای انتزاعی و تصاویر دیجیتال.
جمعبندی
هوش مصنوعی به یک بنبست رسیده است. واقعیت این است که مخزن دادههای دیجیتال ته کشیده است. موج بعدی نوآوری در مدلهای هوش مصنوعی نه از خراشیدن و بازخوانی گذشته؛ بلکه از ثبت و درک لحظه حال پدید میآید.
رباتهایی که حرکت میکنند، عینکهایی که میبینند، پوشیدنیهایی که حس میکنند و خودروهایی که یاد میگیرند؛ اینها ابزارهایی هستند که مسیر تکامل هوش مصنوعی را میسازند. هوش مصنوعی فیزیکی غیرمتمرکز فقط یک ارتقا نیست، بلکه سنگبنای پیشرفت در دهههای آینده است؛ پلی که هوش مصنوعی را به تجربه انسانی نزدیکتر میسازد و مسیر دستیابی به هوش مصنوعی عمومی (AGI) واقعی را هموارتر میکند. آینده هوش مصنوعی فقط متکی به دنیای دیجیتال نیست؛ آینده آن وابسته به دادههای واقعی در دنیای فیزیکی است.