ربات چت جیپیتی (ChatGPT) از اولین مدلهای هوش مصنوعی است که در مدت کوتاهی بسیار محبوب شد و توانست علاقه کاربران را به خود جلب کند. این ربات در ابتدا یک مدل زبانی ساده بود؛ اما بهمرور قابلیتهای جدیدی به آن اضافه شد و حالا به یک دستیار هوش مصنوعی تمام عیار تبدیل شده است. چت جیپیتی ویژن (ChatGPT Vision)، جدیدترین قابلیتی است که به این ربات اضافه شده است و باعث میشود که ربات تصاویر را عمیقا درک کند. در این مقاله با میهن بلاکچین همراه باشید تا ببینیم ChatGPT ویژن چیست و چه قابلیتهایی دارد.
قابلیت GPT-4V یا ChatGPT ویژن چیست؟
چت جیپیتی ویژن قابلیت جدیدی است که به نسخه GPT-4 پلاس اضافه شده است و به همین دلیل به آن GPT-4V یا GPT-4 with vision نیز گفته میشود. با این قابلیت، ربات چت جیپیتی حالا میتواند عکسها و تصاویر ارسالی شما را درک کند، آنها را تحلیل کند و به سوالات شما درباره عکسها پاسخ دهد.
از آنجایی که قابلیت ویژن به نسخه GPT-4 اضافه شده است، فقط کاربرانی میتوانند از آن استفاده کنند که اشتراک چت جیپیتی پلاس دارند. هزینه خرید اشتراک GPT-4 پلاس، ماهانه ۱۰ دلار است. اگر اشتراک پلاس دارید، در گوشه سمت چپ چت باکس (قسمتی که فرمانها را به ربات میدهید) یک آیکون کوچک عکس اضافه شده است. با کلیک کردن روی این آیکون، میتوانید تصویر دلخواه خود را به ChatGPT اضافه کنید و درباره عکس سوال بپرسید یا راهنمایی بخواهید:
میتوانید عکس موردنظر را از فضای ذخیرهسازی کامپیوتر انتخاب کنید و یا بهراحتی عکس کپیشده را در ربات Paste کنید. اگر درباره تصویر کار خاصی از ربات میخواهید، میتوانید دستور موردنظر را به همراه عکس بنویسید. اگر نه، ربات خودش عکس را تحلیل میکند و هرچه را که از عکس میفهمد در اختیار شما قرار میدهد. بعد از آن میتوانید سوالات بیشتری بپرسید و با ربات کار کنید.
مثالهایی از قابلیتهای فوقالعاده ChatGPT ویژن
حالا دیگرChatGPT میتواند عکسها و نوشتههای داخل عکسها را بفهمد و درک کند. با این حساب کارهایی که میتوانید با این قابلیت انجام دهید واقعا نامحدود و بیپایان است. در اینجا به مثالهایی از کاربردهای جذاب چت جیپیتی ویژن و کارهایی که میتواند برای شما انجام دهد اشاره کردهایم.
۱. حل کردن پازلها
چت جیپیتی ویژن این قدرت را دارد که بدون توضیحات شما، نوشتهها، سوالات و فرمولهای داخل عکسها را درک کند و به آنها پاسخ دهد. برای مثال، در بالا یک پازل تصویری به ربات ارسال و بدون هیچ توضیحی از آن خواسته شده است که پازل را حل کند. نتیجه فوقالعاده است!
۲. حل کردن مسائل پیچیده ریاضی
مشابه مورد قبلی، چت جیپیتی ویژن مسائل ریاضی (چه دستنوشته و چه تایپشده) را نیز بهراحتی حل میکند. این ربات، فرمولهای پیچیده را در تصاویر تشخیص میدهد و با جزئیات کامل، راهحل مسئله را برای کاربر مینویسد.
۳. درک عمیق تصاویر و پاسخ به سوالات
یکی از کاربردهای مهم چتجیپیتی ویژن جایی مشخص میشود که از ربات کاری میخواهید. مثلا میتوانید عکس یک غذا را به ربات ارسال کنید و از آن بخواهید که اسم و دستور پخت غذا را به شما بگوید.
۴. راهنمایی در مورد یک عکس
تصویر یک خانه یا اتاق را به ChatGPT ویژن بدهید و از آن بخواهید که درباره دکوراسیون، رنگبندی و حتی انتخاب و چینش اشیا شما را راهنمایی کند. قطعا از پاسخهای ربات شگفتزده خواهید شد.
۵. استخراج دادههای تصویر
تصویر بالا، یک تصویر تاریخی و بسیار قدیمی است که نوشتههای بسیار ریزی روی خود دارد؛ بهطوری که حتی خواندن این نوشتهها با چشم بسیار سخت است. این تصویر را به چت جیپیتی ویژن دادهایم و از آن خواستهایم که اطلاعات آن را در قالب یک جدول ارائه دهد. ربات درصد زیادی از اطلاعات تصویر را درک کرده و بهصورت جدول درآورده است:
۶. تبدیل طرح اولیه به کد
میتوانید طرح سادهای را که با دست کشیده شده است به ChatGPT بدهید و از آن بخواهید که آن را به یک کد برای وبسایت تبدیل کند. چت جیپیتی در چند ثانیه کدها را مینویسد و میتوانید آنها را کپی کرده و در وبسایت استفاده کنید.
۷. تبدیل عکس به جدول نوشتاری
اگر تصویر یک جدول را به چت جیپیتی ویژن بدهید، ربات بهراحتی آن را به یک جدول نوشتاری تبدیل میکند. با این قابلیت فوقالعاده دیگر نیازی به ساختن جدول و نوشتن دادهها نیست و تا حد زیادی در زمان صرفهجویی میشود.
۸. تحلیل نمودارها و دادههای اقتصادی
چت جیپیتی ویژن میتواند تصاویر حاوی دادههای اقتصادی مثل نمودار قیمت یا گزارش مالی یک شرکت را تحلیل کند و اطلاعات درخواستی را در اختیار شما قرار دهد. برای مثال، میتوانید نمودار یک ارز دیجیتال را به ربات بدهید و از آن بخواهید که نمودار را برای شما تحلیل کند. حتی میتوانید تراز مالی یک شرکت را به چت جیپیتی ارسال کنید و از آن درباره عملکرد شرکت سوال کنید.
۹. تشخیص اشیا و درک اجزای تصاویر
اگر تصویر یک شیء را به ChatGPT ویژن بدهید، بهطور کامل به شما توضیح میدهد که آن وسیله چیست و چه کاربردی دارد. برای مثال، در زیر تصویر یک رابط HDMI به چت جیپیتی داده شده و ربات توضیح داده است که این رابط چیست و برای چه هدفی استفاده میشود.
۱۰. تشخیص علامتها و زبانهای مختلف از روی عکس
چت جیپیتی ویژن میتواند علامتهای خاص مثل تابلوهای ترافیکی و سمبلهای تمام زبانهای دنیا را تشخیص دهد. مثلا ممکن است در حین سفر خود تابلويی را ببینید که اصلا نمیدانید چیست. میتوانید عکس تابلو را بگیرید و آن را به ربات ارسال کنید. در عرض چند ثانیه GPT-4V به شما خواهد گفت که این تابلو چیست و چه معنایی دارد.
در مثال بالا، تصویر یک تابلوی ترافیکی به زبان چینی به ChatGPT ارسال شده و ربات توضیح داده است که این تصویر مربوط به یک تابلوی ترافیکی در چین است و به این معنی است که باید به چپ بپیچید.
سوالات متداول (FAQ)
قابلیت جدیدی است که به ربات چتجیپیتی اضافه شده است و باعث میشود این ربات، توانایی درک تصاویر را پیدا کند.
امور مختلفی مثل حل پازلها و مسائل ریاضی، استخراج دادههای تصویر، تبدیل تصویر به کد برنامهنویسی، تبدیل عکس به جدول و تحلیل دادهها و نمودارهای اقتصادی از جمله اموری است که بهکمک چتجیپیتی ویژن میتوان انجام داد.
جمعبندی
ویژن یا GPT-4V، بهروزرسانی جدید ربات هوش مصنوعی چتجیپیتی است که یک قابلیت بسیار کاربردی را به این ربات اضافه کرده است؛ درک عمیق تصاویر و هر چیزی که در عکس وجود دارد. این قابلیت چت جیپیتی را به یک دستیار هوش مصنوعی کاملا کاربردی تبدیل کرده است. این ربات حالا میتواند کارهای خارقالعادهای انجام بدهد: از حل کردن پازلها و مسائل ریاضی گرفته تا ساختن جدول و تبدیل طرح نقاشی به کد وبسایت. در این مطلب توضیح دادیم که ChatGPT ویژن چیست و چه کاربردهایی دارد. اگر به نسخه پلاس چت جیپیتی دسترسی دارید، حتما از این قابلیت استفاده کنید و نظرات و تجربیات خود را با ما به اشتراک بگذارید.