مبتدی مقالات عمومی

قابلیت ChatGPT ویژن چیست و چه کارهایی می‌توان با آن انجام داد؟

ربات چت جی‌پی‌تی (ChatGPT) از اولین مدل‌های هوش مصنوعی است که در مدت کوتاهی بسیار محبوب شد و توانست علاقه کاربران را به خود جلب کند. این ربات در ابتدا یک مدل زبانی ساده بود؛ اما به‌مرور قابلیت‌های جدیدی‌ به آن اضافه شد و حالا به یک دستیار هوش مصنوعی تمام عیار تبدیل شده است. چت جی‌پی‌تی ویژن (ChatGPT Vision)، جدیدترین قابلیتی است که به این ربات اضافه شده است و باعث می‌شود که ربات تصاویر را عمیقا درک کند. در این مقاله با میهن بلاکچین همراه باشید تا ببینیم ChatGPT ویژن چیست و چه قابلیت‌هایی دارد.

قابلیت GPT-4V یا ChatGPT ویژن چیست؟

Chatgpt ویژن چیست
منبع: medium.com

چت جی‌پی‌تی ویژن قابلیت جدیدی است که به نسخه GPT-4 پلاس اضافه شده است و به همین دلیل به آن GPT-4V یا GPT-4 with vision نیز گفته می‌شود. با این قابلیت، ربات چت جی‌پی‌تی حالا می‌تواند عکس‌ها و تصاویر ارسالی شما را درک کند، آن‌ها را تحلیل کند و به سوالات شما درباره عکس‌ها پاسخ دهد.

از آنجایی که قابلیت ویژن به نسخه GPT-4 اضافه شده است، فقط کاربرانی می‌توانند از آن استفاده کنند که اشتراک چت جی‌پی‌تی پلاس دارند. هزینه خرید اشتراک GPT-4 پلاس، ماهانه ۱۰ دلار است. اگر اشتراک پلاس دارید، در گوشه سمت چپ چت باکس (قسمتی که فرمان‌ها را به ربات می‌دهید) یک آیکون کوچک عکس اضافه شده است. با کلیک کردن روی این آیکون، می‌توانید تصویر دلخواه خود را به ChatGPT اضافه کنید و درباره عکس سوال بپرسید یا راهنمایی بخواهید:

اضافه کردن عکس به Chatgpt
منبع: makeuseofimages

می‌توانید عکس موردنظر را از فضای ذخیره‌سازی کامپیوتر انتخاب کنید و یا به‌راحتی عکس کپی‌شده را در ربات Paste کنید. اگر درباره تصویر کار خاصی از ربات می‌خواهید، می‌توانید دستور موردنظر را به همراه عکس بنویسید. اگر نه، ربات خودش عکس را تحلیل می‌کند و هرچه را که از عکس می‌فهمد در اختیار شما قرار می‌دهد. بعد از آن می‌توانید سوالات بیشتری بپرسید و با ربات کار کنید.

مثال‌هایی از قابلیت‌های فوق‌العاده ChatGPT ویژن

حالا دیگرChatGPT می‌تواند عکس‌ها و نوشته‌های داخل عکس‌ها را بفهمد و درک کند. با این حساب کارهایی که می‌توانید با این قابلیت انجام دهید واقعا نامحدود و بی‌پایان است. در اینجا به مثال‌هایی از کاربردهای جذاب چت جی‌پی‌تی ویژن و کارهایی که می‌تواند برای شما انجام دهد اشاره کرده‌ایم.

۱. حل کردن پازل‌ها

حل کردن پازل‌ها
منبع: www.youtube.com/@AppOfTheDay

چت جی‌پی‌تی ویژن این قدرت را دارد که بدون توضیحات شما، نوشته‌ها، سوالات و فرمول‌های داخل عکس‌ها را درک کند و به آن‌ها پاسخ دهد. برای مثال، در بالا یک پازل تصویری به ربات ارسال و بدون هیچ توضیحی از آن خواسته شده است که پازل را حل کند. نتیجه فوق‌العاده است!

۲. حل کردن مسائل پیچیده ریاضی

حل کردن مسائل ریاضی
منبع: www.youtube.com/@AppOfTheDay

مشابه مورد قبلی، چت جی‌پی‌تی ویژن مسائل ریاضی (چه دست‌نوشته و چه تایپ‌شده) را نیز به‌راحتی حل می‌کند. این ربات، فرمول‌های پیچیده را در تصاویر تشخیص می‌دهد و با جزئیات کامل، راه‌حل مسئله را برای کاربر می‌نویسد.

۳. درک عمیق تصاویر و پاسخ به سوالات

درک تصویر و پاسخ به سوالات توسط ويژن
منبع: twitter.com/MrSoroushAhmadi

یکی از کاربردهای مهم چت‌جی‌پی‌تی ویژن جایی مشخص می‌شود که از ربات کاری می‌خواهید. مثلا می‌توانید عکس یک غذا را به ربات ارسال کنید و از آن بخواهید که اسم و دستور پخت غذا را به شما بگوید.

۴. راهنمایی در مورد یک عکس

ارائه راهنمایی برای دکوراسیون
منبع: twitter.com/MrSoroushAhmadi

تصویر یک خانه یا اتاق را به ChatGPT ویژن بدهید و از آن بخواهید که درباره دکوراسیون، رنگ‌بندی و حتی انتخاب و چینش اشیا شما را راهنمایی کند. قطعا از پاسخ‌های ربات شگفت‌زده خواهید شد.

۵. استخراج داده‌های تصویر

استخراج داده‌ها از تصویر
منبع: www.youtube.com/@AppOfTheDay

تصویر بالا، یک تصویر تاریخی و بسیار قدیمی است که نوشته‌های بسیار ریزی روی خود دارد؛ به‌طوری که حتی خواندن این نوشته‌ها با چشم بسیار سخت است. این تصویر را به چت جی‌پی‌تی ویژن داده‌ایم و از آن خواسته‌ایم که اطلاعات آن را در قالب یک جدول ارائه دهد. ربات درصد زیادی از اطلاعات تصویر را درک کرده و به‌صورت جدول درآورده است:

استخراج داده‌ها از تصاویر ۲
منبع: www.youtube.com/@AppOfTheDay

۶. تبدیل طرح اولیه به کد

تبدیل طرح به کد وبسایت
منبع: www.youtube.com/@AppOfTheDay

می‌توانید طرح ساده‌ای را که با دست کشیده شده است به ChatGPT بدهید و از آن بخواهید که آن را به یک کد برای وبسایت تبدیل کند. چت جی‌پی‌تی در چند ثانیه کدها را می‌نویسد و می‌توانید آن‌ها را کپی کرده و در وبسایت استفاده کنید.

تبدیل طرح به کد ۲

۷. تبدیل عکس به جدول نوشتاری

تبدیل عکس به جدول
منبع: www.youtube.com/@AppOfTheDay

اگر تصویر یک جدول را به چت جی‌پی‌تی ویژن بدهید، ربات به‌راحتی آن را به یک جدول نوشتاری تبدیل می‌کند. با این قابلیت فوق‌العاده دیگر نیازی به ساختن جدول و نوشتن داده‌ها نیست و تا حد زیادی در زمان صرفه‌جویی می‌شود.

۸. تحلیل نمودارها و داده‌های اقتصادی

تحلیل داده‌های اقتصادی
منبع: www.youtube.com/@AppOfTheDay

چت جی‌پی‌تی ویژن می‌تواند تصاویر حاوی داده‌های اقتصادی مثل نمودار قیمت یا گزارش مالی یک شرکت را تحلیل کند و اطلاعات درخواستی را در اختیار شما قرار دهد. برای مثال، می‌توانید نمودار یک ارز دیجیتال را به ربات بدهید و از آن بخواهید که نمودار را برای شما تحلیل کند. حتی می‌توانید تراز مالی یک شرکت را به چت جی‌پی‌تی ارسال کنید و از آن درباره عملکرد شرکت سوال کنید.

۹. تشخیص اشیا و درک اجزای تصاویر

تشخیص اشیا
منبع: www.youtube.com/@AppOfTheDay

اگر تصویر یک شیء را به ChatGPT ویژن بدهید، به‌طور کامل به شما توضیح می‌دهد که آن وسیله چیست و چه کاربردی دارد. برای مثال، در زیر تصویر یک رابط HDMI به چت جی‌پی‌تی داده شده و ربات توضیح داده است که این رابط چیست و برای چه هدفی استفاده می‌شود.

۱۰. تشخیص علامت‌ها و زبان‌های مختلف از روی عکس

تشخیص علامت‌ها
منبع: www.youtube.com/@AppOfTheDay

چت جی‌پی‌تی ویژن می‌تواند علامت‌های خاص مثل تابلوهای ترافیکی و سمبل‌های تمام زبان‌های دنیا را تشخیص دهد. مثلا ممکن است در حین سفر خود تابلويی را ببینید که اصلا نمی‌دانید چیست. می‌توانید عکس تابلو را بگیرید و آن را به ربات ارسال کنید. در عرض چند ثانیه GPT-4V به شما خواهد گفت که این تابلو چیست و چه معنایی دارد.

در مثال بالا، تصویر یک تابلوی ترافیکی به زبان چینی به ChatGPT ارسال شده و ربات توضیح داده است که این تصویر مربوط به یک تابلوی ترافیکی در چین است و به این معنی است که باید به چپ بپیچید.

سوالات متداول (FAQ)

پرسش و پاسخ
ChatGPT ویژن چیست؟

قابلیت جدیدی است که به ربات چت‌جی‌پی‌تی اضافه شده است و باعث می‌شود این ربات، توانایی درک تصاویر را پیدا کند.

به کمک چت‌جی‌پی‌تی ویژن چه کارهایی می‌توان کرد؟

امور مختلفی مثل حل پازل‌ها و مسائل ریاضی، استخراج داده‌های تصویر، تبدیل تصویر به کد برنامه‌نویسی، تبدیل عکس به جدول و تحلیل داده‌ها و نمودارهای اقتصادی از جمله اموری است که به‌کمک چت‌جی‌پی‌تی ویژن می‌توان انجام داد.

جمع‌بندی

ویژن یا GPT-4V، به‌روزرسانی جدید ربات هوش مصنوعی چت‌جی‌پی‌تی است که یک قابلیت بسیار کاربردی را به این ربات اضافه کرده است؛ درک عمیق تصاویر و هر چیزی که در عکس وجود دارد. این قابلیت چت جی‌پی‌تی را به یک دستیار هوش مصنوعی کاملا کاربردی تبدیل کرده است. این ربات حالا می‌تواند کارهای خارق‌العاده‌ای انجام بدهد: از حل کردن پازل‌ها و مسائل ریاضی گرفته تا ساختن جدول و تبدیل طرح نقاشی به کد وبسایت. در این مطلب توضیح دادیم که ChatGPT ویژن چیست و چه کاربردهایی دارد. اگر به نسخه پلاس چت جی‌پی‌تی دسترسی دارید، حتما از این قابلیت استفاده کنید و نظرات و تجربیات خود را با ما به اشتراک بگذارید.

منبع
youtubeopenai.com

نوشته های مشابه

اشتراک
اطلاع از
0 دیدگاه
Inline Feedbacks
View all comments
دکمه بازگشت به بالا