شرکت گوگل پس از مدتها انتظار بالاخره از مدل هوش مصنوعی پیشرفته خود با نام جمینای (Gemini ) رونمایی کرد. گوگل مدعی است جمینای از رقبای خود مثل جیپیتی ۴ عملکرد بسیار بهتری دارد.
مدل هوش مصنوعی جدید گوگل در سه نسخه نانو، پرو و اولترا عرضه خواهد شد. علاوه بر این، گوگل مدعی است این مدل زبانی بزرگ نسبت به مدل GPT-4 در ریاضیات و کدنویسی تخصصی بهتر عمل میکند.
اولترا کاملترین نسخه هوش مصنوعی جمینای است و بنابر ادعای گوگل، در ۳۰ مورد از ۳۲ معیار آکادمیکی که در توسعه مدلهای زبانی بزرگ به آن توجه میشود، عملکرد پیشرفتهای نشان داده است. همچنین گوگل مدعی است نسخه اولترا، در تست مولتی تسک خود امتیاز ۹۰ را کسب کرده است که بالاتر از عملکرد یک انسان متخصص است.
جف دین (Jeff Dean)، دانشمند ارشد گوگل در این رابطه اظهار داشت:
نسخه اولترای هوش مصنوعی جمینای اولین مدل زبانی بزرگ است که عملکردی مشابه یک انسان متخصص در آزمایشهای مولتی تسک در ۵۷ زمینه مختلف نشان داده و امتیاز بالای ۹۰٪ گرفته است.
یکی از مزایای جمینای که آن را از سایر رقبا متمایز میکند، قابلیت درک یکپارچه متون، تصاویر، صداها و ویدیوهاست. دین افزود:
ما جمینای را از ابتدا به گونهای طراحی کردیم که چند وجهی باشد. به جای اینکه با یک مدل متنی شروع کنیم و سپس مدلهای دیداری و شنیداری را به آن اضافه کنیم.
مدل هوش مصنوعی جدید گوگل همچنان مهارتهای برنامهنویسی پیشرفتهای دارد، به طوری که میتواند مشکلات کدهای پیچیده را حل کرده و با سایر توسعهدهندگان همکاری کند.
ساندار پیچای (Sundar Pichai) مدیرعامل گوگل در رابطه با جمینای میگوید:
اکنون آغاز عصر جمینای است. زمان تحقق اهدافی که در هنگام شروع به کار گوگل دیپ مایند در سر داشتیم فرا رسیده است.
در حال حاضر، نسخه پرو جمینای به چت بات بارد گوگل اضافه شده است. به گفته روان چونگ (Rowan Cheung)، کارشناس هوش مصنوعی، نسخه پرو جمینای در شش مورد از هشت معیار، از مدل جیپیتی ۳.۵ بهتر عمل کرده است و قدرتمندترین چت بات رایگان در بازار به شمار میرود.
به گفته گوگل، این بزرگترین بروزرسانی چت بات بارد از زمان راهاندازی آن است. این چت بات در حال حاضر در بیش از ۱۷۰ کشور جهان و به زبان انگلیسی در دسترس است، با این حال، گوگل وعده داده است از زبانها و موقعیتهای جغرافیایی بیشتری پشتیبانی کند.
نسخه نانو جمینای نیز قرار است در گوشی پیکسل ۸ پرو عرضه شود. همچنین شرکت گوگل آزمایشات خود برای استفاده از مدل هوش مصنوعی جمینای در موتور جستجوی خود را آغاز کرده است تا تجربه کاربران را بهبود بخشد.
ویدیوی رسمی منتشرشده از جمنای واقعی نیست
ویدیویی که شرکت گوگل از جمنای منتشر کرده و ۱.۶ میلیون بازدید در یوتیوب داشته است، بهگونهای تدوین شده که به نظر میرسد این مدل هوش مصنوعی در لحظه به صحبتهای یک فرد پاسخ میدهد.
با این حال، گوگل اعتراف کرده که برای ایجاد این ویدیو پاسخهای جمنای را سرعت بخشیده است و این مدل هوش مصنوعی اصلا به صدا پاسخ نمیدهد. این شرکت در یک پست وبلاگی جداگانه هم نحوه ساخت این ویدیو را نشان داده و تاکید کرده که با استفاده از فریمهای تصویر ثابت از فیلم و پرامپتهای متنی آن را ساخته است. گوگل خاطرنشان کرده است:
ویدیوی نمایشی جمنای پیامها و خروجیهای واقعی آن را نشان میدهد. ما این ویدیو را برای نشان دادن طیف وسیعی از قابلیتهای جمنای و الهام بخشیدن به توسعهدهندگان ساختیم.
شرکت گوگل پس از مدتها انتظار بالاخره از مدل هوش مصنوعی پیشرفته خود با نام جمینای (Gemini ) رونمایی کرد. گوگل مدعی است جمینای از رقبای خود مثل جیپیتی ۴ عملکرد بسیار بهتری دارد.
مدل هوش مصنوعی جدید گوگل در سه نسخه نانو، پرو و اولترا عرضه خواهد شد. علاوه بر این، گوگل مدعی است این مدل زبانی بزرگ نسبت به مدل GPT-4 در ریاضیات و کدنویسی تخصصی بهتر عمل میکند.
اولترا کاملترین نسخه هوش مصنوعی جمینای است و بنابر ادعای گوگل، در ۳۰ مورد از ۳۲ معیار آکادمیکی که در توسعه مدلهای زبانی بزرگ به آن توجه میشود، عملکرد پیشرفتهای نشان داده است. همچنین گوگل مدعی است نسخه اولترا، در تست مولتی تسک خود امتیاز ۹۰ را کسب کرده است که بالاتر از عملکرد یک انسان متخصص است.
جف دین (Jeff Dean)، دانشمند ارشد گوگل در این رابطه اظهار داشت:
نسخه اولترای هوش مصنوعی جمینای اولین مدل زبانی بزرگ است که عملکردی مشابه یک انسان متخصص در آزمایشهای مولتی تسک در ۵۷ زمینه مختلف نشان داده و امتیاز بالای ۹۰٪ گرفته است.
یکی از مزایای جمینای که آن را از سایر رقبا متمایز میکند، قابلیت درک یکپارچه متون، تصاویر، صداها و ویدیوهاست. دین افزود:
ما جمینای را از ابتدا به گونهای طراحی کردیم که چند وجهی باشد. به جای اینکه با یک مدل متنی شروع کنیم و سپس مدلهای دیداری و شنیداری را به آن اضافه کنیم.
مدل هوش مصنوعی جدید گوگل همچنان مهارتهای برنامهنویسی پیشرفتهای دارد، به طوری که میتواند مشکلات کدهای پیچیده را حل کرده و با سایر توسعهدهندگان همکاری کند.
ساندار پیچای (Sundar Pichai) مدیرعامل گوگل در رابطه با جمینای میگوید:
اکنون آغاز عصر جمینای است. زمان تحقق اهدافی که در هنگام شروع به کار گوگل دیپ مایند در سر داشتیم فرا رسیده است.
در حال حاضر، نسخه پرو جمینای به چت بات بارد گوگل اضافه شده است. به گفته روان چونگ (Rowan Cheung)، کارشناس هوش مصنوعی، نسخه پرو جمینای در شش مورد از هشت معیار، از مدل جیپیتی ۳.۵ بهتر عمل کرده است و قدرتمندترین چت بات رایگان در بازار به شمار میرود.
به گفته گوگل، این بزرگترین بروزرسانی چت بات بارد از زمان راهاندازی آن است. این چت بات در حال حاضر در بیش از ۱۷۰ کشور جهان و به زبان انگلیسی در دسترس است، با این حال، گوگل وعده داده است از زبانها و موقعیتهای جغرافیایی بیشتری پشتیبانی کند.
نسخه نانو جمینای نیز قرار است در گوشی پیکسل ۸ پرو عرضه شود. همچنین شرکت گوگل آزمایشات خود برای استفاده از مدل هوش مصنوعی جمینای در موتور جستجوی خود را آغاز کرده است تا تجربه کاربران را بهبود بخشد.
ویدیوی رسمی منتشرشده از جمنای واقعی نیست
ویدیویی که شرکت گوگل از جمنای منتشر کرده و ۱.۶ میلیون بازدید در یوتیوب داشته است، بهگونهای تدوین شده که به نظر میرسد این مدل هوش مصنوعی در لحظه به صحبتهای یک فرد پاسخ میدهد.
با این حال، گوگل اعتراف کرده که برای ایجاد این ویدیو پاسخهای جمنای را سرعت بخشیده است و این مدل هوش مصنوعی اصلا به صدا پاسخ نمیدهد. این شرکت در یک پست وبلاگی جداگانه هم نحوه ساخت این ویدیو را نشان داده و تاکید کرده که با استفاده از فریمهای تصویر ثابت از فیلم و پرامپتهای متنی آن را ساخته است. گوگل خاطرنشان کرده است:
ویدیوی نمایشی جمنای پیامها و خروجیهای واقعی آن را نشان میدهد. ما این ویدیو را برای نشان دادن طیف وسیعی از قابلیتهای جمنای و الهام بخشیدن به توسعهدهندگان ساختیم.