هوش مصنوعی بدون شک ترند اصلی فناوری امروز است و بسیاری از کمپانیها سرمایهگذاریهای عظیمی در این حوزه کردهاند و در حال رونمایی از آنها هستند. گوگل هم به عنوان یکی از بزرگترین شرکتهای فناوری در دنیا در زمینه هوش مصنوعی فعال است و پیش از این هوش مصنوعی Bard را منتشر کرده. اکنون گوگل در حال کار بر روی یک فناوری هوش مصنوعی جدیدی است که میتواند دستیارهای مجازی را چند سطح ارتقا دهد. این هوش مصنوعی جمینای (Gemini به معنای سومین برج فلکی از دائرهالبروج است) نام دارد.
گوگل جمینای (Gemini) چیست؟
جمینای یک مدل هوش مصنوعی جدید و قدرتمند از گوگل است که میتواند علاوه بر متن، تصاویر، ویدئوها و صدا را نیز درک کند. جمینای قادر به تکمیل وظایف پیچیده در ریاضیات، فیزیک و سایر زمینهها و همچنین درک و تولید کد با کیفیت بالا در زبانهای برنامهنویسی مختلف توصیف شده است.
جمینای در حال حاضر از طریق ادغام با Google Bard و Google Pixel 8 در دسترس است و به تدریج در سایر سرویسهای گوگل نیز قرار خواهد گرفت.
به گفته دیمس هاسابیس، مدیرعامل و یکی از بنیانگذاران گوگل دیپمایند، «جمینای نتیجه تلاشهای مشترک در مقیاس بزرگ توسط تیمهای مختلف در سراسر گوگل، از جمله همکاران ما در بخش تحقیقات گوگل (Google Research) است. جمینای از ابتدا به عنوان یک مدل چندوجهی طراحی شده، به این معنی که میتواند تعمیم دهد و به درک یکپارچهای داشته باشد و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را ترکیب کند.»
در ویدئوی تبلیغاتی که گوگل از این هوش مصنوعی جدید منتشر کرد، ادعاهای بسیار بزرگی مطرح شده، که برخی از آنها با انتقاداتی روبهرو شده. اما در هر حال کارشناسان فعال در این زمینه غالباً معتقدند که جمینای بسیار فراتر از آنچه که الان در اختیار داریم خواهد بود.
چه کسی جمینای را ساخته است؟
جمینای توسط گوگل و آلفابت، شرکت مادر گوگل ساخته شده و به عنوان پیشرفتهترین مدل هوش مصنوعی این شرکت تا به امروز محسوب میشود. شرکت گوگل دیپمایند نیز سهم قابل توجهی در توسعه Gemini داشته است.
آیا Gemini نسخههای مختلفی دارد؟
گوگل جمینای را به عنوان یک مدل انعطافپذیر توصیف میکند که میتواند روی همه چیز از مراکز داده گوگل گرفته تا دستگاههای تلفن همراه اجرا شود. برای دستیابی به این مقیاس پذیری، جمینای در سه اندازه عرضه می شود: جمینای نانو، جمینای پرو و جمینای اولترا.
- جمینای نانو: اندازه مدل جمینای نانو برای اجرا بر روی دستگاههای کوچک مثل گوشیهای هوشمند، بهویژه Google Pixel 8 طراحی شده. این مدل برای انجام کارهایی که نیاز به پردازش سرورهای خارجی ندارند، طراحی شده. از جمله این کارها میتوان به ریپلای خودکار یا خلاصه کردن متن اشاره کرد.
- جمینای پرو: جمینای پرو که در دیتاسنترهای گوگل اجرا میشود، برای تامین آخرین نسخه چت ربات هوش مصنوعی این شرکت یعنی Bard، طراحی شده است. این هوش مصنوعی قادر به ارائه پاسخ سریع و درک سوالات پیچیده است.
- جمینای اولترا: اگرچه هنوز برای استفاده گسترده در دسترس نیست، گوگل جمینای اولترا را به عنوان تواناترین مدل خود توصیف میکند که از «نتایج پیشرفته فعلی در ۳۰ معیار از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیقات مدل زبان بزرگ (LLM) فراتر رفته است» این مدل برای کارهای بسیار پیچیده طراحی شده و قرار است پس از اتمام مرحله آزمایشی فعلی، منتشر شود.
چگونه می توانید به گوگل جمینای دسترسی پیدا کنید؟
جمینای اکنون در محصولات گوگل در مدلهای نانو و پرو، مانند موبایل Pixel 8 و چت ربات بارد، در دسترس است. گوگل قصد دارد Gemini را به مرور زمان در جستجو، تبلیغات، کروم و سایر سرویسهای خود نیز وارد کند.
توسعهدهندگان و مشتریان سازمانی از ۱۳ دسامبر می توانند از طریق API جمینای در استودیوی هوش مصنوعی گوگل و هوش مصنوعی Google Cloud Vertex به Gemini Pro دسترسی داشته باشند. توسعهدهندگان اندروید از طریق AICore به Gemini Nano دسترسی خواهند داشت، که به صورت پیشنمایش اولیه در دسترس خواهد بود.
جمینای چه تفاوتی با سایر مدل های هوش مصنوعی مانند GPT-4 دارد؟
به نظر میرسد که مدل جدید گوگل جمینای یکی از بزرگترین و پیشرفتهترین مدلهای هوش مصنوعی تا به امروز باشد، اگرچه عرضه مدل Ultra مشخص خواهد کرد که جایگاه حقیقی این هوش مصنوعی چیست. در مقایسه با سایر مدلهای محبوبی که در حال حاضر رباتهای چت هوش مصنوعی را تقویت میکنند، جمینای به دلیل ویژگی چندوجهی بومی خود متمایز است، در حالی که مدلهای دیگر، مانند GPT-4، برای چندوجهی بودن به پلاگینها و ادغامها وابسته هستند.