هوش مصنوعی گوگل Gemini چیست و جمینای چه تفاوتی با جی‌پی‌تی ۴ دارد؟

تصویری از صفحه سرچ گوگل در مقاله مربوط به گوگل جمینای که هوش مصنوعی جدید گوگل است.

هوش مصنوعی بدون شک ترند اصلی فناوری امروز است و بسیاری از کمپانی‌ها سرمایه‌گذاری‌های عظیمی در این حوزه کرده‌اند و در حال رونمایی از آن‌ها هستند. گوگل هم به عنوان یکی از بزرگترین شرکت‌های فناوری در دنیا در زمینه هوش مصنوعی فعال است و پیش از این هوش مصنوعی Bard را منتشر کرده. اکنون گوگل در حال کار بر روی یک فناوری هوش مصنوعی جدیدی است که می‌تواند دستیارهای مجازی را چند سطح ارتقا دهد. این هوش مصنوعی جمینای (Gemini به معنای سومین برج فلکی از دائره‌البروج است) نام دارد.

گوگل جمینای (Gemini) چیست؟

جمینای یک مدل هوش مصنوعی جدید و قدرتمند از گوگل است که می‌تواند علاوه بر متن، تصاویر، ویدئوها و صدا را نیز درک کند. جمینای قادر به تکمیل وظایف پیچیده در ریاضیات، فیزیک و سایر زمینه‌ها و همچنین درک و تولید کد با کیفیت بالا در زبان‌های برنامه‌نویسی مختلف توصیف شده است.

جمینای در حال حاضر از طریق ادغام با Google Bard و Google Pixel 8 در دسترس است و به تدریج در سایر سرویس‌های  گوگل نیز قرار خواهد گرفت.

به گفته دیمس هاسابیس، مدیرعامل و یکی از بنیانگذاران گوگل دیپ‌مایند، «جمینای نتیجه تلاش‌های مشترک در مقیاس بزرگ توسط تیم‌های مختلف در سراسر گوگل، از جمله همکاران ما در  بخش تحقیقات گوگل (Google Research) است. جمینای از ابتدا به عنوان یک مدل چندوجهی طراحی شده، به این معنی که می‌تواند تعمیم دهد و به درک یک‌پارچه‌ای داشته باشد و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را ترکیب کند.»

در ویدئوی تبلیغاتی که گوگل از این هوش مصنوعی جدید منتشر کرد، ادعاهای بسیار بزرگی مطرح شده، که برخی از آن‌ها با انتقاداتی روبه‌رو شده. اما در هر حال کارشناسان فعال در این زمینه غالباً معتقدند که جمینای بسیار فراتر از آن‌چه که الان در اختیار داریم خواهد بود.

مقاله مرتبط  هوش مصنوعی OpenAI Sora چیست و چگونه از آن برای ساخت ویدیو استفاده کنیم؟

چه کسی جمینای را ساخته است؟

جمینای توسط گوگل و آلفابت، شرکت مادر گوگل ساخته شده و به عنوان پیشرفته‌ترین مدل هوش مصنوعی این شرکت تا به امروز محسوب می‌شود. شرکت گوگل دیپ‌مایند نیز سهم قابل توجهی در توسعه Gemini داشته است.

آیا Gemini نسخه‌های مختلفی دارد؟

گوگل جمینای را به عنوان یک مدل انعطاف‌پذیر توصیف می‌کند که می‌تواند روی همه چیز از مراکز داده گوگل گرفته تا دستگاه‌های تلفن همراه اجرا شود. برای دستیابی به این مقیاس پذیری، جمینای در سه اندازه عرضه می شود: جمینای نانو، جمینای پرو و جمینای اولترا.

  • جمینای نانو: اندازه مدل جمینای نانو برای اجرا بر روی دستگاه‌های کوچک مثل گوشی‌های هوشمند، به‌ویژه Google Pixel 8 طراحی شده. این مدل برای انجام کارهایی که نیاز به پردازش سرورهای خارجی ندارند، طراحی شده. از جمله این کارها می‌توان به ریپلای خودکار یا خلاصه کردن متن اشاره کرد.
  • جمینای پرو: جمینای پرو که در دیتاسنترهای گوگل اجرا می‌شود، برای تامین آخرین نسخه چت ربات هوش مصنوعی این شرکت یعنی Bard، طراحی شده است. این هوش مصنوعی قادر به ارائه پاسخ سریع و درک سوالات پیچیده است.
  • جمینای اولترا: اگرچه هنوز برای استفاده گسترده در دسترس نیست، گوگل جمینای اولترا را به عنوان تواناترین مدل خود توصیف می‌کند که از «نتایج پیشرفته فعلی در ۳۰ معیار از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیقات مدل زبان بزرگ (LLM) فراتر رفته است» این مدل برای کارهای بسیار پیچیده طراحی شده و قرار است پس از اتمام مرحله آزمایشی فعلی، منتشر شود.

چگونه می توانید به گوگل جمینای دسترسی پیدا کنید؟

جمینای اکنون در محصولات گوگل در مدل‌های نانو و پرو، مانند موبایل Pixel 8 و چت ربات بارد، در دسترس است. گوگل قصد دارد Gemini را به مرور زمان در جستجو، تبلیغات، کروم و سایر سرویس‌های خود نیز وارد کند.

مقاله مرتبط  نسخه جدید چت جی‌پی‌تی (Chat GPT-4) چه ویژگی‌هایی دارد؟

توسعه‌دهندگان و مشتریان سازمانی از ۱۳ دسامبر می توانند از طریق API جمینای در استودیوی هوش مصنوعی گوگل و هوش مصنوعی Google Cloud Vertex به Gemini Pro دسترسی داشته باشند. توسعه‌دهندگان اندروید از طریق AICore به Gemini Nano دسترسی خواهند داشت، که به صورت پیش‌نمایش اولیه در دسترس خواهد بود.

جمینای چه تفاوتی با سایر مدل های هوش مصنوعی مانند GPT-4 دارد؟

به نظر می‌رسد که مدل جدید گوگل جمینای یکی از بزرگترین و پیشرفته‌ترین مدل‌های هوش مصنوعی تا به امروز باشد، اگرچه عرضه مدل Ultra مشخص خواهد کرد که جایگاه حقیقی این هوش مصنوعی چیست. در مقایسه با سایر مدل‌های محبوبی که در حال حاضر ربات‌های چت هوش مصنوعی را تقویت می‌کنند، جمینای به دلیل ویژگی چندوجهی بومی خود متمایز است، در حالی که مدل‌های دیگر، مانند GPT-4، برای چندوجهی بودن به پلاگین‌ها و ادغام‌ها وابسته هستند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

عضویت در خبرنامه

ما را دنبال کنید

از ما بپرسید!

اگر در مورد خدمات محتوایی آژانس نیم‌فاصله سوالی دارید می‌توانید با پر کردن فرم زیر از مشاوره رایگان بهره‌مند شوید.

بایگانی‌ها