نگار علی- Gemini ۲.۵ Deep Think اولین مدل چندعاملی عمومی گوگل محسوب میشود که قادر است چند مسیر فکری را بهصورت همزمان بررسی کرده و از میان نتایج، بهترین پاسخ را انتخاب کند. گوگل میگوید این مدل در مقایسه با نسخه معرفیشده در Google I/O ۲۰۲۵، بهبودهای چشمگیری داشته و از تکنیکهای جدید یادگیری تقویتی برای بهینهسازی مسیرهای استدلال بهره میبرد.
این مدل نهتنها در رقابتهای ریاضی، بلکه در بنچمارکهای متنوعی نیز عملکرد درخشانی داشته است. بهگفتهی گوگل، Gemini ۲.۵ Deep Think موفق شده در آزمون دشوار Humanity’s Last Exam (HLE) که توانایی مدلها را در پاسخگویی به هزاران سؤال علوم پایه، ریاضی و علوم انسانی میسنجد، امتیاز ۳۴.۸٪ کسب کند؛ عددی بالاتر از Grok ۴ متعلق به xAI (با ۲۵.۴٪) و مدل o۳ اوپناِیآی (با ۲۰.۳٪).
در بخش کدنویسی نیز، این مدل در بنچمارک LiveCodeBench ۶ امتیاز چشمگیر ۸۷.۶٪ را به دست آورده که از رقبا بهمراتب بالاتر است. همچنین، توانایی تولید پاسخهای طولانیتر، دقیقتر و حتی زیباتر در حوزههایی مثل طراحی وب، از دیگر ویژگیهای این مدل عنوان شده است.
گوگل همچنین اعلام کرد نسخهای از این مدل که توانست مدال طلای المپیاد جهانی ریاضی (IMO) را کسب کند، بهصورت محدود در اختیار پژوهشگران و ریاضیدانان قرار خواهد گرفت. این نسخه، برخلاف مدلهای رایج که در چند ثانیه پاسخ تولید میکنند، ممکن است ساعتها برای حل یک مسئله زمان صرف کند؛ ویژگیای که میتواند مسیر تازهای برای استفاده از هوش مصنوعی در تحقیقات علمی بگشاید.
با این حال، هزینه بالای اجرای مدلهای چندعاملی باعث شده شرکتهایی مانند xAI و اکنون گوگل، استفاده از آنها را به اشتراکهای ویژه و گرانقیمت محدود کنند. گوگل در ادامه اعلام کرده که طی هفتههای آینده، API این مدل را به گروهی از توسعهدهندگان و شرکتها برای تست و بازخورد ارائه خواهد کرد.
مدلهای چندعاملی اکنون در کانون توجه بازیگران اصلی دنیای هوش مصنوعی قرار دارند. بهجز گوگل، شرکت xAI نیز مدل Grok ۴ Heavy را با چنین معماری معرفی کرده و Anthropic نیز در محصول تحقیقاتی خود از این ساختار بهره گرفته است. اوپناِیآی هم تأیید کرده که در نسخهای آزمایشی برای شرکت در IMO، از یک سیستم چندعاملی استفاده کرده است.
تحلیلگران معتقدند تمرکز شرکتها بر مدلهای چندعاملی، نقطهی عطفی در پیشرفت هوش مصنوعی عمومی (AGI) خواهد بود؛ هرچند چالشهای محاسباتی، محدودیتهای اقتصادی و حفظ کیفیت همچنان موانعی جدی در مسیر توسعه این فناوری هستند.
منبع: techcrunch
۲۲۷۲۲۷