مذاكرات ایران و آمریکا

۱ نفر

۱۵ مرداد ۱۴۰۴ - ۱۵:۰۰

گوگل از Genie ۳ رونمایی کرد: ساخت دنیای مجازی زنده تنها با یک جمله

شرکت Google DeepMind از نسل سوم مدل هوش مصنوعی «جینی» با نام Genie ۳ رونمایی کرد؛ سامانه‌ای پیشرفته که می‌تواند تنها با دریافت یک جمله ساده، یک دنیای سه‌بعدی قابل بازی و تعاملی بسازد، آن هم به‌صورت زنده و در لحظه!

به گزارش خبرگزاری خبرآنلاین، این مدل که در حال حاضر تنها برای تعداد محدودی از پژوهشگران و سازندگان محتوا به‌صورت پیش‌نمایش تحقیقاتی در دسترس قرار گرفته، می‌تواند محیط‌هایی مانند «جنگلی در میانه طوفان» را به صحنه‌ای واقعی با امکان حرکت، تغییر شرایط محیطی و حتی افزودن شخصیت‌ها تبدیل کند.

Genie ۳ چیست و چه کاری انجام می‌دهد؟

Genie ۳ بخشی از خانواده‌ی مدل‌های هوش مصنوعی موسوم به World Models یا «مدل‌های جهان‌ساز» است. این مدل‌ها به‌جای تولید محتوای ایستا، محیط‌های پویا را شبیه‌سازی می‌کنند و برای آموزش ربات‌ها، شبیه‌سازی‌های آموزشی، بازی‌سازی و حتی واقعیت مجازی کاربرد دارند.

قابلیت‌های کلیدی Genie ۳ شامل:

ساخت دنیای قابل بازی با وضوح ۷۲۰p و نرخ ۲۴ فریم بر ثانیه
حافظه دیداری کوتاه‌مدت: اشیایی که رها می‌کنید، در بازگشت همچنان سر جای خود باقی می‌مانند (برای حدود ۱ دقیقه)
تغییر زنده محیط با دستور متنی: می‌توانید با نوشتن دستوراتی مثل «باران ببارد» یا «یک کاراکتر اضافه شود» محیط را تغییر دهید

چه تفاوتی با نسخه‌های قبلی دارد؟

در نسخه‌های قبلی مانند Genie ۲، تعامل کاربران بسیار محدود بود و فقط برای چند ثانیه امکان‌پذیر بود. اما Genie ۳ می‌تواند تعامل پیوسته تا چند دقیقه را پشتیبانی کند. همچنین، برخلاف روش‌هایی مثل NeRF یا Gaussian Splatting که به مدل‌سازی هندسی نیاز دارند، این مدل بدون داشتن صحنه سه‌بعدی از پیش تعیین‌شده، فریم‌ها را به‌صورت زنده تولید می‌کند.

محدودیت‌ها و چالش‌ها

اگرچه Genie ۳ پیشرفتی چشمگیر محسوب می‌شود، اما محدودیت‌هایی نیز دارد:

شبیه‌سازی جغرافیایی واقعی ندارد
متن‌های خوانا تنها در صورت درخواست کاربر ظاهر می‌شوند
تعاملات چندعاملی (بین چند موجود یا شخصیت) هنوز در دست توسعه است
مدت تعامل هنوز به چند دقیقه محدود است

گوگل اعلام کرده که به دلیل چالش‌های ایمنی و مسئولیت‌پذیری، این فناوری به‌تدریج و مرحله‌ای عرضه خواهد شد.

آینده‌ای با دنیای مجازی زنده

مدل‌هایی مانند Genie ۳، گام‌هایی مهم در مسیر ساخت دنیای‌های مجازی تعاملی و یادگیری هوش مصنوعی در محیط‌های شبیه‌سازی‌شده هستند؛ به‌ویژه برای کاربردهایی نظیر آموزش ربات‌ها، بازی‌های ویدیویی با محتوای پویا، یا حتی پلتفرم‌های تعاملی آموزشی.

اگر دسترسی عمومی به این مدل فراهم شود، می‌تواند تحول بزرگی در صنعت سرگرمی، آموزش و توسعه ربات‌ها در جهان ایجاد کند.

۲۲۷۲۲۷

کد مطلب 2099063