به گزارش خبرگزاری خبرآنلاین، این مدل که در حال حاضر تنها برای تعداد محدودی از پژوهشگران و سازندگان محتوا بهصورت پیشنمایش تحقیقاتی در دسترس قرار گرفته، میتواند محیطهایی مانند «جنگلی در میانه طوفان» را به صحنهای واقعی با امکان حرکت، تغییر شرایط محیطی و حتی افزودن شخصیتها تبدیل کند.
Genie ۳ چیست و چه کاری انجام میدهد؟
Genie ۳ بخشی از خانوادهی مدلهای هوش مصنوعی موسوم به World Models یا «مدلهای جهانساز» است. این مدلها بهجای تولید محتوای ایستا، محیطهای پویا را شبیهسازی میکنند و برای آموزش رباتها، شبیهسازیهای آموزشی، بازیسازی و حتی واقعیت مجازی کاربرد دارند.
قابلیتهای کلیدی Genie ۳ شامل:
-
ساخت دنیای قابل بازی با وضوح ۷۲۰p و نرخ ۲۴ فریم بر ثانیه
-
حافظه دیداری کوتاهمدت: اشیایی که رها میکنید، در بازگشت همچنان سر جای خود باقی میمانند (برای حدود ۱ دقیقه)
-
تغییر زنده محیط با دستور متنی: میتوانید با نوشتن دستوراتی مثل «باران ببارد» یا «یک کاراکتر اضافه شود» محیط را تغییر دهید
چه تفاوتی با نسخههای قبلی دارد؟
در نسخههای قبلی مانند Genie ۲، تعامل کاربران بسیار محدود بود و فقط برای چند ثانیه امکانپذیر بود. اما Genie ۳ میتواند تعامل پیوسته تا چند دقیقه را پشتیبانی کند. همچنین، برخلاف روشهایی مثل NeRF یا Gaussian Splatting که به مدلسازی هندسی نیاز دارند، این مدل بدون داشتن صحنه سهبعدی از پیش تعیینشده، فریمها را بهصورت زنده تولید میکند.
محدودیتها و چالشها
اگرچه Genie ۳ پیشرفتی چشمگیر محسوب میشود، اما محدودیتهایی نیز دارد:
-
شبیهسازی جغرافیایی واقعی ندارد
-
متنهای خوانا تنها در صورت درخواست کاربر ظاهر میشوند
-
تعاملات چندعاملی (بین چند موجود یا شخصیت) هنوز در دست توسعه است
-
مدت تعامل هنوز به چند دقیقه محدود است
گوگل اعلام کرده که به دلیل چالشهای ایمنی و مسئولیتپذیری، این فناوری بهتدریج و مرحلهای عرضه خواهد شد.
آیندهای با دنیای مجازی زنده
مدلهایی مانند Genie ۳، گامهایی مهم در مسیر ساخت دنیایهای مجازی تعاملی و یادگیری هوش مصنوعی در محیطهای شبیهسازیشده هستند؛ بهویژه برای کاربردهایی نظیر آموزش رباتها، بازیهای ویدیویی با محتوای پویا، یا حتی پلتفرمهای تعاملی آموزشی.
اگر دسترسی عمومی به این مدل فراهم شود، میتواند تحول بزرگی در صنعت سرگرمی، آموزش و توسعه رباتها در جهان ایجاد کند.
۲۲۷۲۲۷
نظر شما