نگار علی- تصویری ساده از یک پرنده، حالا به نمادی تبدیل شده از پیشرفتی که ChatGPT در تولید تصویر تنها طی یک سال تجربه کرده است. گراهام بارلو، نویسنده حوزه فناوری، در گزارشی از تجربه شخصی خود میگوید که چگونه استفاده از یک پرامپت ثابت، «یک پرنده بکش»، در دو بازه زمانی متفاوت، خروجیهایی با کیفیتی کاملاً متضاد به همراه داشته است.
او نخستین تصویر را در سال ۲۰۲۴ و با نسخه رایگان ChatGPT خلق کرد؛ تصویری ساده و کودکانه که بیشتر از اشکال هندسی ابتدایی چون دایره و مثلث ساخته شده بود. اما وقتی در سال ۲۰۲۵ همان درخواست را تکرار کرد، نتیجه حیرتانگیز بود:« یک تصویر دقیق، واقعگرایانه و چشمنواز از یک پرنده، تولیدشده توسط نسخه بهروزرسانیشده ChatGPT با موتور تصویرسازی جدید. مقایسه این دو تصویر، نمایانگر تحولی است که در این مدت کوتاه در تواناییهای هوش مصنوعی رخ داده است.»
از شکلهای ساده تا تصاویر ترند شبکههای اجتماعی
بارلو توضیح میدهد که در زمان اولین تستش، حتی با وجود پیشرفت مدلهایی چون Midjourney، نسخه رایگان ChatGPT در تولید تصویر محدودیتهای زیادی داشت. او میافزاید اگر آن زمان به نسخه Plus با دسترسی به DALL·E 3 دسترسی داشت، شاید میتوانست نتیجهای بسیار بهتر بگیرد. اما تا تابستان ۲۰۲۴، کاربران رایگان تنها روزی دو تصویر میتوانستند تولید کنند و پس از آن سیستم به همان سبک ابتدایی برمیگشت.
تحولات بزرگ از مارس ۲۰۲۵ آغاز شد، زمانی که ChatGPT موتور بومی تصویرسازی خود را معرفی کرد. از آن زمان به بعد، کاربران به خلق تصاویر باکیفیت و شگفتانگیز عادت کردهاند و ترندهای متعددی در شبکههای اجتماعی شکل گرفتهاند، از تصاویر به سبک انیمههای استودیو جیبلی گرفته تا موج ساخت اکشن فیگورهای خیالی با چهره کاربران.
بارلو در پایان با نگاهی آیندهنگرانه مینویسد: «شاید تا سال ۲۰۲۶، وارد دنیای آن تصویر با عینکهای هوش مصنوعی شویم و از زوایای مختلف به آن نگاه کنیم. هرچه که پیش رو باشد، بیصبرانه منتظرم.»
منبع: techradar
۲۲۷۲۲۷
نظر شما