به گزارش خبرآنلاین، در این پروژه تحقیقاتی، پژوهشگران مجموعهای از جوامع مجازی را ایجاد کردند که ساکنان آنها عاملهای هوش مصنوعی بودند. هر جامعه توسط یک مدل زبانی متفاوت هدایت میشد و عاملها باید برای بقا، همکاری، تولید منابع و تعامل با یکدیگر تصمیمگیری میکردند.
هدف پژوهش این بود که مشخص شود مدلهای مختلف در شرایطی که اختیار بیشتری برای تصمیمگیری دارند، چه نوع ساختارهای اجتماعی و اقتصادی ایجاد میکنند. بر اساس نتایج منتشرشده، مدل Claude متعلق به شرکت Anthropic موفق شد باثباتترین و کمخطرترین جامعه را ایجاد کند. در این محیط، همکاری میان عاملها بیشتر بود و میزان رفتارهای مخرب یا قانونشکنانه در سطح پایینی قرار داشت.
پژوهشگران میگویند جامعه مبتنی بر Claude در مقایسه با سایر مدلها توانست تعادل بهتری میان رشد، امنیت و همکاری برقرار کند.
در نقطه مقابل جامعهای که توسط مدل Grok هدایت میشد عملکرد بسیار ضعیفتری داشت. گزارش پژوهشگران نشان میدهد عاملهای این جامعه در مدت کوتاهی تعداد زیادی تخلف و جرم مجازی مرتکب شدند. در نهایت نیز ساختار اجتماعی این محیط دوام نیاورد و جامعه مذکور تنها پس از چند روز از هم پاشید. همین موضوع باعث شد نتایج مربوط به Grok بیش از سایر مدلها توجه رسانهها را جلب کند.
مدلهای ChatGPT و Gemini نیز عملکردی میان دو سر طیف داشتند. این سیستمها توانستند جوامعی نسبتاً پایدار ایجاد کنند، اما در برخی شاخصها به اندازه Claude موفق نبودند.
به گفته پژوهشگران، تفاوت در نحوه آموزش، تنظیمات ایمنی و روش تصمیمگیری مدلها احتمالاً نقش مهمی در نتایج مشاهدهشده داشته است.
آیا این نتایج درباره دنیای واقعی هم صدق میکند؟
با وجود جذابیت این آزمایش، کارشناسان تأکید میکنند که چنین شبیهسازیهایی لزوماً رفتار واقعی مدلهای هوش مصنوعی در کاربردهای روزمره را پیشبینی نمیکنند.
محیطهای آزمایشی معمولاً قوانین و محدودیتهای خاص خود را دارند و نتایج آنها بیشتر برای بررسی گرایشهای رفتاری و مقایسه مدلها مفید است، نه برای قضاوت قطعی درباره عملکرد واقعی هر سامانه.
با این حال، این مطالعه بار دیگر نشان میدهد که انتخاب معماری، آموزش و چارچوبهای ایمنی میتواند تأثیر چشمگیری بر رفتار عاملهای هوش مصنوعی داشته باشد. موضوعی که با گسترش سیستمهای خودمختار در سالهای آینده اهمیت بیشتری پیدا خواهد کرد.
۵۸۵۸




نظر شما