به گزارش خبرآنلاین، استنادهای ذکرشده در انتهای یک مقاله پژوهشی باید نشاندهنده پایه محکمی از دانش موجود درباره یک محتوای خاص باشند و مجموعهای از منابع بررسیشده را نشان دهند که طی سالها پژوهش و مطالعه بررسی شدهاند. با وجود این، با افزایش استفاده از هوش مصنوعی و مدلهای زبانی بزرگ در نوشتن مقالههای پژوهشی، احتمال فزایندهای وجود دارد که استنادهای ذکرشده حتی وجود نداشته باشند و پژوهش، منبع یا حتی پژوهشگران آن کاملاً جعلی باشند.
به نقل از ایسنا، پژوهشگران در یک پژوهش جدید، میلیونها مقاله را بررسی کردند و دریافتند که حدود ۱۴۶,۹۰۰ استناد جعلی در مقالههای پژوهشی موجود در چهار مخزن علمی اصلی شامل arXiv، bioRxiv، SSRN و PubMed Central وجود دارد. این اعداد فقط مربوط به سال ۲۰۲۵ هستند.
این استنادهای جعلی به تعداد انگشتشماری از افراد فاسد محدود نبودند، بلکه در بسیاری از مقالهها ظاهر شدند که هر کدام حاوی تعداد کمی ارجاع جعلی بودند و به الگوی گستردهتری از پژوهشگرانی اشاره داشتند که از هوش مصنوعی کمک میگیرند، اما در بررسی درستی خروجی خود کوتاهی میکنند.
پژوهشهای علمی با تکیه بر اکتشافات پیشین پیشرفت میکنند و هر یافته جدید به آنچه پیشتر ثابت شده است، بستگی دارد. در این فضا، رشد سریع استفاده از هوش مصنوعی و توهمات همراه آن هیچ نشانهای را از کند شدن نشان نمیدهد و این امر، نگرانیهای جدی را ایجاد میکند.
هوش توهمزا
مدلهای هوش مصنوعی مولد که بر اساس مدلهای زبانی بزرگ ساخته شدهاند، در تولید اطلاعاتی که قابل قبول و واقعبینانه به نظر میآیند اما کاملاً ساختگی یا نادرست هستند، بسیار خوب عمل میکنند. این مدلها براساس مجموعه بزرگی از دادهها آموزش داده میشوند تا الگوها را یاد بگیرند و سپس از آنها برای پیشبینی واژه بعدی و تولید محتوای جدید استفاده کنند. در نتیجه، آنها گاهی اوقات میتوانند خروجی را بر اساس پیشبینی الگو تولید کنند، نه بر اساس حقایق واقعی.
محتوای توهمزا به پژوهشهای محدود نیست، زیرا در گزارشهای دولتی، پروندههای حقوقی و حتی مقالههای خبری از نشریات رسانهای مشهور نیز ظاهر میشود.
دانشمندان پیش از بروز این توهمات، هوش مصنوعی را مورد بررسی قرار دادهاند، اما بیشتر پژوهشها یا در شرایط آزمایشگاهی انجام شدهاند یا نمونههای کوچک و حوزههای محدودی داشتهاند. مقیاس و تأثیر واقعی چنین اشتباهاتی به ویژه در متون علمی هنوز مشخص نیست.
پژوهشگران در این پروژه، بررسی گستردهای را روی ۱۱۱ میلیون مرجع استخراجشده از ۲.۵ میلیون مقاله علمی انجام دادند. آنها به کمک ترکیبی از بررسیهای خودکار و دستی، به دنبال عناوین استنادی گشتند که نمیتوانستند به هیچ نشریه واقعی مرتبط باشند.
بیش از ۹۵ درصد منابع با موفقیت تطبیق داده شدند. پژوهشگران برای ورودیهای باقیمانده، خطاهای تایپی را با استفاده از هوش مصنوعی اصلاح کردند تا زمانی که یک تطابق ظاهر شد و برای چند عنوان مبهم باقیمانده، به Google Scholar مراجعه کردند تا مطمئن شوند هیچ نشریه مبهمی از قلم نیفتاده است.
پژوهشگران برای مشخص کردن نقش هوش مصنوعی، نرخهای ارجاع بینظیر پیش از سال ۲۰۲۳ یعنی پیش از رواج «چتجیپیتی»(ChatGPT)، «جمینای»(Gemini) و سایر مدلهای زبانی بزرگ را بررسی کردند که به آنها مبنایی برای اندازهگیری میزان نسبت مشکل به هوش مصنوعی در برابر خطای انسانی داد.
این بررسی، افزایش شدید استنادهای جعلی و ناموجود را در مقالات علمی جدی بهویژه از اواسط سال ۲۰۲۴ به بعد نشان داد. همچنین، این بررسی نشان داد که دانشمندان تازهکار و گروههای پژوهشی کوچک، بیشترین احتمال را برای استفاده از استنادهای جعلی دارند و در برخی موارد، همین دانشمندان از زمان ظهور هوش مصنوعی شاهد افزایش تقریباً سه برابری بهرهوری خود بودهاند. الگوی جالب دیگری نیز پدیدار شد که نشان میداد ارجاعات جعلی به طور نامتناسبی به دانشمندان برجسته و دانشمندان مرد اعتبار میبخشند. این نشان میدهد که خطاهای ایجادشده توسط مدلهای زبانی بزرگ ممکن است نابرابریهای موجود در شناخت علمی را تقویت کنند.
دادههای این بررسی، شکافهای موجود در حفاظهای اعمالشده مانند بررسی پیشچاپ و ویراستاران مجله را آشکار کردند که تنها میتوانستند بخش کوچکی از این خطاها را شناسایی کنند. به عنوان مثال، اگرچه بررسی arXiv توانست برخی از مشکلات را شناسایی کند، اما تخمین زده میشود که ۷۸.۸ درصد از استنادهای ناموجود همچنان از پلتفرم عبور میکنند و در آن ظاهر میشوند.
پژوهشگران هشدار میدهند که توهمات هوش مصنوعی به طور پیوسته در حال نفوذ به تولید دانش در مقیاس وسیع هستند و هم قابلیت اطمینان و هم عدالت آن را تهدید میکنند. بدون مداخله در این روند، تأثیر آن میتواند از آینده اکتشافات علمی به سیاستگذاری و درک عمومی سرایت کند.
۵۸۵۸




نظر شما