مذاكرات اسلام آباد

۰ نفر
۳۰ اردیبهشت ۱۴۰۵ - ۰۹:۱۵
این مقاله جعلی است؟

دانشمندان هشدار می‌دهند که استنادهای جعلی تولیدشده توسط هوش مصنوعی، مقاله‌های پژوهشی را در سراسر نشریات پر کرده‌اند.

به گزارش خبرآنلاین، استنادهای ذکرشده در انتهای یک مقاله پژوهشی باید نشان‌دهنده پایه محکمی از دانش موجود درباره یک محتوای خاص باشند و مجموعه‌ای از منابع بررسی‌شده را نشان دهند که طی سال‌ها پژوهش و مطالعه بررسی شده‌اند. با وجود این، با افزایش استفاده از هوش مصنوعی و مدل‌های زبانی بزرگ در نوشتن مقاله‌های پژوهشی، احتمال فزاینده‌ای وجود دارد که استنادهای ذکرشده حتی وجود نداشته باشند و پژوهش، منبع یا حتی پژوهشگران آن کاملاً جعلی باشند.

به نقل از ایسنا، پژوهشگران در یک پژوهش جدید، میلیون‌ها مقاله را بررسی کردند و دریافتند که حدود ۱۴۶,۹۰۰ استناد جعلی در مقاله‌های پژوهشی موجود در چهار مخزن علمی اصلی شامل arXiv، bioRxiv، SSRN و PubMed Central وجود دارد. این اعداد فقط مربوط به سال ۲۰۲۵ هستند.

این استنادهای جعلی به تعداد انگشت‌شماری از افراد فاسد محدود نبودند، بلکه در بسیاری از مقاله‌ها ظاهر شدند که هر کدام حاوی تعداد کمی ارجاع جعلی بودند و به الگوی گسترده‌تری از پژوهشگرانی اشاره داشتند که از هوش مصنوعی کمک می‌گیرند، اما در بررسی درستی خروجی خود کوتاهی می‌کنند.

پژوهش‌های علمی با تکیه بر اکتشافات پیشین پیشرفت می‌کنند و هر یافته جدید به آنچه پیشتر ثابت شده است، بستگی دارد. در این فضا، رشد سریع استفاده از هوش مصنوعی و توهمات همراه آن هیچ نشانه‌ای را از کند شدن نشان نمی‌دهد و این امر، نگرانی‌های جدی را ایجاد می‌کند.

هوش توهم‌زا

مدل‌های هوش مصنوعی مولد که بر اساس مدل‌های زبانی بزرگ ساخته شده‌اند، در تولید اطلاعاتی که قابل قبول و واقع‌بینانه به نظر می‌آیند اما کاملاً ساختگی یا نادرست هستند، بسیار خوب عمل می‌کنند. این مدل‌ها براساس مجموعه بزرگی از داده‌ها آموزش داده می‌شوند تا الگوها را یاد بگیرند و سپس از آنها برای پیش‌بینی واژه بعدی و تولید محتوای جدید استفاده کنند. در نتیجه، آنها گاهی اوقات می‌توانند خروجی را بر اساس پیش‌بینی الگو تولید کنند، نه بر اساس حقایق واقعی.

محتوای توهم‌زا به پژوهش‌های محدود نیست، زیرا در گزارش‌های دولتی، پرونده‌های حقوقی و حتی مقاله‌های خبری از نشریات رسانه‌ای مشهور نیز ظاهر می‌شود.

دانشمندان پیش از بروز این توهمات، هوش مصنوعی را مورد بررسی قرار داده‌اند، اما بیشتر پژوهش‌ها یا در شرایط آزمایشگاهی انجام شده‌اند یا نمونه‌های کوچک و حوزه‌های محدودی داشته‌اند. مقیاس و تأثیر واقعی چنین اشتباهاتی به ویژه در متون علمی هنوز مشخص نیست.

پژوهشگران در این پروژه، بررسی گسترده‌ای را روی ۱۱۱ میلیون مرجع استخراج‌شده از ۲.۵ میلیون مقاله علمی انجام دادند. آنها به کمک ترکیبی از بررسی‌های خودکار و دستی، به دنبال عناوین استنادی گشتند که نمی‌توانستند به هیچ نشریه واقعی مرتبط باشند.

بیش از ۹۵ درصد منابع با موفقیت تطبیق داده شدند. پژوهشگران برای ورودی‌های باقی‌مانده، خطاهای تایپی را با استفاده از هوش مصنوعی اصلاح کردند تا زمانی که یک تطابق ظاهر شد و برای چند عنوان مبهم باقی‌مانده، به Google Scholar مراجعه کردند تا مطمئن شوند هیچ نشریه مبهمی از قلم نیفتاده است.

پژوهشگران برای مشخص کردن نقش هوش مصنوعی، نرخ‌های ارجاع بی‌نظیر پیش از سال ۲۰۲۳ یعنی پیش از رواج «چت‌جی‌پی‌تی»(ChatGPT)، «جمینای»(Gemini) و سایر مدل‌های زبانی بزرگ را بررسی کردند که به آنها مبنایی برای اندازه‌گیری میزان نسبت مشکل به هوش مصنوعی در برابر خطای انسانی داد.

این بررسی، افزایش شدید استنادهای جعلی و ناموجود را در مقالات علمی جدی به‌ویژه از اواسط سال ۲۰۲۴ به بعد نشان داد. همچنین، این بررسی نشان داد که دانشمندان تازه‌کار و گروه‌های پژوهشی کوچک، بیشترین احتمال را برای استفاده از استنادهای جعلی دارند و در برخی موارد، همین دانشمندان از زمان ظهور هوش مصنوعی شاهد افزایش تقریباً سه برابری بهره‌وری خود بوده‌اند. الگوی جالب دیگری نیز پدیدار شد که نشان می‌داد ارجاعات جعلی به طور نامتناسبی به دانشمندان برجسته و دانشمندان مرد اعتبار می‌بخشند. این نشان می‌دهد که خطاهای ایجادشده توسط مدل‌های زبانی بزرگ ممکن است نابرابری‌های موجود در شناخت علمی را تقویت کنند.

داده‌های این بررسی، شکاف‌های موجود در حفاظ‌های اعمال‌شده مانند بررسی پیش‌چاپ و ویراستاران مجله را آشکار کردند که تنها می‌توانستند بخش کوچکی از این خطاها را شناسایی کنند. به عنوان مثال، اگرچه بررسی arXiv توانست برخی از مشکلات را شناسایی کند، اما تخمین زده می‌شود که ۷۸.۸ درصد از استنادهای ناموجود همچنان از پلتفرم عبور می‌کنند و در آن ظاهر می‌شوند.

پژوهشگران هشدار می‌دهند که توهمات هوش مصنوعی به طور پیوسته در حال نفوذ به تولید دانش در مقیاس وسیع هستند و هم قابلیت اطمینان و هم عدالت آن را تهدید می‌کنند. بدون مداخله در این روند، تأثیر آن می‌تواند از آینده اکتشافات علمی به سیاست‌گذاری و درک عمومی سرایت کند.

۵۸۵۸

کد مطلب 2221574

برچسب‌ها

خدمات گردشگری

نظر شما

شما در حال پاسخ به نظر «» هستید.
8 + 0 =

آخرین اخبار