نحوه توسعه مدل‌های هوش مصنوعی میلیارد دلاری زیر سوال رفت

برخی معماری‌های الهام‌گرفته از ساختار مغز می‌توانند حتی پیش از آموزش با هرگونه داده، الگوهای فعالیتی تولید کنند که به‌طور چشمگیری با واکنش‌های مغز انسان و نخستی‌ها هم‌خوان است. این یافته نقش «طراحی معماری» را در یادگیری هوش مصنوعی پررنگ‌تر کرده و فرضیه دیرینهٔ تکیه انحصاری مدل‌ها بر داده‌های عظیم را زیر سؤال می‌برد.

تینا مزدکی_پژوهش اخیر دانشمندان نشان می‌دهد طراحی معماری مدل ممکن است بسیار مهم‌تر از فرایندهای سنگین یادگیری عمیقی باشد که معمولاً ماه‌ها زمان می‌برند، انرژی عظیمی مصرف می‌کنند و هزینه‌هایی در حد میلیاردها دلار دارند.

میک بانر، نویسنده اصلی پژوهش و استادیار علوم شناختی دانشگاه جانز هاپکینز، می‌گوید: «مسیر فعلی هوش مصنوعی این است که حجم عظیمی از داده را به مدل‌ها تزریق کنیم و منابع محاسباتی در مقیاس یک شهر کوچک بسازیم. چنین کاری صدها میلیارد دلار هزینه دارد. در حالی‌که انسان‌ها برای یادگیری بینایی به داده بسیار کمی نیاز دارند. احتمالاً تکامل این معماری را بی‌دلیل انتخاب نکرده است. یافته‌های ما نشان می‌دهد معماری‌هایی که شبیه‌تر به مغزند، نقطه شروع بسیار بهتری برای سیستم‌های هوش مصنوعی فراهم می‌کنند.»

بررسی معماری‌های هوش مصنوعی در برابر فعالیت مغز

در این پژوهش، سه دسته اصلی از طراحی شبکه‌ها که معمولاً مبنای ساخت مدل‌های مدرن هستند، بررسی شد:

  • معماری‌های ترنسفورمر
  • شبکه‌های کاملاً متصل (Fully Connected)
  • شبکه‌های عصبی کانولوشنی (CNN)

محققان با ایجاد تغییرات متعدد در این سه معماری، ده‌ها شبکه عصبی مصنوعی جدید ساختند. سپس به این شبکه‌هایی هیچگونه آموزشی ندیده بودند تصاویر مختلف، شامل اشیا، انسان‌ها و حیوانات نشان دادند و پاسخ آن‌ها را با فعالیت مغزی انسان و نخستی‌سانان در مواجهه با همان تصاویر مقایسه کردند.

نتایج نشان داد که افزایش تعداد نورون‌ها در ترنسفورمرها و شبکه‌های تمام‌متصل تأثیر چندانی ایجاد نمی‌کند. اما در مورد شبکه‌های کانولوشنی، تغییرات معماری باعث شد الگوهای فعالیت به شکل قابل‌توجهی شبیه‌تر به مغز انسان شود.

نحوه توسعه مدل‌های هوش مصنوعی میلیارد دلاری زیر سوال رفت

معماری مهم‌تر از آن چیزی است که تصور می‌شد

طبق یافته‌ها، شبکه‌های کانولوشنی بدون هیچ آموزش قبلی و تنها بر پایه معماری توانستند الگویی شبیه مدل‌های رایج آموزش‌دیده با میلیون‌ها یا میلیاردها تصویر تولید کنند. این نتیجه به‌طور جدی این فرض را زیر سؤال می‌برد که یادگیری از داده عظیم، تنها راه رسیدن به هوش مصنوعی مشابه مغز است.

بانر می‌گوید: «اگر آموزش روی داده‌های گسترده واقعاً عامل اصلی باشد، نباید هیچ راهی وجود داشته باشد که تنها با تغییر معماری به سیستم‌هایی نزدیک به مغز برسیم. این یعنی با شروع از یک معماری درست و شاید اضافه‌کردن بینش‌های بیشتر از زیست‌شناسی می‌توانیم سرعت یادگیری در سیستم‌های هوش مصنوعی را به‌طور چشمگیری افزایش دهیم.»

گام بعدی تیم تحقیقاتی، توسعه الگوریتم‌های یادگیری ساده و الهام‌گرفته از زیست‌شناسی است که ممکن است منجر به یک چارچوب یادگیری عمیق جدید شود.

منبع: scitechdaily

۲۲۷۳۲۳

کد مطلب 2152893

برچسب‌ها

خدمات گردشگری

نظر شما

شما در حال پاسخ به نظر «» هستید.
5 + 9 =

آخرین اخبار

پربیننده‌ترین