تینا مزدکی_پژوهش اخیر دانشمندان نشان میدهد طراحی معماری مدل ممکن است بسیار مهمتر از فرایندهای سنگین یادگیری عمیقی باشد که معمولاً ماهها زمان میبرند، انرژی عظیمی مصرف میکنند و هزینههایی در حد میلیاردها دلار دارند.
میک بانر، نویسنده اصلی پژوهش و استادیار علوم شناختی دانشگاه جانز هاپکینز، میگوید: «مسیر فعلی هوش مصنوعی این است که حجم عظیمی از داده را به مدلها تزریق کنیم و منابع محاسباتی در مقیاس یک شهر کوچک بسازیم. چنین کاری صدها میلیارد دلار هزینه دارد. در حالیکه انسانها برای یادگیری بینایی به داده بسیار کمی نیاز دارند. احتمالاً تکامل این معماری را بیدلیل انتخاب نکرده است. یافتههای ما نشان میدهد معماریهایی که شبیهتر به مغزند، نقطه شروع بسیار بهتری برای سیستمهای هوش مصنوعی فراهم میکنند.»
بررسی معماریهای هوش مصنوعی در برابر فعالیت مغز
در این پژوهش، سه دسته اصلی از طراحی شبکهها که معمولاً مبنای ساخت مدلهای مدرن هستند، بررسی شد:
- معماریهای ترنسفورمر
- شبکههای کاملاً متصل (Fully Connected)
- شبکههای عصبی کانولوشنی (CNN)
محققان با ایجاد تغییرات متعدد در این سه معماری، دهها شبکه عصبی مصنوعی جدید ساختند. سپس به این شبکههایی هیچگونه آموزشی ندیده بودند تصاویر مختلف، شامل اشیا، انسانها و حیوانات نشان دادند و پاسخ آنها را با فعالیت مغزی انسان و نخستیسانان در مواجهه با همان تصاویر مقایسه کردند.
نتایج نشان داد که افزایش تعداد نورونها در ترنسفورمرها و شبکههای تماممتصل تأثیر چندانی ایجاد نمیکند. اما در مورد شبکههای کانولوشنی، تغییرات معماری باعث شد الگوهای فعالیت به شکل قابلتوجهی شبیهتر به مغز انسان شود.
معماری مهمتر از آن چیزی است که تصور میشد
طبق یافتهها، شبکههای کانولوشنی بدون هیچ آموزش قبلی و تنها بر پایه معماری توانستند الگویی شبیه مدلهای رایج آموزشدیده با میلیونها یا میلیاردها تصویر تولید کنند. این نتیجه بهطور جدی این فرض را زیر سؤال میبرد که یادگیری از داده عظیم، تنها راه رسیدن به هوش مصنوعی مشابه مغز است.
بانر میگوید: «اگر آموزش روی دادههای گسترده واقعاً عامل اصلی باشد، نباید هیچ راهی وجود داشته باشد که تنها با تغییر معماری به سیستمهایی نزدیک به مغز برسیم. این یعنی با شروع از یک معماری درست و شاید اضافهکردن بینشهای بیشتر از زیستشناسی میتوانیم سرعت یادگیری در سیستمهای هوش مصنوعی را بهطور چشمگیری افزایش دهیم.»
گام بعدی تیم تحقیقاتی، توسعه الگوریتمهای یادگیری ساده و الهامگرفته از زیستشناسی است که ممکن است منجر به یک چارچوب یادگیری عمیق جدید شود.
منبع: scitechdaily
۲۲۷۳۲۳