مدل جدید DeepSeek معرفی شد

معماری جدید دیپ‌سیک «توجه پراکنده» نام دارد و البته برخی کارشناسان می‌گویند نمی‌توان به آن اعتماد کرد.

به گزارش خبرگزاری خبرآنلاین و براساس گزارش دیجیاتو، استارتاپ چینی دیپ‌سیک از یک مدل هوش مصنوعی آزمایشی جدید به نام DeepSeek-V3.2-Exp رونمایی کرده است که با یک معماری جدید به نام «توجه پراکنده» وعده می‌دهد هزینه استفاده از هوش مصنوعی برای تحلیل متون طولانی را تا نصف کاهش دهد. این پیشرفت می‌تواند دسترسی به مدل‌های هوش مصنوعی قدرتمند را برای شرکت‌های کوچک‌تر ممکن کند.

مدل‌های هوش مصنوعی امروزی برای درک یک متن، باید به تمام کلمات و جملات آن «توجه» کنند. این فرایند، به خصوص در متون بسیار طولانی، به قدرت محاسباتی و هزینه سرور بسیار زیادی نیاز دارد. اما رویکرد جدید DeepSeek که «توجه پراکنده» (DSA) نام دارد، این معادله را تغییر می‌دهد.

این سیستم به جای پردازش تمام اطلاعات، به صورت هوشمند و گزیده عمل می‌کند. تصور کنید یک شرکت هواپیمایی می‌خواهد بهترین مسیر را پیدا کند؛ پس به‌جای بررسی تمام مسیرهای ممکن در جهان، فقط گزینه‌های منطقی را فیلتر می‌کند. «توجه پراکنده» نیز دقیقاً همین کار را با داده‌ها انجام می‌دهد. این سیستم ابتدا با یک ماژول هوشمند، مهم‌ترین بخش‌های متن را شناسایی و سپس فقط کلمات (یا توکن‌های) مهم را برای تحلیل نهایی انتخاب می‌کند. این فرایند بار محاسباتی را به شدت کاهش می‌دهد و به گفته دیپ‌سیک، می‌تواند هزینه استفاده از API را در سناریوهای دارای متن طولانی تا ۵۰ درصد کاهش دهد.

معماری جدید دیپ‌سیک برای کاهش هزینه‌ها

به گزارش CNBC، این پیشرفت یک خبر عالی برای کل اکوسیستم فناوری است. کاهش چشمگیر هزینه‌ها به این معناست که توسعه‌دهندگان، محققان و شرکت‌های کوچک‌تر که توانایی پرداخت هزینه‌های زیاد سرور را ندارند، اکنون می‌توانند از مدل‌های قدرتمند هوش مصنوعی برای ساخت اپلیکیشن‌های خود استفاده کنند. این اتفاق می‌تواند به موج جدیدی از خلاقیت و رقابت در بازار منجر شود.

با وجود تمام مزایا، این رویکرد یک نگرانی اساسی نیز دارد: اطمینان‌پذیری. سؤال اصلی این است که هوش مصنوعی چگونه تصمیم می‌گیرد که کدام داده‌ها مهم و کدام غیرمهم هستند؟

«اکاترینا آلماسک» (Ekaterina Almasque)، یکی از سرمایه‌گذاران برجسته در حوزه هوش مصنوعی، می‌گوید: «واقعیت این است که این مدل‌ها بسیاری از ظرافت‌ها را از دست می‌دهند. سؤال واقعی این است که آیا آنها مکانیسم درستی برای حذف داده‌های غیرمهم دارند؟»

این موضوع به‌ویژه از نظر ایمنی و فراگیری هوش مصنوعی می‌تواند مشکل‌ساز باشد. اگر یک مدل به‌طور سیستماتیک داده‌های مربوط به یک گروه خاص یا یک دیدگاه خاص را «غیرمهم» تشخیص دهد، خروجی آن می‌تواند به شدت مغرضانه، غیرقابل اعتماد و حتی خطرناک باشد.

۲۲۷۲۲۷

کد مطلب 2122542