منتشر شد

استارتاپ چینی دیپ سیک با انتشار نسخه جدید مدل زبانی خود بار دیگر جایگاه خود را به‌عنوان یکی از رقبای جدی در عرصه جهانی هوش مصنوعی تثبیت کرده است. این نسخه، که به‌تازگی منتشر شده، در حوزه‌هایی مانند استدلال پیچیده، کدنویسی و منطق عملکرد چشمگیری از خود نشان داده؛ حوزه‌هایی که حتی مدل‌های پیشرفته معروف گاهی با آن‌ها چالش دارند.

تینا مزدکی - مدل تازه‌ی شرکت دیپ سیک چین با نام DeepSeek-R1-0528 توانسته در آزمون AIME 2025، که یکی از سنجه‌های دقیق برای ارزیابی توانایی‌های استدلالی مدل‌های زبانی است، به دقت چشمگیر ۸۷.۵ درصد برسد؛ عددی که در مقایسه با نسخه‌ی قبلی (با دقت ۷۰ درصد)، جهشی بزرگ به حساب می‌آید. در بنچ‌مارک تخصصی LiveCodeBench نیز که عملکرد مدل در زمینه‌ی برنامه‌نویسی را می‌سنجد، دقت DeepSeek-R1-0528 از ۶۳.۵ به ۷۳.۳ درصد افزایش یافته است. حتی در آزمون مشهور و دشوار «آخرین آزمون بشریت» (Humanity’s Last Exam)، امتیاز مدل از ۸.۵ به ۱۷.۷ درصد رسیده؛ یعنی بیش از دو برابر بهبود نسبت به نسخه‌ی قبلی.

این آمارها نشان می‌دهند که DeepSeek-R1-0528 در برخی حوزه‌ها به سطحی رسیده که می‌تواند با مدل‌های مطرحی مانند GPT-4o از OpenAI یا Gemini از Google رقابت کند و حتی در بعضی معیارها، عملکردی بهتر از آن‌ها داشته باشد.

متن باز و در دسترس!

در شرایطی که OpenAI و Google بیشتر مدل‌های قدرتمند خود را تنها از طریق APIهای پولی در اختیار کاربران قرار می‌دهند، دیپ سیک راه متفاوتی را در پیش گرفته است. مدل R1-0528 به‌صورت متن‌باز و تحت مجوز MIT منتشر شده؛ تصمیمی که به توسعه‌دهندگان اجازه می‌دهد آن را به‌دلخواه تغییر دهند، شخصی‌سازی کنند و در محصولات خود به‌کار ببرند.

از دیگر ویژگی‌های مهم این نسخه، پشتیبانی از خروجی‌های JSON و فراخوانی توابع (Function Calling) است. این قابلیت‌ها مسیر توسعه‌ی اپلیکیشن‌ها و ابزارهایی که به‌صورت مستقیم با مدل کار می‌کنند را بسیار ساده‌تر می‌کند. رویکرد باز و در دسترس دیپ سیک، این مدل را به گزینه‌ای ایده‌آل برای استارتاپ‌ها، پژوهشگران و شرکت‌هایی تبدیل کرده که به‌دنبال جایگزینی آزاد برای پلتفرم‌های بسته‌ی غربی هستند.

آموزش هوشمندانه، نه پرهزینه

یکی از نکاتی که در گزارش دیپ سیک جلب توجه می‌کند، تأکید این شرکت بر بهره‌وری در فرآیند آموزش مدل است. به‌گفته‌ی دیپ سیک، نسخه‌ی اولیه‌ی R1-0528 تنها در ۵۵ روز و با بهره‌گیری از حدود ۲۰۰۰ واحد پردازش گرافیکی (GPU) آموزش دیده و کل هزینه‌ی این فرایند حدود ۵.۵۸ میلیون دلار بوده است. عددی که در مقایسه با هزینه‌های سنگین آموزش مدل‌های مشابه در ایالات متحده، بسیار اقتصادی‌تر است. در دوره‌ای که انتقادها نسبت به هزینه‌های مالی و زیست‌محیطی آموزش مدل‌های زبانی شدت گرفته، چنین کارایی‌ای می‌تواند برگ برنده‌ای برای دیپ سیک باشد.

تهدیدی جدی برای ChatGPT و گوگل / آپدیت جدید «دیپ سیک» منتشر شد

آینده هوش مصنوعی چه خواهد شد

انتشار DeepSeek-R1-0528 می‌تواند نشانه‌ای از تغییر موازنه‌ قدرت در عرصه‌ جهانی هوش مصنوعی باشد. با عملکرد قابل توجه در استدلال و برنامه‌نویسی، مجوزهای آزاد و روند توسعه‌ی سریع، دیپ سیک در حال تثبیت جایگاه خود به‌عنوان یک رقیب جدی برای بازیگران اصلی این حوزه است.

در جهانی که آینده‌ هوش مصنوعی بیش‌ازپیش به‌سوی رقابت چندقطبی پیش می‌رود، مدل‌هایی مانند R1-0528 می‌توانند نه‌فقط مسیر پیشرفت فناوری را تعیین کنند، بلکه این پرسش کلیدی را هم مطرح کنند که چه کسانی اجازه دارند این فناوری را بسازند، کنترل کنند و از آن بهره‌مند شوند.

منبع: tomsguide

۵۸۳۲۳

کد مطلب 2073564