تینا مزدکی - مدل تازهی شرکت دیپ سیک چین با نام DeepSeek-R1-0528 توانسته در آزمون AIME 2025، که یکی از سنجههای دقیق برای ارزیابی تواناییهای استدلالی مدلهای زبانی است، به دقت چشمگیر ۸۷.۵ درصد برسد؛ عددی که در مقایسه با نسخهی قبلی (با دقت ۷۰ درصد)، جهشی بزرگ به حساب میآید. در بنچمارک تخصصی LiveCodeBench نیز که عملکرد مدل در زمینهی برنامهنویسی را میسنجد، دقت DeepSeek-R1-0528 از ۶۳.۵ به ۷۳.۳ درصد افزایش یافته است. حتی در آزمون مشهور و دشوار «آخرین آزمون بشریت» (Humanity’s Last Exam)، امتیاز مدل از ۸.۵ به ۱۷.۷ درصد رسیده؛ یعنی بیش از دو برابر بهبود نسبت به نسخهی قبلی.
این آمارها نشان میدهند که DeepSeek-R1-0528 در برخی حوزهها به سطحی رسیده که میتواند با مدلهای مطرحی مانند GPT-4o از OpenAI یا Gemini از Google رقابت کند و حتی در بعضی معیارها، عملکردی بهتر از آنها داشته باشد.
متن باز و در دسترس!
در شرایطی که OpenAI و Google بیشتر مدلهای قدرتمند خود را تنها از طریق APIهای پولی در اختیار کاربران قرار میدهند، دیپ سیک راه متفاوتی را در پیش گرفته است. مدل R1-0528 بهصورت متنباز و تحت مجوز MIT منتشر شده؛ تصمیمی که به توسعهدهندگان اجازه میدهد آن را بهدلخواه تغییر دهند، شخصیسازی کنند و در محصولات خود بهکار ببرند.
از دیگر ویژگیهای مهم این نسخه، پشتیبانی از خروجیهای JSON و فراخوانی توابع (Function Calling) است. این قابلیتها مسیر توسعهی اپلیکیشنها و ابزارهایی که بهصورت مستقیم با مدل کار میکنند را بسیار سادهتر میکند. رویکرد باز و در دسترس دیپ سیک، این مدل را به گزینهای ایدهآل برای استارتاپها، پژوهشگران و شرکتهایی تبدیل کرده که بهدنبال جایگزینی آزاد برای پلتفرمهای بستهی غربی هستند.
آموزش هوشمندانه، نه پرهزینه
یکی از نکاتی که در گزارش دیپ سیک جلب توجه میکند، تأکید این شرکت بر بهرهوری در فرآیند آموزش مدل است. بهگفتهی دیپ سیک، نسخهی اولیهی R1-0528 تنها در ۵۵ روز و با بهرهگیری از حدود ۲۰۰۰ واحد پردازش گرافیکی (GPU) آموزش دیده و کل هزینهی این فرایند حدود ۵.۵۸ میلیون دلار بوده است. عددی که در مقایسه با هزینههای سنگین آموزش مدلهای مشابه در ایالات متحده، بسیار اقتصادیتر است. در دورهای که انتقادها نسبت به هزینههای مالی و زیستمحیطی آموزش مدلهای زبانی شدت گرفته، چنین کاراییای میتواند برگ برندهای برای دیپ سیک باشد.
آینده هوش مصنوعی چه خواهد شد
انتشار DeepSeek-R1-0528 میتواند نشانهای از تغییر موازنه قدرت در عرصه جهانی هوش مصنوعی باشد. با عملکرد قابل توجه در استدلال و برنامهنویسی، مجوزهای آزاد و روند توسعهی سریع، دیپ سیک در حال تثبیت جایگاه خود بهعنوان یک رقیب جدی برای بازیگران اصلی این حوزه است.
در جهانی که آینده هوش مصنوعی بیشازپیش بهسوی رقابت چندقطبی پیش میرود، مدلهایی مانند R1-0528 میتوانند نهفقط مسیر پیشرفت فناوری را تعیین کنند، بلکه این پرسش کلیدی را هم مطرح کنند که چه کسانی اجازه دارند این فناوری را بسازند، کنترل کنند و از آن بهرهمند شوند.
منبع: tomsguide
۵۸۳۲۳
نظر شما