مدل پیشرفته VaultGemma اولین مدل گوگل با تمرکز بر حریم خصوصی است و با تکنیک‌های پیشرفته برای حفظ حریم خصوصی ساخته شده است.

به گزارش خبرگزاری خبرآنلاین و به نقل از پیوست، شرکت‌های فناوری برای ساخت مدل‌های هوش مصنوعی بزرگ‌تر به دنبال داده‌های آموزشی هستند و همین امر نگرانی‌هایی درمورد حریم خصوصی کاربران ایجاد کرده است. اکنون گوگل مدل VaultGemma را معرفی کرده که با تکنیک‌های پیشرفته برای حفظ حریم خصوصی ساخته شده است.

VaultGemma یک مدل آزمایشی است که نشان می‌دهد می‌توان هوش مصنوعی قدرتمندی ساخت که کمتر احتمال دارد داده‌های حساس آموزشی خود را به خاطر بسپارد و ناخواسته بازگو کند. این پیشرفت می‌تواند نحوه نگرش گوگل و سایر شرکت‌ها به مقوله حریم خصوصی در محصولات آینده هوش مصنوعی را تغییر دهد.

هوش مصنوعی VaultGemma گوگل

یکی از بزرگ‌ترین خطرات مدل‌های زبانی بزرگ این است که گاهی اوقات به‌جای تولید محتوای جدید، بخش‌هایی از داده‌های آموزشی خود را کلمه‌به‌کلمه تکرار می‌کنند. اگر این داده‌ها شامل اطلاعات شخصی کاربران یا محتوای دارای کپی‌رایت باشد، می‌تواند به نقض حریم خصوصی یا مشکلات حقوقی جدی منجر شود.

راه‌حل گوگل برای این مشکل، استفاده از تکنیکی به نام Differential Privacy است. این روش با تزریق نویز یا اختلالات حساب‌شده در طول فرایند آموزش، از به‌ خاطرسپردن جزئیات دقیق توسط مدل جلوگیری می‌کند. بااین‌حال، این تکنیک همیشه یک مسئله بزرگ داشته است؛ افزودن نویز باعث کاهش دقت مدل و افزایش نیاز به توان محاسباتی می‌شود.

موفقیت اصلی تیم تحقیقاتی گوگل در این بود که برای اولین‌بار «قوانین مقیاس‌پذیری» را برای این مدل‌های خصوصی کشف کردند. آن‌ها فرمولی را برای ایجاد یک تعادل بهینه بین سه عامل مهم تعریف کردند: بودجه حریم خصوصی (میزان نویز)، بودجه محاسباتی (قدرت پردازش) و بودجه داده (حجم داده‌های آموزشی). این امر به توسعه‌دهندگان اجازه می‌دهد تا با کارایی بیشتری منابع خود را برای ساخت مدل‌های خصوصی تخصیص دهند.

گوگل می‌گوید از این تکنیک احتمالاً در مدل‌های غول‌پیکر و همه‌منظوره که در آن‌ها عملکرد حداکثری حرف اول را می‌زند، استفاده نخواهد شد. در عوض، این تکنیک برای مدل‌های کوچک‌تر و هدفمند که قابلیت‌های خاصی را در محصولات (مانند خلاصه‌سازی ایمیل‌ها یا پیشنهاد پاسخ‌های بهتر) ارائه می‌دهند، بسیار مناسب‌تر است.

VaultGemma یک مدل وزن‌باز (open-weight) است که برپایه مدل Gemma ۲ ساخته شده است. این مدل با فقط ۱ میلیارد پارامتر در مقایسه با غول‌های امروزی نسبتاً کوچک محسوب می‌شود. این مدل درحال‌حاضر برای دانلود در پلتفرم‌های Hugging Face و Kaggle در دسترس است.

۵۸۳۲۳

منبع: بدون منبع