روزنامه ایران با این مقدمه نوشت: اتومبیل معمولی و نهچندان لوکس شما مانند مدل Fusion روزانه 250 گیگابایت اطلاعات را به شرکت فورد ارسال میکند تا سیستمهای تحلیلگر پیشرفته آن را مورد بررسی قرار دهند و کوچکترین نقص یا اختلال در کوتاهترین زمان مشخص شود. حال حسگرهای فراوانی که در آیفون، ساعت مچی هوشمند یا دیگر ابزارهای روزمره به کار گرفته شدهاند را در نظر بگیرید که اطلاعاتی مربوط به پیامهای شخصی، سلامت جسمانی، قرارهای ملاقات، گشتوگذارهای اینترنتی، عکسها و تصاویر، موسیقی، ارتباطات فیسبوکی و... را ذخیره میکنند. به گفته شرکت IBM، این همان دنیای کلان دادهها(Big Data) است که ما هر روز از صبح تا شب با آن سر و کار داریم.
شرکت IBM در گزارش جدید خود که این هفته منتشر کرده است میگوید هیچ انسانی روی کره زمین نیست که بتواند از اطلاعات دور باشد و در زندگی روزمره اش با انواع مختلف دادهها درگیری نداشته باشد. حجم این اطلاعات همیشه در حال گسترش است و به گفته شرکت IBM، در سال 2020 میلادی هر 73 روز یکبار حجم دادههای ذخیره شده در سراسر جهان مربوط به بخش سلامت و بهداشت دو برابر افزایش مییابد. اما توجه داشته باشید علم امروز هر اندازه هم که پیشرفت کرده است، هنوز نمیتواند از این منبع بزرگ استفاده کند و 80 درصد اطلاعاتی که در طول روز تولید میشود سازماندهی نشدهاند و کاربرد خاصی برای انسان ندارند.
بمباران اطلاعاتی
بخش تحقیق و توسعه در شرکت IBM بر اساس جدیدترین بررسی جامع خود به این نتیجه رسیده است که هماکنون در جهان 7/2 زتابایت اطلاعات موجود است. برای آنکه فهم دقیقتری از این حجم اطلاعات به دست آید، عدد 7/2 را با 21 صفر مقابل آن در نظر بگیرید تا متوجه شوید جهان دیجیتال چقدر بزرگ شده است. این بررسی پیشبینی میکند که در سال 2020 میلادی حجم اطلاعات جهانی نسبت به مقداری که هماکنون در اختیار داریم 50 برابر بیشتر میشود و هر یک از کاربران در این رشد فزاینده نقش مؤثری برعهده دارند. کارشناسان میگویند اطلاعات و دادههایی که هر کاربر امروزی ظرف دو روز تولید میکند با اطلاعات بهجا مانده از ابتدای عصر دیجیتال تا پایان سال 2003 برابر است.
میزان استفاده از اطلاعات در جهان همچنان رو به افزایش است و پیشبینی شده است در سال 2020 در هر روز بیش از 450 میلیارد نقل و انتقال اطلاعاتی در سراسر جهان انجام شود و برای ساماندهی این فرآیند، مرکز Akamai هر روز 75 میلیون اتفاق اطلاعاتی تحلیل میکند تا آگهیهای تبلیغاتی بهتر و دقیقتر متناسب با نیازهای کاربران در اختیار آنها قرار گیرد. شرکتها و سازمانهایی که با صرف هزینههای چند میلیون دلاری ابزارهای مخصوص تحلیل کلان دادهها را در اختیار گرفتهاند، تنها 12 درصد آنها را مورد استفاده قرار میدهند و هر روز 88 درصد از اطلاعات ارزشمندی که در سازمانهای مختلف به وجود میآید، دور ریخته میشود. اهمیت این اتفاق به قدری افزایش یافته است که کارشناسان میگویند فرصت شغلی در بازار جهانی برای کسب افرادی که در زمینه کلان دادهها تخصص دارند سالانه 46 درصد افزایش مییابد.
«راب بیردن» از مدیران IBM در این خصوص میگوید: «ارزش اصلی کلان دادهها را سازمانهای بزرگ میفهمند. حجم اطلاعاتی که این مراکز تولید میکنند از هماکنون تا سال 2020 میلادی 50 برابر افزایش مییابد. نکته جالب در اینجاست که 85 درصد دادههای مذکور از منابع جدید به دست میآیند. این منابع همان دستگاههای موبایلی، شبکههای اجتماعی، اینترنت اشیا و... هستند که بزودی تمامی سازمانها را هدف قرار میدهند». در سال 2014 میلادی میانگین دستمزد هر کارشناس حوزه کلان دادهها در جهان 120 هزار دلار بود و اگر او در سطح مدیریتی فعالیت میکرد، تا 160 هزار دلار حقوق میگرفت. اما کارشناسان میگویند رقم یاد شده برای سال جاری رشد 50 درصدی را تجربه میکند تا بر این اساس متخصص امور اطلاعات و داده یکی از بیشترین دستمزدها در صنعت جهانی آیتی را دریافت کند.
اما به جز شرکتها و سازمانها، کاربران عادی در زمینه تولید داده و استفاده از آن نقش مهمی برعهده دارند. در سال 2012 میلادی گوگل در هر دقیقه بیش از 2 میلیون کلیدواژه ارائه شده توسط کاربران جهانی را جستوجو کرد و با رشد باورنکردنی پایان سال 2014 میلادی گفته شد که 4/2 میلیارد کاربر آنلاین در جهان هر دقیقه 4 میلیون کلیدواژه را در گوگل جستوجو کردهاند. هر دقیقه در دنیای مجازی 5/2 میلیون واحد اطلاعات در فیسبوک ایجاد میشود، کاربران 300 هزار توئیت جدید منتشر میکنند، اینستاگرام نزدیک به 220 عکس جدید در اختیار میگیرد، روی یوتیوب معادل 72 ساعت تصویر ویدیویی منتشر میشود، 50 هزار ابزار از فروشگاه اینترنتی اپل بارگذاری میشود، 200 میلیون پست الکترونیکی بین کاربران جهانی رد و بدل میشود، آمازون معادل 80 هزار دلار کالا را به صورت اینترنتی میفروشد و همه اینها کلان دادههایی است که کاربر در طول روز با آنها سر و کار دارد و به صورت مستقیم یا غیرمستقیم حضور آنها را در زندگی روزمره خود احساس میکند.
دستاوردهای علمی
بسیاری از دولتها اهمیت کلان دادهها را کشف کردهاند و با تمرکز بر آن میکوشند اهداف خود را پیش ببرند. برای مثال، «باراک اوباما» در سال 2012 میلادی متبحرترین کارشناسان اطلاعاتی جهان را در اختیار گرفت و به کمک آنها کلان دادهها را تحلیل کرد و در پایان مشخص شد تنها برگ برنده او برای پیروزی در انتخابات همین مسأله بوده است. از آن زمان به بعد کاخ سفید اعلام کرد که مهمترین مشکلات پیشروی دولت امریکا باید با تحلیل کلان دادهها برطرف شود و این مسأله باعث شد 84 برنامه جامع تحلیل کلان داده در 6 وزارتخانه بزرگ این کشور به مرحله اجرا برسد.
در دیگر کشورها نیز فواید کلان دادهها بخوبی دیده شده است دولت هند در انتخابات ریاست جمهوری سال 2014 میلادی توضیح داد که تنها به کمک تحلیل اطلاعات وسیع مربوط به عموم مردم توانسته است پیروزی خود را تضمین کند. در بریتانیا کلیه امور بهداشتی و درمانی به کلان دادهها واگذار شده است و سیستمهای بزرگ تمام اطلاعات مربوط به شهروندان این کشور را برای استفاده از خدمات سلامت بررسی میکنند. سازمان ملل متحد نیز طرحهای بزرگی را با پشتیبانی از سیستمهای تحلیلی کلان دادهها تعریف کرده است که به کمک آنها مطالعات جهانی خود را دقیقتر جلو میبرد.اما شرکت IBM که بزرگترین تولیدکننده سیستمهای تحلیلگر کلان دادهها در عرصه پزشکی محسوب میشود، معتقد است که این بخش جدید در صنعت آیتی به جز دولتها میتواند در دیگر بخشهای جامعه هم کاربرد داشته باشد. برای مثال زمانی که تلسکوپ SDSS سال 2000 میلادی فعالیت خود را آغاز کرد، در چند هفته نخست فعالیت خود موفق شد معادل کل تاریخ ستارهشناسی اطلاعات ارزشمند جمعآوری کند. این سیستم هر شب 200 گیگابایت اطلاعات تولید میکرد و در مجموع موفق به جمعآوری 140 پتابایت شد. اما هماکنون پیشبینی میشود که سال 2016 میلادی تلسکوپهای جدید این حجم از اطلاعات را هر 5 روز یکبار تولید کنند.
در بخش پزشکی همچنین گفته میشود که کشف رمز سیستم ژنتیکی هر انسان به طور میانگین 10 سال به طول میانجامد و هماکنون با استفاده از سیستمهای تحلیلی کلان دادهها میتوان این کار را در کمتر از یک شبانهروز انجام داد. مرکز NCCS به عنوان بزرگترین شبیهساز وضعیت آبوهوایی جهان وابسته به سازمان ناسا هر روز 32 پتابایت اطلاعات را از ماهوارهها و ایستگاههای زمینی دریافت میکند که این حجم گسترده از اطلاعات هم توسط سیستمهای تحلیلگر کلان دادهها کاربردی میشود. با این اطلاعات و بررسیهای شرکت IBM، انسان کنونی دریای گستردهای از اطلاعات را پیشروی خود میبیند که اگر شنا کردن در آن را بلد نباشد، به طور یقین غرق خواهد شد.
5656