شگفت‌انگیزترین دیتاسنترها کاری بیش از ذخیره‌سازی داده‌ها و اطلاعات انجام می‌دهند. آنها به دانشمندان کمک می‌‍کنند بحران‌های اقتصادی را پیش‌بینی کنند، نقشه جهان را تهیه کنند و حتی زندگی شما را نجات دهند.

محمود حاج‌زمان: شاید فکر کنید که پایگاه داده تنها مختص دنیای کامپیوتر است، اما به هیچ وجه این طور نیست. پایگاه‌های داده در علوم مختلفی کاربرد دارند و شگفت‌انگیزترین آنها کاری بیش از ذخیره‌سازی داده‌ها و اطلاعات را انجام می‌دهند. آنها برای محققان راه‌های جدیدی را فراهم می‌کنند تا پرونده‌های پلیسی قدیمی را حل کنند، بحران‌های اقتصادی را پیش‌بینی کنند، نقشه جهان را تهیه کنند و حتی زندگی شما را نجات دهند. با هم نگاهی به 10 پایگاه برتر به انتخاب سایت پاپ‌ساینس می‌اندازیم.
 

سیستم فهرست‌نویسی ترکیبی دی‌ان‌ای
تا قبل از سال 1990 / 1369، زمانی‌که اداره فدرال آمریکا اقدام به ساخت پایگاه داده اصلی دی‌ان‌ای خود را با نام سیستم فهرست‌نویسی ترکیبی دی‌ان‌ای با به اختصار CODIS نمود، کارآگاهان عموما بررسی‌های دی‌ان‌ای را تنها برای پرونده‌هایی انجام می‌دادند که در آنها هر دو شواهد صحنه قتل و یک مظنون مشخص را در اختیار داشتند.
اما اکنون پلیس آمریکا می‌تواند شواهد ژنتیک جمع‌آوری شده در صحنه جرم را با میلیون‌ها نمونه دی‌ان‌ای معلوم مقایسه کند، جرم‌های مشابه را شناسایی کند، مظنونان جدیدی پیشنهاد کند، دو صحنه قتل ظاهرا نامربوط را به یکدیگر ربط دهد، و افرادی را که مدت‌ها است مفقود شده‌اند تعیین هویت کند.
اغلب نمونه‌های این پایگاه داده از مظنونین صحنه‌های جرم و زندانیان گرفته شده است، اما تحلیل‌گران پزشکی قانونی به طور فزاینده‌ای مشغول اضافه کردن شواهد ژنتیکی کشف شده از صحنه‌های جرم، اجساد ناشناس و افراد گمشده به این پایگاه هستند. تا کنون کارآگاهان پلیس آمریکا موفق شده‌اند به کمک CODIS بیش از 143 هزار پرونده را حل کنند.

 

دایره‌المعارف حیات
چهار سال قبل، موسسه اسمیتسونیان، موزه تاریخ طبیعی آمریکا، دانشگاه هاروراد، باغ گیاه‌شناسی میسوری، آزمایشگاه زیست‌شناسی اقیانوسی و کتابخانه میراث تنوع زیستی آمریکا به یکدیگر ملحق شدند تا یک مجموعه داده جامع را درباره تمام موجودات زنده روی زمین خلق کنند.
تا کنون محققان این کنسرسیوم اطلاعات مربوط به 40 درصد از 1.9 میلیون گونه شناخته شده سیاره زمین را جمع‌آوری، مرتب و بررسی کرده‌اند. در این مجموعه می‌توان اطلاعات جالبی مانند مشاهدات توصیفی از رفتار شبانه لمورهای پرنده، و یا نقشه توزیع قارچ سیاه عسل را پیدا کرد.
محققان اطلاعات را از صدها منبع مختلف جمع‌آوری کرده‌اند، آن را به یک قالب واحد و سازگار تبدیل کرده‌اند، و بر اساس گونه‌های منفرد آن را سازمان‌دهی کرده‌اند. ترکیب کردن داده‌های مجزا و مختلف به صورت یک پایگاه داده واحد و قابل جستجو امکان مشاهده ارتباطات جدید بین اشکال مختلف حیات را فراهم کرده است. با جستجوی الگوهای طول عمر یا شباهت‌هایی در مقاومت در مقابل بیماری، و انجام این جستجو در طیف گسترده صفحات دایره‌المعارف حیات، زیست‌شناسان قصد دارند تا گونه‌ها و ژن‌های جدیدی را کشف کنند که به مطالعات آنها در خصوص افزایش طول عمر، توسعه واکسن‌ها و سایر تحقیقات پزشکی کمک کند. با سرعت فعلی، دایره‌المعارف حیات (EOL) داده‌های مربوط به تمام گونه‌های گیاهی، جانوری، حشرات و میکروب‌ها را تا سال 2017 / 1396 جمع‌آوری خواهد کرد.
 

FAOSTAT
نظارت و پیگیری بر منابع غذای جهان شامل ردیابی داده‌های کشاورزی، استفاده از زمین، ماهیگیری، جنگلبانی، کمک‌های غذایی، رشد جمعیت و تغذیه است. برای قابل فهم کردن تمام این اطلاعات، محققان سازمان خوار و بار جهانی (FAO) سازمان ملل متحد اقدام به ساخت FAOSTAT کردند: بزرگ‌ترین پایگاه داده جهان در خصوص اطلاعات غذا و کشاورزی، با بیش از یک میلیون سرشماری که آمار مربوط به پنج دهه و 254 کشور و منطقه را شامل می‌شود.
با استفاده از FAOSTAT محققان به سرعت می‌توانند تعیین کنند که در سال 2000 / 1379، انسان‌ها در مقایسه با بیست سال پیش از آن، 249 کالری بیشتر در روز مصرف می‌کردند؛ 70 درصد مصرف آب انسان صرف کشاورزی می‌شود؛ نزدیک به 2 میلیارد گوسفند و بز در گله‌های جهان وجود دارد؛ و اگرچه سیاره زمین غذای کافی برای تغذیه تمام ساکنان آن تولید می‌کند، اما 13 درصد جمعیت جهان دچار سوء‌تغذیه هستند. سال گذشته سازمان فائو استفاده از FAOSTAT را به صورت رایگان درآورد و از آن تاریخ تعداد کاربران آن از 400 نفر به 11500 نفر افزایش یافت.
در میان کاربران این پایگاه داده، دولت‌ها و سازمان‌های مردم‌نهاد (NGOs) وجود دارند که FAOSTAT را به دنبال راه‌هایی برای غذارسانی موثرتر به مردم جهان زیر و رو می‌کنند. در یک مطالعه اخیر، وزارت کشاورزی چین با استفاده از داده‌های فائو، میزان استفاده از زمین و تولید مواد غذایی خام را در 19 کشور مقایسه کرد. یکی از نتایج شگفت‌آور این بود که تعداد کارگران در مزارع چین بیش از حد نیاز است، و اگر افراد بیشتری به شهرها مهاجرت کنند کارایی و راندمان مزارع بهتر خواهد شد.
 

پروژه ژنوگرافیک
بهترین سابقه مهاجرت انسان‌های اولیه نه در استخوان‌های باستانی و نه در مصنوعات باستان‌شناسی، بلکه در دی‌ان‌ای انسان‌های زنده امروزی یافت می‌شود. در سال 2005 / 1384 برای قابل دسترس کردن این اطلاعات، انجمن ملی جغرافیا آمریکا و آی‌بی‌ام پروژه ژنوگرافیک (Genographic Project) را آغاز کردند.
در این پروژه، کیت‌های جمع‌آوری دی‌ان‌ای به افراد فروخته می‌شود و یک تحلیل از خاستگاه آنها به افراد ارائه می‌شود. شرکت‌کنندگان تشویق می‌شوند تا اطلاعات خود را به صورت ناشناس به یک پایگاه داده اهدا کنند؛ پایگاهی که همچنین نمایه دی‌ان‌ای افراد بومی را که توسط ژنتیک‌دانان انسان‌شناسی در 10 آزمایشگاه جمع‌آوری شده است نگهداری می‌کند. با جستجوی 420 هزار نمایه ذخیره شده در این پایگاه داده، دانشمندان می‌توانند جهش‌های ژنتیکی را در میان مردم پیگیری، و مراحل آن را در انسان‌های باستانی مجددا ردیابی کنند.
در سال 2008 / 1387، با مطالعه نسب مادری 624 ژن آفریقایی، محققان پروژه ژنوگرافیک کشف کردند که اگرچه تمام انسان‌ها در دی‌ان‌ای یک جد مادری 200 هزار ساله با هم سهیم هستند، دسته‌های کوچک انسان‌ها پیش از آنکه برای شکل دادن یک جمعیت واحد در اواخر عصر حجر با یکدیگر متحد شوند، نیمی از تاریخ بشر را در انزوا زندگی کرده‌اند.
 

مرکز توزیع داده هیئت بین‌المللی تغییرات آب‌وهوایی
قبل از اینکه هیئت بین‌المللی تغییرات آب‌وهوایی مرکز توزیع داده خود (DDC) را در سال 1998 / 1377 راه‌اندازی کند، محققانی که به پروژه‌های تغییرات آب‌وهوایی نیاز داشتند مجبور بودند که آنها را از تنی چند از دانشمندان بگیرند که در مدلسازی آماری آب‌وهوایی محاسبات بالا متخصص بودند. مدل‌سازها با کوهی از اطلاعات مواجه بودند و مطالعات بسیار خسته کننده بود.
بدتر از آن، آنها اغلب فرضیات و قالب‌های داده‌ای متفاوتی را استفاده می‌کردند، که مقایسه سریع نتایج را دشوار می‌ساخت. با این حال، اکنون DDC به عنوان مخزن مرکزی جهانی برای پروژهای آب‌وهوایی آینده خدمت می‌کند. تحلیل‌گران DDC قبل از آنکه داده‌ها را به پایگاه داده اصلی وارد کنند، آنها را از مدل‌های مختلف به قالب‌های سازگار و قابل بارگذاری تبدیل می‌کنند.
اگر یک دانشمند بخواهد مطالعه کند که سناریوهای مختلف گرمایش جهانی مثلا بر روی تولید ذرت در چین چطور اثر می‌گذارد، می‌تواند مجموعه داده‌های تولید شده از 49 مدل آماری مختلف را انتخاب کند و داده‌هایی را که به یک قالب قابل استفاده تبدیل شده‌اند، دانلود کند.
 

MD-Pro
با داشتن فهرستی از بیش از 15 میلیون بدافزار کامپیوتری، MD-Pro مرکزی برای کنترل بیماری‌های دنیای مجازی است. شرکت Frame4 Security Services که در سال 2006 / 1385 در هلند تاسیس شد، این پایگاه داده را به عنوان منبعی برای متخصصان امنیت ایجاد کرد، متخصصانی که برای شناسایی تهدیدهای جدید و توسعه و تست اقدامات دفاعی نیاز دارند تا به بدافزارها دسترسی داشته باشند.
تحلیل‌گران Frame4 برای جمع‌آوری نمونه‌ها از کامپیوترهایی موسوم به honeypot استفاده می‌کنند، که برنامه‌ریزی می‌شوند تا بدافزارها را جذب و گمراه کنند. همچنین بخشی از نمونه‌ها از سوی سازندگان آنتی‌ویروس و متخصصان امنیت مجازی به این پایگاه اهدا شده است. تحلیل‌گران می‌توانند نمونه‌ها را از سایت MD-Pro دانلود کنند، البته برای جلوگیری از فروش نمونه‌ها به سازندگان بدافزارها و هکرها، Frame4 بر کاربران خود نظارت می‌کند. پس از افزودن یک موتور پردازش دیگر در اوایل سال میلادی، MD-Pro با سرعت بیش از یک میلیون نمونه در ماه در حال توسعه است.
 

پایگاه داده نقشه‌برداری دیجیتال آسمان اسلون
در سال 1998 / 1377 اخترشناسان با استفاده از تلسکوپ 2.5 متری Sloan در رصدخانه آپاچی نیومکزیکو شروع به عکسبرداری از آسمان و بارگذاری تصاویر تهیه شده در پایگاه داده نقشه‌برداری دیجیتال آسمان اسلون (SDSS) کردند که به رایگان در اختیار عموم مردم قرار دارد. از آن زمان، اخترشناسان 100 ترابیت فضا را برای نقشه‌برداری نیم میلیارد ستاره، کهکشان، سیارک و کوازار استفاده کرده‌اند؛ و نقشه‌های سه‌بعدی کهکشان‌های خارجی را خلق، و ساختار کیهان را مطالعه کرده‌اند.
سال گذشته، دانشمندان از نمونه‌های ستاره‌ای انبوه SDSS استفاده کردند تا تعیین کنند که چرا برخی از کوتوله‌های سفید رد غیرمنتظره‌ای از فلز را در اتمسفر خود بر جای می‌گذارند. با مقایسه اندازه‌گیری‌های SDSS از هزاران کوتوله سفید جدیدا شناسایی شده با اندازه‌گیری‌های مربوط به سایر ستارگان، آنها کشف کردند که این آلودگی احتمالا باقی‌مانده‌های سیاره‌ای است. از آنجایی‌که کهکشان راه‌شیری در بردارنده تعداد زیادی کوتوله سفید آلوده است، دانشمندان استدلال کردند که ممکن است سیارات صخره‌ای و آبدار از چیزی که قبلا گمان می‌شد متداول‌تر باشند. بنابراین ممکن است احتمال وجود حیات فرازمینی در کهکشان ما بیش از آن چیزی باشدکه دانشمندان قبلا حدس می‌زدند.
 

Wayback Machine
هدف Wayback Machine کپی و ذخیره کردن اینترنت است. زمانی‌که شرکت غیرانتفاعی Internet Archive این پایگاه داده را 15 سال پیش بنیان گذاشت، نرم‌افزار مرورگر موسوم به خزنده (crawlers) حدود 180 میلیارد صفحه وب متعلق به بیش از 200 میلیون سایت را ذخیره کرده است.
اکنون با حجم 4 پتابایت، که هر ماه 35 تا 40 ترابایت نیز به آن اضافه می‌شود، Wayback Machine بزرگ‌ترین آرشیو در دسترس وب است که در جهان وجود دارد. کافی است یک آدرس URL مانند آدرس یک وبلاگ بسته شده را وارد کنید، و تاریخچه زمانی رو به عقب آن را با لینک‌هایی که به نسخه‌های عملیاتی وب سایت‌های همان زمان ارجاع می‌دهند، مشاهده کنید. پایگاه Wayback Machine رایگان است، بنابراین هر کاربر کنجکاوی می‌تواند داده‌های آن را برای تحقیق‌های تاریخی یا مطالعه تکامل وب استفاده کند.
 

WorldCat
از زمانی‌که مرکز کتابخانه کامپیوتر آنلاین در 40 سال قبل WorldCat را خلق کرد، کتابداران سراسر دنیا این پایگاه داده را با اطلاعات کتاب‌شناسی بیش از 1.75 میلیارد کتاب از 72 هزار کتابخانه در 170 کشور مختلف پر کرده‌اند.
کتابداران از این پایگاه داده برای دسترسی به اطلاعات هر کتابی در قفسه کتابخانه جهانی استفاده می‌کنند. امانت‌گیرندگان می‌توانند با نرم‌افزار مخصوص WorldCat برای گوشی‌های همراه، به جستجوی کتاب‌ها، فیلم‌ها، موسیقی و مقالات تحقیقی در کتابخانه‌های نزدیک خود بپردازند. در عین حال محققان می‌توانند WorldCat را برای کشف گرایش‌های فرهنگی و تاریخی، و شاید پیش‌بینی گرایش‌های آینده زیر و رو کنند. برای مثال دانشگاهی در تورنتو با استفاده از این پایگاه داده کشف کرد که افت و خیزهایی که در تعداد کتاب‌های فناورانه جدید ایجاد می‌شود، به ترتیب بر شکوفایی‌ها و بحران‌های اقتصادی مقدم است.

53275

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
8 + 9 =

نظرات

  • نظرات منتشر شده: 1
  • نظرات در صف انتشار: 0
  • نظرات غیرقابل انتشار: 0
  • در مورد Wayback Machine IR ۰۰:۰۵ - ۱۳۹۰/۰۸/۱۷
    4 0
    مراقب باشید، هر چیزی که در اینترنت بگذارید همیشه باقی خواهد ماند، حتی این نظری که من الان گذاشتم، برای همیشه خواهد بود، حتی اگر خبرآنلاین تمام فضای رزرو شده اش را از اطلاعات پاک کند.