به نظر می‌رسد که هر چه یک کلمه کوتاه‌تر باشد، استفاده از آن بیشتر است. اما بررسی‌های جدید نشان می‌دهد که طول کلمات بیشتر از آنکه به فراوانی استفاده آنها وابسته باشد، به بار اطلاعاتی آنها وابسته است.

محمود حاج‌زمان: تحقیق گروهی از دانشمندان علوم شناختی نشان می‌دهد که کلمات طولانی‌تر، اطلاعات بیشتری را حمل می‌کنند.

به گزارش نیچر، وقتی‌که به این مساله فکر کنید، موضوع ممکن است از نظر شهودی کاملا واضح به نظر برسد. اما تکلیف تفاوت طول کلماتی مانند «فورا» و «همین الان» چه می‌شود؟ برای سالیان متمادی زبان‌شناسان باور داشتند که طول یک کلمه با میزان استفاده آن ارتباط دارد و کلمات کوتاه‌تر بیشتر از کلمات بلندتر استفاده می شوند. این ارتباط و وابستگی نخستین بار در دهه 1930 / 1310، توسط زبان‌شناس دانشگاه هاروارد، جرج کینزگلی زیف پیشنهاد شد.

زیف باور داشت که ارتباط بین طول کلمات و فراوانی استفاده از آنها، از انگیزه حداقل کردن زمان و تلاش مورد نیاز برای صحبت کردن و نوشتن ریشه گرفته است. اما استیون پیانتادوسی و همکارانش در موسسه فناوری ماساچوست، ام.ای.تی می‌گویند که برای انتقال حجم مشخصی از اطلاعات، به جای استفاده از کلمات کوتاه‌تر، بهتر است که از کلمات اخباری استفاده کرد.

تئوری زیف در کل درست است و به نظر می‌رسد که وابستگی استفاده از کلمات با طول آنها، در بسیاری از زبان‌ها برقرار است. از آنجایی‌که طول گفته و نوشته عموما مشابه است، این مساله در هر دو زمینه کلام و متن اعمال می‌شود. اما پس از بررسی کلمات مورد استفاده در 11 زبان اروپایی، پیانتادوسی و همکارانش دریافتند که طول کلمات بیشتر از آنکه به فراوانی استفاده از آنها وابسته باشد، به بار اطلاعاتی آنها وابسته است.

راجر لیوی، زبان‌شناس دانشگاه کالیفرنیا می‌گوید: «این مطالعه، یک نقطه عطف تاریخی است. درک ما از ارتباط بین فراوانی کلمات و طول آنها تقریبا از زمان کشفیات زیف دست‌نخورده باقی مانده بود.» وی می‌افزاید این مطالعه جدید می‌تواند باعث «بزرگ‌ترین جهش 75 سال اخیر» برای درک این مطلب شود که چطور کارایی کلمات در برقرای ارتباط، تکامل آنها را کنترل کرده است.

بار اطلاعاتی
اندازه‌گیری بار اطلاعاتی یک کلمه آسان نیست، زیرا این موضوع می‌تواند به شدت وابسته به زمینه صحبت باشد. پیانتادوسی و همکارانش فرض کردند که هر چه کلمه قابل پیش‌بینی‌تر باشد، بار اطلاعاتی آن کمتر است. برای مثال، لغت «نه» در جمله «بزرگترین عدد یک رقمی نه است.»، اطلاعات کمتری را نسبت به عبارت «افراد شرکت‌کننده در آزمون نه نفر بود.» در بر دارد، زیرا در جمله اول آمدن لغت نه قابل پیش‌بینی بود. در این جمله، آمدن لغت «نه» اطلاع چندانی را به جمله موجود اضافه نمی‌کند.

این گروه روشی را برای تخمین بار اطلاعاتی کلمات در متون دیجیتال ابداع کردند. این روش بررسی می‌کرد که چطور یک کلمه با کلمات ماقبل خود وابسته و در نتیجه قابل پیش‌بینی است. پیانتادوسی این روش را برای تنها یک کلمه این‌طور توضیح می‌دهد: «ما حساب کردیم که جفت کلماتی مانند آن مرد، آن پسر، یک مرد، یک پسر و ... چند بار با یکدیگر در یک توالی اتفاق می‌افتند. سپس این شمارش را برای تخمین احتمال اینکه یک کلمه به کلمه قبلی وابسته است، به کار بردیم. در حالت کلی‌تر، احتمال وابستگی هر کلمه به هر نوع توالی تعداد مشخصی از کلمات قبلی را نیز حساب کردیم.» بر اساس تئوری اطلاعات، بار اطلاعاتی یک کلمه متناسب با منفی لگاریتم این احتمال است.

با این وجود، دیمین زانتی، فیزیک‌دان مرکز اتمی باریلوچه آرژانتین نسبت به این مساله که روش گروه پیانتادوسی با دقت بتواند بار اطلاعاتی حقیقی یک کلمه را در متن تشخیص دهد، قانع نشده است. وی می‌گوید که به صورت کلی، این بار اطلاعاتی توسط چند صد کلمه دیگری که یک کلمه را احاطه می‌کنند، تعیین می‌شود.

پیانتادوسی و همکارانش پیشنهاد کرده‌اند که ارتباط بین طول کلمات و محتوای اطلاعاتی آنها، نه تنها انتقال اطلاعات را از نظر زبان‌شناسی کارآمدتر می‌کند، بلکه باعث می‌شود که فهم و شناخت زبان برای خواننده یا شنونده راحتتر شود. اگر کلمات کوتاه‌تر و خلاصه‌تر، اطلاعات کمتری را با خود داشته باشند؛ وضعیت اطلاعاتی که در کل یک عبارت یا جمله حمل می‌شود از سادگی خارج می‌شود. در نتیجه فهم عبارت یا جمله سخت‌تر می‌شود. از این نقطه نظر، نتایج تحقیقات نشان می‌دهد که چطور ساختار یک زبان می تواند به ارتباطات آن کمک کند.

50

کد خبر 128201

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
1 + 8 =

نظرات

  • نظرات منتشر شده: 2
  • نظرات در صف انتشار: 0
  • نظرات غیرقابل انتشار: 0
  • اسماعیل غلامی MY ۰۸:۴۴ - ۱۳۸۹/۱۱/۱۹
    0 0
    به عقیده من سال ها پیش ، سعدی - استاد سخن - به رمز و رموز این "بار اطلاعاتی وايگان" واقف بوده. کوچک ترین تورق در آثار سعدی این عقیده را ثابت می کند.
  • بدون نام IR ۱۵:۵۲ - ۱۳۸۹/۱۱/۲۱
    0 0
    شما اهل ادبیات هستی و از کلمات "اطلاعات" و "تورق" استفاده می‌کنی؟