با پروژه زوئی، منشی های دیجیتال، جایگزین سیستم های پاسخگو می شوند

محققان می گویند روزی می رسد که منشی های دیجیتال چهره فناوری را تغییر می دهند و این کار با پرده برداری از آواتار ها و نمادهای دیجیتال شکل واقعی به خود می گیرند .

با نگاهی اجمالی به این موضوع می توان گفت اسمارتفونهایی که نقش منشی دیجیتال را بر عهده خواهند گرفت، نمادهای دیجیتالی دنیای فناوری را کاملا تغییر می دهند.

فیلم علمی تخیلی Red Dwarf را حتما به یاد می آورید که در آن سرهای مصنوعی کامپیوتری، با انسان صحبت کرده و گفت و گو می کنند. این فیلم با پیش بینی های آینده کاملا سازگاری داشته و کامپیوترهایی که با انسان چت می کنند را به واقعیت تبدیل می کند.

واسط کاربری یا user interface در این بین در نقش دستیار دیجیتالی ظهور کرده و محققان لابراتوار تحقیقاتی توشیبا در کمبریج همراه دپارتمان مهندسی کامپیوتر دانشگاه کمبریج چشم انداز روشنی را در این رابطه ترسیم کرده اند.

آنها با پروژه زوئی Zeo (سری از جنس کامپیوتر که به صوت و تصویر واکنش نشان داده و احساسات را روی چهره خود نشان می دهد) سر شناور در فضا ساخته اند که آواتاری دو بعدی محسوب شده که به گفتار با احساسات تعریف شده روی چهره اش واکنش نشان می دهد و به وسیله موتور تبدیل متن به گفتار و برنامه مدل سازی چهره، پاسخ دیجیتالی می دهد.

ایده اصلی در این طرح این است که واسط های کاربری مانند زوئی آنچه در فناوری هایی مقل سیری اپل وجود دارد را گسترده تر ساخته و مانند یک خواننده کتاب عمل کرده و یا کیوسک خودکار همه پاسخ های لازم را دهد و حتی در نقش منشی اتاق عمل به جراح کمک کند.

در این پروژه فناوری سیری در حد ایده آل و به صورت ویژوال تعریف شده و تمام کارهای لازم بعنوان یک دستیار دیجیتال توسط زوئی انجام می شود.

بجون استینگر رئیس گروه چشم انداز کامپیوتر در مرکز تحقیقات بخش اروپایی توشیبا می گوید: در کوتاه مدت پروژه زوئی را کامل شده عملیاتهایی که سیری روی گوشی های هوشمند انجام می دهد، فرض کنید و در درازمدت به عنوان دستیار دیجیتالی-تعاملی فرض کرده که مانند یک انسان می تواند به جای شما نگاه کرده و موضوعات را جستجو کند، به شما زبان یاد دهد و در مورد اخبار با شما به مباحثه بپردازد.

احتمال قابل پیش بینی دیگر در این مورد اینکه دارندگان اسمارتفون ممکن است روزی قادر شوند تا دستیار دیجیتالی خود را شبیه سیستم تعریف شده در زوئی بیافرینند(VA/virtual assistant)

در آینده می توان مشابه زوئی ، دستیاران مخصوصی ایجاد کرد تا دست به ارسال پیام های چهره ای (face message) بزنیم. در حالی که کار می کنیم، این دستیاران پیام ها را خوانده و واکنش های مختلف به نوع پیام را از خود نشان می دهند و اگر پیام شادی انگیز باشد، می خندند و اگر پیام غم انگیز باشد، چهره ای گرفته به خود می گیرند.

استینگر تاکید می کند آواتارهای سخنگو فناوری جدیدی نیست و تاریخ خبر خوانهایی مانند آنانوا به اوایل قرن بر می گردد، اما در مقایسه، زوئی ، احساسات انسانی بیشتری از خود بروز می دهد. گفتنی است سرهای کامپیوتری سخنگو پیش از زوئی بوده اند اما انعطاف پذیری آنرا نداشته اند. همچنین نمونه هایی مانند زوئی ، واقعی تر از قبل نیز شده اند.

انبار نشانه های زبان انگلیسی با استفاده از منابع موجود در پروژه زوئی غنی تر شده و واحد های آوایی که زبان سخن را می سازند، اظهارات بیان شده را به صورت زبان چهره کپچر می کند و زوئی می تواند این مراحل را با تبدیل متن به گفتار بوسیله موتور مدل سازی تعبیه شده به خوبی ترسیم کند.

در تامین منابع زوئی از دایره کلمات وسیع از حوزه زورنامه و ... نظیر آنچه در hollyoaks است، استفاده شده است.

ویدئوی مپچر شده توسط نرم افزار تجزیه و تحلیل ، آنالیز شده و موقعیتهای مختلف صورت و حرکات گرفته شده، کنار هم چیده شده و از روی نشانه های مختلف، احساسات را بیان می کند.

نشانه ها بر اساس کلمات و احساسات توسط نرم افزار صدا مطابقت داده شده و صدا ها آنالیز می شود.

با ترکیب دیتاهای گردآوری شده از روی منابع صوتی و تصویری، زوئی می تواند احساسات انسانی را بازسازی کند و جملات داده شده به او را بخواند. بعنوان نمونه به گفته استینگر، با افزایش تحرکات و عمق دادن به صدا، شادی را در صورت خلق کرده و نشان دهد.

ترکیبی از احساساتی مانند خشم و سرعت و ترس در زوئی باعث می شود در نهایت چهره زوئی وحشت زده شود و کاربر وحشت را در چهره زوئی ببیند.

اکنون زوئی در مرحله تست قرار دارد و کاربر نوع کلماتی که قرار است گفته شود را تایپ می کند و از بین 6 مورد تعریف شده happy, sad, tender, angry, afraid and neutral بر اساس شدت تنظیم احساسات و عمق و زیر و بمی و سرعت، صدای مورد مظر را برگزیند.

این تنطیمات برای تولید 50 پارامتر که دیکته می کند چگونه زوئی چهره خود را حرکت دهد، تعریف و تعبیه شده است.

این دستیار دیجیتالی فعلا در بیرون از لابراتوار وجود ندارد و استینگر می گوید تمرکز گروه، فعلا روی توسعه بهبود باوری زوئی است. برای اینکه زوئی بتواند نقش دستیار انسانی خوب را بازی کند، باید موتور شناسایی سخن و انشعابی کردن گفتگو با هم ترکیب شود و البته فعلا این چیزی نیست که محققان دنبال آن باشند.

تیمی که زوئی را خلق کرده با مدرسه ناشنوایان و مبتلایان اوتیسم کار می کند و به دانش آموزان ناشنوا کمک می کند تا احساسات را از طریق چهره زوئی تشخیص دهند.

محققان پروژه زوئی ، موتور متن به گفتار، کپچر صورت، نرم افزار مدل سازی و الگوریتم آموزش سیستم را ساخته اند.

همچنین از زبانهای مختلف برنامه نویسی با بیس C++ در نرم افزارهای داخل زوئی ستفاده شده است.تیم توسعه دهنده زوئی ، فعلا نقشه ای برای توسعه کار با سیستم های اوپن سورس ندارد. البته کالیبراسیون زوئی روی شاخه لینوکس قرار داده شده و موتور تبدیل متن به گفتار و مدل سازی چهره روی سرور لینوکس قرار داده شده است.

واسط کاربر نهایی زوئی بر اساس کلاینت جاوا تعبیه شده که چند ده مگابایت بیشتر حجم ندارد بنابراین چند پلتفورمه تعریف شده و قابلیت قراردادن آن روی گوشی هوشمند و تبلت وجود دارد.

چشم انداز منشی واقعی با سیستم های خودکار پاسخگو ممکن است منجر به ایجاد کاربرانی شود که به جای هیجان با ترس و بیم مواجه شوند و استینگر می گوید در نهایت می گوید در هراس از سوء استفاده از این سیستم سهیم است.

منبع: زد دی نت

5656

کد مطلب 283421