دانشمندان با استفاده از تکنولوژی اسکن، هوش مصنوعی و ترکیب کننده های کلامی الگوهای مغزی را به گویش کلامی قابل درک تبدیل کردند، کاری که می تواند به کسانی که صدا ندارند صدا ببخشد!

جای تاسف است که استیون هاوکینگ زنده نیست تا این اتفاق را به چشم ببیند چون این تکنولوژی می توانست به او کمک زیادی بکند! این سیستم کلامی جدید که توسط محققین در لابراتوار پردازش صوتی عصبی دانشگاه کلمبیا در شهر نیویورک ایجاد شده است ابداعی است که شاید فیزیک دانان نیز بتوانند از آن بهره های زیادی ببرند.

استیون هاوکینگ به بیماری اسکلروزی جانبی آمیوتروپیک یا ALS مبتلا بود که یک بیماری عصبی حرکتی است و باعث از دست رفتن توان صحبت کردن می شود اما او با استفاده از کامپیوتر و یک ترکیب کننده ی کلامی توانست ارتباط گفتاری برقرار کند.

هاوکینگ با استفاده از سوئیچی که به عینکش وصل شده بود می توانست کلمات را روی کامپیوتر انتخاب کند تا به وسیله ی یک ترکیب کننده ی صوتی خوانده شوند. شاید کمی خسته کننده به نظر برسد اما همین روش به هاوکینگ امکان تولید کلمات زیادی در هر دقیقه را می داد.

اما تصور کنید هاوکینگ مجبور نبود کلمات را به صورت فیزیکی انتخاب کند. البته بعضی اشخاص با وجود اینکه به ALS مبتلا هستند به گونه ای در این سندروم گیر کرده اند و به ندرت می توانند از این آسیب به حالت بهتری بازگردند و ممکن است دیگر توانایی های لازم برای کنترل کامپیوتر را نداشته باشند حتی اگر با تکان دادن جزئی از صورت باشد!

مطالعه
بلاک چین به زبان ساده

حالت ایده آل این است که یک سیستم صوت مصنوعی بتواند افکار شخص را دریافت کرده و با آنها مستقیما کلام را بسازد و نیاز کنترل کامپیوتر را برطرف نماید.

تحقیقی که اخیراً منتشر شده است ما را یک گام به این هدف نزدیک تر می کند اما در عوض دریافت افکار درونی فرد برای بازسازی کلام از الگوهای مغزی ایجاد شده هنگام شنیدن کلام استفاده می کند.

برای پیشنهاد این کار عصب شناسی به نام نیما مسگرانی و همکارانش پیشرفت های نوین در یادگیری عمیق را با تکنولوژی ترکیب کلامی ترکیب کرده اند. محیط کاربری مغزی-کامپیوتری حاصل از این کار اگر چه هنوز کامل نیست اما الگوهای دریافتی از مغز که مستقیما از قشر شنوایی مغز گرفته و توسط کدگشای مجهز به هوش مصنوعی یا ترکیبگر کلامی،  رمزگشایی می شود در نهایت می تواند کلامی قابل درک را ایجاد کند. این کلام صدای رباتیکی دارد اما حدود سه تا چهار شنونده توانستند محتوای آن را بفهمند. این یک اتفاق هیجان انگیز است! اتفاقی که می تواند در نهایت به افرادی که قدرت تکلم خود را از دست داده اند کمک بزرگی کند!

دستگاه عصب خوانی مسگرانی در واقع گفته های پنهان شخص را مستقیما به کلام ترجمه نمی کند. متاسفانه از نظر علمی هنوز به چنین جایگاهی نرسیده ایم. در عوض این سیستم می تواند هنگام شنیدن صدای ضبط شده ی صحبت مردم واکنش های شناختی مشخص فرد را ثبت کند. باید شبکه ی عصبی به صورت عمیق رمزگشایی شود و پس از ترجمه به این سیستم امکان بازسازی کلام را بدهید.

مطالعه
نرم افزار مدیریت فایل اندروید گوگل اکنون قابلیت پشتیبانی از دستگاه های USB را نیز دارد!

منبع: gizmodo.com

مترجم: سیده مینا سیدصالحی

ارسال یک پاسخ

لطفا دیدگاه خود را وارد کنید!
لطفا نام خود را در اینجا وارد کنید