Google اعلام کرد که به پروژه دسترسی به گفتار میپیوندد تا به توسعه سیستمهای تشخیص گفتار پیشرفته کمک کند که میتواند نیازهای افراد دارای اختلال گفتار را برآورده کند.
تشخیص گفتار برای دسترسی به وبسایتها، ترجمه گفتار، دستیارهای صوتی و برای دستگاههای عامل استفاده میشود.
اما اگر الگوی گفتار کاربر تحت تأثیر بیماری لو گهریگ، بیماری پارکینسون یا سندرم داون از جمله دلایل دیگر باشد، ممکن است کارکرد دستگاهها و سرویسهای فعال صوتی دشوار باشد.
این پروژه با ایجاد پروژهای که پنج شرکت فناوری را گرد هم میآورد که میتوانند برای حل چالش ایجاد تشخیص گفتار برای کسانی که الگوهای گفتاری غیر استاندارد دارند، با هم همکاری کنند، تغییر وضعیت میدهد.
این پروژه ابتدا با انگلیسی کار می کند و سپس به زبان های دیگر گسترش می یابد.
وب سایت پروژه دسترسی به گفتار توضیح داد:
«…بدون داده های متنوع و معرف، مدل های ML نمی توانند یاد بگیرند که چگونه تنوع گفتار را درک کنند. هدف این پروژه تغییر آن با ایجاد مجموعه داده های مورد نیاز برای آموزش موثرتر این مدل های یادگیری ماشینی است.”
پروژه جدید برای دسترسی پیشرفته
پروژه دسترسی به گفتار یک برنامه جدید توسط دانشگاه ایلینویز و پنج شرکت فناوری است که با یکدیگر برای ایجاد فناوری کار میکنند که فناوری فعالسازی صوتی را برای گروه وسیعتری از مردم در دسترس قرار میدهد.
شرکتهای زیر اعضای طرح جدید هستند:
- آمازون
- سیب
- متا
- مایکروسافت
وب سایت پروژه مشکلی را که آنها حل خواهند کردبیان کرد >:
«سیستمهای تشخیص گفتار امروزی، مانند دستیارهای صوتی و ابزارهای ترجمه، همیشه افرادی را با الگوهای گفتاری متنوعی که اغلب با ناتوانیها مرتبط هستند، تشخیص نمیدهند.
این شامل گفتار تحت تأثیر بیماری لو گهریگ یا اسکلروز جانبی آمیوتروفیک، بیماری پارکینسون، فلج مغزی و سندرم داون است.
در واقع، بسیاری از افراد در این جوامع و سایر جوامع ممکن است نتوانند از جدیدترین ابزارهای تشخیص گفتار بهره مند شوند.”
راه حل دسترسی به تشخیص گفتار
پروژه دسترسی به گفتار نمونه هایی از الگوهای صوتی مختلف را جمع آوری می کند و یک مجموعه داده ناشناس ایجاد می کند.
سپس از این مجموعه داده برای ایجاد مدلهای یادگیری ماشینی استفاده میشود که میتوانند انواع الگوهای صوتی را که در حال حاضر استفاده نمیشوند، بهتر درک کنند.
پروژه Euphonia
Google ابتکار دستیابی مبتنی بر هوش مصنوعی خود را در سال ۲۰۱۹ به نام Project Euphonia راه اندازی کرد. این پروژه به Google کمک کرد تا تشخیص گفتار را برای درک گفتار غیر استاندارد انگلیسی تطبیق دهد.
این پروژه ضبطهای الگوی گفتار را از بیش از ۲۰۰۰ شرکتکننده در پروژه Google جمعآوری کرد.
یکی از کمکهای Google به پروژه دسترسی به گفتار این است که شرکتکنندگان در پروژه Euphonia را آسان میکند تا نمونههای الگوی گفتار خود را بهطور ناشناس در پروژه دسترسپذیری جدید مشارکت دهند.
اطلاعیه Google بیان شده است :
“امید ما این است که با در دسترس قرار دادن این مجموعه داده ها برای تیم های تحقیق و توسعه، بتوانیم به بهبود سیستم های ارتباطی برای همه، از جمله افراد دارای معلولیت کمک کنیم.”
تشخیص گفتار پیشرفته
این پروژه جدید نقطه عطفی در ایجاد فناوری است که می تواند به افرادی که الگوهای گفتاری غیر استاندارد دارند خدمت کند.
آنچه این پروژه جدید را هیجانانگیز میکند این است که هر پنج شرکت فناوری با هم برای حل مشکلات تشخیص گفتار به جای کار در سیلوهای جداگانه کار خواهند کرد.
بهبود دسترسی به دستگاهها و اینترنت برای جوامع محروم به نفع همه است.
نقلها
اعلامیه Google
روشهای جدیدی که در حال کارکرد تشخیص گفتار هستیم همه
وب سایت پروژه
وبسایت رسمی پروژه دسترسی به گفتار
تصویر ویژه توسط Shutterstock/Krakenimages.com