تهران ، ولیعصر
021-987654

گوگل، اپل، متا، آمازون و مایکروسافت برای بهبود تشخیص صدا به هم می پیوندند

Google اعلام کرد که به پروژه دسترسی به گفتار می‌پیوندد تا به توسعه سیستم‌های تشخیص گفتار پیشرفته کمک کند که می‌تواند نیازهای افراد دارای اختلال گفتار را برآورده کند.

تشخیص گفتار برای دسترسی به وب‌سایت‌ها، ترجمه گفتار، دستیارهای صوتی و برای دستگاه‌های عامل استفاده می‌شود.

اما اگر الگوی گفتار کاربر تحت تأثیر بیماری لو گهریگ، بیماری پارکینسون یا سندرم داون از جمله دلایل دیگر باشد، ممکن است کارکرد دستگاه‌ها و سرویس‌های فعال صوتی دشوار باشد.

این پروژه با ایجاد پروژه‌ای که پنج شرکت فناوری را گرد هم می‌آورد که می‌توانند برای حل چالش ایجاد تشخیص گفتار برای کسانی که الگوهای گفتاری غیر استاندارد دارند، با هم همکاری کنند، تغییر وضعیت می‌دهد.

این پروژه ابتدا با انگلیسی کار می کند و سپس به زبان های دیگر گسترش می یابد.

وب سایت پروژه دسترسی به گفتار توضیح داد:

«…بدون داده های متنوع و معرف، مدل های ML نمی توانند یاد بگیرند که چگونه تنوع گفتار را درک کنند. هدف این پروژه تغییر آن با ایجاد مجموعه داده های مورد نیاز برای آموزش موثرتر این مدل های یادگیری ماشینی است.”

پروژه جدید برای دسترسی پیشرفته

پروژه دسترسی به گفتار یک برنامه جدید توسط دانشگاه ایلینویز و پنج شرکت فناوری است که با یکدیگر برای ایجاد فناوری کار می‌کنند که فناوری فعال‌سازی صوتی را برای گروه وسیع‌تری از مردم در دسترس قرار می‌دهد.

شرکت‌های زیر اعضای طرح جدید هستند:

  • آمازون
  • سیب
  • Google
  • متا
  • مایکروسافت

وب سایت پروژه مشکلی را که آنها حل خواهند کردبیان کرد >:

«سیستم‌های تشخیص گفتار امروزی، مانند دستیارهای صوتی و ابزارهای ترجمه، همیشه افرادی را با الگوهای گفتاری متنوعی که اغلب با ناتوانی‌ها مرتبط هستند، تشخیص نمی‌دهند.

این شامل گفتار تحت تأثیر بیماری لو گهریگ یا اسکلروز جانبی آمیوتروفیک، بیماری پارکینسون، فلج مغزی و سندرم داون است.

در واقع، بسیاری از افراد در این جوامع و سایر جوامع ممکن است نتوانند از جدیدترین ابزارهای تشخیص گفتار بهره مند شوند.”

راه حل دسترسی به تشخیص گفتار

پروژه دسترسی به گفتار نمونه هایی از الگوهای صوتی مختلف را جمع آوری می کند و یک مجموعه داده ناشناس ایجاد می کند.

سپس از این مجموعه داده برای ایجاد مدل‌های یادگیری ماشینی استفاده می‌شود که می‌توانند انواع الگوهای صوتی را که در حال حاضر استفاده نمی‌شوند، بهتر درک کنند.

پروژه Euphonia

Google ابتکار دستیابی مبتنی بر هوش مصنوعی خود را در سال ۲۰۱۹ به نام Project Euphonia راه اندازی کرد. این پروژه به Google کمک کرد تا تشخیص گفتار را برای درک گفتار غیر استاندارد انگلیسی تطبیق دهد.

این پروژه ضبط‌های الگوی گفتار را از بیش از ۲۰۰۰ شرکت‌کننده در پروژه Google جمع‌آوری کرد.

یکی از کمک‌های Google به پروژه دسترسی به گفتار این است که شرکت‌کنندگان در پروژه Euphonia را آسان می‌کند تا نمونه‌های الگوی گفتار خود را به‌طور ناشناس در پروژه دسترس‌پذیری جدید مشارکت دهند.

اطلاعیه Google بیان شده است :

“امید ما این است که با در دسترس قرار دادن این مجموعه داده ها برای تیم های تحقیق و توسعه، بتوانیم به بهبود سیستم های ارتباطی برای همه، از جمله افراد دارای معلولیت کمک کنیم.”

تشخیص گفتار پیشرفته

این پروژه جدید نقطه عطفی در ایجاد فناوری است که می تواند به افرادی که الگوهای گفتاری غیر استاندارد دارند خدمت کند.

آنچه این پروژه جدید را هیجان‌انگیز می‌کند این است که هر پنج شرکت فناوری با هم برای حل مشکلات تشخیص گفتار به جای کار در سیلوهای جداگانه کار خواهند کرد.

بهبود دسترسی به دستگاه‌ها و اینترنت برای جوامع محروم به نفع همه است.


نقل‌ها

اعلامیه Google

روش‌های جدیدی که در حال کارکرد تشخیص گفتار هستیم همه

وب سایت پروژه

وب‌سایت رسمی پروژه دسترسی به گفتار

تصویر ویژه توسط Shutterstock/Krakenimages.com

مقالات مرتبط
پاسخ دهید

آدرس ایمیل شما منتشر نخواهد شد.قسمتهای مورد نیاز علامت گذاری شده اند *