تهران ، ولیعصر
021-987654

مرورگر Edge تمام تصاویر وب را با هوش مصنوعی بهبود می بخشد

مایکروسافت بینگ یک فناوری هوش مصنوعی جدید را معرفی کرد که تجربه تصویر ۴K را از طریق مایکروسافت اج به وب‌سایت‌ها می‌آورد و به‌طور خودکار تصاویر وب‌سایت را بهبود می‌بخشد. این فناوری که Turing Image Super-Resolution نام دارد، باعث می شود تصاویر با وضوح بالا نمایش داده شوند، صرف نظر از اینکه تصویر اصلی چقدر ضعیف باشد.

فناوری جدید توسط تیم توسعه Project Turing AI مایکروسافت توسعه یافته است.

از قبل در نقشه های Bing استفاده شده است

فناوری جدید در حال حاضر در نقشه‌های بینگ استفاده می‌شود تا کیفیت تصاویر هوایی ماهواره‌ای آن‌ها را واضح‌تر کند.

در زیر مقایسه ای از تصاویر هوایی از مقر Google در Mountain View، CA است.

عکس صفحه Bing Maps در سمت چپ و تصویر مربوطه از Google Maps در سمت راست است:

Bing Maps در مقابل Google Maps

Side by side comparison of Bing Maps versus Google Maps Aerial images

چگونه مایکروسافت فناوری را ساخت

چهار دیدگاه مهم وجود داشت که منجر به موفقیت مدل شد.

  1. اریاب‌گذاران انسانی
  2. مدلسازی نویز
  3. از دست دادن ادراکی و GAN
  4. Transformers for Vision: Enhance and Zoom

ارزیاب های انسانی

مایکروسافت متوجه شد که معیارهای مورد استفاده برای سنجش موفقیت مدل‌های مرتبط با تصویر با ادراک بصری انسان همخوانی ندارد. بنابراین آنها یک ابزار مقایسه بصری کنار هم ایجاد کردند که از ارزیابی‌کننده‌های انسانی برای کمک به ارزیابی موفقیت مدل استفاده می‌کرد.

مدلسازی نویز

مایکروسافت این رویکرد را در پیش گرفت که با تصاویر با کیفیت بالا شروع کرد و سپس آنها را با اضافه کردن نویز به آنها کاهش داد و سپس به مدل آموزش داد تا تصویر را به حالت اولیه با کیفیت بالا برگرداند.

از دست دادن ادراکی و GAN

این بخشی از تلاش برای تراز کردن نتایج با دید انسان بود.

اعلامیه مایکروسافت بیان کرد:

«… متوجه شدیم که بهینه‌سازی مدل‌های ما صرفاً با استفاده از کاهش پیکسل بین تصاویر خروجی و تصاویر حقیقت زمین برای تولید خروجی بهینه که با ادراک چشم انسان همسو باشد کافی نیست.

در پاسخ، از دست دادن ادراکی و GAN را نیز معرفی کردیم و یک ترکیب وزنی بهینه از سه باخت را به عنوان یک تابع هدف تنظیم کردیم.

Transformers for Vision

مایکروسافت از قدرت ترانسفورماتورهایی استفاده کرد که در مدل‌های زبانی استفاده می‌شد، با تمرکز بر تقویت و بزرگ‌نمایی.

این به معنای بهبود تصویر و همچنین تمرکز بر بزرگ‌نمایی تصویر است که انجام آن کاری دشوار است.

معمولاً کوچک کردن یک تصویر آسان است. اما گرفتن یک تصویر کوچک و بزرگ کردن آن به طور کلی منجر به بزرگنمایی مصنوعات با وضوح پایین تصویر اصلی می شود.

بنابراین کاری که محققان انجام دادند این بود که سیستمی ایجاد کردند که می‌تواند داده‌های تصویر گمشده را از تصویر با وضوح پایین‌تر محاسبه و “بازیابی” کند و آن را به وضوح بالاتر برساند.

مایکروسافت فرآیند بزرگ‌نمایی تصویر را DeepZoom می‌نامد.

Edge: تلویزیون ۴K مرورگرهای وب

مایکروسافت این ویژگی جدید هوش مصنوعی را به عنوان راهی برای ارائه یک تجربه بصری ۴K در وب گردی و همچنین بهبود جلسات ویدیویی و عکس های خانوادگی آپلود شده در وب در نظر می گیرد.

این فناوری در حال حاضر در نسخه آزمایشی Edge به نام Edge موجود است قناری.

ویژگی جدید در ماه‌های آینده در نسخه اصلی مرورگر Edge ارائه خواهد شد.

نقل قول

اعلامیه مایکروسافت را بخوانید

Turing Image Super -رزولوشن

مقالات مرتبط
پاسخ دهید

آدرس ایمیل شما منتشر نخواهد شد.قسمتهای مورد نیاز علامت گذاری شده اند *