نوآوریهای همافزا، الگوریتمهای نوین
این سرویس هوش مصنوعی برای تبدیل گفتار موجود در فیلمهای ورودی به متن مکتوب و تعیین زمان دقیق شروع و پایان هر کلمه یا جمله طراحی شده است. نحوه کار به این صورت است که محتوای صوتی ویدئو توسط الگوریتمهای پیشرفته بازشناسی گفتار (ASR) تحلیل شده و متن خام تولید میگردد. سپس با استفاده از فرآیند همترازی اجباری، زمان دقیق بیان هر واحد کلامی با دقت بالا مشخص میشود. ورودی این سرویس یک فایل ویدیویی یا صوتی است و خروجی آن یک فایل زیرنویس استاندارد (مانند SRT یا VTT) است که شامل متن کامل مکالمات به همراه برچسبهای زمانی دقیق برای هر کلمه یا بخش از دیالوگ میباشد. هدف اصلی این سرویس بازشناسی و تولید زیرنویسهایی با زمانبندی دقیق برای بهبود دسترسیپذیری محتوای ویدیویی است.