نوآوریهای همافزا، الگوریتمهای نوین
هدف این سرویس تشخیص دقیق نوع کلمات (مانند اسم، فعل، صفت، قید، حرف اضافه و...) برای تمامی واژههای موجود در جملات است. این سرویس به عنوان یک پایه قوی، زیرساختهایی نظیر استخراج کلمات کلیدی، شناسایی موجودیتهای نامدار، خلاصهسازی و فهم عمیق متون را فراهم میآورد. این قابلیت به صورت تخصصی برای تشخیص نوع کلمات در هر دو گونه ادبیات رسمی و محاورهای فارسی طراحی شده است. ورودی این سرویس یک رشته متنی خام (جمله یا پاراگراف) به زبان فارسی است و خروجی آن، تگگذاری دستوری (Part-of-Speech Tagging) هر کلمه در ورودی است. نحوه محقق شدن این سرویس از طریق بهرهگیری از مدلهای زبان بزرگ مبتنی بر ترنسفورمر است که بر روی پیکرههای وسیع و متنوع زبان فارسی آموزش دیدهاند تا توانایی تحلیل بافت و نقش دستوری کلمات را در هر شرایطی داشته باشند.