Новини

AI-UniBot: ефективний пошук без мовних бар’єрів

Ми вдосконалили ядро інтелектуального пошуку Персонального асистента & Корпоративного чат-бота AI-UniBot, запустивши мультимовний семантичний індекс на базі Штучного Інтелекту (АІ)
Ця технологія вирішує ключову проблему корпоративних знань: високу вартість та несприятливу тривалість індексації документів у багатомовному середовищі. При цьому точність пошуку – безкомпромісна. 

Раніше всі документи перекладалися англійською для єдиного індексу. І це вимагало значних обчислювальних ресурсів. Тепер же Адміністратори обирають одну основну мову та до трьох фундаментальних (додаткових) мов, для яких індексація відбувається без перекладу. Інакші мови автоматично перекладаються лише основною. Таким чином обсяг операцій скорочується на 70% – 99%. При цьому під час пошукового запиту система аналізує контекст усіма фундаментальними мовами водночас, забезпечуючи максимальну релевантність незалежно від мови оригіналу чи запиту.

Ми опрацювали такий ключовий кейс застосування: до певного часу Міжнародний Холдинг застосовував у роботі російську мову. Згодом було прийняте рішення про повний перехід на українську і водночас – активний вихід на англомовні ринки. В цій ситуації мультимовний індекс став критично важливим інструментом. 

Відтак Адміністратор вказав українську як основну мову, англійську та російську – як фундаментальні. Тож відпала потреба в перекладі російськомовних архівних документів та україномовних новостворених. Це скоротило витрати на індексацію на 75%, а час оновлення бази знань – з 12 годин до трьох. При цьому Співробітники отримують точні відповіді на запити українською чи англійською, навіть якщо документ створений інакшою мовою. 

Технічна реалізація виглядає так: під час налаштування Адміністратор AI-UniBot визначає основну мову (приміром, українську) та фундаментальні мови (наприклад, англійську, польську). Система аналізує кожен документ при завантаженні. Якщо мова файлу відповідає обраним фундаментальним, то бот індексує оригінал. Якщо ні, перекладає лише основною мовою.

Таким чином, щойно Користувач увів пошуковий запит, AI-UniBot визначає його мову. Далі шукає у всіх фундаментальних індексах одночасно через крос-мовні векторні представлення та переклади ключових слів. Наостанок бот ранжує результати, враховуючи семантичну близькість до запиту незалежно від мови оригіналу. При цьому це обмеження в одну-три мови й забезпечує баланс між швидкістю та якістю.

Коротше кажучи, мультимовний семантичний індекс в Персональному асистенті & Корпоративному чат-боті AI-UniBot радикально знижує вартість та скорочує час обробки багатомовних даних. При цьому точність пошуку зберігається. Відтак Компанії отримують можливість в єдиній інтелектуальній системі ефективно працювати як з архівами історій, так і з сучасними документами й міжнародними джерелами.

 

Є питання? Напишіть!