AI-UniBot: мощный поиск и актуальность данных с Cosmos DB
Мы в Lizard Soft продолжаем внедрять в наши продукты инновации в области Искусственного Интеллекта (АI) и обработки данных. Теперь – в механизм индексации контента, с которым работает Персональный ассистент & Корпоративный чат-бот UniBot. Этот механизм значительно усиливает архитектуру Retrieval Augmented Generation (RAG). А она, в свою очередь, позволяет Large Language Model (LLM), подобно ChatGPT, использовать самую мощную систему поиска информации для обеспечения максимальной точности ответов.
Интеграция такой системы поиска информации в UniBot v2 усиливает контроль над данными, используемыми LLM при формулировании ответов. Для компаний это значит, что способности генеративного AI можно ограничить контентом компании, получаемым из векторизированных документов, изображений и остальных форматов данных. При условии, что для этого контента есть соответствующие модели встраивания.
До этого обновления UniBot v2 использовал Azure Account Storage Blobs для хранения промежуточных результатов индексации, что было достаточно для многих ситуаций. Однако, в связи с ростом объемов данных и повышением требований к обработке этих данных, мы добавили поддержку Cosmos DB. Так мы обеспечили не только необходимую гибкость и масштабируемость, но и оптимизировали процесс индексации для огромных баз данных.
Ключевым преимуществом такого решения является возможность управлять процессом индексации вашими IТ-администраторами: они теперь могут изменять количество и порядок шагов, что делает систему индексации адаптивной. А благодаря этому предприятия могут быстро интегрировать новейшие АI-модели и embedding-модели без необходимости переиндексировать весь массив информации. И это значительно экономит время и ресурсы.
Рассмотрим практическое применение:
- банковское учреждение, использующее UniBot v2, может оперативно обновлять информацию в колл-центре, учитывая текущие изменения в продуктах и услугах.
- юридическая фирма может значительно повысить производительность поиска по документам правовой базы (законам, подзаконным актам, судебным решениям и т. п.), а это – ключевой фактор эффективности работы юристов.
- фармацевтические компании могут ускорить анализ научных данных для своих разработок, опираясь на точную и быструю индексацию научных публикаций и доступных клинических данных – как отечественных, так и иностранных.
Короче говоря, обновление в UniBot v2 – это новые возможности, благодаря которым бизнесы могут управлять большими объемами данных. При этом информация, используемая АI-системами, обеспечена максимально точными и актуальными данными. Масштабируемость и адаптивность новой архитектуры индексации гарантирует, что предприятия могут быстро реагировать на изменения, не тратя лишних усилий на переиндексацию. Так что для выполнения их бизнес-задач потенциал АI будет применяться в полную силу.