Ijtimoiy-gumanitar fanlar

ТЕОРЕТИЧЕСКИЕ И ПРАКТИЧЕСКИЕ ОСНОВЫ СОЗДАНИЯ ПРАВОВОЙ СИСТЕМЫ ВОПРОСОВ И ОТВЕТОВ НА УЗБЕКСКОМ ЯЗЫКЕ НА ОСНОВЕ ОПЫТА ТЮРКСКИХ ЯЗЫКОВ

обработка естественного языка, системы юридических вопросов и ответов, юридический корпус, гибридный подход, большая языковая модель, искусственный интеллект, семантическая роль, лемматизация, морфологическая разметка, токенизация.

Авторы

В статье анализируются ресурсы обработки естественного языка (BERTurk, KazNERD, UD Treebanks), сформированные
на турецком и казахском языках, и предлагается теоретическая и практическая модель создания на их основе системы
юридических вопросов и ответов (Legal QA, LQA) на узбекском языке. Архитектура основана на гибридном принципе:
поиск информации (BM25/dense), логическое рассуждение (трансформаторы) и фильтрация ограничений на основе
правил (нормативная проверка). Рассматриваются агглютинативная морфология узбекского языка, порядок слов SOV,
формульные конструкции официально-юридического дискурса и интеграция требований к аннотированию на основе UD
в систему LQA. В результате разработана интегрированная архитектура, корпус и дорожная карта требований к
аннотированию для узбекской системы LQA.