ИЕРАРХИЧЕСКИЙ СВЯЗАННЫЙ СИНТАКСИЧЕСКИЙ КОРПУС ДЛЯ ХУДОЖЕСТВЕННЫХ ТЕКСТОВ НА УЗБЕКСКОМ ЯЗЫКЕ

Узбекский язык, художественные тексты, синтаксическая связь, древовидный корпус, лемматизация, морфологическая разметка, универсальные зависимости, платформа INCEpTION, аннотация.

Авторы

В данной статье рассматривается вопрос создания и совершенствования корпуса синтаксических иерархических деревьев на основе узбекских литературных произведений. Был разработан корпус, состоящий из 30 высококачественных предложений, отобранных из сборника повестей современного узбекского писателя Шухрата Маткарима. Эти предложения были аннотированы двумя экспертами-специалистами с использованием платформы INCEpTION, включая лемматизацию, морфологическую разметку и определение синтаксических связей. В результате впервые был создан корпус синтаксических иерархических деревьев для узбекского повествовательного стиля и проанализированы его синтаксические особенности