O‘ZBEK TILI BADIIY MATNLARI UCHUN IYERARXIK BOG‘LIQLIK DARAXTI KORPUSI

O‘zbek tili, badiiy matnlar, sintaktik bog‘lanish, daraxt korpusi, lemmatizatsiya, morfologik belgilash, Universal Dependencies, INCEpTION platformasi, annotatsiya.

Mualliflar

Ushbu maqolada o‘zbek adabiy asarlaridan olingan sintaktik iyerarxik daraxt korpusini yaratish va uni takomillashtirish masalasi o‘rganiladi. Zamonaviy o‘zbek yozuvchisi Shuhrat Matkarimning qissalar to‘plamidan saralab olingan 30 ta yuqori sifatli jumlalardan tashkil topgan korpus ishlab chiqildi. Bu jumlalar INCEpTION platformasidan foydalanib, ikki ekspert mutaxassis tomonidan annotatsiyalangan bo‘lib, lemmatizatsiya, morfologik teglash va sintaktik bog‘liqliklarni aniqlashlarni o‘z ichiga oladi. Natijada, o‘zbek hikoya uslubi uchun ilk bor sintaktik iyerarxik daraxti korpusi yaratildi va undagi sintaktik xususiyatlar tahlil qilindi.