Aniq fanlar

O‘ZBEK TILI UCHUN UNIVERSAL BOG‘LIQLIK DARAXTI KORPUSI ASOSIDA CHUQUR BI-AFFIN TOBELIK TAHLILINING NEYRON MODELI

Universal Bog’liqliklar, o‘zbek tili, daraxtsimon korpus, tobelik tahlili, chuqur bi-affin neyron diqqat mexanizminig neyron modeli

Авторы

  • San’atbek Matlatipov Mirzo Ulug‘bek nomidagi O‘zbekiston milliy universiteti, Toshkent, O‘zbekiston, Узбекистан

daraxtsimon korpusi va uning asosida qurilgan chuqur bi-affin neyron tobelik tahlil modeli
taqdim etiladi. Korpus o‘zbek adabiy va ilmiy-ommabop matnlaridan tanlangan 686 ta gapni
(taxminan 7 800 ta token) o‘z ichiga oladi va INCEpCTION platformasida tilshunoslar hamda
NLP muhandislari tomonidan yuqori annotatorlararo moslik (lemmatizatsiya va UPOS bo‘yicha
> 95%) bilan belgilandi. Sintaktik tahlil uchun [3] tomonidan taklif etilgan chuqur bi-affin neyron
diqqat mexanizmi arxitekturasiga asoslangan model qurilib, BiLSTM enkoder va bosh-tobe so‘z
juftliklari uchun bi-affin baholash funksiyasi yordamida tobelik grafigi optimallashtirildi. Stanza
kutubxonasiga integratsiyalashgan neyron quvur (tokenizatsiya, POS-tagging, morfologik tahlil
va dependency parsing) bo‘yicha olib borilgan tajribalar morfologiya kuchli bo’lgan sharoitida
Unlabeled Attachment Score (UAS) 69:21% va Labeled Attachment Score (LAS) 53:21% natijalarini
ko‘rsatdi; bu ko‘rsatkichlar o‘zbek tili uchun chuqur neyron tobelik tahlilining birinchi mustahkam
bazaviy modeli sifatida taklif etiladi va keyingi matematik hamda amaliy tabiiy tillar jarayoni
tadqiqotlari uchun poydevor bo‘lib xizmat qiladi.