Aniq fanlar

ATOQLI OTLARNI ANIQLASHNING ANNOTATSIYA QOIDALARI VA MATEMATIK MODELLARI

token, indekslash, agglutinativ, annotatsiya, obyekt

Mualliflar

  • Bobur Allaberdiyev Mirzo Ulug‘bek nomidagi O‘zbekiston milliy universiteti, Toshkent, O‘zbekiston O‘zbekiston xalqaro islomshunoslik akademiyasi, Uzbekistan
  • San’atbek Matlatipov Mirzo Ulug‘bek nomidagi O‘zbekiston milliy universiteti, Toshkent, O‘zbekiston, Uzbekistan
  • Mujgonabonu Mavlonova Mirzo Ulug‘bek nomidagi O‘zbekiston milliy universiteti, Toshkent, O‘zbekiston, Uzbekistan

Ushbu maqolada matnlardagi atoqli otlarni (Named Entity) aniqlash uchun annotatsiya qoidalari,
BIO markalash tizimi, matematik modellar (CRF, BiLSTM-CRF, Transformer), agglutinativ
tillarga xos xususiyatlar, hamda real O‘zbek matnlari misolida amaliy misollar bayon qilinadi.
Model qurilishining formal ifodasi, ehtimollik asosidagi yondashuv, annotatorlar o‘rtasidagi kelishuv
(Cohen’s Kappa) va annotatsiya sifatini oshirish bo‘yicha usullar ham yoritiladi. Maqola natural
tilni qayta ishlash (NLP) yo‘nalishida NER tizimi yaratish istagidagi tadqiqotchilar uchun metodik
qo‘llanma sifatida xizmat qiladi.