O‘ZBEK TILI KORPUSIDA NERNI TEGLASHNING UMUMIY QOIDALARI

NLP, NER, nomlangan obyekt, atoqli ot, korpus, annotatsiya, ML, DL, teg, model.

Mualliflar

  • Botir ELOV Madina SAMATBOYEVA
    dilnoza.turamuratovna@mail.com
    Toshkent davlat o‘zbek tili va adabiyoti universiteti dotsenti, PhD, Toshkent davlat o‘zbek tili va adabiyoti universiteti tayanch doktoranti , Uzbekistan

Ushbu maqola o‘zbek tili korpusida nomlangan obyektlarni tanib olish (NER – Named Entity Recognition) tizimlarini yaratish va ularni teglash jarayonlariga bag‘ishlangan. Maqolada NER tizimlarining ahamiyati, ularning tabiiy tilni qayta ishlashdagi roli, shuningdek, o‘zbek tilida ushbu tizimlarni ishlab chiqishdagi mavjud qiyinchiliklar va muammolar tahlil qilinadi. O‘zbek tilining morfologik va sintaktik xususiyatlari, shuningdek, fonetik va leksik farqlari NER tizimlarining aniqligini oshirishda muhim omillar hisoblanadi. Shuningdek, o‘zbek tilida NER tizimlarini yaratish va ularni samarali ishlashini ta'minlash uchun zarur bo‘lgan metodologiyalar va amaliy yondoshuvlar ko‘rib chiqiladi. Taqdim etilgan materiallar va tahlillar texnik xodimlar, kompyuter tilshunoslari va sohada ishlayotgan tadqiqotchilar uchun foydali manba bo‘lishi mumkin.