Ijtimoiy-gumanitar fanlar

N-GRAM YORDAMIDA TURG‘UN LISONIY BIRLIKLARNI ANIQLASH BOSQICHLARI

frazeologik birlik, idiomalar, korpus lingvistikasi, kollokatsiya, o‘zbek tili korpusi, avtomatik aniqlash

Mualliflar

  • Umidjon YODGOROV, Toshkent davlat o‘zbek tili va adabiyoti universiteti o‘qituvchisi, Uzbekistan

Maqolada o‘zbek tilidagi turg‘un lisoniy birliklarni milliy matn korpusi asosida avtomatik aniqlashning ilmiy-metodik asoslari yoritiladi. Tadqiqotda 2–5 so‘zli N-gramlar statistik ko‘rsatkichlar orqali saralanib, lingvistik mezonlar va kontekstual modellar yordamida frazeologik va erkin birliklarga tasniflandi. Taklif etilgan yondashuv 90% aniqlik ko‘rsatkichiga erishdi hamda yuqori bog‘langan birliklarning muhim qismi frazeologik tabiatga egaligini tasdiqladi. Olingan natijalar avtomatik frazeologik lug‘atlar yaratish, korpus lingvistikasi amaliyoti va NLP tizimlarida ko‘p so‘zli birikmalarni qayta ishlash sifatini oshirishga xizmat qiladi.