Ijtimoiy-gumanitar fanlar

O‘ZBEK TILI SHEVALARINI AVTOMATIK NUTQNI ANIQLASH (ASR) TIZIMLARIDA TANIB OLISH SAMARADORLIGI TAHLILI

avtomatik nutqni tanib olish, ASR, Speech-to-Text, o‘zbek tili shevalari, Word Error Rate (WER), Whisper Large, Kotib STT, dialektal korpus, fine-tuning.

Mualliflar

  • Xurmatoy MULLABOYEVA Magistrant, Toshkent davlat o‘zbek tili va adabiyoti universiteti, Toshkent, O‘zbekiston, Uzbekistan

Ushbu maqolada o‘zbek tili sheva xilma-xilligining avtomatik nutqni tanib olish (ASR) va subtitrlash tizimlari samaradorligiga ta’siri qiyosiy tadqiq etilgan. Jonli dialektal nutqda intellektual modellarning aniqlik darajasi pasayishi mavzuning dolzarbligini belgilaydi. Tadqiqotda qarluq, qipchoq va o‘g‘uz lahjalari audio namunalari bazasida Kotib STT, OmoN STT, Rubai STT va OpenAI Whisper Large modellarining imkoniyatlari statistik tahlil qilindi. Natijalarga ko‘ra, adabiy tilda aniqlik 90–95% ni tashkil etsa-da, variativlik yuqori bo‘lgan shevalarda bu ko‘rsatkich 25–30% gacha pasayadi. Ayniqsa, affiksal reduksiya va unlilar almashishi leksik hamda punktuatsion xatoliklarni keltirib chiqarmoqda. Muammoni bartaraf etish uchun shevalarga xos akustik-lingvistik korpuslarni kengaytirish va modellarni hududiy xususiyatlarga moslab qayta o‘qitish zarurligi ilmiy asoslangan.