Это устаревшая версия, которая была опубликована 2025-09-24. Прочтите самую последнюю версию.
Ijtimoiy-gumanitar fanlar

GRADIENT BOOSTING METODI VOSITASIDA O‘ZBEK TILI MATNLARINI SENTIMENT TAHLIL QILISH

Gradient Boosting, sentiment Analysis, data cleanup, tokenization, property output, TF-IDF, Bag-of-Words, word embedding, morphological normalization.

Авторы

Версии

В данной статье исследуется эффективность и возможности сентиментального анализа текстов на узбекском языке с использованием метода Gradient Boosting (GB). Тексты в корпусе были подготовлены заранее посредством этапов очистки, токенизации и нормализации. Точность модели, созданной на основе алгоритма градиентного усиления, оценивалась экспериментальными испытаниями на основе таких метрик, как precision, recall и F1-score. Благодаря способности ГБ исправлять последовательные ошибки, сложные словосочетания в узбекском языке (например, "нехорошо," "ничего плохого") были четко интерпретированы. Такие методы, как морфологическая нормализация (выделение корней слов) и балансировка данных, повысили надежность модели на 4%. Результаты исследования подтверждают, что они могут быть использованы в системах анализа отзывов клиентов, мониторинга социальных сетей и автоматической оценки в языковых услугах.