ИСПОЛЬЗОВАНИЕ ЭКСТРАЛИНГВИСТИЧЕСКИХ ТЕГОВ ПРИ РАЗРАБОТКЕ ВНУТРЕННЕГО КОРПУСА (ПОДКОРПУСА)
В данной статье рассматривается использование экстралингвистических тегов при разработке внутреннего корпуса (подкорпуса). Внутренний корпус (подкорпус) — это часть более крупного лингвистического корпуса, которая выделяется в соответствии с определенными критериями. В данном случае национальный корпус включает в себя различные внутренние корпуса. Внутренний корпус позволяет лингвистам и исследователям сосредоточиться на конкретных аспектах языка и изучить его подробно. Использование внутренних корпусов позволяет проводить точный и целенаправленный анализ конкретных языковых данных.
1. Christ O. A Modular and Flexible Architecture for an Integrated Corpus Query System Oliver Christ // Proceedings of COMPLEX'94 3rd Conference on Computational Lexicography and Text Research Budapest, Hungary, July 7{10, 1994, pp. 2332.
2. https://en.wikipedia.org/wiki/Corpus_manager
3. https://guides.libraries.psu.edu/c.php?g=1139753&p=8391284
4. The Uppsala Russian Corpus: http://www.slaviska.uu.se/korpus.htm (05.12.2024); The Lancaster-Oslo/Bergen Corpus of British English, LOB: http://clu.uni.no/icame/manuals/LOB/INDEX.HTM (accessed: 04.12.2024);
5. https://www.english-corpora.org/bnc/; Brown Corpus:
6. https://uzschoolcorpara.uz/
7. https://www.sketchengine.eu/
8. Manios K, Nenadic G, Spasic I, Ananiadou S. An Integrated Term-Based Corpus Query System. In {EACL} 2003, 10th Conference of the European Chapter of the Association for Computational Linguistics, April 12-17, 2003, Agro Hotel, Budapest, Hungary. - 2003. p. 243-250.
Copyright (c) 2025 Вестник УзМУ

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-ShareAlike» («Атрибуция — Некоммерческое использование — На тех же условиях») 4.0 Всемирная.






.jpg)

2.png)





