Preview

Tiltanym

Расширенный поиск

ОБРАБОТКА ТЕКСТОВ, ВКЛЮЧЕННЫХ В МЕТАРАЗМЕТКУ, НА СПЕЦИАЛЬНОМ КОМПЬЮТЕРНОМ ПРОГРАММНОМ ОБЕСПЕЧЕНИИ

https://doi.org/10.55491/2411-6076-2021-3-37-52

Аннотация

В статье рассматривается проблема металингвистической разметки текстов в составе Национального корпуса казахского языка. Описаны метаразметные системы казахских текстов. Метаразметка включает в себя ссылку на текст поисковым параметрам, характеризующих фрагмент в целом. Мета-разметка позволяет пользователю искать и выбирать тексты для составления внутренней структуры с указанными свойствами. Метаразмеченные материалы – незаменимый источник в научно-исследовательской работе по сбору текстового контента, относящегося к определенному периоду, стилю, автору, теме и др. Одной из главных задач при выборе литературы при создании корпуса является учет жанрового разнообразия текстов. Необходимость введения метаразметок при создании корпуса не вызывает споров. Они позволяют пользователю корпуса, особенно исследователям-корреспондентам, быстро и легко находить любую необходимую информацию.

Кроме того, лингвистическая информация по возможности извлекается со всех языковых уровней. А вот в корпусах предоставление лингвистической информации сразу по всем уровням крайне сложно и возможности ограничены. Тем не менее, в «корпусе текстов казахского языка» запущена программа метатекстовых разметок и лингвистических разметок – морфологических, словообразовательных, фонетических, морфосемантических разметок. В статье описываются виды метатекстов на корпус (23 параметра), механизмы функционирования программы лингвистических разметок.

Об авторах

А. А. Жанабекова
Институт языкознания имени А.Байтурсынулы
Казахстан

Алматы



А. К. Кожахметова
Институт языкознания имени А.Байтурсынулы
Казахстан

Алматы



Список литературы

1. Finegan E. LANGUAGE: its structure and use. – N.Y.: Harcourt Brace College Publishers, 2004.

2. Wikipedia – http://en.wikipedia.org/wiki/

3. McEnery T., Wilson, A. Corpus Linguistics. – Edinburgh: Edinburgh University Press, 2001.

4. Рыков В.В. Корпус текстов как реализация объектно-ориентированной парадигмы // Труды Международного семинара Диалог-2002. – М.: Наука, 2002.

5. Захаров В.П. Корпусная лингвистика: Учебно-метод. пособие. – СПб., 2005.

6. Савчук С.О. Метатекстовая разметка в Национальном корпусе русского базовые принципы и основные функции // Национальный корпус русского языка: 2003–2005. Результаты и перспективы. – М., 2005 – С. 62–88.

7. Сиразитдинов З.А., Бускунбаева Л.А., Ишмухаметова А.Ш., Ибрагимова А.Д. Информационные системы и базы данных башкирского языка. – Уфа: Книжная палата РБ, 2013. – 116 с.


Рецензия

Для цитирования:


Жанабекова А.А., Кожахметова А.К. ОБРАБОТКА ТЕКСТОВ, ВКЛЮЧЕННЫХ В МЕТАРАЗМЕТКУ, НА СПЕЦИАЛЬНОМ КОМПЬЮТЕРНОМ ПРОГРАММНОМ ОБЕСПЕЧЕНИИ. TILTANYM. 2021;(3):37-52. https://doi.org/10.55491/2411-6076-2021-3-37-52

For citation:


Zhanabekova A.A., Kozhahmetova A.K. PROCESSING OF THE TEXTS INCLUDED IN METAMARKING ON THE SPECIAL COMPUTER SOFTWARE. Tiltanym. 2021;(3):37-52. (In Kazakh) https://doi.org/10.55491/2411-6076-2021-3-37-52

Просмотров: 394


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2411-6076 (Print)
ISSN 2709-135X (Online)