Scientific Library of Tomsk State University

   E-catalog        

Normal view MARC view

Using TXM platform for research on language changes over time: the dynamics of vocabulary and punctuation in Russian literary texts (Record no. 720697)

000 -Маркер записи
Контрольное поле постоянной длины 07878nab a2200421 c 4500
001 - Контрольный номер
Контрольное поле koha000720697
005 - Дата корректировки
Контрольное поле 20230319233652.0
007 - Кодируемые данные (физ. описан.)
Контрольное поле постоянной длины cr |
008 - Кодируемые данные
Контрольное поле постоянной длины 211027|2021 ru s a eng d
024 7# - Прочие стандартные номера
Стандартный номер 10.17223/19986645/70/5
Источник номера doi
035 ## - Системный контрольный номер
Системный контрольный номер koha000720697
040 ## - Источник каталогиз.
Служба первич. каталог. RU-ToGU
Код языка каталог. rus
Служба, преобразующая запись RU-ToGU
245 10 - Заглавие
Заглавие Using TXM platform for research on language changes over time: the dynamics of vocabulary and punctuation in Russian literary texts
Ответственность A. M. Lavrentiev, T. Yu. Sherstinova, A. M. Chepovskiy, B. Pincemin
246 11 - Заглавие тома/части
Заглавие тома/части Использование платформы TXM для исследования изменений языка во времени: динамика словарного состава и пунктуации в русских литературных текстах
336 ## - Тип содержимого
Тип содержимого Текст
337 ## - Средство доступа
Средство доступа электронный
504 ## - Библиография
Библиография Библиогр.: 45 назв.
520 3# - Аннотация
Аннотация The aim of this article is to test the methodological tools provided by TXM open-source software for research on dynamics of vocabulary and punctuation marks in diachronic corpo-ra. TXM provides both quantitative and qualitative analysis features. It is shown that Russian revolution of 1917 did make significant changes in the core vocabulary of the corpus of Rus-sian Short Stories (1901–1930). The same methodology may be used both for diachronic stu-dies of literature and for various NLP tasks. Цель настоящей статьи – испытать инструменты анализа, которые предоставляет платформа TXM для исследования динамики словарного состава и пунктуации в диа-хронических корпусах текстов. TXM представляет собой комплекс программного обес-печения для количественного и качественного анализа текстов, построенный на принципах прозрачной архитектуры и открытого кода. В статье демонстрируется, как можно использовать платформу для диахронического исследования текстов с учетом внешних факторов, оказывающих влияние на эволюцию языка. Исследование проводилось на Корпусе русских рассказов первой трети XX в. Корпус создавался независимо от TXM с целью отразить максимально широкий спектр произведений русских писателей и слу-жить, таким образом, испытательной площадкой для различных методик математиче-ского анализа текстов. Результаты этого пилотного исследования показывают эффективность использования TXM для исследования динамики развития языка и подтвер-ждают явное влияние диахронического фактора на статистическое распределение тек-стов изучаемого корпуса. Основными методами, использованными в статье, явились анализ соответствий и индекс специфичности, вычислявшиеся на различных разбивках корпуса (по годам, по периодам и индивидуально по текстам) на базе 200 самых частотных лемм (слов и знаков препинания). Использование базовой лексики (включающей служебные слова) и пунктуации позволяет сконцентрироваться на глубинных изменениях языка, абстрагируясь от индивидуальных стилистических факторов. В каче-стве периодов были выделены: мирное время до революции (1901–1913), Первая мировая война (1914–1916), революция и Гражданская война (1917–1922) и постреволюци-онное мирное время (1923–1930). Относительная несбалансированность периодов и размеров отдельных текстов компенсируется методикой статистического анализа. В результате исследования было показано, что наиболее существенные изменения в употреблении базовой лексики и пунктуации происходят сразу после революционного 1917 г. При анализе соответствий периоды располагаются строго в хронологическом порядке по первому измерению факторного плана. В то же время сопоставление перио-дов не выявило четкого противопоставления по признаку мирное / военное время. Анализ специфичности позволил выявить характерные для каждого периода леммы, в том числе местоимения, служебные слова и знаки препинания, которые интуитивно не ассоциируются с изменениями в языке рассматриваемой исторической эпохи. Например, местоимения третьего лица он и она характерны для периода до революции, а частотность точки, тире и двоеточия повышается статистически значимым образом после 1917 г. Представленная методика анализа в дальнейшем может использоваться как для диахронических исследований в литературоведении, так и для решения различных за-дач автоматической обработки текста, направленных на выявление эволюции в лингвистических, стилистических и эмоциональных аспектах под влиянием каких-либо внешних факторов.
653 ## - Ключевые слова
Ключевые слова стилеметрия
653 ## - Ключевые слова
Ключевые слова текстометрия
653 ## - Ключевые слова
Ключевые слова корпусная лингвистика
653 ## - Ключевые слова
Ключевые слова русская литература
653 ## - Ключевые слова
Ключевые слова 20 век
653 ## - Ключевые слова
Ключевые слова словарный состав
653 ## - Ключевые слова
Ключевые слова пунктуация
653 ## - Ключевые слова
Ключевые слова диахроническая лингвистика
653 ## - Ключевые слова
Ключевые слова TXM, комплекс программного обеспечения
655 #4 - Термин индексирования — жанр/форма
Жанр/форма статьи в журналах
9 (RLIN) 879358
700 1# - Другие авторы
Другие авторы Lavrentiev, A. M.
9 (RLIN) 761237
700 1# - Другие авторы
Другие авторы Sherstinova, T. Yu.
9 (RLIN) 761239
700 1# - Другие авторы
Другие авторы Chepovskiy, A. M.
9 (RLIN) 761240
700 1# - Другие авторы
Другие авторы Pincemin, B.
9 (RLIN) 761241
773 0# - Источник информации
Название источника Вестник Томского государственного университета. Филология
Место и дата издания 2021
Прочая информация № 70. С. 69-89
ISSN 1998-6645
Контрольный № источника 0210-37760
852 4# - Местонахождение единицы хранения
Код организации-хранителя RU-ToGU
856 4# - Электронный адрес документа
URL <a href="http://vital.lib.tsu.ru/vital/access/manager/Repository/koha:000720697">http://vital.lib.tsu.ru/vital/access/manager/Repository/koha:000720697</a>
908 ## - Параметр входа данных
Параметр входа данных статья
999 ## - Системные контрольные номера (Koha)
biblionumber (Koha) 720697

No items available.