Normal view
MARC view
Using TXM platform for research on language changes over time: the dynamics of vocabulary and punctuation in Russian literary texts (Record no. 720697)
[ view plain ]
000 -Маркер записи | |
---|---|
Контрольное поле постоянной длины | 07878nab a2200421 c 4500 |
001 - Контрольный номер | |
Контрольное поле | koha000720697 |
005 - Дата корректировки | |
Контрольное поле | 20230319233652.0 |
007 - Кодируемые данные (физ. описан.) | |
Контрольное поле постоянной длины | cr | |
008 - Кодируемые данные | |
Контрольное поле постоянной длины | 211027|2021 ru s a eng d |
024 7# - Прочие стандартные номера | |
Стандартный номер | 10.17223/19986645/70/5 |
Источник номера | doi |
035 ## - Системный контрольный номер | |
Системный контрольный номер | koha000720697 |
040 ## - Источник каталогиз. | |
Служба первич. каталог. | RU-ToGU |
Код языка каталог. | rus |
Служба, преобразующая запись | RU-ToGU |
245 10 - Заглавие | |
Заглавие | Using TXM platform for research on language changes over time: the dynamics of vocabulary and punctuation in Russian literary texts |
Ответственность | A. M. Lavrentiev, T. Yu. Sherstinova, A. M. Chepovskiy, B. Pincemin |
246 11 - Заглавие тома/части | |
Заглавие тома/части | Использование платформы TXM для исследования изменений языка во времени: динамика словарного состава и пунктуации в русских литературных текстах |
336 ## - Тип содержимого | |
Тип содержимого | Текст |
337 ## - Средство доступа | |
Средство доступа | электронный |
504 ## - Библиография | |
Библиография | Библиогр.: 45 назв. |
520 3# - Аннотация | |
Аннотация | The aim of this article is to test the methodological tools provided by TXM open-source software for research on dynamics of vocabulary and punctuation marks in diachronic corpo-ra. TXM provides both quantitative and qualitative analysis features. It is shown that Russian revolution of 1917 did make significant changes in the core vocabulary of the corpus of Rus-sian Short Stories (1901–1930). The same methodology may be used both for diachronic stu-dies of literature and for various NLP tasks. Цель настоящей статьи – испытать инструменты анализа, которые предоставляет платформа TXM для исследования динамики словарного состава и пунктуации в диа-хронических корпусах текстов. TXM представляет собой комплекс программного обес-печения для количественного и качественного анализа текстов, построенный на принципах прозрачной архитектуры и открытого кода. В статье демонстрируется, как можно использовать платформу для диахронического исследования текстов с учетом внешних факторов, оказывающих влияние на эволюцию языка. Исследование проводилось на Корпусе русских рассказов первой трети XX в. Корпус создавался независимо от TXM с целью отразить максимально широкий спектр произведений русских писателей и слу-жить, таким образом, испытательной площадкой для различных методик математиче-ского анализа текстов. Результаты этого пилотного исследования показывают эффективность использования TXM для исследования динамики развития языка и подтвер-ждают явное влияние диахронического фактора на статистическое распределение тек-стов изучаемого корпуса. Основными методами, использованными в статье, явились анализ соответствий и индекс специфичности, вычислявшиеся на различных разбивках корпуса (по годам, по периодам и индивидуально по текстам) на базе 200 самых частотных лемм (слов и знаков препинания). Использование базовой лексики (включающей служебные слова) и пунктуации позволяет сконцентрироваться на глубинных изменениях языка, абстрагируясь от индивидуальных стилистических факторов. В каче-стве периодов были выделены: мирное время до революции (1901–1913), Первая мировая война (1914–1916), революция и Гражданская война (1917–1922) и постреволюци-онное мирное время (1923–1930). Относительная несбалансированность периодов и размеров отдельных текстов компенсируется методикой статистического анализа. В результате исследования было показано, что наиболее существенные изменения в употреблении базовой лексики и пунктуации происходят сразу после революционного 1917 г. При анализе соответствий периоды располагаются строго в хронологическом порядке по первому измерению факторного плана. В то же время сопоставление перио-дов не выявило четкого противопоставления по признаку мирное / военное время. Анализ специфичности позволил выявить характерные для каждого периода леммы, в том числе местоимения, служебные слова и знаки препинания, которые интуитивно не ассоциируются с изменениями в языке рассматриваемой исторической эпохи. Например, местоимения третьего лица он и она характерны для периода до революции, а частотность точки, тире и двоеточия повышается статистически значимым образом после 1917 г. Представленная методика анализа в дальнейшем может использоваться как для диахронических исследований в литературоведении, так и для решения различных за-дач автоматической обработки текста, направленных на выявление эволюции в лингвистических, стилистических и эмоциональных аспектах под влиянием каких-либо внешних факторов. |
653 ## - Ключевые слова | |
Ключевые слова | стилеметрия |
653 ## - Ключевые слова | |
Ключевые слова | текстометрия |
653 ## - Ключевые слова | |
Ключевые слова | корпусная лингвистика |
653 ## - Ключевые слова | |
Ключевые слова | русская литература |
653 ## - Ключевые слова | |
Ключевые слова | 20 век |
653 ## - Ключевые слова | |
Ключевые слова | словарный состав |
653 ## - Ключевые слова | |
Ключевые слова | пунктуация |
653 ## - Ключевые слова | |
Ключевые слова | диахроническая лингвистика |
653 ## - Ключевые слова | |
Ключевые слова | TXM, комплекс программного обеспечения |
655 #4 - Термин индексирования — жанр/форма | |
Жанр/форма | статьи в журналах |
9 (RLIN) | 879358 |
700 1# - Другие авторы | |
Другие авторы | Lavrentiev, A. M. |
9 (RLIN) | 761237 |
700 1# - Другие авторы | |
Другие авторы | Sherstinova, T. Yu. |
9 (RLIN) | 761239 |
700 1# - Другие авторы | |
Другие авторы | Chepovskiy, A. M. |
9 (RLIN) | 761240 |
700 1# - Другие авторы | |
Другие авторы | Pincemin, B. |
9 (RLIN) | 761241 |
773 0# - Источник информации | |
Название источника | Вестник Томского государственного университета. Филология |
Место и дата издания | 2021 |
Прочая информация | № 70. С. 69-89 |
ISSN | 1998-6645 |
Контрольный № источника | 0210-37760 |
852 4# - Местонахождение единицы хранения | |
Код организации-хранителя | RU-ToGU |
856 4# - Электронный адрес документа | |
URL | <a href="http://vital.lib.tsu.ru/vital/access/manager/Repository/koha:000720697">http://vital.lib.tsu.ru/vital/access/manager/Repository/koha:000720697</a> |
908 ## - Параметр входа данных | |
Параметр входа данных | статья |
999 ## - Системные контрольные номера (Koha) | |
biblionumber (Koha) | 720697 |
No items available.