Preview

Политическая лингвистика

Расширенный поиск

Вероятностно-статистические модели в производстве автороведческой экспертизы русскоязычных текстов

https://doi.org/10.26170/pl19-02-18

Полный текст:

Аннотация

В статье представлен опыт разработки компьютеризованной модели авторизации текста и ее адаптации к нуждам идентификационной и диагностической автороведческой экспертизы русскоязычных текстов. Цель исследования -- продемонстрировать возможности идентификационного автороведческого экспертного исследования текстов посредством автоматической обработки текстов на основе комплексного применения вероятностно-статистических методов. Описан очередной этап апробации усовершенствованной версии программы «КАТ» (компьютерная авторизация текста) -- эксперимент по определению относительных частот соотношения тех или иных языковых элементов (вычислению коэффициентов корреляции) в нескольких выборках из сравниваемых текстов по комплексу разноуровневых параметров - коэффициентам Б. Н. Головина, дополненному существующими в научной практике и прикладной сфере индексами понятности текста («индекс Флеша - Кинкейда», «FOG-индекс») и рядом других параметров. Материалом исследования являются первичные базы данных текстов русской классики (произведений Л. Н. Толстого, Н. В. Гоголя, И. С. Тургенева). В результате экспериментального исследования были выработаны следующие критерии идентификации авторства: считать текст принадлежащим автору, если коэффициент корреляции текста с существующей базой больше 0,87, т. е. в качестве доверительного интервала принять интервал 0,87-1,0; считать текст не принадлежащим автору, если коэффициент корреляции текста с существующей базой меньше 0,82; учесть, что точность работы программы увеличивается с возрастанием объема текстов в базе. Под базой понимается средний показатель, исчисленный по всем текстам, с достоверностью атрибутированным как принадлежащие данному автору. В случае успешной доводки предложенной программы автоматической обработки текстов «КАТ» с ее помощью можно будет решать экспертные задачи по авторизации и диагностике спорных текстов, реализованных в пространстве медийного и политического дискурсов, в юридической, официально-деловой и коммерческой документации и пр.

Об авторах

Т. Б. Радбиль
Национальный исследовательский Нижегородский государственный университет им. Н. И. Лобачевского
Россия


М. В. Маркина
Национальный исследовательский Нижегородский государственный университет им. Н. И. Лобачевского
Россия


Список литературы

1. Баранов А. Н. Введение в прикладную лингвистику : учеб. пособие. - М. : Эдиториал УРСС, 2001. 347 с.

2. Верзохин С. С. К вопросу о лингвотеоретических основах методик авторизации текста // Учен. зап. ЗабГГПУ. 2013. № 2 (49). С. 22-27.

3. Вул С. М. Теоретические и методические вопросы криминалистического исследования письменной речи. - М. : ВНИИСЭ, 1977. 109 с.

4. Галяшина Е. И., Ермолова Е. И. Перспективы развития автороведческой экспертизы в России // Судебная экспертиза : науч.-практ. журн. 2005. № 3. С. 5-11.

5. Головин Б. Н. Язык и статистика. - М. : Просвещение, 1970. 190 с.

6. Кремер Н. Ш. Теория вероятностей и математическая статистика. Изд. 3-е, перераб. и доп. - М. : ЮНИТИ-ДАНА, 2007. 543 с.

7. Мартыненко Г. Я. Основы стилеметрии. - Л. : Изд-во Ленингр. ун-та, 1988. 173 с.

8. Морозов Н. А. Лингвистические спектры: средство для отличения плагиатов от истин. произведений того или др. известного авт. [Электронный ресурс]. - Петроград : тип. Имп. Акад. наук, 1916. 42 с. URL:http://www.textology.ru/ library/book.aspx?bookId=1&textId=3.

9. Радбиль Т. Б. Выявление содержательных и речевых признаков недобросовестной информации в экспертной деятельности лингвиста // Вестн. Нижегор. ун-та им. Н. И. Лобачевского. 2014. № 6. С. 146-149.

10. Радбиль Т. Б., Юматов В. А. Способы выявления имплицитной информации в лингвистической экспертизе // Вестн. Нижегор. ун-та им. Н. И. Лобачевского. 2014. № 3 (2).С. 18-21.

11. Романов А. С., Мещеряков Р. В. Идентификация автора текста с помощью аппарата опорных векторов // Компьютерная лингвистика и интеллектуальные технологии : по материалам ежегодной Междунар. конф. «Диалог-2009» (Бекасово, 27-31 мая 2009 г.). - М. : РГГУ, 2009. Вып. 8 (15). С. 432-437.

12. Хмелев Д. В. Распознавание автора текста с использованием цепей А. А. Маркова // Вестн. МГУ. Сер. 9, Филология. 2000. № 2. С. 115-126.

13. Юматов В. А., Маркина М. В., Ковалева А. С. Программа криминалистической диагностики и авторизации текста «КАТ» // Вестн. Костром. ун-та. 2015. Т. 21. № 3. С. 199-202.

14. Юматов В. А., Маркина М. В., Юматов С. В. Математические методы криминалистической диагностики и авторизации текста в речеведческой экспертизе // Вестн. Нижегор. ун-та им. Н. И. Лобачевского. 2016. № 5. С. 227-232.


Для цитирования:


Радбиль Т.Б., Маркина М.В. Вероятностно-статистические модели в производстве автороведческой экспертизы русскоязычных текстов. Политическая лингвистика. 2019;(2):156-166. https://doi.org/10.26170/pl19-02-18

For citation:


Radbil' T.B., Markina M.V. Probabilistic-Statistical Models in Conducting Authoring Expertise of Russian Texts. Political Linguistics. 2019;(2):156-166. (In Russ.) https://doi.org/10.26170/pl19-02-18

Просмотров: 5


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1999-2629 (Print)