Новая техника поступила в лабораторию цифровых лингвистических исследований ИФИЯМ ИГУ

Новая техника поступила в лабораторию цифровых лингвистических исследований ИФИЯМ ИГУ

В лаборатории цифровых лингвистических исследований ИФИЯМ ИГУ появилась новая техника, позволяющая ускорять создание корпусов устной речи [это база данных аудиофайлов и транскрипций текст]: быстро и максимально точно расшифровывать аудиозаписи и анализировать полученные текстовые файлы.

«Лингвистические корпуса представляют важный инструмент для широкого круга исследований. Они позволяют изучать как отдельные языковые явления, так и феномены, универсальные для человеческих языков. В настоящее время корпуса активно используются для обучения программ машинного перевода, систем автоматической обработки текста и других технологий. С их помощью представители различных областей гуманитарного знания могут исследовать, как люди описывают те или иные исторические события, как осмысляют свой жизненный опыт, как воспринимают и интерпретируют окружающую действительность», - пояснила Ульяна Чекмез, преподаватель кафедры русского языка и общего языкознания ИГУ.

С 2021 года на кафедре русского языка и общего языкознания ИГУ реализуется проект «Устный корпус как инструмент лингвистических и междисциплинарных исследований». Основной целью работы коллектива является создание пополняемого общедоступного корпуса звучащей речи, включающего как тексты интервью с жителями Иркутска, так и диалоги с носителями диалекта Баргузинского района Республики Бурятия.

«Такой корпус обеспечивает синхронизацию расшифрованных текстов и аудиозаписей: это позволяет исследователю услышать то, что не передадут буквы. Ресурс будет полезен не только лингвистам, но и специалистам из других гуманитарных областей (литературоведам, социологам, антропологам, историкам и т.д.): он позволит работать с большими массивами текстов, причём текстов уникальных, имеющих региональную, сибирскую специфику», - отметила Марина Ташлыкова, директор ИФИЯМ.

В проекте участвуют студенты-филологи, которые осуществляют необходимую для работы корпуса разметку. Именно благодаря разметке в корпусе можно быстро и легко находить не только определённые формы слов, но и различные невербальные элементы, которые тоже несут информацию, например, паузы, вздохи, покашливание.

В процессе работы над проектом выяснилось, что ноутбуки, имеющиеся на кафедре, не позволяют устанавливать и использовать современные компьютерные программы, необходимые для анализа звучащей речи. Кроме того, для организации групповой работы с расшифровками аудиозаписей, часто невысокого качества, понадобились высокочувствительные наушники.

Новое оборудование - шесть ноутбуков и 11 пар наушников - не только позволит более эффективно организовать работу всех участников проекта, но и обеспечит возможность проведения других лингвистических исследований: учёные уже планируют новые диалектологические экспедиции.

 

"Сибирские новости"

08:07
RSS
Нет комментариев. Ваш будет первым!
Использование нашего сайта означает ваше согласие на прием и передачу файлов cookies.

© 2025