Инструкция по работе с мультимедийным корпусом

Мультимедийный русский корпус (МУРКО) – это подкорпус Национального корпуса русского языка, который содержит устные русские тексты, выровненные с соответствующими аудио- и видеофрагментами. МУРКО позволяет изучать устную речь, используя не только ее письменную фиксацию, но и ее реальное звучание и жестовое сопровождение. МУРКО рассчитан, прежде всего, на фонетистов, интонологов, специалистов по жестикуляции, но будет также полезен преподавателям русского языка, прежде всего, как иностранного.

Терминологический указатель

Как задать свой подкорпус?

На главной странице поиска нужно щелкнуть мышкой по закладке «задать подкорпус»:


После этого откроется окно выбора подкорпуса. Здесь можно выбрать основные параметры нужного вам текста (автор, название, год создания, пол и год рождения автора). Кроме того, выбрать тип и жанр текста (например, разные типы устной речи):


На этой же странице можно выбрать подкорпус по социологическим характеристикам участвующих в кликсте [пара клип + текст расшифровки имеющейся в клипе речи; см. Терминологический указатель] говорящих (по имени – для актеров, по возрасту, году рождения, полу):


После того, как нужный вам подкорпус задан, щелкните по одной из кнопок внизу страницы:


Если вы щелкнете по «Очистить», то все выбранные вами позиции будут отменены и вы сможете снова выбрать нужные вам характеристики подкорпуса. Если вы щелкнете по «Очистить подкорпус», то будет выполнена команда «Очистить», т.е. весь предыдущий выбор будет отменен, и при этом вы будете перемещены на основную страницу поиска, где сможете осуществлять поиск по всему Мультимедийному русскому корпусу, а не по своему подкорпусу. Если вы щелкнете по кнопке «Далее», то выбор вашего подкорпуса будет сохранен, а вы будете перемещены на следующую страницу, где сможете конкретно оценить, какие именно кликсты попали в ваш выбор:


Если вас удовлетворяет полученный список, то вы щелкаете по кнопке «Сохранить подкорпус и перейти к странице поиска», если же вас список не удовлетворяет, вы выбираете закладку «выбрать подкорпус» и снова попадаете на страницу «Выбрать подкорпус». Далее поиск производится по выбранному вами подкорпусу.

Основная страница поиска в МУРКО

Основная страница поиска в Мультимедийном русском корпусе устроена так же, как и в остальных модулях Национального корпуса русского языка, но имеет дополнительные параметры, которые расширяют возможности поиска нужных кликстов.

Как задать точный поиск?

Строка точного поиска устроена в МУРКО так же, как и в акцентологическом подкорпусе НКРЯ, а именно, здесь можно искать точные формы слова с различением места ударения и букв «е» и «ё». Таким образом, на запрос «полу’чите» будут выданы только формы будущего времени глагола «получить», а на запрос «получи’те» – только формы императива. Аналогичным образом будут различены при выдаче словоформы «черт» и «чёрт»:


После набора искомой формы вам следует щелкнуть по кнопке «Искать».

Напомним, что в случае, если у вас нет русской раскладки клавиатуры, то для набора необходимой формы вы можете воспользоваться виртуальной клавиатурой, щелкнув по кнопке АБВ рядом со строкой поиска.

Как задать параметры лексико-грамматического и семантического поиска?

Для того, чтобы найти все формы данного слова, наберите исходную форму слова в ячейке леммы в зоне «Лексико-грамматический поиск»:

В случае, если вы хотите найти словосочетание, укажите первый его элемент в первой строке, второй — во второй. Если вам нужно словосочетание из трех и более слов, нажмите стрелку вниз рядом со второй строкой, и появится третья строка.


Степень контактности элементов словосочетания определяется параметром «Расстояние». По умолчанию расстояние равно нулю.


Для того, чтобы задать поиск грамматических признаков, щелкните на кнопке «выбрать», перед вами откроется диалоговое окно, в котором вы сможете выбрать нужные характеристики:


Выберите нужные параметры и нажмите кнопку OK.

Аналогичным образом, для того, чтобы выбрать семантические признаки, щелкните на кнопке «выбрать» и, выбрав нужные параметры в диалоговом окне, щелкните по кнопке OK:


Вы можете уточнить ваш запрос, используя дополнительные признаки (знаки препинания, заглавные буквы, повторы):


Дополнительные признаки в случае необходимости задаются для каждого слова словосочетания.

По завершении действий, описанных в пункте 2.2, щелкните по кнопке «Искать»:

Поиск по орфоэпической разметке

В МУРКО при каждом словоупотреблении размечены имеющиеся в нем сочетания согласных и гласных букв, которые могут представлять интерес для исследований, касающихся норм произношения сочетаний звуков.
В МУРКО при каждом словоупотреблении размечены имеющиеся в нем сочетания согласных и гласных букв, которые могут представлять интерес для исследований, касающихся норм произношения сочетаний звуков. Если нужно найти сочетание двух или трех конкретных гласных внутри слова, их следует набрать в строке «Орфоэпическая структура», а потом щелкнуть по кнопке «Искать»:


Аналогичным образом ищутся сочетания согласных (например, стр) или гласных и согласных (например, сча). При этом, однако, мы не можем искать более трех единиц (например, сочетание стро найти уже нельзя).

Возможен поиск сочетаний групп согласных и гласных. Например, чтобы найти сочетание «губной согласный + заднеязычный согласный + гласный переднего ряда», следует щелкнуть по ссылке «Выбрать» в строке «Орфоэпическая структура». Откроется диалоговое окно, в котором нужно выбрать последовательно соответствующие позиции, щелкнуть по кнопке OK, а потом – по кнопке «Искать»:


Пользователь также может использовать квадратные скобки для выбора соответствующего звукосочетания. Так, запись структуры [мн]а[мн] означает, что будут найдены словоформы с буквосочетаниями ман, мам, нам, нан. Для того, чтобы найти сочетание букв на границе слов, для обозначения границы используйте знак подчеркивания:


Этот же знак используется для обозначения границы слова между группами звуков. Например, запрос на сочетание заднеязычных согласных на границе слова выглядит следующим образом:


В случае, если вам нужно найти сочетание конечных гласных перед любым началом слова, используйте запрос следующей структуры:


или

Поиск по вокалической структуре слова

Поскольку в МУРКО размещены тексты с размеченными реальными ударениями, это дает возможность пользователю найти слова с одинаковым акцентным контуром, вне зависимости от их морфологических и семантических характеристик. А именно, при поиске словоформ одинаковой вокалической структуры можно учитывать: 1) количество слогов, 2) качество и номер ударного слога, 3) качество и номер предударного слога, 4) качество и номер заударного слога. Для этого в строке «Вокалическая структура» следует щелкнуть по кнопке «выбрать» и в открывшемся диалоговом окне выбрать нужные вам параметры. Например, в следующем примере формируется поиск словоформ с третьим по счету ударным слогом и первой предударной гласной о:


После нажатия кнопки OK в диалоговом окне строка поиска выглядит следующим образом:


То есть 1) ударный слог имеет номер 3 при счете от начала словоформы, 2) в словоформе первая предударная гласная (т.е. первая при счете налево от ударного слога) – о, 3) качество и количество заударных гласных и общее число слогов не заданы. В качестве ответа на данный запрос вы получите кликсты, в которых будут словоформы георгины, потому, хорошо, заодно, стороне, гастроном, разворачивается и мн. др.

В случае, если вам нужны все предударные гласные словоформы, и первая, и вторая, прямо в строке поиска вы должны дописать то, что вам нужно:


Такой запрос обозначает, что вы хотите найти то же самое, что и в предыдущем запросе, но только второй предударный гласный в искомых словоформах должен быть а. В ответе на такой запрос встретятся словоформы заодно, разворачивается, Краснореченск, нахожу и др.

Как найти то или иное речевое действие?

В небольшой части МУРКО (т.н. «глубоко аннотированный» МУРКО) размечены разные типы речевых действий и жестов. Для их поиска на сайте предусмотрен специальный интерфейс, который ввиду своего большого объема по умолчанию свернут и выглядит следующим образом:


Для того, чтобы задать поиск по тем или иным типам речевых действий, следует щелкнуть по ссылке «задать» и начать работу с открывшимся списком:


Первые четыре позиции характеризуют ситуацию, отраженную в кликсте, с социологической точки зрения (количество участников, их пол, язык, который звучит в кликсте, и отраженная в нем социальная ситуация).


Если вы хотите вести поиск по всем файлам, то в социологической зоне разметки не задавайте никаких ограничений.

Следующая зона разметки речевых действий содержит порядка 150 разновидностей разных речевых актов, организованных в 13 групп. Чтобы знать, какие именно речевые акты размечены в корпусе и в какой именно группе они размещены, обратитесь к справочному списку, щелкнув по вопросительному знаку в первой строке поискового интерфейса:


В открывшемся окне полужирным шрифтом даны те речевые акты, которые вообще размечаются в корпусе, а светлым шрифтом в скобках — названия групп, в которых они размещены (так, зов следует искать в апеллятивах, запрет — в отрицаниях, а заявление — в утверждениях).

Щелкнув на закладке любого названия группы речевых актов, например, «Чужая речь», вы получите диалоговое окно со списком соответствующих речевых актов. Нажав в нем на кнопку «Инвертировать», вы сможете искать все случаи чужой речи, без ее разделения на отдельные типы:


Отдельно пользователь имеет возможность выбрать кликсты с высказываниями разной степени полноты (параметр «Полнота речевого действия»), включающие разные типы повторов (параметр «Наличие и типы повторов»), разную манеру говорения, а также разнообразные вокальные жесты и междометия («Манера говорения», «Типы вокальных жестов и междометий»). Пользователю следует выбрать интересующий его параметр и в соответствующем окне поставить галочку напротив того или иного значения параметра:


Выбрав нужное вам значение параметра и щелкнув по кнопке OK, перейдите к кнопке «Искать» на основной странице поиска и щелкните по ней:

Как найти тот или иной жест?

В небольшой части МУРКО размечены разные типы речевых действий и жестов. Для их поиска на сайте предусмотрен специальный интерфейс, который ввиду своего большого объема по умолчанию свернут и выглядит следующим образом:


Для того, чтобы задать поиск по тем или иным жестам, следует щелкнуть по ссылке «задать» и начать работу с открывшимся списком:


Выбрав нужное вам значение параметра и щелкнув по кнопке OK, перейдите к кнопке «Искать» на основной странице поиска и щелкните по ней:

Социологические характеристики жеста

Параметр «Имя говорящего (актера)» предоставляет пользователю возможность работать только с теми кликстами, где жестикулирует тот или иной актер из предложенного списка:


Пол говорящего (актера), естественно, может быть мужским или женским, но в особых случаях, например, когда жестикулирующий не виден целиком и неясен из ситуации, пол может отмечаться как неизвестный:


Пол персонажа имеет более сложную структуру, чем пол говорящего: отмечаются случаи, когда реальный пол актера и пол персонажа не совпадают:


Возраст актера и персонажа определяются описательно (ребенок, подросток, взрослый, пожилой):


Напомним, что точный возраст говорящего (если он известен) можно задать, формируя подкорпус с использованием социологических характеристик (см. п. 1 Как задать свой подкорпус?), кроме того, возраст говорящего и год его рождения указаны в корпусе при каждой реплике.

Объективные характеристики жеста

1. Пользователь может задать основной орган (подробнее см. Терминологический указатель), который формирует искомый жест (например, отобрать кликсты/клипы, которые содержат жесты головы), а может выбрать конкретный активный орган, имеющий отношение к данному основному органу (например, отобрать кликсты/клипы, которые содержат жесты, осуществляемые указательным пальцем). Для того, чтобы определить, какие именно основные и активные органы размечены в корпусе, следует щелкнуть либо по закладке «Основной орган», либо по закладке «Активный орган»:


Выбрав необходимый орган, следует щелкнуть по кнопке OK. Естественно, одновременно можно выбрать несколько активных органов. Вы также можете выбрать любой пассивный орган


или адаптор:


2. Объективная характеристика жеста включает в себя его временные и пространственные характеристики.

Временные характеристики описывают жест с точки зрения его однократности или многократности:


При этом следует учитывать, что в корпусе при назывании многократных жестов используется несовершенный вид, а при назывании однократных жестов — совершенный вид (кивать vs. кивнуть).

Пространственная характеристика всех жестов включает в себя указание на направление движения активного органа. При этом для всех направлений движения указаны актуальные для данного направления активные органы:


Специально для жестов рук добавлены такие пространственные характеристики, как ориентация ладони (ладоней) и кисти (кистей):


При этом, как видно, ориентация кисти (кистей) в значительной степени определяется ориентацией ладони (ладоней), соответственно, ориентация кисти (кистей) выбирается в соответствии с выбором ориентации ладони (ладоней).

3. И, наконец, объективная характеристика жеста включает указание на используемые в ходе жестикуляции предметы и их роль в осуществлении жеста. Следовательно, пользователь может выбрать удлинители, спойлеры и аксессуары, участвующие в искомом жесте:

Субъективные характеристики жеста

Жесты в корпусе с субъективной (функционально-прагматической) точки зрения описываются как триады тип жеста / значение жеста / название жеста. На данный момент определено 14 типов жестов, выделенных в соответствии с функцией и происхождением жестов (последнее верно для заимствованных жестов, которые — в случае, если бы они не были заимствованы, — распределились бы по остальным 13-ти группам).

Для того, чтобы узнать, какие именно жесты встречаются в корпусе, следует щелкнуть по вопросительному знаку в строке «Жесты»:


После этого откроется справочное окно, в котором значения жестов даны полужирным шрифтом и расположены в алфавитном порядке; после значения жестов в скобках обозначен тип жестов, к которому относится данное значение, а затем курсивом перечислены все жесты, встретившиеся в корпусе в этом значении.

В случае, если вы хотите выбрать для анализа все жесты данного типа или только отдельные значения, следует щелкнуть на закладке «Тип жеста» или «Значение жеста»:


В случае, если вы хотите выбрать кликсты/клипы с жестами, имеющими в русском языке одно и то же название, вы должны щелкнуть на закладке «Название жеста»:


Открывшееся диалоговое окно позволит вам при необходимости уточнить, в каком именно значении вы хотите исследовать данный жест (например, для жеста отмахнуться вы можете выбрать значение жеста внутреннего состояния пренебрежение или этикетного жеста не стоит благодарности).

Дополнительные характеристики жеста

Вы можете определить, какие проявления эмоций сопровождают выбранный вами жест. Для этого следует щелкнуть на закладке «Эмоции» и в открывшемся диалоговом окне выбрать значение этого параметра из предлагаемого списка:


Жест также может быть охарактеризован с точки зрения полноты его осуществления. Для того, чтобы выбрать необходимое значение параметра, следует щелкнуть на закладке «Полнота жеста» и выбрать нужное значение в открывшемся диалоговом окне:


И, наконец, жест описывается с точки зрения его аутентичности. Для этого следует щелкнуть на закладке «Аутентичность жеста» и выбрать то или иное значение в диалоговом окне:

Интерфейс выдачи

На любой ваш запрос открывается специальное окно выдачи, которое имеет следующую структуру:

  1. Для того, чтобы запустить ролик, нужно щелкнуть по большой желтой стрелке в центре ролика.
  2. Для того, чтобы повысить качество видео, следует щелкнуть по кнопке «Качество» (левый верхний угол ролика, обведено белым и черным кругом).
  3. Для того, чтобы скачать ролик на свой компьютер, следует щелкнуть закладку «Скачать mp4» в правом верхнем углу ролика (обведено белым и черным кругом).
  4. В левом нижнем углу ролика (красный треугольник) дается информация о его длительности.
  5. Нижняя строка ролика (желтый прямоугольник) отведена для уникального имени ролика в базе данных корпуса.
  6. Зеленая стрелка указывает на таблицу жестов, которые размечены для данного кликста/клипа (если, конечно, данный клип был размечен с точки зрения жестикуляции); таблица содержит имя жестикулирующего актера (если оно известно), его пол (это важно для тех актеров, имя которые неизвестно, и облегчает ориентацию в клипе), активный орган, название и значение жеста. Таблица призвана помочь пользователю понять, какие именно жесты отмечены в данном клипе и как именно они были проинтерпретированы.
  7. Оранжевым пятиугольником обозначена закладка (многоточие), щелкнув по которой, вы получаете возможность работать только с данным конкретным кликстом, а также указать его точный адрес в интернете:


Щелкнув по ссылке «Предыдущий фрагмент» или «Следующий фрагмент», можно просмотреть клип, непосредственно предшествующий найденному или следующий за ним: