02_Collecting_texts

Домашнее задание № 2
=Сбор образцов живой русской речи для корпуса=

Видео-файл в дропбоксе, папка Unit2. Имя файла может быть любым, желательно, чтобы оно отражало тему разговора.
 * Чеклист:**

Записи спонтанных разговоров являются ценным материалом для изучения разговорной речи -- со всеми ее запинками, оговорками, нестандартным порядком слов, особенностями произношения, интонации и проч.
 * Для чего это нужно?**

Запишите на видео разговор на улице, в университете, дома и т.д. Это может быть диалог, монолог или полилог. Попросите своих знакомых или родственников поговорить на какую-нибудь тему (например, диалог об одноклассниках, рассказ бабушки о том, как вы были маленьким и т.п.). Не старайтесь записывать "гладкие" монологи людей с хорошо подвешенным языком -- для наших целей это неинтересно. С другой стороны, диалоги вроде "А чего говорить-то?" (пауза) -- "Ну скажи что-нибудь" (пауза) тоже будут неудачны -- постарайтесь вначале разговорить людей, чтобы они перестали стесняться камеры и в идеале забыли про нее.
 * Что делать**

Качество записи - любое (предполагается, что видео записывается с помощью камеры на телефоне или планшете, можно на видеокамеру), однако старайтесь, чтобы размер получившегося файла был не более 400-500 Мб (файлы объемом больше гигабайта трудно закачивать и обрабатывать). Время звучания ролика - 5 минут (примерно) Формат файла - .mpg, .wav, .avi (в принципе, любой формат, поддерживаемый вашим устройством, годится, но потом файлы придется конвертировать).

Старайтесь, чтобы запись была сделана не в шумном месте. Например, очень неудачны записи в кафе или ночном клубе -- вы просто не услышите потом, о чем говорят собеседники. В кадре могут быть все собеседники, допустимо также, чтобы один из собеседников (снимающий ролик) был за кадром. Идеально, чтобы у говорящего были видны руки (жестикуляция), но портретная съемка тоже годится.

Соберите сведения о говорящих - пол, примерный возраст, образование (среднее, высшее, ниже среднего), профессия, регион проживания, регион, где родился. Вся информация должна быть занесена в эту таблицу: https://docs.google.com/spreadsheets/d/1t_TvLHfz9kLyBS4dd5lfBRjppl05LUFbYIiynVxcle8/

Использование материалов
Чтобы мультимедийные материалы могли быть помещены в учебный корпус, вы должны соблюдать правила научно-исследовательской этики: Если в разговоре участвуют двое или больше говорящих, то согласие должен дать каждый из них. Расшифровывать видео будет тот, кто его записал. Обработанные материалы будут общедоступны.
 * говорящий должен быть поставлен в известность, что его записывали
 * говорящий должен дать согласие на то, что его видео появится в корпусе (на анонимных условиях, т. е. без указания имени и т.д.).
 * любая информация, которая может нанести вред говорящему или другим, шифруется как в видеозаписи, так и в транскрипте (таковой могут быть: номера паспортов, резкие оценки других людей с называнием их имени и др.)

Если говорящий не согласен на размещение видео, обсудите компромиссные возможности использования аудио- или даже просто письменного транскрипта речи в корпусе. Пожалуйста, сразу пометьте себе "уровень согласия" говорящих там же, где вы записали сведения о них.

В дропбокс попадают данные без предварительной обработки. Вся работа по обработке видео (вырезание лишнего, выделение аудио-дорожки в отдельный файл и т.п.), письменной расшифровке и улучшению ее качества, лингвистической аннотации будет проводиться в ходе дальнейших домашних заданий.

Если хотите, вы можете сделать первичную расшифровку видеозаписи. Полностью расшифровка потребуется в следующем домашнем задании по корпусу живой разговорной речи.


 * Примеры удачных роликов (для вдохновения)**

Продолжение TBA soon