archive_2_Collecting_texts

Домашнее задание
=Сбор образцов живой русской речи для корпуса=

(видео-файл + .txt-файл) ИЛИ (3 .txt-файла) в дропбоксе Unit2 (или того занятия, когда вы получали задание). Имена файлов пишите латиницей, спец. папки для них не заводите.
 * Чеклист:**

Задание имеет два варианта (по желанию). Запишите на видео разговор на улице, в университете, дома и т.д. Попросите своих знакомых или родственников поговорить на какую-нибудь тему (например, диалог об одноклассниках, рассказ бабушки о том, как вы были маленьким и т.п.) Выложите в дропбокс а) видеофайл, б) расшифровку записи в формате *.txt (сделанную в текстовом редакторе) - можно фрагмент расшифровки. В расшифровке укажите сведения о говорящих - пол, примерный возраст, профессия. Время звучания ролика - от 5 до 20 минут (примерно) Формат файла - любой Качество записи - любое (предполагается, что видео записывается с помощью камеры на телефоне или планшете)
 * __1 вариант__**

Соберите 3 текста из блогов, вместе с комментариями. Скопируйте их и сохраните в текстовом редакторе (файл с расширением .txt) Объем каждого текста - не менее 100 слов. Особенно приветствуются фейсбук и инстаграм. Из инстаграмма могут быть короткие тексты, но с длинным шлейфом комментариев. Начало текста и каждого комментария должно быть помечено, в квадратных скобках можно указать сведения об авторе блога и каждого комментария (если знаете). Выложите в дропбокс 3 текстовых файла.
 * __2 вариант__**

Дальнейшие пояснения
Чтобы мультимедийные материалы могли быть помещены в ощедоступный корпус, вы должны соблюдать правила научно-исследовательской этики: Если в разговоре участвуют двое или больше говорящих, то согласие должен дать каждый из них. Любая информация, которая может нанести вред говорящему или другим, шифруется (таковой могут быть: номера паспортов, резкие оценки других людей с называнием их имени и др.) Пожалуйста, сразу пометьте "уровень согласия" говорящих в расшифровке. В дропбокс попадают данные без предварительной обработки. Вся работа по обработке видео (вырезание лишнего, выделение аудио-дорожки в отдельный файл и т.п.), улучшению качества письменной расшифровки, ее лингвистической аннотации будет проводиться в ходе дальнейших домашних заданий. Кодировка текста - любая (пока что).
 * говорящий должен знать, что его записывают
 * говорящий должен дать согласие на то, что его видео (если несогласен - только аудио или даже просто письменная расшифровка появится в корпусе)

Продолжение банкета