11_Projects

=Проектные задания для зачета=

Проекты выполняются в группах по __4 человека__. Участники cдают письменный отчет по проекту и затем рассказывают о проекте на самом зачете. **Записаться на проект в []**.

Варианты проектных заданий (либо-либо):
1) Лингвический компьютерный ресурс (корпус, словарь, база данных) 2) Анализ учебного корпуса LiveCorpus (перейти к описанию )


 * 1) Описание лингвистического компьютерного ресурса**
 * Письменный отчет** по проекту выполняется в виде краткого отчета об экспертизе **usability** ресурса. Экспертиза обязательно дополняется 2-3 заданиями для поиска (со скриншотами). Задания должны отражать разные функциональные возможности ресурса. Отчет сдается в Word / OpenOffice (около двух страниц).

Вопросы для экспертизы usability:
 * дизайн, что нравится и что не нравится (общее впечатление, цветовая гамма, форма и расположение кнопок и т.п.)
 * onboarding (ресурс глазами новичка): легко ли вы нашли сам ресурс и форму поиска; быстро ли вы сориентировались, как и что искать; насколько все "интуитивно очевидно"; есть ли образцы запросов для новичков?
 * помощь пользователю: наличие подсказок, инструкций, наколько легко их найти, насколько легко в них ориентироваться; насколько быстро вы нашли нужную информацию (опять же дизайн)
 * продвинутый функционал (сложные запросы) -- что позволяет и что не позволяет найти ресурс.


 * Устная часть** (на экзамене) включает презентацию ресурса, состав текстов, уровни разметки. Предполагается критическое обсуждение его достоинств и недостатков. Требуется показать "в прямом эфире", как работает ресурс, выполнив 1-2 запроса.

Ссылки на корпуса можно найти на Студиоруме, [|linguistlist.org], [|web-corpora], [|английские корпуса], [|Lancaster list], [|Humboldt list], [|тьюториалы], а также погуглить. Некоторые ссылки на другие ресурсы см. на странице Лингвистические ресурсы (обзор)
 * Какой ресурс взять для проекта? **
 * Любой корпус (кроме подкорпусов НКРЯ и COCA, которые мы смотрели в течение модуля), для любого языка (русского, иностранного, языков России, параллельного на нескольких языках, язык вы можете знать или не знать)
 * Интересный электронный словарь (который предоставляет больше возможностей, нежели просто поиск по электронной версии бумажного словаря)
 * Лингвистическую базу данных

Схема работы:

 * узнаем, есть ли доступ к ресурсу онлайн или оффлайн и как его получить
 * читаем информацию на сайте (описания, инструкции и т.п.)
 * находим в сети статьи об этом ресурсе (например, материалы конференций - в частности, в Гугл-Академии или в архиве aclweb.org, но и не только )
 * разбираемся практически, как и что можно искать
 * составляем критическое мнение, какие возможности (поиска, представления найденного) есть, что удобно, что неудобно, чего не хватает и т.п.

Критерии оценки письменной работы и устного выступления:

 * у студентов есть представление о том, сколько и каких слоев разметки прилично иметь корпусу ("мейнстрим")
 * относительно этого, как описываются слои разметки выбранного корпуса
 * критическая оценка функциональности -- какие задачи можно/нельзя решать с помощью корпуса
 * критическая оценка дизайна -- насколько красиво и удобно, в том числе насколько легко ориентироваться новичку, насколько интуитивен (в смысле Стива Джобса) дизайн
 * указано, имеются ли инструкции, видеохелпы и т.п. (как на странице корпуса, так и на внешних сайтах)
 * указано, есть ли доступ для скачивания тех или иных материалов (с которыми потом можно работать оффлайн)
 * приведены примеры 2-3 запросов со скриншотами (на устной презентации -- 1 запрос, другие можем попросить выполнить при обсуждении).

 Вы получаете в свое распоряжение:
 * 2) Анализ материалов корпуса живой устной речи**
 * коллекцию транскриптов видео
 * коллекцию морфологически размеченных транскриптов

Схема анализа LiveCorpus: 1. Анализ частотного словаря словоформ и лемм (в сопоставлении с частотным словарем Основного корпуса НКРЯ, подкорпуса бытовой речи Устного корпуса НКРЯ.

2. Элементы разговорного языка (то, что отличается от литературного языка)
 * сленг
 * слова-"паразиты" и "запинки" (//вот, значит, эээ, ммм//)
 * оговорки, обрывы (в транскриптах)
 * речевые ошибки (например, ошибки в выборе падежа, слова)
 * словообразовательные инновации в лексике (//френдюшки//)
 * порядок слов, нестандартартный синтаксис
 * в целом - смена речевой стратегии говорящего и как она выражается в языке; поддержание коммуникации в диа- и полилоге и др. вопросы с точки зрения модели "говорящий - слушающий".

3. Анализ несловарных слов (помета bastard) в морфологической аннотации. Сложные случаи разбора -- по вашему опыту разметки (например, сложность в выборе части речи, леммы и т.п.).

Отчет по проекту LiveCorpus также состоит из письменной и устной части. В письменной работе и устной презентации вы должны указать, на каких материалах вы строили анализ, затем отразить п. 1-3 и закончить кратким общим выводом. Примеры из просмотренных текстов обязательны. Приветствуется составление частотных словариков (и сравнение их с частотными списками НКРЯ здесь), а также использование NotePad++ (регулярных выражений) для поиска тегов и т.п.

Разделение труда при подготовке письменной части и презентации - на усмотрение участников группы, группа получает общую оценку за письменную часть. На зачете рассказывают все - и затем отвечают на вопросы. В зависимости от устного ответа, оценка каждому участнику может быть повышена или понижена. Последняя составляющая (индивидуальной) оценки -- вопросы другим группам по их проектам.
 * Оценка за зачет**

На последнем семинаре можно будет обсудить детали ваших проектов.


 * PS** Для самых острожных сообщаю, что разрешены любые отступления от указанной схемы, креатив уважается. Можно посоветовать не запихивать все-все-все в устную презентацию, а сосредоточиться на самом интересном из того, что вы узнали. Но будьте готовы - остальное вас спросят в режиме "вопросов из зала".