10_ELAN

=ELAN=

ELAN - система для разметки (аудио- и видео-) данных, созданная в Институте Макса Планка в Неймегене (Нидерланды). Позволяет создавать слои разметки разных типов, определяемых пользователем. В ELAN-е часто делают следующие виды разметки:
 * письменная расшифровка,
 * жесты, мимика, направление взгляда (для видео),
 * лексемы, грамматическая аннотация (глоссирование для полевых данных на малых языках),
 * фонетическая транскрипция (для малых языков).

1. Знакомство с системой
Скачайте программу ELAN со страницы Института М. Планка (Webstart: ELAN v 4.6.1 for Windows), а также Example Set Annotation Video Audio Запустите программу (исполняемый файл .jnlp, согласитесь, что вы доверяете источнику, из которого получен файл), затем откройте файл с аннотацией Файл -> Открыть -> выберите в проводнике файл с аннотацией .eaf. Подождите некоторое время, пока загрузятся файлы (одновременно загружаются и аннотация, и файлы видео и/или аудио), изучите структуру слоев разметки, запустите видео, чтобы посмотреть, как синхронизируется видео и слои разметки.

_Важные фичи_: Все можно масштабировать.
 * окно видео * окно настроек (можно замедлять воспроизведение)
 * окно аудиопотоков/осциллограм
 * несколько слоев разметки



Независимые и связанные с родительским слои: принцип Time Subdivision (например, реплика членится на отдельные слова -- слой не может выходить за границы начала/конца родителя), принцип Symbolic Association (один в один). Представление слоев как иерархии (Вид...). Активация слоев для редактирования (двойным кликом).

2. Разметка файла с нуля
Файлы для работы видео [|1]

2.1. Создайте новый пустой файл для аннотации вашего видео и(или) аудио
В появившемся окне выберите нужный видео/аудио и отправьте его в Выбранные файлы. Нажмите ОК. Сохраните файл аннотации под своим именем (формат .eaf)
 * Файл -> Новый
 * Файл -> Сохранить

2.2. Создайте типы аннотаций / Импортируйте из образца .eaf
Создадим два новых типа: >> speech и >> gestures (стереотип у обоих - None). Еще один тип -- для интерпретации значения жестов: >> gesture-meaning (должен иметь стереотип Symbolic Association, это зависимый тип, т.к. аннотация значений привязана по времени к аннотации жестов).
 * Тип -> Добавьте новый тип слоев

Можно сразу импортировать все типы слоев из файла образца, который вы скачали с сайта Института Макса-Планка.
 * Тип -> Импортировать типы...

2.2. Создайте слои аннотации
Проиграйте мультимедиа с помощью центральной кнопки на панели проигрывателя, определите количество участников речевой ситуации (включая и тех, кто говорит на видео "за кадром"). Для каждого участника создадим слой расшифровки его реплик (для участника А - А-Speech и т.п.). Укажем тип слоя (speech), участника, аннотатора (себя), остальные характеристики дефолтные (none).
 * Слой -> Добавьте новый слой

Если вы размечаете видео, для каждого участника в кадре создадим слой его жестов (для участника А - А-Gestures и т.п.). Укажем тип (gestures), участника, аннотатора, остальное дефолтно. Под каждым слоем жестов создадим слой для интерпретации их значения в речевой ситуации (например, A-GestMeaning). Здесь укажите тип (gesture-meaning) и родительский слой (например, A-Gestures)
 * Слои можно импортировать, так же, как типы: Слой -> Импортировать слой...

2.3. Разбейте клип на микрореплики и впишите аннотации для транскриптов.
Если нужно, настройте режим замедленного проигрывания видео (90-80%): Чтобы начать вводить аннотации, необходимо _активировать нужный слой_ (двойным кликом - он должен быть подкрашен розовым). Проигрывайте мультимедиа и выделяйте микрореплики -- предложения или даже лучше части предложений между паузами.
 * Controls - Скорость/Rate

Кликнув мышкой, установите красную полосу на месте примерного начала микрореплики, а затем, держа нажатой клавишу SHIFT кликните на конце микрореплики (то же можно сделать в режиме drag-and-drop, как будто вы выделяете слова). Кликните на появившемся "отрезке" дважды, откроется область для заполнения аннотации.

_Полезное_ Сдвинуть левую/правую границу аннотации: зажав ALT, подвести курсор к границе и подвинуть. Сдвинуть аннотацию: зажав ALT и наведя курсор на аннотацию, подвинуть влево/вправо. Ctrl + Space: проиграть / поставить на паузу. Shift + Space: проиграть выделенное. Ctrl + PageUp/PageDown: промотать вперед/назад. Уточнять области для аннотации можно с помощью панели прокрутки (например, переместить красную линию на 1 секунду вперед) и находящейся справа панели выделений (переместить красную линию к концу/началу реплики; проиграть реплику; снять выделение). Аннотируйте реплики говорящих примерно для 30 секунд видео/аудио.

2.4. Разметьте слои жестов и значения жестов.
Для каждого участника нужно выделить фрагменты, в которых он делает какой-либо жест, в слое жестов нужно указать активный орган (например, "правая рука") и характеристику движения (например, "слева направо" - кстати, считается относительно говорящего). NB В учебной аннотации мы не используем классификации жестов и стандартизованных словарей для разметки, слой жестов размечается с помощью свободного описания.

В слое значения жестов укажите свою интерпретацию (например, привлечение внимания, подчеркивание значимой информации, указание, угроза и т.п.).

2.5. *Разделите реплики на словоформы (необязательное задание).
Активируйте слой реплик. Выделите реплику. Подвиньте границы словоформ, чтобы они совпадали с произнесением.
 * Слой -> Токенизировать слой... выберите слой, в который вставить словоформы (стандартные параметры: разделитель - пробел)

2.6. *Словоформам припишите помету части речи (необязательное задание).
Если у вас нет слоя частей речи (POS), импортируйте его из файла образца, как указано выше. Переименуйте его и перепривяжите к слою Words одного из говорящих. (Слой -> Изменить...) В слое POS должны появиться пустые аннотации. Выберите часть речи из открывающегося списка, double-кликая на каждой аннотации.
 * Слой -> Создать аннотации на зависимых слоях... (выбрать слой-источник) -> Next -> (выбрать конечный слой)

PROFIT!
В конце работы сохраните свой файл аннотаций (он будет иметь расширение .eaf) и загрузите в дропбокс Unit 11 (создайте папку Unit11, если нужно).
 * Файл -> Сохранить

Горячие клавиши
Alt+d – удалить элемент аннотации; Alt+Down – перейти на нижнюю аннотацию; Alt+Left – перейти на предыдущую аннотацию; Alt+n – новый элемент разметки на слое; Alt+Right – перейти на следующую аннотацию; Alt+Shift+c – отменить выделение; Alt+Up – перейти на верхнюю аннотацию; Ctrl+/ – перевести курсор в начало/конец выделения; Ctrl+Alt+p – настройка печати разметки ￼ ELAN; Ctrl+Alt+t – удалить слой разметки; Ctrl+b – промотать в начало; Ctrl+c – копировать элемент аннотации; Ctrl+e – промотать в конец; Ctrl+Left – перевести курсор на 40 ms раньше; Ctrl+n – создать новый проект ￼ ELAN; Ctrl+o – открыть один из старых проектов ￼ ELAN; Ctrl+PgDown – промотать вперед на “страницу”; Ctrl+PgUp – промотать назад на “страницу”; Ctrl+Right – перевести курсор на 40 ms позже; Ctrl+s – сохранить проект ￼ ELAN; Ctrl+Shift+Left – перевести курсор на 10 ms раньше; Ctrl+Shift+Right – перевести курсор на 10 ms позже; Ctrl+Shift+t – добавить новый лингвистический тип; Ctrl+Space – запустить/остановить проигрывание медиа файла; Ctrl+t – создать новый слой разметки; Ctrl+v – вставить элемент аннотации; Ctrl+w – закрыть один из открытых проектов ￼ ELAN; Ctrl+y – повторить действие; Ctrl+z – отменить действие; Ctrl+с – копировать элемент аннотации; Ctrl+v – вставить элемент аннотации; Alt+d – удалить элемент аннотации; Shift+Left – перевести курсор на 1 s раньше; Shift+Right – перевести курсор на 1 s позже; Shift+Space – проиграть выделенное; File>Automatic Backup – настройка автосохранения резервных копий проектов ￼ ELAN; File>New (Ctrl+n) – создать новый проект; File>Open (Ctrl+o) – открыть один из старых проектов ￼ ELAN; File>Save (Ctrl+s) – сохранить проект ￼ ELAN; File>Export as – экспортировать проект из ELAN в другие форматы; File>Import – импортировать в ￼ ELAN из ￼￼￼Toolbox, ￼ FieldWorks, PRAAT, ￼ Transcriber, Shoebox, CHAT, Recognizer или CSV-файла; Edit>Linked files (Ctrl+Alt+l) – добавить или удалить медиа файлы в проект ￼ ELAN; View>Shortcuts – посмотреть список всех команд, которые заданы горячими клавишами; Edit>Preferences>Edit Shortcuts – изменить горячие клавиши;

=Дополнительные материалы= Краткая инструкция по-русски (Brigitte Pakendorf) Подробная инструкция по-русски Подробное официальное руководство Другие инструкции сторонних разработчиков [|Тьюториал Г.А.Мороза по PRAAT (как визуализировать звуковую дорожку)]