10_Практикум+COCA


 * Практикум COCA-2**
 * (домашнее задание)**

NB Обучающий практикум по COCA находится здесь.

Уровни выполнения задания: >> пп. 1 и 8 -- на 6 баллов >> пп. 1-8 -- на 8 баллов >> все - на 10 баллов.

1. Сравните сочетаемость двух глаголов существительными в позиции их объекта (ср. //to reach an agreement, to attain a target, to secure an agreement, to realise a dream, to fulfil an obligation, to achieve a compromise//): >> achieve и reach -- если ваша фамилия начинается с А >> reach и secure -- если ваша фамилия начинается с Б-Г >> fulfil и realize -- если ваша фамилия начинается с Д-Е >> attain и realize -- если ваша фамилия начинается с Ж-И >> achieve и fulfil -- если ваша фамилия начинается с К-Л >> achieve и realize -- если ваша фамилия начинается с М-Р >> achieve и attain -- если ваша фамилия начинается С-Я

Примечание: Воспользуйтесь режимом COMPARE (см. 2.5 в практикуме). Глаголы нужно искать во всех формах сразу. Объект - существительное, находящееся на расстоянии 2 слова справа от глагола. Настройки **первой выдачи**: SORT BY FREQUENCY, других ограничений нет.

Сформулируйте кратко (1-2 предложения), с какими типами имен существительных //прежде всего// употребляется каждый глагол. Какой глагол, по-вашему, имеет более узкую / более широкую сочетаемость, если их можно сравнить по этому параметру. Ответы запишите в текстовый файл COCA_report.txt.

2. Скопируйте выдачу (copy and paste) в Эксель/Calc. Назовите лист, на который вы вставили данные, COCA1. Уберите лишние пробелы в столбцах с существительными. Найдите существительные, которые встречаются в обеих таблицах (т.е. среди существительных, которые чаще всего сочетаются с первым глаголом, и среди тех, которые чаще всего сочетаются со вторым глаголом). Для этого вставьте в Эксель новый столбец под названием BOTH_VERBS и примените формулу ПОИСКПОЗ. Сохраните таблицу под именем COCA.xlsx (COCA.xls в старых версиях Эксель). Пожалуйста, не заменяйте формулы на значения, чтобы мы могли проверить адекватность выполнения задания. Глаголы, которые нашлись в обеих таблицах, скопируйте в текстовый файл COCA_report.txt.

3. Добавьте в обе таблицы Экселя столбцы LENGTH, LEMMA и NUMBER. С помощью фильтра разметьте существительные по числу SG (ед. число) или PL (мн. число). Подсказка - в основном существительные во мн. числе заканчиваются на //-s//, но это нужно дополнительно проверять.

4. В столбец LENGTH вставьте формулу, которая определит длину существительного в буквах (ДЛСТР).

5. Отфильтровав слова по помете PL, в поле LEMMA вставьте лемму с помощью формулы ЛЕВСИМВ (если слово во мн. числе оканчивается на -s, в большинстве случаев нужно взять на 1 символ меньше, чем длина слова). Заменитна значения (выделить - копировать - вставить как значение, 123), отредактируйте леммы, если нужно.

6. Отфильтровав слова по помете SG, в поле LEMMA вставьте лемму с помощью формулы равенства (например, =B2).

7. Сделайте сводные таблицы на двух новых листах, сколько форм единственного и множественного числа встречается в обеих таблицах.

8. Выясните, какие слова встречаются с глаголом и в единственном, и во множественном числе (третья и четвертая сводная таблица, в которых нужно подсчитать, сколько раз встретилась каждая лемма при одном и при другом глаголе). Осортируйте сводные таблицы по количеству лемм - те, которые встречаются в обеих числовых формах, присутствуют в таблице дважды. Перенесите результаты п. 7 и 8 в текстовый файл COCA_report.txt.

9. Вторая выдача по тому же запросу (SORTING AND LIMITS): Установите параметры выдачи SORT BY -- RELEVANCE и MINIMUM -- FREQUENCY -- 10 -- 10 (поставьте галочки справа и слева от 10). Вы получите существительные, которые встречаются с обоими глаголами, причем в каждом случае с частотой не меньше 10 раз. Создайте новый лист в файле COCA.xlsx и назовите его COCA2. Вставьте результаты поиска по корпусу в него. Кратко опишите в текстовом файле COCA_report.txt, как релевантность изменила результаты выдачи (примеры, какие слова остались, какие ушли и почему).

10. В режиме LIST поищите список сочетаний с одним из ваших глаголов вида [attain] * [n*] -- все в поле WORD(S) (кликните на слове COLLOCATIONS, чтобы убрать все коллокации). Задание этого пункта - выяснить, какие слова (артикли, местоимения и т.п.) встречаются между глаголом и существительным, а затем представить это в виде шаблонов конструкций вида V the N V their N и т.п. С помощью Эксель, опции "Текст по столбцам", найдите слова в позиции после глагола (the, my, their и т.п.), они должны стоять в отдельном столбце. Сделайте сводную конструкцию, скопируйте ее на отдельный лист "как значения". Вставьте столбец с формулой конкатенации строк вида ="V "&//адрес_ячейки//&" N" В итоге у вас должна получиться табличка вида: V the N 10 V their N 5 и т.п.

Скопируйте эту табличку в файл-отчет COCA_report.txt .

11. Не забудьте выполнить задание по AntConc-у:)

Файл Эксель/Calc под названием COCA.xlsx (COCA.xls) + текстовый файл COCA_report.txt лежат в дропбоксе в папке Unit9. Каждый лист в экселе должен быть проименован ясным образом. Каждый раздел в текстовом файле должен иметь заголовок. Заголовок всего текстового файла должен содержать названия глаголов, которые вы сравниваете.
 * Чеклист домашнего задания.**