Экспериментальные методы в лингвистике - это методы , позволяющие изучать факты языка в условиях. управляемых и контролируемых исследователем. Философской основой применения экспериментальных методов в лингвистике является тезис о единстве теоретического и эмпирического уровней познания.
В современной лингвистике термин "экспериментальный метод" не является четким; лингвисты часто говорят об эксперименте там, где имеет место наблюдение, прежде всего наблюдение над текстами (письменными и устными). Существенно. что текст как таковой, будучи данностью не может быть объектом ЭМ; именно поэтому ЭМ не применимы к изучению истории языка, особенностей стиля автора и т.п. в этих случаях следует говорить о наблюдении. Объектом ЭМ является человек - носитель языка, порождающий текст, воспринимающий тексты и выступающий как информант для исследователя. в лингвистическом эксперименте исследователь может иметь в качестве подобного объекта самого себя или других носителей языка; в первом случае следует говорить об интроспекции, во втором - об объективном эксперименте.
Экспериментальная работа с информантами (нередко в сочетании с наблюдением) непосредственно в среде носителей языка называется обычно полевой лингвистикой.
Историю применения ЭМ в лингвистике можно разделить на три периода:
1. Активное освоение ЭМ в фонетике, акцент на сходстве ЭМ в лингвистике и точных науках (труды Богородицкого, Щербы, Матусевича)
2. Осознание ЭМ в лингвистике как важнейшего способа получения данных о живом языке вообще , включая его морфологию. синтаксис, семантику, а также проблемы языковой нормы, языкового общения, патологий речевого развития и т.д. эта научная программа была впервые сформулирована Щербой ("О трояком аспекте языковых явлений и об эксперименте в языкознании")
3. Реализация указанной научной программы, и как следствие углублении методологических разработок (Апресян, Фрумкина). В социолингвистике и психолигвистике ЭМ занимают доминирующие место.
Последовательное применение ЭМ в исследовании языка и речевых процессов сделало необходимым использование статистических методов при планировании эксперимента и обработке результатов (лингв. статистика). существенно. что лигвист, изучающий речевое поведение человека, имеет дело с объектом, равным ему самому по сложности. В силу этого отношение исследователь - объект в лингвистике превращается в симметричное отношение между двумя исследователями: информант может иметь свою теорию об экспериментаторе и соответственно изменять свое поведение в процессе эксперимента, что может негативно повлиять на результаты Э. Особой сферой использования ЭМ являются машинные эксперименты, проверяющие адекватность формализованных действующих моделей языка.
Процесс Э:
* общая задача
* рабочая гипотеза
* формальные выводы, изменения
* новые гипотезы
Цель Э - проверка гипотез. Человек не должен знать целевую установку экспериментатора.
Типы экспериментов:
* моделирующие эксперименты (в социолингвистике): порождается ряд гипотез, отбираются социальные параметры, которые варьируются
* имитационные эксперименты (лабораторные) - имитация усеченной действительности
* натурные эксперименты включают условия, позволяющие демонстрировать поведение, максимально похожее на реакцию в аналогичной естественной ситуации.
Типы методов (по количеству информантов):
* индивидуальный
* межгрупповой
* многоуровневый, многофакторный
(Хофман) Экспериментальные методы в семантике:
* ассоциативный эксперимент - испытуемому дается слово-стимул и предлагается реагировать на это слово первым пришедшим в голову словом или словосочетанием
* метод семантического дифференциала (экспер. семантика) - один из методов построения субъективных сем. пространств ( градуированные оценочные шкалы)
* метод классификации (в психолигвистике - испытуемым предлагается разбить материал на произвольное количество классов.)
* эксперимент п членению денотативного континуума (Фрумкина: смысловые отношения в группе слов цветообозначений + Лабов "Структура денотативных значений" - сосуды - cup, bowl, glass -> размытость и взаимозависимость денотативных границ; модели, основанные на компонентном анализе, не объясняют вышеназваного свойства, вывод - более адекватна теория прототипов, которая только начинает применяться в семантике).
2. Эволюция систем автоматизированного перевода.
1947 г. - Memorandum by Warren Weaver об автоматическом переводе
1954 г. - Джорджтаунский эксперимент (Массачусетс)
Типы систем:
* системы машинного перевода (СМП)
* системы человеко машинного перевода (АС)
* ТБД
Три поколения СМП (условная классификация, Марчук не признавал деления на поколения):
I поколение:
* содержали полный алгоритм морфологического анализа
* имели имели алгоритм снтаксического анализа, но всегда одновариантный
* синтез - блок морфологического синтеза, болк синтаксического синтеза
* в словарной статье - только переводной эквивалент, остальная информация - в алгоритмах
* работа только в пакетном режиме
II поколение (SYSTRAN, АМПАК, Georgetown System, ):
* мощный блок синтаксическогоанализа и синтеза
* многовариантный синтаксический анализ
* увеличение числа и объема словарных статей: ПЭ + синтаксические модели управления и сочетаемости (информация об управлении должна находится в словаре, а не в алгоритме)
* недостаточное внимание семантике ( нет сем. дефиниций, моделей упраления в терминах сем. классов)
* работа и пакетном и в интерактивном режимах
III поколение (ЭТАП-1 (350 слов), ЭТАП-2 (4000 слов), модель "Смысл-текст", Апресян):
* широкое использование семантики на всех уровнях: в словаре, алгоритме
* только исследовательские системы, нет ни одной промышленной
Марчук "Проблемы МП" - 3 периода, Слокум "Обзор разработок по МП":
1. 1946 - 1957
* выдвинута концепция языка как кода
* созданы первые машинные словаридля МП
* разработана общая концепция МП (алгоритмы наализа и синтеза, рпограммное обеспечение)
* опробованы первые СМП
* повышенный интерес к проблеме, связанный с надеждами на возможность скоростного высококачественного перевода текстов любого типа, щедрое финансирование
2. 1957 - 1967
* доклад консультативного Комитета по автоматизированной обработке ЕЯ (ALPAC) при Национального Академии Наук США - доказана невозможность полностью автоматизированного высококачественного перевода -> свертывание разработок, сокращение финансирования текущих исследований (но не долгосрочных)
* успешные попытки промышленной эксплуатации СМП
* широкие теоретические исследования: возникла идея языка-посредника, методика контекстного анализа для рзрешения основных лигв. проблем.
3. 1967 - настоящее время
* возрождение интереса к МП
* Люксембург, конференция "Преодоление языковых барьеров"
* активная промышленная эксплуатация СМП
Развитие МП происходило согласно гегелевской триаде - тезис, антитезис, синтез.
СМП АС ТБД
SYSTRAN (1070, автор -Peter Toma, 15 пром. пар языков, пакетный режим работы, язык посредник Interlingua, 200.000 - 300.000 )
АНРАП (ВЦП), СПРИНТ PC, ЭТАП-1 (Апресян, модель "Смысл-текст", словарь -350 слов), ЭТАП-2, словарь -4000 слов EURODICAUTOM (1.200.000 заголовков)
LEXIS (1.500.000)
SIEMENS (1.500.000)
TERMIUM (> 2 млн.)
Default FixSim_112007