takya.ru страница 1
скачать файл

Интеграция лексической и формальной (композиционной) семантики, Лекция 1.

В.Б. Борщев и B.H. Partee. Казань, КГУ, Апрель 2003 стр.

Лекция 1. Какие семантики бывают. Исчисление предикатов как прототипический пример формального языка

Владимир Борщев, ВИНИТИ РАН borschev@online.ru

Barbara H. Partee, University of Massachusetts, Amherst partee@linguist.umass.edu

home page: http://www-unix.oit.umass.edu/~partee/



  1. Цели


Наши цели – дать некоторое представление о формальной и лексической семантике и о том, как эти семантики можно интегрировать.

Первая лекция – вводная. Ее содержание видно из названия и handout’а. В самом ее конце мы начнем рассказ о формальной семантике и продолжим его во второй лекции. Третья лекция будет посвящена нашему (логическому) подходу к лексической семантике и тому, как можно интегрировать формальную и лексическую семантику.

И, наконец, четвертая (и последняя) лекция будет посвящена конкретной проблеме – описанию генитивной конструкции (стакан молока) и взаимодействию формальной и лексической семантики на этом примере.

  1. Какие семантики бывают


Их много, назовем некоторые: лексическая, формальная, когнитивная, вычислительная. В этом разделе мы скажем несколько слов о каждой из перечисленных, а после будем говорить, в основном, о первых двух и их интеграции.
    1. Лексическая семантика


Как следует из названия, лексическая семантика занимается значениями слов. В каком-то смысле, этим всегда занимались лексикографы, составляя толковые словари. В последнее время это стало наукой. Перечислим кратко несколько известных нам направлений и имен.

Московская семантическая школа.


Первые работы начались в конце 50-х. Основные имена: И.А.Мельчук, А.К.Жолковский, Ю.Д.Апресян. Ключевые слова: Модель «Смысл-Текст», Толково-комбинаторный словарь (ТКС), лексические функции. Книга Апресяна «Лексическая семантика» (закончена в 1970, первое издание 1974, второе – 1995). В середине 70-х Мельчук эмигрировал в Канаду (и продолжает там работу). Жолковский уехал в Америку и занимается сейчас литературоведением. Апресян и его группа продолжают работать в Москве. Результаты подробно описаны в многочисленных публикациях.

Основные принимаемые принципы (в нашем субъективном изложении, очень грубо). Слова разбиваются на лексемы (разные лексемы имеют разные значения). Значения языковых единиц (лексем) описываются с помощью их толкований. Толкования – это тексты на специальном формальном метаязыке, определяющие, грубо говоря, эти значения через более простые. Существуют семантические примитивы, элементарные значения, атомы смысла. Все остальные значения строятся из элементарных (и уже построенных промежуточных) с помощью некоторого синтаксиса, некоторых операций. «Толкование не должно содержать «порочных кругов» (нетавтологичность) и должно быть семантически эквивалентным толкуемой единице (необходимость и достаточность)» (Апресян 1994).

Можно сказать, что принимается схема математических определений. Существуют элементарные неопределяемые понятия, остальные понятия определяются с их помощью.

Пример (Апресян 1990). Фрагмент словарной статьи глагола выйти:

ВЫЙТИ… 1.1. ‘идя, переместиться вовне': выйти из комнаты;

1.2. ‘переместиться вовне': Судно вышло из бухты;

Направления, близкие Московской семантической школе


Упомянем тут прежде всего работы известной польско-австралийской лингвистки Анны Вежбицой (Anna Wierzbicka).

Много лингвистов, занимающихся лексической семантикой и не входящих в группу Апресяна, работает в Москве (например, Н.Д. Арутюнова, Е.В. Падучева, Е.В. Рахилина, их сотрудники и коллеги).


Западные работы


Назовем только некоторые имена: M. Bierwisch, J.Dölling, D. Dowty, Ch. Fillmore, P. Kiparsky, M. Krifka, B. Levin, J. Pustejovsky, M. Rappoport-Hovav. Основной задачей большинства западных работ была связь лексической семантики и синтаксиса. Например, в какоой степени лексическое значение глагола может предсказать конструкции, главным словом 9вершиной0 которых является данный глагол.

2.2. Формальная семантика


Это направление в семантике было основано логиками. Можно назвать несколько имен – D.Lewis, M. Cresswell etc. Но главная фигура здесь – Richard Montague (Ричард Монтегю) – именно его работы сформировали это направление, отсюда и его первое название – грамматики Монтегю (другие названия – композиционная семантика, семантика синтаксиса; но основное название теперь – формальная семантика).

Основная идея Монтегю выражена в названии одной из его работ – "English as a formal language" (Montague 1970b). Т.е. формальная семантика рассматривает естественный язык как формальный логический язык, может быть гораздо более сложный, чем "обычные" логические языки. Тем самым при его описании естественно использовать такие же понятия и конструкции, как и при описании "обычных" логических языков.

Как иллюстрацию, приведем цитату, начало уже упомянутой работы Монтегю “English as a Formal Language”: “I reject the contention that an important theoretical difference exists between formal and natural languages. ... In the present paper I shall accordingly present a precise treatment, culminating in a theory of truth, of a formal language that I believe may reasonably be regarded as a fragment of ordinary English. ... The treatment given here will be found to resemble the usual syntax and model theory (or semantics) [due to Tarski] of the predicate calculus, but leans rather heavily on the intuitive aspects of certain recent developments in intensional logic [due to Montague himself].”

Приблизительный перевод этого яркого отрывка: “Я отвергаю тезис, что формальные и естественные языками существенным образом различаются с теоретической точки зрения... В настоящей работе я представлю точное описание формального логического языка, который, как я думаю, может с достаточными основаниями рассматриваться как фрагмент обычного английского языка; это описание завершается теорией истинности1. Это описание аналогично обычному синтаксису и теории моделей (или семантике) для исчисления предикатов [построенные Тарским], но существенным образом опирается и на некоторые последние результаты в интенсиональной логике [полученные самим Монтегю]. ”

Как мы уже говорили, это основной тезис формальной семантики. Значительная часть наших лекций будет посвящена его прояснению. Мы попытаемся ответить на следующие вопросы:

Что такое формальный (логический) язык?

Какие черты формального языка особенно важны для формальной семантики?

Каковы основные различия между естественным языком и “искусственными” формальными языками?

Какие механизмы семантики “настоящего” естественного языка мы можем моделировать средствами (cуществующей) формальной семантики? И для каких вещей нужны другие инструменты?

2.3 Когнитивная семантика (когнитивная лингвистика)


Наверное, основная идея здесь, разделяемая, видимо, подавляющим большинством лингвистов), состоит в том, что язык описывает не «объективную реальность», а «наивную картину мира» (Московская семантическая школа, см., например, Апресян 1986). Говорят также о «наивной онтологии» (Link 1983) или “natural language metaphysics” (Bach 1986).

Когнитивная семантика (лингвистика) акцентирует внимание именно на этой стороне языка и связывает лингвистику с другими науками, занимающимися тем. Как человек воспринимает мир.

В наших лекциях мы почти не будем касаться этих аспектов. Назовем тут только основные имена: G. Lakoff (Лаков), L. Talmy (Талми), R. Jackendoff (Джакендоф).

    1. Вычислительная семантика (Computational Semantics)


Эта семантика занимается тем, что можно делать на компьютерах. Прежде всего, это прикладные задачи. Вычислительная семантика занимается реализацией семантических методов в таких задачах, как машинный перевод, информационный поиск, диалог с компьютером и т.п. С другой стороны, понимание вычислительных аспектов семантики может помочь развитию теории, в частности поставить перед ней новые задачи.

По следующей ссылке (link’у) можно найти работы по вычислительной семантике: http://mas.cs.umass.edu/~rawlins/clsbib/


3. Синтаксис и семантика исчисления предикатов (ИП)


Как уже говорилось, мы в наших лекциях, будем обсуждать лексическую и формальную семантику и их интеграцию. Формальной основой всего этого является логика. Логика сама когда-то возникла из анализа естественного языка…

Поэтому нам естественно начать с краткого рассмотрения самого известного и, в некотором смысле, «прототипического» логического языка – Исчисления Предикатов. Мы используем его, чтобы проиллюстрировать наиболее важные для нас черты формального языка: понятие модели и теоретико- модельной семантики, и Принцип Композиционности (Principle of Compositionality).


3.1. Неформальное описание синтаксиса и семантики ИП


Мы ограничимся здесь несколькими примерами и замечаниями. Более точные определения даны в Приложении.

Предложения Джон любит Мери и Всякий, кого любит Мери, счастлив могут быть представлены как формулы ИП:



Джон любит Мери love (John, Mary)2

Всякий, кого любит Мери, счастлив x(love(Mary, x) happy(x))

Формула x(even(x) & (x 1)) говорит, что существуют четные числа, большие 1



Формулы и другие выражения ИП строятся из индивидуальных констант (или просто “констант”), (индивидуальных) переменных, предикатных констант (или предикатных символов), логических связок и кванторов. Каждое выражение принадлежит к определенному типу. Структура типов в ИП очень проста: объекты (individuals, entities), отношения разной арности (унарные, бинарные и т.д.), и истинностные значения.

В наших примерах мы используем следующие выражения



Выражения Types

===================================================

John, Mary, 1, 2, … константы объекты

x, y, z, x1, y1, z1, x2, ... переменные объекты

happy, even унарные предикатные унарные отношения

символы


love, бинарные предикатные бинарные отношения

символы


love (John, Mary)

love(Mary, x)

happy(x)

even(x) формулы истинностные значения

(x 1)



x(love(Mary, x) happy(x))

x(even(x) & (x 1))

Первые пять формул выше – примеры атомарных формул.

Выражения логических языков интерпретируются в моделях. Структура моделей, в которых интерпретируются выражения данного языка, отражают базисные пресуппозиции о «структуре мира», имплицитно содержащиеся в языке. Для исчисления предикатов каждая модель состоит из множества {1,0} истинностных значений, универсума (или домена – domain) D – некоторого множества объектов, и некоторого набора n-арных отношений на множестве D.

Интерпретация выражений языка ИП в данной модели задается с помощью интерпретационной функции I, которая сопоставляет значения константам и предикатным символам.

Итак, мы будем представлять каждую модель в виде



M =

Интерпретация строится рекурсивно на основе интерпретирующей функции I. Каждому выражению сопоставляется его семантическое значение M M в данной модели М (точнее, M,g, где g – некоторая оценивающая функция, сопоставляющая значения переменным). Семантические значения должны соответствовать типам выражений. Так, в нашем примере индивидуальным константам John и Mary сопоставляются некоторые элементы множества D, переменные принимают свои значения на множестве D, бинарному предикатному символу love сопоставляется бинарное отношение loveM, а унарному предикатному символу happy сопоставляется унарное отношение happyM . Формулы получают истинностные значения. Формула love (John, Mary) истинна в модели М, если пара элементов, соответствующих константам John и Mary, принадлежит отношениюloveM.

Формула x(love(Mary, x) happy(x)) истинна в М если и только если:

для каждого элемента d D, d happyM, если MaryM, d loveM.

Чтобы точнее говорить о значениях такого рода выражений в моделях, нужно подробнее описать функции оценки переменных, значения связок, кванторов и т.п. Мы делаем это в Приложении, куда и отсылаем читателя.

А здесь мы чуть точнее покажем, как вычисляется истинностное значение формулы x(love(Mary, x) happy(x)) в модели M по приведенным в этом Приложении семантическим правилам. Используемая ниже запись g[d/x] обозначает функцию оценки, которая совпадает с функцией g для всех переменных, кроме x. Для x значение g[d/x] равно d.

Итак, по правилу S7 мы имеем:



x(love(Mary, x) happy(x)) M,g = 1 тогда и только тогда, когда для каждого d D,

d happy M,g[d/x] , если MaryM,g[d/x], xM,g[d/x] loveM,g[d/x].

Заметим, что если в выражении нет переменных, то значение этого выражения не зависит от функций оценки. Так, в нашем примере, для каждой константы (индивидуальной или предикатной), M,g[d/x] = I().

Для переменной xM,g[d/x] = g[d/x]( x) = d.

Поэтому:

x(love(Mary, x) happy(x)) M,g = 1 тогда и только тогда, когда для каждого d D, d I(happy), если I(Mary), d> I(love).

Наша формула замкнута, так как единственная переменная этой формулы связана квантором общности (т.е. не свободна). Мы видим, что значения таких формул не зависят от функций оценки. Каждая такая формула истинна или ложна в данной модели. Курсив в предыдущей фразе подчеркивает, что речь идет не об истинности и ложности вообще, а только относительно той или иноой модели. По сути дела, это условие на вид модели: какой должна быть модель (мир), чтобы формула была истинна. Такого рода семантика называется теоретико-модельной.


Пример


Рассмотрим очень простой язык ИП, содержащий, как и формулы, рассмотренные выше, всего две константы, John и Mary, и два предикатных символа: love (бинарный) и happy (унарный).

Рассмотрим две модели, M1 и M2:



M1 = 1>, D = {j,m},

I1(John) = j, I1(Mary) = m,

I1(love) = {,,,}, I1 (happy) = {j,m},

M2 = 2>, D = {j,m},

I2(John) = j, I2(Mary) = m,

I2(love) = {,}, I2 (happy) = {m}.

Легко видеть, что формулы love (John, Mary) и love (Mary, John) истинны в модели M1, но только вторая из них истинна в M2. Формула x(love(Mary, x) happy(x)) истинна в M1 и ложна M2, так как для оценки g, такой, что g(x) = j имеет место love(Mary, x)M2,g = 1 и happy(x) M2,g = 0.

Формальная семантика тоже строится как теоретико-модельная. Каждое предложение рассматривается как формула некоторого логического языка и вычисляется его истинностное значение. Но это не истинность и ложность вообще, а истинность и ложность относительно той или иной модели. Т.е это тоже условие на вид модели. Грубо говоря, на тип ситуаций, для которых данное предложение истинно.

3.2. Принцип композиционности (The Principle of Compositionality)


Бесконечное множество формул ИП строится из переменных, констант и предикатных символов в помощью рекурсивных синтаксическоих правил (правила R1 – R8 в Приложении). Семантика этих формул – их интерпретация в каждой данной модели – определяется семантическими правилами S1 – S8, которые прямо соответствуют синтаксическим правилам. Такое соответствие позволяет (при интерпретации выражений) определять семантику целого через семантику частей. между семантическими правилами интерпретации и синтаксическими правилами образования выражений семантика целого основывается на семантике частей. Это очень важная характеристика формального языка называется Принципом Композиционности. Естественно считать, что этот принцип соблюдается также (может быть, с некоторыми отклонениями и модификациями) и в естественном языке.

Действительно, носитель языка может породить бесконечное множество грамматически правильных предложений. Поэтому синтаксис строится как конечное число правил, описывающих множество предложений естественного языка. Кроме того, носитель языка может понять значение каждого из этого бесконечного множества предложений. Так что семантика должна обеспечить некоторый конечный способ описания значений бесконечного множества предложений естественного языка.

Центральный принцип формальной семантики состоит в том, что отношение между синтаксисом и семантикой композиционно.

Принцип Композиционности: Значение выражения есть функция значений его частей и способа их синтаксической комбинации.

Смысл каждого из основных терминов в формулировке принципа композиционности зависит от используемой теории, и существует столько версий этого принципа, сколько существует определений этих терминов. (значение, функция, части (синтаксис)).

В теоретико-модельной семантике (Фреге, Тарский, Карнап, Монтегю) определяются истинностные значения выражений в каждой модели (при данной оценке переменных). Значение каждого выражения определяется по значениям его частей.

Для этого, как мы уже говорили, не нужно знать, верно ли на самом деле то или иное предложение. Мы определяем его значения в той или иной модели. Т.е. значение предложения описывает множество ситуаций (моделей), в которых оно истинно.


4. Формальная семантика (грамматики Монтегю)

4.1. Предварительные замечания


Это наша вторая тема в этом курсе. Обычно, читая семестровый курс в РГГУ (лекция и семинар раз в неделю), Барбара тратит на эту тему большую часть времени. Здесь в нашем распоряжении чуть больше одной лекции. Поэтому наше изложение будет более чем фрагментарным. В основном, опирающееся на отдельные примеры. Какие-то точные вещи в Приложениях. Наша цель – дать какое-то начальное впечатление о формальной семантике.

4.2. Еще раз об основных идеях формальной семантики и почему Исчисления Предикатов недостаточно для описания семантики естественного языка


Выше мы приводили основной тезис Монтегю “English as a formal language”. Он предлагал рассматривать естественный язык как формальный, описывая его синтаксис и теоретико-модельную семантику, т.е. так же, как это делается в логике. И, конечно, использовать Принцип композиционности.

Два подхода.


При этом возможны два подхода (и Монтегю в разных своих работах использовал оба):

  1. Прямой: непосредственно описывать синтаксис естественного языка и непосредственно интерпретировать выражения естественного языка в моделях.

  2. Двухэтапный, с использованием промежуточного логического языка: Описать предварительно «подходящий» логический язык, его синтаксис и семантику, предполагая что этот язык эквивалентен (и близок) естественному языку. А затем строить (тоже, конечно, композиционно) перевод с естественного языка на этот «промежуточный» логический язык, тем самым решая (в два этапа) задачу четкого описания семантики естественного языка.

Подходы эти, технически и методически разные. Разные работы и разные учебники выбирают тот или иной подход. Подчеркнем, что одна ключевая вещь одинаково важна в обоих походах – это представления о структуре моделей. На самом деле, это представления о том, как естественный язык структурирует мир.

Почему недостаточно Исчисления Предикатов?


Первые попытки использовать логику для описания семантики естественного языка были связаны с Исчислением Предикатов. Сразу же возникли трудности при представлении многих конструкций, причем не ясно было, как их можно преодолеть, «не выходя» за пределы этого языка.

Проиллюстрируем это на некоторых примерах


Союзы и кванторы

(1) (а) Джон поет и танцует (б) Джон поет и Джон танцует

Предложения (1а) и (1б), грубо говоря, эквивалентны. Предложение (1б) можно представить в виде формулы (1в):

(1) (в) dance(John) & sing(John)

Но формулу (1в) трудно получить композиционно по предложению (1а).

(2) (а) Каждый студент танцует

Стандартным переводом предложения (2а) считается формула (2б). Но ее трудно считать «композиционным переводом» предложения (2а):

(2) (б) x (student(x) dance(x))

Еще больше трудностей возникает при (композиционном) представлении формулами ИП предложений, сочетающих две упомянутые конструкции – кванторы и несентенциальную («групповую») конъюнкцию:

(3) Один студент поет и танцует


  1. Каждый студент поет и танцует

Прилагательные как определения к существительным


Разные подклассы прилагательных в сочетании с существительными, которые они определяют, ведут себя по-разному с семантической точки зрения. Например:

(5) красная книга в некотором приближении можно сказать, что это «нечто красное и, в то же время, являющееся книгой', red(x) & book(x)



  1. искусный хирург это, конечно, ‘некто, являющийся хирургом», но он уже искусен, как хирург, а вовсе не 'универсальный искусник', скажем, уже не обязательно искусный скрипач. И простой конъюнкцией тут не обойтись

(6) бывший учитель это уже некто, кто был когда-то учителем, но сейчас уже и не учитель

(7) предполагаемый убийца этот некто может быть, а может и не быть убийцей

Проблемы, возникающие здесь, требуют интеграции лексической и композиционной семантики и прежде всего, адекватного семантического описания конструкции именной группы, содержащей прилагательные.

Не менее серьезные трудности возникают при адекватном представлении глагольных времен, модальностей, «предикатов над предикатами» и в массе других случаев.

Чтобы суммировать некоторые из упомянутых трудностей, рассмотрим соотношение категорий конструкций исчисления предикатов и стандартных конструкций естественного языка. Мы увидим, что для большей части конструкций естественного языка, в исчислении предикатоа отсутствуют соответствующие категории:

Категории ИП Категории естественного языка


Формула - Предложение

Предикат - Глагол, Существительное (нарицательное), Прилагательное

Термы

Константа - Имя собственное



Переменная - Местоимение (он, она, оно)

==========

(больше нет) - Глагольная Группа, Именная Группа, неполная Именная Группа, Группа Прилагательного, Детерминатор, Предлог, Предложная Группа, Наречие

Чтобы преодолеть хотя бы часть такого рода трудностей, Монтегю предложил использовать в качестве «промежуточного» логического языка язык интенсиональной логики. Многие дополнительные (по отношению к ИП) средства языка интенсиональной логики уже описывались раньше. Некоторые средства, как и вся их комбинация (интенсиональная логика), были, видимо, предложены самим Монтегю.

Мы продолжим на следующей лекции, в Приложении к которой будет приведено описание языка интенсиональной логики, его синтаксиса и семантики.

Литература


Апресян Ю.Д. 1970, Лексическая семантика. Синонимические средства языка. М.: Наука.

Апресян Ю.Д. 1986, Дейксис в лексике и грамматике и наивная модель мира. Семиотика и информатика. Вып. 28, 5-33.

Апресян, Ю.Д. (1990) “Лексикографический портрет глагола выйти” , Вопросы кибернетики. Язык логики и логика языка. Москва. Перепечатана в Апресян, Ю.Д. (1995) Избранные труды, Т. II: Интегральное описание языка и системная лексикография. Москва, Школа “Языки Русской Культуры”. 485-502.

Апресян Ю.Д. 1994 О языке толкований и семантических примитивах. Известия АН, серия литературы и языка, №4. (Цитируется по Ю.Д. Апресян, Избранные труды, т. II, М.:Школа «Языки русской культуры», М. 1995, 466-484).


Борщев В.Б. и Л.В. Кнорина (1990) «Типы реалий и их языковое восприятие», в «Язык логики и логика языка», Москва. 106-134.

Борщев В.Б. (1994) Формальный язык как часть естественного. НТИ, Серия 2, № 9, 27-31

Борщев В.Б. (1996) Естественный язык – наивная математика для описания наивной картины мира. Московский лингвистический альманах 1, 1996.203-225.

Борщев В.Б. (1998) Язык и схемы. НТИ, Серия 2, № 11,1998, 1-5.

Жолковский А.К., Мельчук И.А. (1967) О семантическом синтезе. Проблемы кибернетики. Вып. 19.

Мельчук И.А. (1974) Опыт теории лингвистических моделей «Смысл <==> Текст. М.

Мельчук И.А., Жолковский А.К. (1984) Толково-комбинаторный словарь современного русского языка. Вена

Bach, Emmon. (1986) Natural language metaphysics. In Logic, Methodology, and Philosophy of Science VII, eds. Ruth Barcan Marcus, Georg J.W. Dorn and Paul Weingartner, 573-595. Amsterdam: North-Holland.

Bach, Emmon (1989), Informal Lectures on Formal Semantics. State University of New York Press, Albany.

Dowty, David (1979) Word Meaning and Montague Grammar, Dordrecht:Reidel.

Dowty, David, R. Wall and S. Peters (1981), Introduction to Montague Semantics, Dordrecht: Reidel.

Frege, Gottlob (1892) "Ueber Sinn und Bedeutung", Zeitschrift fuer Philosophie und philosophische Kritik 100, 25-50. Translated as "On sense and reference", in P.T. Geach and M.Black, eds., Translations form the Philosophical Writings of Gottlob Frege. Oxford: Blackwell (1952), 56-78.

Gamut, L.T.F. (1991), Logic, Language, and Meaning. Vol I: Introduction to Logic; Vol II: Intensional Logic and Logical Grammar. University of Chicago Press, Chicago and London.

Lewis, David (1970) "General semantics" Synthese 22, 18-67; reprinted in D.Davidson and G.Harman (eds.), Semantics of Natural Language. Dordrecht: Reidel (1972), 169-218.

Link, Godehard (1983) "The logical analysis of plurals and mass terms: a lattice-theoretical approach", in R.Bauerle, Ch.Schwarze, and A.von Stechow, eds., Meaning, Use, and Interpretation of Language, Walter de Gruyter, Berlin, 302-323.

Mel'chuk, Igor' A. and Aleksandr K. Zholkovsky (1984) Explanatory Combinatorial Dictionary of Modern Russian, Semantico Syntactic Study of Russian Vocabulary, Vienna: Wiener Slawistischer Almanach.

Montague, Richard (1970b) "English as a Formal Language", in B. Visentini et al, eds. Linguaggi nella Societa e nella Tecnica. Milan: Edizioni di Comunita; reprinted in Montague (1974) 188-221.

Montague, Richard (1970c) "Universal Grammar", Theoria 36, 373-398; reprinted in Montague (1974) 222-246.

Montague, R. (1973) "The Proper Treatment of Quantification in Ordinary English," in K.J.J. Hintikka, J.M.E. Moravcsik, and P. Suppes, eds., Approaches to Natural Language, Reidel, Dordrecht, 221-242, reprinted in Montague (1974) 247-270.

Montague, Richard (1974) Formal Philosophy: Selected Papers of Richard Montague. Edited and with an introduction by Richmond Thomason, New Haven: Yale Univ. Press.

Partee, Barbara H. (1984) "Compositionality", in F. Landman and F. Veltman, eds., Varieties of Formal Semantics: Proceedings of the 4th Amsterdam Colloquium, Sept. 1982. Foris Pubs., Dordrecht, 281 311.

Partee, Barbara (1995) "Lexical Semantics and Compositionality", in Invitation to Cognitive Science, 2nd edition. Daniel Osherson, general editor; in Part I: Language, Lila Gleitman and Mark Liberman, eds. MIT Press, Cambridge, pp. 311-­360.

Partee, Barbara (1996) "The development of formal semantics in linguistic theory", in Shalom Lappin, ed., The Handbook of Contemporary Semantic Theory, Blackwell Handbooks in Linguistics Series, Oxford: Blackwell, 11-38.

Partee, B., A. ter Meulen, and R.E. Wall (1990) Mathematical Methods in Linguistics, Dordrecht: Kluwer Academic Publishers.

Pustejovsky, James (1995) The Generative Lexicon. The MIT Press.

Wierzbiсka A. (1972) Semantic primitives. Frankfurt.



Приложение. Синтаксис и семантика исчисления предикатов

СИНТАКСИС.

Синтаксические Категории:

термы (Term): множество Var (индивилуальных) переменных

множество Const (индивидуальных) констант

множество Term термов, Term = Var Const

предикаты (Pred): множество предикатных символов Pred, разбитое на подмножества одноместных предикатных символов Pred-1, двуместных предикатных символов Pred-2, ..., n-местных предикатных символов Pred-n, …

формулы (Form).



Основные выражения:

Term(s): (i) (индивидуальные) переменные: x, y, z, x1, y1, z1, x2, ...

(ii) (индивидуальные) константы: a,b,c,a1, ..., John, Mary, ..., 0,1,

Pred-1: run, walk, happy, calm, ..., even, odd,

Pred-2: love, kiss, like, see, ..., ,

Синтаксические правила задаются рекугсивно:

Базис рекурсии:

R1: Если P Pred-1 и T Term, то P(T) Form.

Если R Pred-2 и T1, T2 Term, то R(T1, T2) Form.

Более общее правило: Если R Pred-n и T1, ...,Tn Term, то R(T1, ...,Tn) Form

Формулы, определяемые этим правилом, называются атомарными



Рекурсивные синтаксические правила (операции на множестве формул):

R2 (): Если Form, то Form.

R3 (&): Если Form и Form, то ( & ) Form.

R4 (): Если Form и Form, то ( ) Form.

R5 (): Если Form и Form, то ( ) Form.

R6 (): Если Form и Form, то ( ) Form.

R7 (v): Если v Var и Form, то v Form.

R8 (v): Если v Var и Form, то v Form.

Заметим, что правила R7 и R8 задают множества операций, по одной операции для каждой переменной из Var.



Несколько дополнительных понятий и обозначений:

В формуле v ее подформула называется сферой действия квантора . Аналогично, в формуле v подформула называется сферой действия квантора .



Открытые и замкнутые формулы

Для формулы обозначим через Var() множество всех ее переменных. Для каждой формулы определим по индукции множество FreeVar() ее свободных переменных:

FreeVar() = Var() для каждой атомарной формулы ;

FreeVar() = FreeVar();

FreeVar( & ) = FreeVar( ) = FreeVar( ) = FreeVar( ) =

= FreeVar() FreeVar()

FreeVar(v) = FreeVar(v) = FreeVar() – {v}.

Формула называется замкнутой (или предложением), если множество ее свободных переменных пусто (FreeVar() = ). Незамкнутые формулы называются открытыми.



Примеры:

Атомарные формулы: love(Mary, x), calm(Peter)

Открытые формулы: love(Mary, x), x(calm(x) happy(y))

Замкнутые формулы: love(Mary, Mary), y(happy(y) &xlove(y, x))



СЕМАНТИКА.

Строение модели: Несущее множество D объектов (сущностей – entities, individuals)

Истинностные значения {Истина, Ложь} или {1,0}

I: Интерпретирующая функция, которая приписывает семантические значения всем константам из Const и предикатным символам из Pred (Pred-1, Pred-2, ... Pred-n)

Модель M =

Множество G функций оценки переменных g: Var D. Каждая такая функция придает каждой переменной значение из D.

Семантические типы, приписываемые Синтаксическим Категориям:

Term: объекты (индивиды, сущности – entities, individuals). Семантические значения этого типа являются элементами D (т.е. I(c) D для каждой константы c Const и g(v) D для каждой переменной v Var и каждой функции g)

Pred-1: множества (объектов). Семантические значения этого типа являются элементами (D)

(D) – множество всех подмножеств D (power set или булеан D).

Pred-2: отношения между объектами (множества пар объектов). Значения этого типа элементы (DD).

Pred-n: n-местные отношения; множества n-ок (n- местных кортежей) объектов. Значения: элементы (D ...D). (Т.е. I(R) Dn для каждого n-арного предикатного символа R)

Form: Истинностные значения. Значения: элементы {0,1}.

Семантическая интерпретация выражений относительно модели M и функции g:

Мы интерпретируем выражения ИП в каждой модели М и каждой функции оценки g и используем обозначение M,g для семантического значения выражения относительно модели M и оценки g.



Основные Выражения (“лексическая семантика”):

A. Если переменная, то M,g = g().

B. Если константа из Const или предикатный символ из Pred, то M,g = I().

(т.е. M,g D, если константа из Const или переменная и M,g Dn, если – n-арный предикатный символ).

Семантика формул ИП – это приписывание им истинностных значений. Мы делаем это рекурсивно с помощью правил S1-S8 (в соответствии с принципом композиционности).

Семантические Правила (“семантика синтаксиса”)

Базис рекурсии:

S1: Если P Pred-1 и T Term, то P(T)M,g = 1 если и только если TM,g PM,g .

Общее правило: Если R Pred-n и T1, ...,Tn Term, то R(T1, ...,Tn) M,g = 1 если и только если 1M,g , ..., TnM,g > RM,g .



Рекурсивные правила. Если , Form и v – переменная, то:

S2 (): M,g = 1, если и только если M,g = 0.

S3 (&): ( & ) M,g = 1, если и только если M,g = 1 и M,g = 1.

S4 (): ( ) M,g = 1, если и только если M,g = 1 или M,g = 1.

S5 (): ( ) M,g = 1, если и только если M,g = 0 или M,g = 1.

S6 (): ( ) M,g = 1, если и только если M,g = M,g.

S7 (v): v M,g =1 если для каждого d D, M,g[d/v] =1.

S8 (v): v M,g =1 если существует элемент d D такой, что M,g[d/v] =1.

Обозначение g[d/x]: g[d/x] – это функция оценки из G, идентичная функции g для всех переменных, кроме x. Для x значение g[d/x] равно d.

Замечание.

Правила S2 – S6 можно переписать в более элегантной форме:



S2 (): M,g = M,g.

S3 (&): ( & ) M,g = M,g & M,g.

S4 (): ( ) M,g = M,g M,g.

S5 (): ( ) M,g = M,g M,g.

S6 (): ( ) M,g = M,g M,g .

В такой записи в формулах левой части символы , & и т.п – это логические связки (синтаксические операции над формулами). В правой части те же символы обозначают булевы операции над истинностными значениями. Так t = 1 если и только если t = 0, t & s = 1 если и только если t = 1 и s = 1 и т.д.



Истинность формул в модели: Истинность некоторых формул в модели M не зависит от функций оценки (т.е не зависит от значений переменных, присваиваемых этими функциями); такие формулы могут быть названы истинными или ложными в модели M. Легко видеть, что все замкнутые формулы обладают этим свойством.

Для каждой формулы Form:



M = 1, если и только если M,g = 1 для всех оценок g,

M = 0, если и только если M1,g = 0 для всех оценок g.

В других случаях M не определено.



ПРИМЕР. Синтаксический вывод и вычисление истинностного значения формулы x(love(Mary, x) happy(x))

Цель примера – проиллюстрировать «работу» синтаксических и семантических правил на данной формуле.

Начнем с синтаксиса. Ниже приведена синтаксическач структура данной формулы, ее «синтаксическое дерево». Каждой вершине (узлу) дерева сопоставлена формула или ее части, синтаксическая категория и синтаксическое правило, примененное в данном месте.

Дерево 1.

x(love(Mary, x) happy(x)), Form, R7

3

x (love(Mary, x) happy(x)), Form, R6



qp

love(Mary, x), Form, R2 happy(x), Form, R1

9 qp

love, Pred-2, Basic | x, T, Basic happy, Pred-1, Basic x, T, Basic

Mary, T, Basic

(Основные выражения помечены в дереве как Basic)



Вычисление истинностного значения

Ниже мы будем вычислять истинностное значение нашей формулы (в модели M, для функции оценки g), аннотируя каждый шаг применяемым семантическим правилом и указанием вершины в приведенном выше дереве (вместе с номером соответствующего синтаксического правила). Для краткости мы будем писать английское “iff” вместо русского «если и только если»

1.║x(love(Mary, x) happy(x))║M,g =1 iff для каждого d D,

love(Mary, x) happy(x)M,g[d/x] =1. Правило S7 в вершинеR7”

2. Это выполняется iff для каждого d D,

love(Mary, x) M,g[d/x] = 0 или ║happy(x) M,g[d/x] =1 . Правило S6 в вершинеR6”

3. Это выполняется iff для каждого d D,

если <║Mary M,g[d/x] ,║ x M,g[d/x]> ║love M,g[d/x], то

x M1,g[d/x]happyM1,g[d/x] .

Правило S2 в вершине R2 и правило S1 в вершине R1.

4. Это выполняется iff для каждого d D,

если <║Mary M,g[d/x], d> ║love M,g[d/x] , то d ║happy M,g[d/x].

Правило A (для переменных) для двух x вершин.

5. Т.е. если Mary), d> I(love), то d I(happy).

Правило B (для констант) для вершин Mary, love, happy.

Если теперь в синтаксическом дереве (см. выше) показать семантические правила, примененные на каждом шаге, мы увидим полное соответствие синтаксических и семантических правил при порождении формулы и вычислении ее истинностного значения (что иллюстрирует Принцип композиционности)

Tree 2. x(love(Mary, x) happy(x)), Form, R7, S7

3

x (love(Mary, x) happy(x)) , Form, R6, S6



qp

love(Mary, x), Form, R2, S2 happy(x), Form, R1, S1



9 qp

love, Pred-2, Basic | x, T, Basic happy, Pred-1, Basic x, T, Basic

Mary, T, Basic

О лекторах



Barbara Hall Partee (Барбара Парти) закончила в 1965 г. аспирантуру (PhD) у Хомского, в MIT. С 1965 по 1972 г. – профессор Department of Linguistics in UCLA (University of California at Los Angeles). С 1972 по настоящее время профессор Department of Linguistics in UMass (University of Massachusetts), Amherst. С 1996 г. почти каждый год проводит один семестр в Москве, последнее время – в РГГУ (visiting professor), где читает курс лекций (иногда – два) по семантике.


В 1968 г. посещала семинар Р. Монтегю на котором тот впервые рассказывал о своем подходе к семантике естественного языка. С тех пор в основном занимается семантикой.

Владимир Борисович Борщев закончил в 1959 г. КАИ. В том же году поступил в аспирантуру ВИНИТИ, с тех пор в ВИНИТИ. К.т.н. (1968), диссертация, в основном, по математической лингвистике. Д.ф.-м.н. (1992)диссертация по семантике языков логического программирования и асинхронным параллельным вычислениям. В основном занимался Theoretical Computer Science. Но все время работал в отделе, в котором работало много лингвистов. Последние несколько лет вместе с Барбарой Парти занимается семантикой естественных языков.

1 По-видимому, имеется в виду, что вычисляются истинностные значения для выражений этого языка.

2 В формулах мы «переводим» с русского на английский (латинский алфавит, почему-то, кажется более подходящим для формул).
скачать файл



Смотрите также:
В. Б. Борщев и B. H. Partee. Казань, кгу, Апрель 2003 стр. Лекция
411.65kb.
-
3098.63kb.
Дистанционные задания с 05. 05. по 30. 05
247.26kb.
Занятие по разделу «Миология» проводится в следующей форме
29.03kb.
Литература стр. Приложения стр. Задача
336.98kb.
Урока Урок Тема урока 03. 02 1 Русский язык
59.01kb.
Русский язык: Ларионова Л. Г. Рабочая тетрадь. Выполнить тестовые задания, стр. 43-46. Соловьева Т. В. Словарик современного школьника. 5-9 класс. Выполнить задания, стр. 12-15. Малюшкин А. Б. Комплексный анализ текста
25.02kb.
«Географическое положение Южной Америки. Из истории открытия и исследования материка». Рабочая тетрадь (стр. 46 название карты «Южная Америка. Физическая карта) выполнить задание 1,2,3,4
22.2kb.
3 приняты и введены в действие с 1 сентября 2003 г. #M12291 901869201постановлением Госстроя России от 23. 06. 2003 г
722.14kb.
Відомості Верховної Ради України (ввр), 2002, n 3-4, ст
2255.75kb.
Требования к оформлению рукописи и ее электронной версии для издания учебной и научной литературы в Научно-информационном издательском центре
269.62kb.
Президент Кыргызской Республики Роза Отунбаева подписала Указ о награждении специальным нагрудным знаком «Апрель элдик революциясынын баатыры»
1008.43kb.