АОТ   Автоматическая Обработка Текста

главная о нас продукты скачать  демо технологии   ^

М.Л. Рубинштейн. Описание английского общесемантического словаря (АОСС)

1. Вводные замечания

2. Алгоритм перевода русского слова в английское

3. Русский и английский граф

4. Возможности поиска

5. Перечень и описание полей словарных статей АОССа

 

1. Вводные замечания ^

В АОССе содержится информация, необходимая для синтеза английского текста. Входом в словарь считается пара <слово, номер значения>. (В дальнейшем, говоря «слово», «русское слово», «английское слово», мы будем иметь в виду «слово с номером значения», и любое отступление от этого соглашения будет специально оговариваться.)

Для каждого входа составляется словарная статья – набор пар вида <название поля, значение поля>. Между названием поля и его значением ставится знак ‘=’. Название поля состоит из собственно названия и (факультативно) некоторого набора индексов. Например: ГХ1, СХ1(2) и т.д. Если поле идет без индекса, то оно относится к входному слову (входное слово обозначается русской заглавной буквой С), если с индексом n без скобок – к актанту с номером n (обозначается Аn). Значение индекса в скобках будет объяснено ниже

Словарные статьи АОССа устроены по тому же принципу, что и статьи РОССа. Основные отличия:

  • в АОССе не используется поле КАТ
  • значения полей СЛСЧ и ИЛЛ содержат в обязательном порядке как английские единицы (словосочетания, предложения, фрагменты предложений), так и их русские переводы; английские и русские единицы разделяются знаком «–»; между эквивалентными одноязычными единицами ставится знак «/»
  • вместо поля АНГ в каждой статье есть поле РУС, которое содержит русские переводы входного слова
  • присутствуют поля, которых нет в РОССе – АРТИКЛЬ, АЛГОРИТМ, и т.д., описывающие специфические свойства английских слов
2. Алгоритм перевода русского слова в английское ^

Русское слово может быть переведено как одним английским словом, так и английским словосочетанием. Перевод слов осуществляется на этапе трансфера.

  1. С самого начала программа обращается к полю АНГ словаря РОСС, в котором записаны английские эквиваленты русских входных единиц. Поле АНГ может отсылать как к единице из АОССа, так и к единице из словаря английских словосочетаний (collocs) или к единице из словаря английских оборотов (obor).
  2. Если в поле АНГ указан единственный вариант перевода (слово с номером значения), то выбирается именно он. Если вариантов перевода больше одного, программа ищет в русской статье поля АГХi и если находит, выбирает перевод в соответствии с информацией из этого поля.
  3. Если в русском предложении у слова есть какая-либо лексическая функция, то выбирается тот перевод, в статье которого есть поле ЛФ с указанием одноименной лексической функции; при этом то слово, которое является значением этой лексической функции, переводится не само по себе, а в соответствии с тем, какое значение этой функции дано в поле ЛФ английской статьи.
  4. Если в поле АНГ указана единица без номера значения, а в английском словаре этой единице соответствует более одной статьи, программа сравнивает эти статьи по полю ГХ и выбирает перевод с наиболее близкой грамматической характеристикой.
  5. Если возможных переводов все еще больше одного, программа обращается к полю ВАЛ английской статьи и накладывает описанную в нем валентную структуру на валентную структуру русского графа. Выбирается тот перевод, валентная структура которого ближе всего к валентной структуре русской единицы.

 

3. Русский и английский граф ^

Русский семантический граф, построенный на этапе анализа, может измениться на этапе трансфера. Изменения предписывают поля ОГРН и АЛГОРИТМ. В зависимости от свойств конкретной английской единицы английский граф может измениться в структуре: может возникнуть новая составляющая, могут поменяться местами имеющиеся составляющие, и т.д.

Окончательный граф подается на синтез.

 

4. Возможности поиска ^

Для поиска статей по какому-либо полю существует функция «Поиск статьи, в которую входит текущая статья». Порядок использования: в специальной «поисковой» статье (название которой обычно начинается с какого-нибудь небуквенного символа) вводится маска

<НАЗВАНИЕ_ПОЛЯ> = *

или

<НАЗВАНИЕ_ПОЛЯ>* = *

если в названии поля присутствует цифровой индекс, после этого на название статьи ставится планка, нажатием правой клавиши мыши вызывается констекстное меню, выбирается пункт «Найти все статьи, в которую входит текущая статья». Пользователь получает «карман» – список слов, в которых есть это поле.

Вместо звездочки после знака равенства может идти конкретное значение. Например, для поиска всех слов, валентных на объект-результат (ОБ.РЕЗЛТ), вводится маска

ВАЛ = ОБ.РЕЗЛТ

а для поиска всех глаголов – маска

ГХ = 1 VERB

и т.д.

 

5. Перечень и описание полей словарных статей АОССа ^

Поля:

ГХ

СХ

ВАЛ

ГХi*

СХi

ЛХi

ГХij

СХij

ЛФ

ДОП

ОГРН

НЕСОВМ

АЛГОРИТМ

АРТИКЛЬ

АРТИКЛЬi

ЗГЛ

ЗНАЧ

АВТОР

ИЛЛ

ОТС

СЛСЧ

РУС

ПО

ВАР

ПОЗ

РУСАВРЕМ

*i – номер валентности входного слова.

 

Поле ГХ (грамматическая характеристика входного слова) ^

Формат: ГХ = <номер> <грамматическая_характеристика>

Применимо: ко всем словам

Обязательно: да

Пояснение: это частеречная характерстика входного слова.

Возможные значения:

ADJ - прилагательное,

ADJ:Neg – отрицательное местоимение-прилагательное,

ADJ:Quest – вопросительное местоимение-прилагательное,

ADV:DEGREE – наречие степени,

ADV:FREQ – наречие частоты,

ADV - наречие,

ADV:MANNER – наречие образа действия,

ADV:Neg – отрицательное наречие,

ADV:PLACE – наречие места,

ADV:Quest – вопросительное наречие,

ADV:SENT – наречие, относящееся ко всему предложению в целом,

ADV:TIME - наречия времени,

NOUN – существительное,

NUM - числительное или цифровой комплекс,

PART:Neg – отрицательная частица, 

PART:Quest – вопросительная частица, 

PN - местоимение,

PN:Neg - отрицательное местоимение,

PN:Quest – вопросительное местоимение,

PN_ADJ – местоимение-прилагательное,

PN_ADJ:Neg – отрицательное местоимение-прилагательное (ГХ специально для слова no),

PN_ADJ:Quest – вопросительное местоимение-прилагательное,

PRONOUN:conj – союзное слово

 

Поле СХ (семантическая характеристика входного слова) ^

Формат: СХ = <номер> <СХ or ЛФ (английское_слово)>

Применимо: к существительным, прилагательным, глаголам, наречиям

Обязательно: нет

Возможные значения:

АБСТР – любое абстрактное существительное или прилагательное

АРТ – артефакт. Все, что сделано человеком.

ВЕЛИЧ – прилагательное, образованное от параметрических существительных и от существительных, обозначающих какое-либо значение на параметрической шкале

ВЕЩВО – неисчисляемое существительное, любое название химического вещества или того, что можно как-либо дозировать, отмерять, продавать по весу или объему.

ВЛАСТЬ – высшие государственные и военные должности и учреждения. Любые должности, связанные с непосредственным управлением людьми.

ВМЕСТЛ – все, что предназначено для содержания чего-либо другого.

ВОСПР – все глаголы и существительные восприятия

ГЕОГР – географические объекты

ГОС -- любое название государства или тип государства

ДВИЖ – глаголы движения

ДЕЙСТВ – активное действие

ДОЛЖ – любая должность, понимаемая расширительно

ИЗМ – действия-изменения

ИНТЕЛ – все действия, непосредственно связанные с мыслительной деятельностью

ИНТРВЛ – временной интервал

ИНФ – информация

КОММУНИК – глаголы речи и все, связанное с речью

НАПРАВ

НОСИНФ – стандартные носители информации

Н-ТРЕБ – набор требований

ОДЕЯТ – область деятельности, знаний

ОДУШ – одушевленные имена

ОРГ – организации, возможно персонифицированные

ОТН – отношение

ОТСУТ – отсутствие чего-либо

ПОЧВ_РАСТ – растения, все, что растет из земли

ПРЕДМ – любой предмет (объект, который меньше по размерам среднего человека). Часто является АРТ.

ПРОСТР – пространственный объект

ПРОТЯЖ – протяженные географические объекты

ПРОЦС – процесс

СИТУАТ – любая ситуация

СОБИР – все, что обозначает множество однотипных объектов

СОЦ – любые ситуации, выходящие за пределы одной семьи

СУЩЕСТ – бытийные глаголы

УСТР – любое устройство

ФИН – все, связанное с финансами

ЭМОЦ – обычно прилагательные и существительные , которые выражают эмоции

Кроме того, семантической характеристикой могут служить лексические функции, например, Bon (обозначает нечо хорошее), Caus (обозначает каузатив), и т.д.

Поле ВАЛ (валентная структура входного слова) ^

Формат:

ВАЛ = <валентность1>, <А_номер_актанта or С> , <А_номер_актанта or С>

... 

<валентностьi>, <А_номер_актанта or С> , <А_номер_актанта or С>

Применимо: к существительным, прилагательным, глаголам, наречиям

Обязательно: да

Пояснения: валентности записываются в порядке их встречаемости в предложении. Если валентность активная (т.е. входное слово – главное, актант – зависимое), то пишется <валентность>, An, C, если валентность пассивная (т.е. входное слово – зависимое, актант – главное), то пишется <валентность>, С, An. Формат записи семантического отношения следующий: R, А,B, где R – название семантического отношения, А – зависимый член отношения, B – управляющий член отношения. Для конкретных А,B и отношения R направление выбирается таким образом, чтобы формула R,А,B была эквивалентна утверждению, что “А является R для B”. Например, для фразы роман Толстого  будет построена формула АВТОР(Толстой, роман), а не наоборот, потому что верно утверждение “Толстой является АВТОРом романа”, а не наоборот.

Большинство прилагательных обладают одной синтаксически пассивной валентностью на существительные, которая переходит в отношение ПРИЗН или ОЦЕНКА

Возможные значения:

АВТОР

АГЕНТ

АДР

АКТ

В-АКТ

В-КАЧ

ВМЕСТЕ

В-НАПР

ВРЕМЯ

В-СООТВ

В-СОСТ

ДАТА

ЕД-ИЗМ

ЗНАЧ

ИДЕНТ

ИМЯ

ИНСТР

ИСТОЧ

ИСХ-Т

К-АГЕНТ

КВАНТР

КОЛИЧ

КОН-Т

ЛОК

МАСШТ

МНОЖ

МОДЛ

НАЗН

ОБ

ОБ.РЕЗЛТ

ОГРН

ОЦЕНКА

П-АКТ

ПАРАМ

ПО-ОТН

ПОСЛЕ

ПРИЗН

ПРИНАДЛ

ПРИЧ

РАВНО

РЕЗЛТ

РЗНВД

СВОЙСТ

СВЯЗАН

СОДЕРЖ

СТАД

СПЕЦ

С-ПОМ

СПОСОБ

СРАВН

СРЕДСТВО

СТАД

СТЕПЕНЬ

СУБ

СФЕРА

СХОДНО

ТЕМА

ФОРМА

ЦЕЛЬ

ЧАСТЬ

Примеры:

статья continue 1:
ВАЛ   =   СУБ , А1 , С
          СОДЕРЖ , А2 , С
          статья empty 2:
ВАЛ   =   ПРИЗН , С , А1

 

Поле ГХi (грамматическая характеристика слова, заполняющего i-ю валентность входного) ^

Формат:

ГХi = <номер> <грамматическая_характеристика>

...

<номер> <грамматическая_характеристика>

Применимо: к словам, у которых есть валентности

Обязательно: да

Пояснения: ГХi – это управление. Для слова, заполняющего соответствующую валентность, прописывется синтаксическая характеристика, если же слово управляет предложным сочетанием, прописывается это сочетание (<предлог>+<часть речи>). Прочерк означает, что данная валентность может и не заполняться; соответсвенно, если среди варантов нет прочерка, это означает, что валентность обязательно заполняется.

ГХi=subj/obj означает именную группу, занимающую позицию подлежащего/дополнения. Придаточное предложение обозначается sent, и если оно вводится каким-либо специальным союзом, записывается ГХi = <союз>+sent.

Русскому управлению существительным может соответствовать английское управление gerund или to+inf, если русское существительное само по себе является названием ситуации, т.е. S0 (и имеет соответствующую СХ).

ГХ разбиты на следующие группы:

  1. Subj = subj
  2. VerbGram = to+inf , предлог+gerund, gerund
  3. PrepNp = предлог+NP (кроме of+NP)
  4. SubClause = that+sent, that+subj_clause
  5. PossNp = PN_poss (притяжательное местоимение), of+NP, NP_poss (существительное с ’s или группа of+NP)
    Примечание. Следует при этом смотреть на соответствующий заполнитель актанта в русской статье: если по-русски это грамматически одушевленное существительное или ИГ с грамматически одушевленной вершиной, то по-английски будет существительное с 's; если это грамматически неодушевленное существительное или ИГ с неодушевленной вершиной, то по-английски будет of+NP.
  6. Obj = obj

Для каждой ГХi они упорядочены в вышеописанном порядке, т.е. если одной валентности соответствуют несколько способов заполнения, ГХ выбираются по этой схеме.

Для пассивных валентностей принята запись Х = <ГХ>, где Х (икс) обозначает «хозяин».

Пример

статья buy1:
ГХ1     = 1  subj
ГХ2     = 1  obj
ГХ3     = 1  from+NP
          2  of+NP
          3  -
ГХ4     = 1  for+NP
ИЛЛ     =  one should add that sometimes these posthumous auspices
           and interventions were in the nature of parody -
           тут стоит добавить , что порой такие посмертные
           знамения и вмешательства отзывались пародией
статья add1: ГХ      = 1  VERB СХ      = 1  КОММУНИК ВАЛ     =  СУБ , А1 , С СОДЕРЖ , А2 , С ГХ1     = 1  subj ГХ2     = 1  obj 2  that+sent 3  sent РУС     =  добавлять 1 прибавлять 1
hate1: ГХ      = 1  VERB СХ      = 1  ЭМОЦ ИНТЕЛ
AntiBon: ВАЛ     =  СУБ , А1 , С ОБ , А2 , С ПРИЧ , А3 , С ГХ1     = 1  subj СХ1     = 1  ОДУШ ГХ2     = 1  obj СХ2     = 1  ОДУШ 2  СИТУАТ ГХ3     = 1  because+sent СХ3     = 1  СИТУАТ РУС     =  ненавидеть 1

Возможные значения:

все части речи (см. описание поля ГХ);

<предлог>+<слово> -- предложные сочетания;

<союз>+слово -- сочетания с союзами типа as;

<союз>+sent – придаточные предложения в изъявительном наклонении, вводимые союзами;

sent – придаточные предложения, вводимые бессоюзно;

dir_sp – прямая речь;

gerund -- герундий;

<союз>+gerund – сочетание союза с герундием;

Copul – расщепление валентностей, уточняемое в полях ГХi,j…ГХi,k;

inf – нифинитив без частицы to;

to+inf;

that+subj_clause – придаточные предложения в субъюнктиве, т.е. с would, вводимые союзами

INTER+sent – придаточные предложения в изъявительном наклонении, вводимые вопросительными словами

NP_attr – именная группа в атрибутивной функции (film week — неделя кино, wedding invitation — приглашение на свадьбу, и т.д.)

NP_poss – одно из трех возможных значений, см. выше, в пояснениях.

 

Поле CХi (семантическая характеристика слова, заполняющего i-ю валентность входного) ^

Формат:

CХi = <номер> <семантическая_характеристика>

...

<номер> <семантическая_характеристика>

Применимо: к словам, у которых есть поле ВАЛ

Обязательно: нет

Пример

статья borrow 1:
ВАЛ     =  СУБ , А1 , С
           ОБ , А2 , С
К-АГЕНТ , А3 , С
ГХ1     = 1  subj
СХ1     = 1  ОДУШ
ГХ2     = 1  obj
          2  -
СХ2     = 1  ПРЕДМ
          2  ФИН
ГХ3     = 1  from+NP
СХ3     = 1  ОДУШ

Возможные значения: те же, что и для поля СХ.

 

Поле ЛХi (лексическая характеристика слова, заполняющего i-ю валентность входного) ^

Формат:

ЛХi = <английское_слово_1>

...

<английское_слово_k>

Применимо: ко всем словам, имеющим валентности

Обязательно: нет

Пояснения: ЛХ – это английское слово. ЛХ употребляется тогда, когда в позиции i-го актанта могут стоять слова из ограниченного набора, и придумывать для них СХ не имеет смысла. ЛХi = <слово> означает, что <слово> может быть i-м актантом входного слова. Поле может стоять вместо СХi, но ГХi обязательна: необходима информация о том, в какой форме должно стоять слово. ЛХi также может сосуществовать с СХi; в таком случае ЛХ обозначет слово, не соответствующее СХi и/или ГХi, мугущее тем не менее заполнять i=тую валентность входного слова.

Примеры:

статья flash 1:
ВАЛ =  СУБ , А1 , С
       ОБ , А2 , С
       СПОСОБ , А3 , С
АДР , А4 , С
ГХ1     = 1  subj
ГХ2     = 1  obj
ЛХ2     =  light
           glance
           smile
           fire
ГХ3     = 1  with+NP
          2  -
ГХ4     = 1  at+NP
   
статья charge 1:
ИЛЛ     =  ...the architect who charged us a fee of seven
           hundred and fifty pounds  -
           архитектор, предъявивший нам счет на семьсот пятьдесят
           фунтов
ГХ      = 1  VERB
СХ      = 1  ФИН
ВАЛ     =  СУБ , А1 , С
           ОБ , А2 , С
           АДР , А3 , С
ГХ1     = 1  subj
СХ1     = 1  ОДУШ
ГХ2     = 1  obj
СХ2     = 1  ФИН
          2  КОЛИЧ
ЛХ2     =  price
ГХ3     = 1  obj
СХ3     = 1  ОДУШ
РУС     =  назначать 4
           предъявлять 2

 

Поле ГХi(j) (грамматическая характеристика j-го по счету слова, образовавшегося из расщепление i-й валентности входного) ^

Формат: ГХi(j) = <грамматическая_характеристика>

Применимо: к словам, имеющим расщепляемые валентности, например, Copul

Обязательно: да

Пояснения: если одна семантическая валентность расщепляется на две или более синтаксических валентностей, для каждой из получающихся валентностей необходимо прописать ее выражение. Таким образом, поле ГХi(j) устроено так же, как и поле ГХi.

Пример:

статья work 4:
ВАЛ     =  СУБ , А1 , С
ГХ1     = 1  Copul
СХ1     = 1  ОДУШ
РУС     =  работать 1
ГХ1(1)  = 1  subj
ГХ1(2)  = 1  as+NP

Возможные значения: см. поле ГХi.

 

Поле СХi(j) (семантическая характеристика j-го по счету слова, образовавшегося из расщепление i-й валентности) ^

Формат: ГХi(j) = <семантическая_характеристика>

Применимо: к словам, имеющим расщепляемые валентности, например, Copul

Обязательно: да

Пояснения: если одна семантическая валентность расщепляется на две или более синтаксических валентностей, для каждой из получающихся валентностей может прописываться семантическая характеристика. Таким образом, поле СХi(j) устроено так же, как и поле СХi.

Пример:

статья work 4:
ВАЛ     =  СУБ , А1 , С
ГХ1     = 1  Copul
СХ1     = 1  ОДУШ
РУС     =  работать 1
ГХ1(1)  = 1  subj
ГХ1(2)  = 1  as+NP

Возможные значения: см. поля СХ, CХi.

 

Поле ЛФ (лексическая функция) ^

Формат:

ЛФ = <название функции 1> : <английское_слово>

...

<название функции i> : <английское_слово>

Применимо: к существительным, глаголам, прилагательным, наречиям

Обязательно: нет

Пояснения: слово должно, по идее, присутствовать в АОССе. При поиске лексических функций нужно следить, чтобы одноименные ЛФ английского слова и его русского перевода тоже являлись бы эквивалентами. Поле ЛФ важно для перевода русских слов в английские: при наличии нескольких вариантов перевода выбирается тот (при прочих равных), в котором совпадает с русским значение поля ЛФ, если это поле, конечно, присутствует.

Пример:

статья character 2:
ЛФ  =  Oper1 : have 1
       CausFunc0 : form 1
       CausFunc0 : make 1
       AntiBon : primitive

Возможные значения (лексические функции, известные системе Диалинг):

A0, A1, A2, A3, Abbr, Adv0, Adv1, Adv2, Adv3, AntiBon, AntiMagn, AntiReal, AntiReal1, AntiReal2, AntiVer, Bon, Caus, Caus1Func0, Caus1Func1, Caus1Manif, Caus1Oper1, Caus1Oper2, Caus2Func0, Caus2Func1, Caus2Func2, Caus2Oper2, Caus3Oper3, CausFunc, CausFunc0, CausFunc1, CausFunc2, CausIncep, CausLiqu, CausLoc, CausMagn, CausManif, CausOper1, CausOper2, CausOper3, Centr, Copul, Culm, Fin, FinCaus, FinFunc0, FinOper1, FinOper2, Func, Func0, Func1, Func2, Func3, Incep, IncepCaus, IncepFunc0, IncepFunc1, IncepLabor21, IncepOper1, IncepOper2, IncepOper3, Labor, Labor12, Labor13, Labor21, Liqu, Liqu1Func0, Liqu1Func1, Liqu1Labor13, Liqu1Oper1, Liqu1Oper2, Liqu2Func0, Liqu2Oper2, LiquFunc0, LiquFunc1, LiquMagn, LiquOper1, LiquOper2, LiquOper3, Loc, Magn, MoveLoc, Oper, Oper1, Oper2, Oper3, OperCaus, Perm2Oper1, PermFunc0, PermOper1, Pred0, Real, Real1, Real2, Real3, S_res, S0, S1, S2, S3, S4, V0, Ver.

Пояснения: Мельчуковский набор, несколько измененный для практических целей.

 

Поле ОГРН (ограничение на употребление некоторых форм) ^

Формат: ОГРН = <грамммема> !

Применимо: к изменямым частям речи

Обязательно: нет

Пояснение: записываются граммемы, которые входное слово должно иметь. Например, бывают глаголы, которые употребляются только в пассиве, или существительные, у которых формально имеется множественное число, но употребляется только единственное. Таким образом, на этапе трансфера может изменяться граф предложения в соответствии с предписанием поля ОГРН. В поле ОГРН кроме уже имевшихся в РОССе значений мн! и ед! есть специфически английские predic!, pass!,  и т.д. В этом поле, как и в поле АЛГОРИТМ, записывается информация о том, в какую грамматическую форму следует переводить слово на этапе трансфера.

Пример:

статья alike 1:
ИЛЛ     =  No two areas of the country are alike -
           В этой стране нет двух похожих областей
ГХ      = 1  ADJ
ОГРН    =  predic !
СХ      = 1  СХОДНО
ВАЛ     =  ПРИЗН , С , А1
           ОГРН , А2 , С
ГХ1     = 1  NP_pl
ГХ2     = 1  in+NP
             in+gerund
СЛСЧ    =  alike in every particular —
           похожи во всех отношениях
РУС     =  похожий 1

Возможные значения:

ед (употребляется только в единственном числе),

мн (употребляется только в множественном числе),

predic (употребляется только в предикативной функции),

pass (употребляется только в пассивном залоге); валентности соответствуют пассивной форме

not_cont (употребляется только в непродолженных временах),

not_seq_tn (не подчиняется правилу согласования времен)

it (подлежащим глагола может быть только слово it),

 

Поле ДОП (дополнительные сведения о валентной структуре) ^

Формат:

ДОП = <семантическое отношение 1> (Ai, Aj)

...

<семантическое отношение i> (Ak, Ax)

[i, j, k, x – номера актантов]

Применимо: к существительным, прилагательным, глаголам, наречиям

Обязательно: нет

Пояснения: это дополнительная информация об отношении актантов между собой.

Пример: (статья buy 1):

ДОП = ПРИНАДЛ ( А2 , А3 )

 ПРИНАДЛ ( А2 , А1 )

 

Поле НЕСОВМ (несовместимость актантов) ^

Формат:

 НЕСОВМ = Ai, Aj 

или же

 НЕСОВМ = i.k, j.l

[i, j – номера актантов в поле ВАЛ; k, l – номера этажей у ГХi и ГХj]

Применимо: ко всем словам, имеющим валентности

Обязательно: нет

Пояснения: в поле записываются актанты слова, одновременное выражение которых при данном слове невозможно

Примеры:

статья contract 1:
ВАЛ     =  АКТ , А1 , С
           П-АКТ , А2 , С
           В-АКТ , А3 , С
           ТЕМА , А4 , С
           ВРЕМЯ , А5 , С
ГХ1     = 1  NP_pl
          2  between+NP_pl
          3  -
ГХ2     = 1  NP_poss
          2  PN_poss
          3  -
ГХ3     = 1  with+NP
          2  -
ГХ4     = 1  for+NP
          2  NP_attr
          3  -
НЕСОВМ  =  А1 , А2
статья address 2: ИЛЛ     =  to address a meeting - выступать с речью на собрании / обратиться к собравшимся soldiers address officers as sir - ГХ      = 1  VERB СХ      = 1  КОММУНИК ВАЛ     =  СУБ , А1 , С АДР , А2 , С СОДЕРЖ , А3 , С СПОСОБ , А4 , С ГХ1     = 1  subj ГХ2     = 1  obj СХ2     = 1  ОДУШ ГХ3     = 1  obj 2  with+NP СХ3     = 1  ИНФ 2  СИТУАТ ГХ4     = 1  as+NP 2  - НЕСОВМ  =  2.1 , 3.1

 

Поле АЛГОРИТМ ^

Формат: АЛГОРИТМ = <английский_алгоритм>

Применимо: к глаголам, предикативам, наречиям

Обязательно: да

Пояснения: в этом поле записывается информация о возможностях синтаксического поведения входной единицы. Таким образом, это поле задает необходимость преобразования графа на этапе трансфера. Например, некоторые английские глаголы могут быть переходными и непереходными, и валентная структура непереходного (декаузативного) варианта может быть получена следующей трансформацией структуры переходного глагола: удаляется СУБ, а ОБ повышается в ранге до подлежащего. Так, в статье глагола open будет записана валентная структура переходного глагола, а в поле АЛГОРИТМ будет ссылка на вышеописанную трансформацию (AL1).

Описание каждого алгоритма в отдельности лежит в файле «Английские алгоритмы».

Пример:

статья seem 1:
АЛГОРИТМ =  AL_it
ГХ      = 1  VERB
ОГРН    =  not_cont !
СХ      = 1  ИНТЕЛ
ВАЛ     =  СУБ , А1 , С
           СОДЕРЖ , А2 , С
ГХ1     = 1  to+NP
СХ1     = 1  ОДУШ
ГХ2     = 1  Copul
ГХ2(1)  = 1  subj
          2  to+inf
          3  that+sent
ГХ2(2)  = 1  ADJ
          2  NP
РУС     =  казаться 1

 

Поле АРТИКЛЬ, АРТИКЛЬi.или АРТИКЛЬi(j) ^

Формат: АРТИКЛЬi(j) = a | the | - | the NOUN

Обязательно: нет

Пояснения: ставится, если данное слово или его актант всегда употребляется с каким-то конкретным артиклем. Обычно это существительные, обозначающие уникальные объекты, или особые прилагательные типа last (употр., как правило, the last), certain (употр., как правило, a certain), etc. Прочерк означает нулевой артикль, т.е. артикль при данном слове или его актанте ставиться не может.

Примеры:

ЗГЛ      =  sky1
ГХ       = 1 NOUN
АРТИКЛЬ  =  the
РУС      =  небо 1
ЗГЛ      =  certain 1
ГХ       = 1 ADJ
АРТИКЛЬ1 =  a
РУС      =  некий
ЗГЛ      =  maximaize
АРТИКЛЬ2 =  the

Пояснения:

В алгоритме артикля должны учитываться запрещающие случаи, типа наличия притяжательных местоимений (ср. my late father – мой покойный отец). 

Возможен (встречается в статьях very и late2) такой формат: АРТИКЛЬ1 = the | NOUN. Это означает, что эта запись релевантна, только если в английском синтаксическом дереве хозяином слова very является существительное. Это сделано, чтобы отличать эти употребления от всех прочих, когда very подвешивается к прилагательному, наречию или глаголу.

 

Поле ЗГЛ (Заглавие) ^

Формат: ЗГЛ = <английское_слово>

Применимо: ко всем словам

Обязательно: да.

Пояснение: поле не отображается в словаре, видно только в текстовом формате.

 

Поле ЗНАЧ (Значение) ^

Формат: ЗНАЧ = <цифра>

Применимо: ко всем словам

Обязательно: да.

Пояснения: не отображается. Не рекомендуется выделять более 5-ти значений для многозначных слов.

 

Поле АВТОР ^

Формат: АВТОР = <имя_автора>

Применимо: ко всем словам

Обязательно: нет

Пояснение: имя автора словарной статьи важно лишь для организации работы над проектом, а не для работы переводчика

 

Поле ИЛЛ (Иллюстрация) ^

Формат:

ИЛЛ = <английский текст> –

 <русский текст>

Применимо: ко всем словам.

Обязательно: нет.

Пояснение: Иллюстрирует употребление входного слова английской фразой с русским (необязательно буквальным) переводом.

 

Поле ОТС (отсылка) ^

Формат: ОТС = <английское_слово_без_номера> : # <номер_значения>

Применимо: ко всем словам

Обязательно: нет.

Пояснение: В этом поле записывается то слово (вместе с номером значения) у которого данное слово наследует все поля, то есть это отсылка к, например, орфографическому дублету (варианты organise – organize, и т.д.)

 

Поле СЛСЧ (словосочатание с входным словом) ^

Формат:

СЛСЧ = <английское_словосочетание> -

<русский_перевод>

Применимо: ко всем знаменательным частям речи

Обязательно: нет

Пояснения: по идее, данное словосочетание должно быть описано в специальном словаре словосочетаний.

Пример:

статья before1:
СЛСЧ =  a moment before -
        минуту назад / только что
        long before -
        задолго до / давно уже
        the day before -
        накануне

 

Поле РУС (русский перевод) ^

Формат:

РУС = <русское_слово1_с_номером_значения>

...

<русское_словоi_с_номером_значения>

Применимо: ко всем

Обязательно: да

Пояснения: русское слово из словаря РОСС либо словосочетание из словаря словосочетаний.

 

Поле ПО (предметная область) ^

Формат: ПО = <область>

Применимо: ко всем знаменательным

Обязательно: нет

Пояснения: ПО пишется, только если оно отлично от «общ». Вообще, все слова с ограниченной областью применения описываются в тезаурусах.

Возможные значения: воен, геогр, информ, культура, наука, общ, полит, социо, фин, эконом, юр

 

Поле ВАР (вариант) ^

Формат: ВАР = <английское_слово>

Применимо: ко всем

Обязательно: нет

Это синоним входной единицы.

 

Поле РУСАВРЕМ (время английского глагола)

^

Формат: РУСАВРЕМ = <русская_граммема_времени> -> <английское_время>

Обязательно: нет

Применимо: к наречиям времени

Пояснения: РУСАВРЕМ означает, что глагол, к которому относится данное наречие времени, должен переводиться на английский в определенной видо-временной форме, т.е. что наречие сочетается только с какой-то одной формой при условии, что у русского глагола есть определенные граммемы (описанные в первой части поля до знака ->) Таковы наречия ever, already – они сочетаются только с перфектным временем. Поскольку в русском языке не различия между перфектом настоящего времени и прошедшим временем может не быть, вводится это поле.

Примеры:

статья still 2:
РУСАВРЕМ= прш - > Cont
ГХ= 1  ADV:TIME
СХ= 1  ВРЕМЯ
РУС = недавно
      в последнее время
      все так же
статья ever 1: РУСАВРЕМ   =  прш - > Perf ГХ      = 1  ADV:FREQ СХ      = 1  ВРЕМЯ ВАЛ     =  ВРЕМЯ , С , А1

Возможные значения:

прш -> Perf,

нст -> Cont,

* -> Perf,

* -> Cont.

 

Поле ПОЗ (позиция относительно глагола) ^

Формат:

Применимо: к наречиям

Обязательно: нет

Пояснения: позиция относительно глагола разная у разных наречий. Кроме того, при налиции в предложении нескольких наречных групп, их нужно упорядочить относительно друг друга. Обозначения: VERB – глагол целиком, H – вспомогательный гл., V – глагол, Pn – предлог, B – глагол to be, D – короткое дополнение, L – длинное дополнение, P – предлог, O – любое дополнение, возможно с предлогом, A – само входное наречие (наречная группа). Цепочка символов отражает порядок слов в предложении. Короткими дополнениями считать вторую валентность глагола, заполненную следующими формами: NP, NP_attr, NP_pl, NP_sg, NP_poss, obj, obj_pl, obj_sg.

Значения:

VA – наречие идет после глагола

// he is clever enough

PnA -- наречие идет после местоимения (используется только для ‘all’)

// she would watch them all

PnBA – наречие идет после местоимения и глагола to be (используется только для ‘all’)

//They will all do it

HAV – наречие идет после первого вспомогательного глагола (и до смыслового)

// I shall never forget it

BA – наречие идет после глагола to be

// I shall never forget it

AV – наречие идет перед глаголом

// just do it

NA – наречие идет после существительного

// We both like it

AN – наречие идет перед существительным (используется только для ‘all’)

// All people are clever

VOA – наречие идет после глагола с его дополнением

// he made it soon

AdjA – наречие идет после прилагательного (используется только для enough)

<M – наречие идет после наречия места, если такое есть в предложении (помета сочетается с другой, указывающей место наречия в предложении относительно других ориентиров)

<there – наречие идет после наречия there, если такое есть в предложении (помета сочетается с другой, указывающей место наречия в предложении относительно других ориентиров)

begin – наречие идет в начале предложения, первым словом

end – наречие идет в конце предложения, последним словом

Примеры:

статья perhaps 1:
ПОЗ     =  begin
ИЛЛ     =  Perhaps I have dwelt too long upon this new acquaintance -
           Может быть , я слишком увлекся описанием своего нового знакомого
ГХ      = 1  ADV:SENT
РУС     =  возможно
           может быть
статья little 1: ПОЗ     =  VA ИЛЛ     =  The land here yields little - Здешняя земля мало дает he is little known - его мало кто знает ГХ      = 1  ADV:DEGREE РУС     =  мало 2

 

главная о нас продукты скачать  демо технологии ^

 
Разработка DiP.
© 2003 АОТ. Все права защищены.