Это не официальный сайт wikipedia.org 01.01.2023

Иерархия Хомского — Википедия

Иерархия Хомского

Иерархия Хомского — классификация формальных языков и формальных грамматик, согласно которой они делятся на 4 типа по их условной сложности. Предложена профессором Массачусетского технологического института, лингвистом Ноамом Хомским.

Классификация грамматикПравить

Согласно Хомскому, формальные грамматики можно разделить на четыре типа. Для отнесения грамматики к тому или иному типу необходимо соответствие всех её правил (продукций) некоторым схемам.

Тип 0 — неограниченныеПравить

Грамматика с фразовой структурой G — это алгебраическая структура, упорядоченная четвёрка (VT, VN, P, S), где[1]:

  • V T   — алфавит (множество) терминальных символов — терминалов,
  • V N   — алфавит (множество) нетерминальных символов — нетерминалов,
  • V = V T V N   — словарь G  , причём V T V N =  
  • P   — конечное множество продукций (правил) грамматики, P V + × V  
  • S   — начальный символ (источник).

Здесь V   — множество всех строк над алфавитом V  , а V +   — множество непустых строк над алфавитом V  .

К типу 0 по классификации Хомского относятся неограниченные грамматики — грамматики с фразовой структурой, то есть все без исключения формальные грамматики. Правила можно записать в виде:

α β  ,

где α V +   — любая непустая цепочка, содержащая хотя бы один нетерминальный[2] символ, а β V   — любая цепочка символов из алфавита.

Практического применения в силу своей сложности такие грамматики не имеют.

Тип 1 — контекстно-зависимыеПравить

К этому типу относятся контекстно-зависимые (КЗ) грамматики и неукорачивающие грамматики. Для грамматики G ( V T , V N , P , S ) , V = V T V N   все правила имеют вид[3]:

  • α A β α γ β  , где α , β V , γ V + , A V N  . Такие грамматики относят к контекстно-зависимым.
  • α β  , где α , β V + , 1 | α | | β |  . Такие грамматики относят к неукорачивающим.

Эти классы грамматик эквивалентны. Могут использоваться при анализе текстов на естественных языках, однако при построении компиляторов практически не используются в силу своей сложности. Для контекстно-зависимых грамматик доказано утверждение: по некоторому алгоритму за конечное число шагов можно установить, принадлежит цепочка терминальных символов данному языку или нет.

Тип 2 — контекстно-свободныеПравить

К этому типу относятся контекстно-свободные (КС) грамматики. Для грамматики G ( V T , V N , P , S ) , V = V T V N   все правила имеют вид:

  • A β  , где β V +   (для неукорачивающих КС-грамматик) или β V   (для укорачивающих), A V N  . То есть грамматика допускает появление в левой части правила только нетерминального символа.

КС-грамматики широко применяются для описания синтаксиса компьютерных языков (см. синтаксический анализ).

Тип 3 — регулярныеПравить

К третьему типу относятся регулярные грамматики (автоматные) — самые простые из формальных грамматик. Они являются контекстно-свободными, но с ограниченными возможностями.

Все регулярные грамматики могут быть разделены на два эквивалентных класса, которые для грамматики вида III будут иметь правила следующего вида:

  • A B γ   или A γ  , где γ V T , A , B V N   (для леволинейных грамматик).
  • A γ B  ; или A γ  , где γ V T , A , B V N   (для праволинейных грамматик).

Регулярные грамматики применяются для описания простейших конструкций: идентификаторов, строк, констант, а также языков ассемблера, командных процессоров и др.

Классификация языковПравить

Формальные языки классифицируются в соответствии с типами грамматик, которыми они задаются. Однако, один и тот же язык может быть задан разными грамматиками, относящимися к разным типам. В таком случае, считается, что язык относится к наиболее простому из них. Так, язык, описанный грамматикой с фразовой структурой, контекстно-зависимой и контекстно-свободной грамматиками, будет контекстно-свободным.

Так же, как и для грамматик, сложность языка определяется его типом. Наиболее сложные — языки с фразовой структурой (сюда можно отнести естественные языки), далее — КЗ-языки, КС-языки и самые простые — регулярные языки.

ПримечанияПравить

  1. Кук, Бейз, 1990, с. 258,264.
  2. Серебряков В. А., Галочкин М. П., Гончар Д. Р., Фуругян М. Г. Теория и реализация языков программирования. — М. : МЗ-Пресс, 2006. — С. 21. — ISBN 5-94073-094-9.
  3. Кук, Бейз, 1990, с. 268.

ЛитератураПравить