Бэкуса-Наура формы (БНФ)

Метаязык Хомского-Щутценберже

Метаязык Хомского

Метаязык Хомского вышел из недр математической логики. Он имеет следующую систему обозначений:

символ “ ® ” отделяет левую часть правила от правой (читается как "порождает" и "это есть");
нетерминалы обозначаются буквой А с индексом, указывающим на его номер;
терминалы - это символы используемые в описываемом языке;
каждое правило определяет порождение одной новой цепочки, причем один и тот же нетерминал может встречаться в нескольких правилах слева.

Описание идентификатора на метаязыке Хомского будет выглядеть следующим образом:

1. A₁ ® A	23. A₁ ® W	45. A₁ ® s
2. A₁ ® B	24. A₁ ® X	46. A₁ ® t
3. A₁ ® C	25. A₁ ® Y	47. A₁ ® u
4. A₁ ® D	26. A₁ ® Z	48. A₁ ® v
5. A₁ ® E	27. A₁ ® a	49. A₁ ® w
6. A₁ ® F	28. A₁ ® b	50. A₁ ® x
7. A₁ ® G	29. A₁ ® c	51. A₁ ® y
8. A₁ ® H	30. A₁ ® d	52. A₁ ® z
9. A₁ ® I	31. A₁ ® e	53. A₂ ® 0
10. A₁ ® J	32. A₁ ® f	54. A₂ ® 1
11. A₁ ® K	33. A₁ ® g	55. A₂ ® 2
12. A₁ ® L	34. A₁ ® h	56. A₂ ® 3
13. A₁ ® M	35. A₁ ® i	57. A₂ ® 4
14. A₁ ® N	36. A₁ ® j	58. A₂ ® 5
15. A₁ ® O	37. A₁ ® k	59. A₂ ® 6
16. A₁ ® P	38. A₁ ® l	60. A₂ ® 7
17. A₁ ® Q	39. A₁ ® m	61. A₂ ® 8
18. A₁ ® R	40. A₁ ® n	62. A₂ ® 9
19. A₁ ® S	41. A₁ ® o	63. A₃ ® A₁
20. A₁ ® T	42. A₁ ® p	64. A₃ ® A₃A₁
21. A₁ ® U	43. A₁ ® q	65. A₃ ® A₃A₂
22. A₁ ® V	44. A₁ ® r

Приведенный в предыдущем разделе пример описания идентификатора показывает громоздкость метаязыка Хомского, что позволяет эффективно использовать его только для описания небольших абстрактных языков. Более компактное описание возможно с применением метаязыка Хомского-Щутценберже, использующего следующие обозначения метасимволов:

символ “=” отделяет левую часть правила от правой (вместо символа “ ® ”);
нетерминалы обозначаются буквой А с индексом, указывающим на его номер;
терминалы - это символы используемые в описываемом языке;
каждое правило определяет порождение нескольких альтернативных цепочек, отделяемых друг от друга символом “+”, что позволяет, при желании, использовать в левой части только разные нетерминалы.

Введение возможности альтернативного перечисления позволило сократить описание языков. Описание идентификатора будет выглядеть следующим образом:

1. A ₁ =A+B+C+D+E+F+G+H+I+J+K+L+M+N+O+P+Q+R+S+T+
U+V+W+X+Y+Z+a+b+c+d+e+f+g+h+i+j+k+l+m+n+o+p+q+
r+s+t+u+v+w+x+y+z

2. A ₂ =0+1+2+4+5+6+7+8+9

3. A ₃ =A ₁ +A ₃ A ₁ +A ₃ A ₂

Метаязыки Хомского и Хомского-Щутценберже использовались в математической литературе при описании простых абстрактных языков. Метаязык, предложенный Бэкусом и Науром, впервые использовался для описания синтаксиса реального языка программирования Алгол 60. Наряду с новыми обозначениями метасимволов, в нем использовались содержательные обозначения нетерминалов. Это сделало описание языка нагляднее и позволило в дальнейшем широко использовать данную нотацию для описания реальных языков программирования. Были использованы следующие обозначения:

символ "::=" отделяет левую часть правила от правой;
нетерминалы обозначаются произвольной символьной строкой, заключенной в угловые скобки "<" и ">";
терминалы - это символы, используемые в описываемом языке;
каждое правило определяет порождение нескольких альтернативных цепочек, отделяемых друг от друга символом вертикальной черты "|".

Пример описания идентификатора с использованием БНФ:

1. <буква>:: = А|В|С|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|
W|X|Y|Z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z

2. <цифра>:: = 0|1|2|3|4|5|6|7|8|9

3. <идентификатор>::= <буква> | <идентификатор><буква> |
<идентификатор><цифра>

Правила можно задавать и раздельно:

3. <идентификатор>:: = <буква>

4. <идентификатор>:: = <идентификатор> <буква>

5. <идентификатор>:: = <идентификатор> <цифра>