Приведённая контекстно‑свободная грамматика для арифметических выражений S -> S + S | S * S | (S) | id неоднозначна и леворекурсивна; преобразуйте её в эквивалентную грамматику, пригодную для построения LL(1)‑парсера и для LALR‑parserа, поясните, как вы устраняете неоднозначность при соблюдении приоритетов операторов и ассоциативности?
Предыдущий
вопрос Следующий
вопрос

Question

Приведённая контекстно‑свободная грамматика для арифметических выражений S -> S + S | S * S | (S) | id неоднозначна и леворекурсивна; преобразуйте её в эквивалентную грамматику, пригодную для построения LL(1)‑парсера и для LALR‑parserа, поясните, как вы устраняете неоднозначность при соблюдении приоритетов операторов и ассоциативности?
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по информатике

Приведённая контекст...

eva

20 Окт в 16:39

3 +3

0

Helper · Answer 1

Коротко: нужно убрать левую рекурсию и явно заявить уровни приоритетов и ассоциативность. Привожу устойчивую LL(1)‑версию и вариант для LALR (через либо переработанную грамматику, либо декларации приоритетов).
1) LL(1)‑грамматика (без левой рекурсии, с приоритетом

^{'} *^{'} >^{'} +^{'}

и левой ассоциативностью):

\to T\ E'

\to +\ T\ E'\ \mid\ \varepsilon

\to F\ T'

\to *\ F\ T'\ \mid\ \varepsilon

\to (\ E\ )\ \mid\ id

Пояснения:
- Уровни соответствуют нетерминалам:

E

— выражение с суммой,

T

— терм (умножение),

F

— фактор. Это гарантирует, что операторы

*

связываются сильнее, чем

+

, потому что в

E

сначала полностью распознаётся

T

(включая все

*

), и только затем возможны «+».
- Ассоциативность «влево» реализуется хвостовой рекурсией

\to +\ T\ E'

и

\to *\ F\ T'

: при построении AST принято сворачивать последовательность справа налево в левую цепочку, что даёт семантику

(a + b) + c

и

(a * b) * c

.
- Грамматика не содержит левой рекурсии и удовлетворяет условиям LL(1): для каждого нетерминала множества FIRST альтернатив и FOLLOW при

ε\varepsilon

являются разделимыми.
2) Вариант для LALR (две возможности)
a) Использовать ту же грамматику, что и для LL(1). Она подходит и для LALR(1) парсеров (нет неоднозначности).
b) Если хотите оставить исходную компактную форму (удобно в Yacc/Bison), разрешить неоднозначности с помощью приоритетов и ассоциативности:
Пример в стиле Yacc/Bison (псевдосинтаксис; порядок деклараций определяет приоритет — более поздние выше):
%left '+'
%left '*'
%%
S : S '+' S
| S '*' S
| '(' S ')'
| id
;
Пояснения:
- Директивы `%left` устанавливают левую ассоциативность для указанных токенов.
- Порядок деклараций делает `*` более приоритетным, чем `+` (в Bison/Yacc позднее объявленные токены имеют больший приоритет).
- При возникновении конфликтов shift/reduce парсер использует эти декларации: при конфликте между `+` и `*` выберется соответствующее разрешение по приоритету; при конфликте с одинаковым приоритетом и `%left` — произойдёт reduce (что даёт левую ассоциативность).
Итого:
- Для LL(1) и детерминированного парсинга безопасно применять приведённую «разложенную» грамматику

E, T, F

.
- Для генераторов LALR можно либо использовать ту же неамбициозную грамматику, либо оставить компактную и разрешать конфликты через объявления приоритета/ассоциативности.

Другие вопросы eva

Другие вопросы
eva