Задан контекстно‑свободный грамматический фрагмент: S -> S S | 'a' | 'b'. Докажите или опровергните её однозначность (ambiguous/не ambiguous), приведите пример строки с двумя разными деревьями разбора или докажите невозможность такого, и обсудите, как модификация грамматики влияет на парсинг LR(1) vs LL(1)
Предыдущий
вопрос Следующий
вопрос

Question

Задан контекстно‑свободный грамматический фрагмент: S -> S S | 'a' | 'b'. Докажите или опровергните её однозначность (ambiguous/не ambiguous), приведите пример строки с двумя разными деревьями разбора или докажите невозможность такого, и обсудите, как модификация грамматики влияет на парсинг LR(1) vs LL(1)
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по информатике

Задан контекстно‑сво...

eva

27 Окт в 13:42

8 +8

0

Helper · Answer 1

Грамматика

\to S\ S \mid a \mid b

амбигуозна.
Пример строки с двумя разными деревьями разбора: возьмём

w = aba

.
Два различных вывода (скобочная группировка отражает структуру двоичного конкатенирования):
1)

a)((a\ b)\ a)

:

\Rightarrow S\ S \Rightarrow S\ S\ S \Rightarrow a\ S\ S \Rightarrow a\ b\ S \Rightarrow a\ b\ a

.
2)

a))(a\ (b\ a))

:

\Rightarrow S\ S \Rightarrow a\ S \Rightarrow a\ S\ S \Rightarrow a\ b\ S \Rightarrow a\ b\ a

.
Эти два дерева дают один и тот же выводный ряд символов

aba

, но имеют разную структуру — отсюда неоднозначность.
Следствия для парсинга:
- Поскольку грамматика неоднозначна, она не может быть распознаваема как детерминированная LR(1)-грамматика (всякая LR(k)-грамматика однозначна), следовательно исходная грамматика не является LR(1).
- Она также не является LL(1) (LL(1) требует единственного выбора продукции по первому символу при предсказании; неоднозначность и пересекающиеся FIRST-наборы препятствуют этому).
Как модификации влияют:
- Чтобы получить однозначную и LL(1)-совместимую грамматику для множества всех непустых строк над

{a,b\}

, можно факторизовать по первому символу, например

\to a\ A \mid b\ A,\qquad A \to a\ A \mid b\ A \mid \varepsilon.

Здесь FIRST-альтернатив для

S

раздельны (

{a\}

и

{b\}

), грамматика однозначна и является LL(1) (а значит и LR(1)).
- Если сделать левую рекурсию, например

\to S\,a \mid S\,b \mid a \mid b,

то грамматика может быть однозначной, но из‑за левой рекурсии она не LL(1) без преобразований; LR(1)-парсер с такими правилами справится (LR(1) нормально обрабатывает левую рекурсию).
- В общем: устранение двоичного правила конкатенации

SS\to S\ S

в пользу правых/левых линейных или факторизованных правил делает грамматику однозначной; факторизация даёт LL(1), а леворекурсивная форма — удобна для LR(1).

Другие вопросы eva

Другие вопросы
eva