Дана контекстно-свободная грамматика G с правилами S -> SS | "a" S "b" | ε; определите язык, который она порождает, докажите или опровергните её неоднозначность, приведите эквивалентный детерминированный автомат (если существует) или докажите, что язык не является детерминируемым (LR(1)/DFA), и предложите способ преобразования грамматики для парсинга в практическом компиляторе
Предыдущий
вопрос Следующий
вопрос

Question

Дана контекстно-свободная грамматика G с правилами S -> SS | "a" S "b" | ε; определите язык, который она порождает, докажите или опровергните её неоднозначность, приведите эквивалентный детерминированный автомат (если существует) или докажите, что язык не является детерминируемым (LR(1)/DFA), и предложите способ преобразования грамматики для парсинга в практическом компиляторе
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по информатике

Дана контекстно-своб...

eva

28 Окт в 11:19

9 +9

0

Helper · Answer 1

Грамматика:

\to SS \mid a\,S\,b \mid \varepsilon

1) Язык, порождённый грамматикой.

L(G)=\{w\in\{a,b\}^*\mid \#_a(w)=\#_b(w)\ \text{и для каждой позиции }u\text{ (префикс }w)\ \#_a(u)\ge\#_b(u)\},

то есть язык корректно сбалансованных скобок одного типа (аналог Dyck-1, ставим \(a='('\), \(b=')'\)).
Краткое объяснение: правило

a S b

даёт вложенные пары

a…ba\ldots b

, правило

SS

— конкатенацию корректных фрагментов,

ε\varepsilon

— пустую строку. Все и только корректно сбалансированные строки получаются.
2) Неоднозначность грамматики.
Грамматика неоднозначна. Контрпример:

w = ababab

(эквивалентно "()()()"). Две разные левосторонние вывoдные последовательности (показываю схематично):
Первый вариант (дерево вида

((SS) S)

):

S\Rightarrow SS \Rightarrow SS\,S \Rightarrow (aSb)\,S\,S \Rightarrow (a\varepsilon b)\,S\,S \Rightarrow ab\,S\,S \Rightarrow ab\,(aSb)\,S \Rightarrow ab\,(a\varepsilon b)\,S \Rightarrow abab\,S \Rightarrow abab\,(aSb)\Rightarrow ababab.

Второй вариант (дерево вида

(S (SS))

):

S\Rightarrow SS \Rightarrow S\,SS \Rightarrow S\,(aSb)\,S \Rightarrow S\,(a\varepsilon b)\,S \Rightarrow S\,ab\,S \Rightarrow (aSb)\,ab\,S \Rightarrow (a\varepsilon b)\,ab\,S \Rightarrow ab\,ab\,S \Rightarrow ab\,ab\,(aSb)\Rightarrow ababab.

Получены разные деревья вывода для одного слова ⇒ грамматика неоднозначна.
3) Регулярность и детерминируемость.
- Язык не является регулярным. Простая аргументация: для любого

p

(pumping length) строка

a^p b^p

принадлежит

L (G)

, но по лемме о накачке регулярных языков нельзя накачать часть только из блока

a

так, чтобы равенство чисел

a

и

b

сохранялось — противоречие.
- Язык является детерминируемым в смысле детерминированного КСЯ (DPDA) и является LR(1) (и даже LL(1)). Это стандартный детерминированный язык скобочной последовательности одного типа.
DPDA (одно состояние

q

, маркер дна

Z_0

, символ стека

A

):

\begin{aligned}&\delta(q,a,Z_0)=(q,AZ_0),\qquad \delta(q,a,A)=(q,AA),\\&\delta(q,b,A)=(q,\varepsilon),\\&\text{при конце входа: если стек }Z_0\text{ — принять, иначе отклонить.}\end{aligned}

На

a

— детерминированно пушим

A

; на

b

— если верх стека

A

, попаем; иначе — ошибка. Это детерминированный автомат-стек, принимающий

L (G)

.
4) Предложение по преобразованию грамматики для парсинга в компиляторе.
Заменить неоднозначную грамматику на эквивалентную однозначную (и пригодную для LL/LR-парсинга), например:

S\to a\,S\,b\,S \mid \varepsilon.

Эта грамматика однозначна и описывает тот же язык: любая непустая сбалансированная строка представляется как первая пара

a…ba\ldots b

с вложенным внутри

S

и затем следует (конкатенируется) ещё один

S

. Она подходит для рекурсивного спуска (LL(1)) и для LR(1)-парсеров. Для практической реализации:
- использовать рекурсивный спуск по правилу: если lookahead =

a

, потребовать

a

, вызвать S, ожидать

b

, затем рекурсивно вызвать S; если lookahead =

b

или EOF — возвращать

ε\varepsilon

;
- либо строить LR(1)-таблицу по этой грамматике (она не содержит конфликтов).
Вывод: грамматика порождает язык корректно сбалансованных

a, b

-строк (Dyck-1), сама неоднозначна, язык не регулярный но является детерминируемым КСЯ (DPDA, LR(1)). Для парсинга замените грамматику на, например,

S→aSbS∣εS\to aSbS\mid\varepsilon

.

Другие вопросы eva

Другие вопросы
eva