Проведите сравнительный синтаксический анализ использования партиципа II в роли прилагательного и в составе перфектных времён; приведите примеры неоднозначности и предложите критерии для автоматического распознавания в корпусе
Сравнительный синтаксический анализ (суть, отличия, признаки и алгоритм распознавания) Коротко о категориях - Причастие II (страдательное причастие прош. времени, далее ПII) в роли прилагательного: выступает как определение внутри именной группы (атрибутивно), согласуется с существительным в роде/числе/падеже, может образовывать номинализованные формы («уволенные» = «уволенные люди»). - ПII в составе перфектных/составных времен (перефразируем как перфразная страдательная конструкция с вспомогательным глаголом): входит в состав сказуемого вместе с вспомогательным глаголом (быть/стать/оказаться и пр.), образует перипрастический предикат (пассив/результативное состояние). Главные распределяющие признаки и тесты (с объяснениями) 1) Позиция и синтаксическая функция - Атрибутивное (adj): внутри NP, обычно непосредственное определение: «построенный дом» (модификатор существительного). - Предикативное/составное (verb): компонент VP; участвует в предикате вместе с вспомогательным: «Дом был построен». Тест: в дереве зависимостей — если токен ПII прикреплён к существительному как amod/obl в NP → атрибутивно; если он — главный в предикате (root или часть VP) и имеет вспомогательный как зависимый aux/aux:pass → предикативно. 2) Наличие вспомогательного глагола - Надёжный маркер перфекта: присутствие вспомогательного глагола (быть, стать, оказаться, быть + modal) в той же предикативной доменной области: «был/будет/становится + ПII» → перфразный предикат. - Отсутствие — не гарантирует атрибута (возможны эллипсисы, номинализация). 3) Морфологическая форма (полная vs краткая) - Краткая форма (напр. «открыта», «убраны») часто выступает предикативно: «Окна открыты». - Полная форма чаще атрибутивна: «открытые окна». (Но и исключения: в сложных конструкциях возможны обе формы в предикативной позиции.) 4) Согласование с существительным - Атрибутив: согласуется в роде/числе/падеже с определяемым существительным (формально: признаки совпадают). - В предикате: тоже может согласовывать с подлежащим (особенно краткие формы), однако синтаксически является частью VP, а не детерминантом NP. 5) Управление и аргументы - Как глагол (перфект): ПII может требовать косвенных/прямых дополнений и допускать вводной агентной фразы с инструментальным «кем/кем-то» («комнату убрали кем-то») — наличие агентного инструмента/агента — показатель предикативности. - Как прилагательное: не требует управлять объектами, но может иметь зависимые именные модификаторы типа «прочитанный кем?» — обычно в таких случаях это причастный оборот, а не простое прилагательное. 6) Возможность модификации наречиями степени - Прилагательное: допускает степень, усилители («совсем/очень открытая дверь»). - ПII в составе перфекта: модификация степенью чаще звучит трудно или имеет иной семантический эффект («дверь была очень открыта» — возможно, но интерпретация предикативная, не атрибутивная). 7) Пунктуация и позиционные признаки - Причастный оборот после определяемого существительного часто выделяется запятыми → аргумент в пользу синтаксической предикативности/ограниченности (причастный оборот vs определение). Примеры неоднозначности и разбор 1) «Построенный дом простоял много лет.» - Чтение A (атрибутивное): «построенный» = определение к «дом» (какой дом? построенный). Показатели: прямо модифицирует, внутри NP. - Чтение B (предикативное, с эллипсой): менее вероятно без вспомогательного; для предикативного чтения нужно «дом был построен и простоял» — здесь смысл меняется. 2) «Уволенные пришли на работу.» - Чтение A (номинализация/атрибутивное → номинатив): «уволенные (работники)» = субстантивированное прилагательное «those dismissed» — субъект. - Чтение B (перфектная/предикативная): «(они) были уволены и... пришли» — противоречиво; реже: контекст может потребовать предикативного анализа (если перед этим было 'их уволили' и затем 'уволенные пришли' как сокращённая эллипсная конструкция). 3) «Документ подписан директором.» - Предикативный: «подписан» — часть пассивного предиката; наличие агентного «директором» с инструментальным указывает на глагольное управление. - Альтернативное атрибутивное чтение («подписанный директором документ») отличается порядком и потребует перестановки. Критерии для автоматического распознавания в корпусе (предлагаемая система сигналов) Обозначим бинарные/числовые признаки fif_ifi. Простейшая scoring-модель: score=∑iwifi
\text{score}=\sum_i w_i f_i score=i∑wifi
Решение: если score≥T\text{score} \ge Tscore≥T → предикативное (перфект/пассив), иначе → атрибутивное. Предлагаемые признаки fif_ifi (возможные веса wiw_iwi задавать эмпирически): - f1f_1f1 — наличие вспомогательного глагола из списка {быть, стать, оказаться, оказаться} в окне ±3\pm 3±3 токена и зависящий как aux: 0/1 (высокий вес). - f2f_2f2 — позиция: внутри NP (токен в пределах детерминативной проекции) = 0/1 (атрибутивный маркер снижает score). - f3f_3f3 — форма: краткая форма = 1 (в пользу предикативного), полная = 0. - f4f_4f4 — согласование: совпадение морфосинтаксических признаков с ближайшим существительным в роли определяемого = 1 (в пользу атрибутивного; в score добавлять с отрицательным весом). - f5f_5f5 — наличие агентного инструмента в винительном/творительном (конструкция 'кем'/'кем-то') зависимом к ПII = 1 (в пользу предикативного). - f6f_6f6 — зависимые обстоятельственные модификаторы (наречие степени: очень/совсем) = 1 (в пользу атрибутивного, но смешанный). - f7f_7f7 — пунктуация: выделен запятыми причастный оборот = 1 (в пользу предикативного/обособленного оборота). - f8f_8f8 — позиция относительно существительного: перед существительным = 1 (атрибутив); после без запятой = смешанный. - f9f_9f9 — синтаксическая роль токена в UD: если head = существительное (amod/acl) → 0/1 accordingly. - f10f_{10}f10 — словообразовательная и лексическая вероятностная модель: частотность использования формы в атрибутивной роли по размеченному корпусу (число в [0,1]). Пример конкретной формулы (простая лог-лин. модель): logit(p)=β0+∑iβifi,p=σ(logit)
\text{logit}(p)=\beta_0 + \sum_i \beta_i f_i,\quad p=\sigma(\text{logit}) logit(p)=β0+i∑βifi,p=σ(logit)
где порог p≥0.5p\ge 0.5p≥0.5 → предикативное. (Коэффициенты βi\beta_iβi обучить на размеченной выборке.) Практические рекомендации по реализации - Использовать синтаксический парсер (UD) для выявления связей aux, amod, acl, nsubj. - Экстрагировать морфологию (корпус/морфологический анализатор) — форма краткая/полная. - Отдельная проверка на номинализации (превращение прилагательного в существительное) — если токен функционирует как подлежащее и после него часто следует глагол, вероятно номинализация. - Обучение модели: разметить ~5–10k предложений, включающих причастия, и обучить логистическую регрессию / lightGBM с перечисленными признаками. - Правила-резерв: для строгих шаблонов (наличие aux:pass и agent-instrument) ставить детерминированное решение предикатив. Краткая сводка диагностических индикаторов (быстрая шпаргалка) - +Вспом.глагол рядом → предикативно. - +Краткая форма → предикативно. - +Агент в творительном (кем) → предикативно. - +Согласование с существительным внутри NP и позиция перед именем → атрибутивно. - +Модификатор степени (очень) → скорее атрибутивно. - +Выделение запятыми/после существительного с зависимостями → часто причастный оборот/предикативно. Если нужно, могу дать: 1) конкретные регулярные шаблоны/UD-запросы для Corpus Query, 2) пример разметки обучающей выборки, 3) пример кода для расчёта score.
Коротко о категориях
- Причастие II (страдательное причастие прош. времени, далее ПII) в роли прилагательного: выступает как определение внутри именной группы (атрибутивно), согласуется с существительным в роде/числе/падеже, может образовывать номинализованные формы («уволенные» = «уволенные люди»).
- ПII в составе перфектных/составных времен (перефразируем как перфразная страдательная конструкция с вспомогательным глаголом): входит в состав сказуемого вместе с вспомогательным глаголом (быть/стать/оказаться и пр.), образует перипрастический предикат (пассив/результативное состояние).
Главные распределяющие признаки и тесты (с объяснениями)
1) Позиция и синтаксическая функция
- Атрибутивное (adj): внутри NP, обычно непосредственное определение: «построенный дом» (модификатор существительного).
- Предикативное/составное (verb): компонент VP; участвует в предикате вместе с вспомогательным: «Дом был построен».
Тест: в дереве зависимостей — если токен ПII прикреплён к существительному как amod/obl в NP → атрибутивно; если он — главный в предикате (root или часть VP) и имеет вспомогательный как зависимый aux/aux:pass → предикативно.
2) Наличие вспомогательного глагола
- Надёжный маркер перфекта: присутствие вспомогательного глагола (быть, стать, оказаться, быть + modal) в той же предикативной доменной области: «был/будет/становится + ПII» → перфразный предикат.
- Отсутствие — не гарантирует атрибута (возможны эллипсисы, номинализация).
3) Морфологическая форма (полная vs краткая)
- Краткая форма (напр. «открыта», «убраны») часто выступает предикативно: «Окна открыты».
- Полная форма чаще атрибутивна: «открытые окна».
(Но и исключения: в сложных конструкциях возможны обе формы в предикативной позиции.)
4) Согласование с существительным
- Атрибутив: согласуется в роде/числе/падеже с определяемым существительным (формально: признаки совпадают).
- В предикате: тоже может согласовывать с подлежащим (особенно краткие формы), однако синтаксически является частью VP, а не детерминантом NP.
5) Управление и аргументы
- Как глагол (перфект): ПII может требовать косвенных/прямых дополнений и допускать вводной агентной фразы с инструментальным «кем/кем-то» («комнату убрали кем-то») — наличие агентного инструмента/агента — показатель предикативности.
- Как прилагательное: не требует управлять объектами, но может иметь зависимые именные модификаторы типа «прочитанный кем?» — обычно в таких случаях это причастный оборот, а не простое прилагательное.
6) Возможность модификации наречиями степени
- Прилагательное: допускает степень, усилители («совсем/очень открытая дверь»).
- ПII в составе перфекта: модификация степенью чаще звучит трудно или имеет иной семантический эффект («дверь была очень открыта» — возможно, но интерпретация предикативная, не атрибутивная).
7) Пунктуация и позиционные признаки
- Причастный оборот после определяемого существительного часто выделяется запятыми → аргумент в пользу синтаксической предикативности/ограниченности (причастный оборот vs определение).
Примеры неоднозначности и разбор
1) «Построенный дом простоял много лет.»
- Чтение A (атрибутивное): «построенный» = определение к «дом» (какой дом? построенный). Показатели: прямо модифицирует, внутри NP.
- Чтение B (предикативное, с эллипсой): менее вероятно без вспомогательного; для предикативного чтения нужно «дом был построен и простоял» — здесь смысл меняется.
2) «Уволенные пришли на работу.»
- Чтение A (номинализация/атрибутивное → номинатив): «уволенные (работники)» = субстантивированное прилагательное «those dismissed» — субъект.
- Чтение B (перфектная/предикативная): «(они) были уволены и... пришли» — противоречиво; реже: контекст может потребовать предикативного анализа (если перед этим было 'их уволили' и затем 'уволенные пришли' как сокращённая эллипсная конструкция).
3) «Документ подписан директором.»
- Предикативный: «подписан» — часть пассивного предиката; наличие агентного «директором» с инструментальным указывает на глагольное управление.
- Альтернативное атрибутивное чтение («подписанный директором документ») отличается порядком и потребует перестановки.
Критерии для автоматического распознавания в корпусе (предлагаемая система сигналов)
Обозначим бинарные/числовые признаки fif_ifi . Простейшая scoring-модель:
score=∑iwifi \text{score}=\sum_i w_i f_i
score=i∑ wi fi Решение: если score≥T\text{score} \ge Tscore≥T → предикативное (перфект/пассив), иначе → атрибутивное.
Предлагаемые признаки fif_ifi (возможные веса wiw_iwi задавать эмпирически):
- f1f_1f1 — наличие вспомогательного глагола из списка {быть, стать, оказаться, оказаться} в окне ±3\pm 3±3 токена и зависящий как aux: 0/1 (высокий вес).
- f2f_2f2 — позиция: внутри NP (токен в пределах детерминативной проекции) = 0/1 (атрибутивный маркер снижает score).
- f3f_3f3 — форма: краткая форма = 1 (в пользу предикативного), полная = 0.
- f4f_4f4 — согласование: совпадение морфосинтаксических признаков с ближайшим существительным в роли определяемого = 1 (в пользу атрибутивного; в score добавлять с отрицательным весом).
- f5f_5f5 — наличие агентного инструмента в винительном/творительном (конструкция 'кем'/'кем-то') зависимом к ПII = 1 (в пользу предикативного).
- f6f_6f6 — зависимые обстоятельственные модификаторы (наречие степени: очень/совсем) = 1 (в пользу атрибутивного, но смешанный).
- f7f_7f7 — пунктуация: выделен запятыми причастный оборот = 1 (в пользу предикативного/обособленного оборота).
- f8f_8f8 — позиция относительно существительного: перед существительным = 1 (атрибутив); после без запятой = смешанный.
- f9f_9f9 — синтаксическая роль токена в UD: если head = существительное (amod/acl) → 0/1 accordingly.
- f10f_{10}f10 — словообразовательная и лексическая вероятностная модель: частотность использования формы в атрибутивной роли по размеченному корпусу (число в [0,1]).
Пример конкретной формулы (простая лог-лин. модель):
logit(p)=β0+∑iβifi,p=σ(logit) \text{logit}(p)=\beta_0 + \sum_i \beta_i f_i,\quad p=\sigma(\text{logit})
logit(p)=β0 +i∑ βi fi ,p=σ(logit) где порог p≥0.5p\ge 0.5p≥0.5 → предикативное. (Коэффициенты βi\beta_iβi обучить на размеченной выборке.)
Практические рекомендации по реализации
- Использовать синтаксический парсер (UD) для выявления связей aux, amod, acl, nsubj.
- Экстрагировать морфологию (корпус/морфологический анализатор) — форма краткая/полная.
- Отдельная проверка на номинализации (превращение прилагательного в существительное) — если токен функционирует как подлежащее и после него часто следует глагол, вероятно номинализация.
- Обучение модели: разметить ~5–10k предложений, включающих причастия, и обучить логистическую регрессию / lightGBM с перечисленными признаками.
- Правила-резерв: для строгих шаблонов (наличие aux:pass и agent-instrument) ставить детерминированное решение предикатив.
Краткая сводка диагностических индикаторов (быстрая шпаргалка)
- +Вспом.глагол рядом → предикативно.
- +Краткая форма → предикативно.
- +Агент в творительном (кем) → предикативно.
- +Согласование с существительным внутри NP и позиция перед именем → атрибутивно.
- +Модификатор степени (очень) → скорее атрибутивно.
- +Выделение запятыми/после существительного с зависимостями → часто причастный оборот/предикативно.
Если нужно, могу дать: 1) конкретные регулярные шаблоны/UD-запросы для Corpus Query, 2) пример разметки обучающей выборки, 3) пример кода для расчёта score.