Сравните композицию и риторические приемы классического романа XIX века на немецком и современного романа: как меняются синтаксическая плотность, лексическая вариативность и тиражируемость стилей
Кратко и по пунктам. Состав (композиция и синтаксис) - XIX‑в. (нем. классика): доминирует гипотаксис, длинные периодические предложения, развернутые описания и авторская экспозиция — высокая синтаксическая плотность. Типично: средняя длина предложения L‾≈25–40 \overline{L} \approx 25\text{–}40L≈25–40 слов, плотность придаточных Dc=число придаточных Cчисло предложений SD_c=\frac{\text{число придаточных }C}{\text{число предложений }S}Dc=числопредложенийSчислопридаточныхC высокая. - Современный роман: более короткие предложения, парта́ктика, фрагментарность, быстрые сценические срезы, диалог и прямой доступ к сознанию персонажей — синтаксическая плотность падает, типично L‾≈10–20 \overline{L} \approx 10\text{–}20L≈10–20 слов, DcD_cDc ниже. Лексика и лексическая вариативность - Метрики: типально используют TTR =VN=\frac{V}{N}=NV (V — число типов, N — число токенов), MSTTR, и энтропию Шеннона H=−∑pilogpiH=-\sum p_i\log p_iH=−∑pilogpi. - XIX‑в.: более формальная лексика, устойчивый книжный словарь и богатая флексия/номинализация; высокая частота редких форм, но из‑за длины текста TTR склонен снижаться. Энтропия среднего уровня. - Современный роман: смешение регистров (жаргон, англицизмы, термины СМИ), большая внутренняя вариативность стилей внутри одного текста; это повышает разнообразие типов слов в корпусе (вырождается в росте HHH), но в отдельных жанрах массовой прозы TTR может снижаться из‑за повторяемых формул и клише. Риторические приёмы - XIX‑в.: перифразы, длинные метафорические описания, развёрнутые синтаксические фигуры (анапора, градация, антитеза), авторская реторика, частая омнискентность/комментирование. - Современный роман: минимализм, ирония, мета‑приёмы, фрагментированная метафора, свободное косвенное речеизложение и поток сознания; приём «плотных» метафор заменяется разреженными образными всплесками + прямой диалог. Тиражируемость стилей (репликативность) - Показатели: можно оценивать через среднюю сходность векторных представлений авторов simavg=2A(A−1)∑i<jvi⋅vj∥vi∥∥vj∥ \text{sim}_{avg}=\frac{2}{A(A-1)}\sum_{i<j}\frac{v_i\cdot v_j}{\|v_i\|\|v_j\|} simavg=A(A−1)2∑i<j∥vi∥∥vj∥vi⋅vj или по точности авторской атрибуции AccAccAcc. - Тенденция: для массовой современной прозы стиль более «шаблонизирован» (редакционные требования, жанровые формулы) — растёт тиражируемость (более высокая внутренняя однородность корпуса), то есть simavg↑ \text{sim}_{avg} \uparrow simavg↑ и в ряде задач снижается различимость авторов. Классические романы чаще сохраняют индивидуальные синтаксические и риторические паттерны, что облегчает авторскую атрибуцию (высокая уникальность стиля). - Исключение: авангардные/экспериментальные современные тексты — низкая тиражируемость, большая уникальность. Как это измерять практически (коротко) - Синтаксическая плотность: средняя длина предложения L‾=1S∑i=1Sli \overline{L}=\frac{1}{S}\sum_{i=1}^S l_i L=S1∑i=1Sli, и Dc=CSD_c=\frac{C}{S}Dc=SC. - Лексика: TTR=VNTTR=\frac{V}{N}TTR=NV, MSTTR, H=−∑pilogpiH=-\sum p_i\log p_iH=−∑pilogpi. - Тиражируемость: средняя внутригрупповая косинус‑сходство или кластерная компактность; альтернативно — точность классификатора авторства AccAccAcc. Краткое итоговое заключение - Синтаксическая плотность: общий спад от XIX к современности (DcD_cDc и L‾ \overline{L} L уменьшаются). - Лексическая вариативность: смещение — меньше книжной однородности, больше регистровой смешанности и заимствований; энтропия корпуса часто растёт, но TTR зависит от жанра и длины текста. - Тиражируемость: массовая современная проза стала более «тиражируемой» (больше шаблонов), в то время как классические романы сохраняют более узнаваемую авторскую индивидуальность.
Состав (композиция и синтаксис)
- XIX‑в. (нем. классика): доминирует гипотаксис, длинные периодические предложения, развернутые описания и авторская экспозиция — высокая синтаксическая плотность. Типично: средняя длина предложения L‾≈25–40 \overline{L} \approx 25\text{–}40L≈25–40 слов, плотность придаточных Dc=число придаточных Cчисло предложений SD_c=\frac{\text{число придаточных }C}{\text{число предложений }S}Dc =число предложений Sчисло придаточных C высокая.
- Современный роман: более короткие предложения, парта́ктика, фрагментарность, быстрые сценические срезы, диалог и прямой доступ к сознанию персонажей — синтаксическая плотность падает, типично L‾≈10–20 \overline{L} \approx 10\text{–}20L≈10–20 слов, DcD_cDc ниже.
Лексика и лексическая вариативность
- Метрики: типально используют TTR =VN=\frac{V}{N}=NV (V — число типов, N — число токенов), MSTTR, и энтропию Шеннона H=−∑pilogpiH=-\sum p_i\log p_iH=−∑pi logpi .
- XIX‑в.: более формальная лексика, устойчивый книжный словарь и богатая флексия/номинализация; высокая частота редких форм, но из‑за длины текста TTR склонен снижаться. Энтропия среднего уровня.
- Современный роман: смешение регистров (жаргон, англицизмы, термины СМИ), большая внутренняя вариативность стилей внутри одного текста; это повышает разнообразие типов слов в корпусе (вырождается в росте HHH), но в отдельных жанрах массовой прозы TTR может снижаться из‑за повторяемых формул и клише.
Риторические приёмы
- XIX‑в.: перифразы, длинные метафорические описания, развёрнутые синтаксические фигуры (анапора, градация, антитеза), авторская реторика, частая омнискентность/комментирование.
- Современный роман: минимализм, ирония, мета‑приёмы, фрагментированная метафора, свободное косвенное речеизложение и поток сознания; приём «плотных» метафор заменяется разреженными образными всплесками + прямой диалог.
Тиражируемость стилей (репликативность)
- Показатели: можно оценивать через среднюю сходность векторных представлений авторов simavg=2A(A−1)∑i<jvi⋅vj∥vi∥∥vj∥ \text{sim}_{avg}=\frac{2}{A(A-1)}\sum_{i<j}\frac{v_i\cdot v_j}{\|v_i\|\|v_j\|} simavg =A(A−1)2 ∑i<j ∥vi ∥∥vj ∥vi ⋅vj или по точности авторской атрибуции AccAccAcc.
- Тенденция: для массовой современной прозы стиль более «шаблонизирован» (редакционные требования, жанровые формулы) — растёт тиражируемость (более высокая внутренняя однородность корпуса), то есть simavg↑ \text{sim}_{avg} \uparrow simavg ↑ и в ряде задач снижается различимость авторов. Классические романы чаще сохраняют индивидуальные синтаксические и риторические паттерны, что облегчает авторскую атрибуцию (высокая уникальность стиля).
- Исключение: авангардные/экспериментальные современные тексты — низкая тиражируемость, большая уникальность.
Как это измерять практически (коротко)
- Синтаксическая плотность: средняя длина предложения L‾=1S∑i=1Sli \overline{L}=\frac{1}{S}\sum_{i=1}^S l_i L=S1 ∑i=1S li , и Dc=CSD_c=\frac{C}{S}Dc =SC .
- Лексика: TTR=VNTTR=\frac{V}{N}TTR=NV , MSTTR, H=−∑pilogpiH=-\sum p_i\log p_iH=−∑pi logpi .
- Тиражируемость: средняя внутригрупповая косинус‑сходство или кластерная компактность; альтернативно — точность классификатора авторства AccAccAcc.
Краткое итоговое заключение
- Синтаксическая плотность: общий спад от XIX к современности (DcD_cDc и L‾ \overline{L} L уменьшаются).
- Лексическая вариативность: смещение — меньше книжной однородности, больше регистровой смешанности и заимствований; энтропия корпуса часто растёт, но TTR зависит от жанра и длины текста.
- Тиражируемость: массовая современная проза стала более «тиражируемой» (больше шаблонов), в то время как классические романы сохраняют более узнаваемую авторскую индивидуальность.