Кейс: компания-разработчик нейросети использовала для обучения миллионы чужих текстов без получения лицензий; кто и на каких основаниях может требовать компенсацию, и как соотнести авторские права с интересом к инновациям
Кто может требовать компенсацию - Правообладатели: авторы текстов, издатели, агрегаторы, владельцы баз данных, правопреемники (наследники, компании), организации коллективного управления (ОКУ), если они уполномочены представлять интересы авторов. - В некоторых юрисдикциях — государственные органы (при нарушениях публичных интересов) или пострадавшие третьи лица (если нарушены иные права, напр. на конфиденциальность). На каких основаниях (правовые основания требований) - Нарушение исключительных авторских прав: несанкционированное воспроизведение, воспроизведение фрагментов, распространение, обнародование, создание производного произведения (модель, обученная на чужих текстах, может считаться производным или результатом переработки). - Нарушение прав на базы данных (EU sui generis right): неправомерное извлечение/использование существенного объёма содержимого. - Нарушение лицензионных условий (если данные были из ресурсов с ограничениями). - Моральные права (в некоторых странах) — нарушение права на авторство или недопустимая обработка содержания. - Дополнительные основания: конкуренция/антимонопольные претензии, незаконная обработка персональных данных (если в корпусе есть персональные данные). Виды возмещений и судебных мер - Компенсация реального ущерба и/или упущенной выгоды; отчёт о прибыли (disgorgement). - Статутные (в США) или фиксированные убытки: например, в США диапазон статутных убытков для каждого произведения обычно $750 \$750 $750–$30,000 \$30{,}000 $30,000 и при умышленном нарушении до $150,000 \$150{,}000 $150,000. - Инъюнкция (запрет на дальнейшее использование, распространение модели), изъятие/удаление материалов, уничтожение копий. - Обязание лицензирования/платежи по лицензионным соглашениям, публичные опровержения, судебные издержки. - Административные/уголовные санкции — в особо тяжёлых случаях в зависимости от юрисдикции. Защитные аргументы и ограниченные исключения - Fair use / fair dealing (США, часть других юрисдикций) — суды взвешивают цель использования, характер материала, объём и влияние на рыночную нишу. Обучение моделей иногда признаётся трансформативным, но это неоднозначно. - Специальные исключения для text and data mining (TDM) в некоторых странах/юрисдикциях (ЕС, UK, Япония и др.). - Лицензии, публичный доступ, общественное достояние (public domain). Практические выводы для стороны правообладателя и разработчика - Правообладатели могут требовать компенсации или лицензирования, инициировать коллективные иски, добиваться запрета использования и долевого возмещения прибыли. - Разработчики могут полагаться на защиту fair use/TDM-исключения только частично; без явных лицензий риск значителен. Как соотнести авторские права с интересом к инновациям — баланс и рекомендации - Законодательный баланс: вводить чёткие TDM-исключения с ограничениями (например, для научных/некоммерческих целей или при условии соблюдения атрибуции и минимизации объёма), либо прокладывать процедуру обязательного коллективного лицензирования с разумными роялти. - Практики индустрии: - Коллективное лицензирование и фонды распределения вознаграждений авторам. - Прозрачность датасетов: хранение provenance/метаданных, аудит источников. - Модель коммерческих и бесплатных дорожных карт: свободные корпуса (CC, public domain) + платные лицензии для коммерческого обучения. - Коммерческие соглашения о TDM с условиями компенсации и гарантий (indemnities). - Регулирование и саморегулирование: разработка стандартов раскрытия использованных источников, обязательные уведомления авторам/платформам, стимулирование использования открытых лицензий. - Судебный баланс: суды должны учитывать общественный интерес от технологий (инновации, исследование) в применении теста fair use/эквивалентов, но это требует прецедентов и/или ясного законодательства. Коротко — практические шаги для снижения риска и справедливого распределения выгод - Разработчику: использовать лицензионно чистые или общественные корпуса, заключать соглашения/покупать лицензии, аутсорсить очистку данных, вести логи доступа, предусматривать прозрачность и выплату вознаграждений. - Правообладателю: организовать коллективное управление правами для упрощения лицензирования, требовать возмещения или предлагать коммерческие лицензии, добиваться законных исключений для TDM при справедливой компенсации. Итог: правообладатели имеют реальные основания требовать компенсацию (нарушение авторских/базовых прав и условий лицензий); долгосрочное решение — сочетание ясного законодательства по TDM, коллективного лицензирования, прозрачности данных и коммерческих механизмов распределения дохода, чтобы сохранить и защитить авторам права и одновременно не душить инновации.
- Правообладатели: авторы текстов, издатели, агрегаторы, владельцы баз данных, правопреемники (наследники, компании), организации коллективного управления (ОКУ), если они уполномочены представлять интересы авторов.
- В некоторых юрисдикциях — государственные органы (при нарушениях публичных интересов) или пострадавшие третьи лица (если нарушены иные права, напр. на конфиденциальность).
На каких основаниях (правовые основания требований)
- Нарушение исключительных авторских прав: несанкционированное воспроизведение, воспроизведение фрагментов, распространение, обнародование, создание производного произведения (модель, обученная на чужих текстах, может считаться производным или результатом переработки).
- Нарушение прав на базы данных (EU sui generis right): неправомерное извлечение/использование существенного объёма содержимого.
- Нарушение лицензионных условий (если данные были из ресурсов с ограничениями).
- Моральные права (в некоторых странах) — нарушение права на авторство или недопустимая обработка содержания.
- Дополнительные основания: конкуренция/антимонопольные претензии, незаконная обработка персональных данных (если в корпусе есть персональные данные).
Виды возмещений и судебных мер
- Компенсация реального ущерба и/или упущенной выгоды; отчёт о прибыли (disgorgement).
- Статутные (в США) или фиксированные убытки: например, в США диапазон статутных убытков для каждого произведения обычно $750 \$750 $750–$30,000 \$30{,}000 $30,000 и при умышленном нарушении до $150,000 \$150{,}000 $150,000.
- Инъюнкция (запрет на дальнейшее использование, распространение модели), изъятие/удаление материалов, уничтожение копий.
- Обязание лицензирования/платежи по лицензионным соглашениям, публичные опровержения, судебные издержки.
- Административные/уголовные санкции — в особо тяжёлых случаях в зависимости от юрисдикции.
Защитные аргументы и ограниченные исключения
- Fair use / fair dealing (США, часть других юрисдикций) — суды взвешивают цель использования, характер материала, объём и влияние на рыночную нишу. Обучение моделей иногда признаётся трансформативным, но это неоднозначно.
- Специальные исключения для text and data mining (TDM) в некоторых странах/юрисдикциях (ЕС, UK, Япония и др.).
- Лицензии, публичный доступ, общественное достояние (public domain).
Практические выводы для стороны правообладателя и разработчика
- Правообладатели могут требовать компенсации или лицензирования, инициировать коллективные иски, добиваться запрета использования и долевого возмещения прибыли.
- Разработчики могут полагаться на защиту fair use/TDM-исключения только частично; без явных лицензий риск значителен.
Как соотнести авторские права с интересом к инновациям — баланс и рекомендации
- Законодательный баланс: вводить чёткие TDM-исключения с ограничениями (например, для научных/некоммерческих целей или при условии соблюдения атрибуции и минимизации объёма), либо прокладывать процедуру обязательного коллективного лицензирования с разумными роялти.
- Практики индустрии:
- Коллективное лицензирование и фонды распределения вознаграждений авторам.
- Прозрачность датасетов: хранение provenance/метаданных, аудит источников.
- Модель коммерческих и бесплатных дорожных карт: свободные корпуса (CC, public domain) + платные лицензии для коммерческого обучения.
- Коммерческие соглашения о TDM с условиями компенсации и гарантий (indemnities).
- Регулирование и саморегулирование: разработка стандартов раскрытия использованных источников, обязательные уведомления авторам/платформам, стимулирование использования открытых лицензий.
- Судебный баланс: суды должны учитывать общественный интерес от технологий (инновации, исследование) в применении теста fair use/эквивалентов, но это требует прецедентов и/или ясного законодательства.
Коротко — практические шаги для снижения риска и справедливого распределения выгод
- Разработчику: использовать лицензионно чистые или общественные корпуса, заключать соглашения/покупать лицензии, аутсорсить очистку данных, вести логи доступа, предусматривать прозрачность и выплату вознаграждений.
- Правообладателю: организовать коллективное управление правами для упрощения лицензирования, требовать возмещения или предлагать коммерческие лицензии, добиваться законных исключений для TDM при справедливой компенсации.
Итог: правообладатели имеют реальные основания требовать компенсацию (нарушение авторских/базовых прав и условий лицензий); долгосрочное решение — сочетание ясного законодательства по TDM, коллективного лицензирования, прозрачности данных и коммерческих механизмов распределения дохода, чтобы сохранить и защитить авторам права и одновременно не душить инновации.