HCAI // Регулирование ИИ

🔖

Доклад ОЭСР о веб-скрейпинге и IP

В феврале 2025 года ОЭСР опубликовала доклад «Intellectual property issues in artificial intelligence trained on scraped data», посвященный проблемам сбора данных для обучения ИИ.

🔍

Веб-скрейпинг (web scraping / data scraping) - автоматизированный процесс сбора информации со сторонних сайтов, из баз данных и социальных сетей.

📈 ОЭСР признает, что скрейпинг позволяет получить доступ к большому объему данных для развития и совершенствования ИИ-систем и способствовать росту инноваций при ответственном использовании.

❓ Несмотря на очевидную пользу такой практики, возникает вопрос:
Является ли сбор и использование данных, охраняемых авторским правом, нарушением прав правообладателей?

ОЭСР подчеркивает необходимость баланса между интересами авторов и разработчиков и предлагает следующие способы решения:
✅ Обязательное или добровольное раскрытие информации об используемых при обучении датасетах.
✅ Создание механизмов вознаграждения авторов либо через лицензирование контента напряму, либо через организации коллективного управления правами.
✅ Расширение исключений для майнинга текстов и данных (TDM).
✅ Разработка этических кодексов и добросовестных практик скрейпинга.

❗️Особенно перспективным кажется принятие практики исключений из законодательства об охране интеллектуальной собственности для text and data mining. Такие исключения на данный момент существуют в:

🇪🇺

Европейском союзе — в рамках Директивы 2019/790 допускается использование защищённых авторским правом материалов для анализа данных, если у пользователя есть законный доступ; некоммерческие научные организации имеют дополнительное исключение.

🇬🇧

Великобритании — разрешен сбор для анализа данных для некоммерческих исследований, а также обсуждаются расширения для коммерческого использования.

🇯🇵

Японии — авторское право допускает воспроизведение работ для целей анализа данных, включая коммерческое использование, при условии, что это не нарушает нормального использования произведения.

🇸🇬

Сингапуре — закон 2021 года ввёл прямое исключение для компьютерного анализа данных, как в коммерческих, так и некоммерческих целях.

🇰🇷

Южной Корее — допускается добросовестное использование данных для анализа ИИ, аналогично подходу США, без отдельного исключения, но с широкой интерпретацией "fair use".

Несмотря на широкое распространение разрешительного регулирования сбора данных для обучения ИИ, количество исков от правообладателей к ИИ-компаниям только растет.
📌 Во 2 части обсудим последние новости в судебных разбирательствах по поводу веб-скрейпинга.

#AI #IP #Copyright #TDM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤3🤩2

589 viewsedited 12:35

HCAI // Регулирование ИИ

🔍

Новый виток противостояния разработчиков ИИ и правообладателей

🔼 Количество судебных разбирательств по поводу веб-скрейпинга стремительно растет.

🇺🇸 Бесспорным лидером по предъявленным претензиям является США. Большинство ИИ-компаний в суде в качестве аргумента используют доктрину добросовестного использования («fair use»). Но образует ли такой подход судебный прецедент или нет пока не понятно, так как ни одно из дел на данный момент не разрешено по существу.

Тем не менее, март этого года ознаменовался несколькими интересными высказываниями как сторон процесса, так и судей.

📌

The New York Times против OpenAI и Microsoft
Федеральный суд в Нью-Йорке разрешил продолжить иск издания против ИИ-гигантов за использование её материалов для обучения ИИ. По мнению Times, это «масштабное хищение» журналистского труда стоимостью в миллиарды долларов. Суд отклонил лишь часть требований — основные остаются в силе.

📌

Музыкальные лейблы против Anthropic
Суд отказался временно запретить Anthropic использовать тексты песен для обучения Claude. Но дело продолжится: Universal Music Group, Concord и ABKCO настаивают, что использование более 500 песен без согласия — это прямое нарушение их исключительных прав.

📌

Австралийские писатели против Meta
Meta использовала пиратскую библиотеку LibGen для обучения своих моделей. Среди «обучающих» данных — произведения известных австралийских авторов. Писатели возмущены: «Это цифровое разграбление», а Meta настаивает на fair use и «технологической необходимости».

❓ Все эти дела объединяет один нерешенный вопрос: можно ли использовать материалы, охраняемые авторским правом, для обучения ИИ без разрешения правообладателей?

#AI #IP #Copyright #FairUse

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6🔥6👍5

436 views12:40

HCAI // Регулирование ИИ

🇪🇺

Исследование EUIPO по авторскому праву и генеративному ИИ в Евросоюзе

Европейское ведомство интеллектуальной собственности (EUIPO) представило исследование о взаимодействии технологий генеративного ИИ с авторским правом.

🔍

Основные выводы исследования:

1️⃣

Доступ к качественному контенту – основа для обучения GenAI
Модели ИИ требуют большого объёма данных для обучения, что стимулирует формирование рынка лицензирования контента.

2️⃣

Механизмы защиты авторских прав в процессе обучения ИИ
🔵На этапе ввода данных правообладатели могут использовать опт-аут (технический или юридический запрет на использование данных), чтобы исключить свои данные из процесса парсинга (text and data mining).
🔵На этапе вывода данных стоит указывать, что контент был сгенерирован ИИ.

3️⃣

Роль государственных институтов
Национальные IP-ведомства и EUIPO могут:
🔵Обеспечивать техническую поддержку для реализации правовых механизмов;
🔵Содействовать прозрачности использования ИИ;
🔵Повышать осведомлённость о способах защиты авторских прав и предоставлять актуальную информацию о новых решениях.

⚙️ В докладе также изучены некоторые технические решения для защиты авторских прав:

1️⃣

TDM Reservation Protocols – протоколы, позволяющие правообладателям автоматически отказаться от использования их данных в обучении ИИ.

2️⃣

Content Authenticity Initiatives – меры по проверке и маркировке контента, созданного ИИ.

3️⃣

Valuenode и Liccium Trust Engine – платформы для управления авторскими правами в условиях цифровой трансформации.

👍 Более того, в рамках Стратегического плана 2030 EUIPO планирует запустить к концу 2025 года Центр знаний по авторскому праву для содействия обмену информацией между правообладателями, разработчиками ИИ и регуляторами и развитию механизмов лицензирования и защиты интеллектуальной собственности.

#AI #Regulation #Copyright #IP #GenAI #EUIPO

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤4🙏3

355 views09:58

HCAI // Регулирование ИИ

🧑‍⚖️

Обзор главных судебных дел прошедшей недели

На прошлой неделе сразу несколько громких судебных дел задали важные ориентиры в области IP и GenAI.

🖥

Anthropic
Федеральный судья США Уильям Олсап постановил, что обучение модели Claude на официально купленных книгах, защищенных авторским правом, не нарушает интересы правообладателей, поскольку использование произведений, полученных законным путем, для обучения больших языковых моделей признано добросовестным (fair use). Суд отметил, что Claude не воспроизводит оригинальные тексты книг и не копирует авторский стиль.
Однако отдельно будет рассмотрен вопрос ответственности компании за первоначальное скачивание этих книг с пиратских ресурсов.

📱

Meta*
Другой федеральный судья, Винс Чхабрия, отклонил аналогичный иск 1️⃣3️⃣ известных писателей против Meta, заявив, что истцы представили «неверные аргументы». Но он отдельно подчеркнул, что данное решение не подтверждает законность действий Meta, а лишь показывает слабость конкретного иска.
В своём иске авторы утверждали, что компания несёт «ответственность за массовые нарушения авторских прав», поскольку она загружала их книги из онлайн-хранилищ пиратских материалов, обучая свою генеративную модель Llama.

📱

Microsoft
На этом фоне Microsoft столкнулась с новым судебным разбирательством. Группа авторов обвинила компанию в использовании пиратских цифровых копий почти 200 тысяч книг при обучении модели Megatron. В иске подчёркивается, что Megatron создан для генерации текстов, имитирующих стиль, тематику и структуру оригинальных произведений. Авторы требуют компенсацию до 150 тысяч долларов за каждую книгу, использованную Microsoft незаконно.

❗️Эти судебные разбирательства важны тем, что формируют правовые ориентиры и границы использования защищённых авторским правом материалов при разработке и обучении генеративных моделей ИИ.

* Meta признана в России экстремистской организацией и запрещена

#AI #IP #Copyright #Anthropic #Meta #Microsoft #USA

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡7👍4❤2

407 views09:52

About

Blog

Apps

Platform