Дамасские чернила | AI и M&A
918 subscribers
19 photos
2 videos
22 files
74 links
Об искусственном интеллекте в M&A-процессах (и иных юридических процессах) от практикующего юриста из консалтинга с ноткой постиронии.

Авторский канал Софьи Смирновой, советника корпоративной практики O2 Consulting.

Не является консультацией.
Download Telegram
Фундаментальные ограничения ИИ в юридической работе

Большие языковые модели, казалось бы, уже умеют писать письма, резюмировать многотомные дела и помогать с ресерчем. На этом месте можно сделать прекрасный, но опасный вывод: «Отдадим ИИ всё рутинное, а юристов сократим».

В материале разбираю фундаментальные ограничения LLM в юридической работе:
– почему галлюцинации заложены в саму архитектуру и процессы обучения моделей, а не лечатся «волшебным промптом»;
– как «чёрный ящик» ИИ конфликтует с требованиями прозрачности и почему он не должен иметь доверия;
– где проходят реальные пределы длинных контекстных окон и почему многошаговое юридическое мышление по‑прежнему остаётся слабым местом моделей;
– почему даже «юридический» ИИ с доступом к базам данных продолжает ошибаться, а RAG снижает, но не устраняет риски;
– какие экономические, технические и даже этические барьеры стоят между идеей и устойчивым использованием ИИ в практике.

Получился этакий протокол «презумпции недостоверности».

Полную версию материала (файл PDF) можно скачать и прочитать по ссылке.

Буду рада вашей критике и кейсам из практики.
11🔥2🥱2
Статья_Фундаментальные_ограничения_ИИ_в_юриспруденции_Смирнова_O2.pdf
5.8 MB
Был комментарий, что ссылка выше на полную версию материала не открывается. Вот сам файл.
Спасибо за внимание :)
👍3🔥2
Те самые три слова - "просто сделай RAG"

Я давно хотела осветить нюансы, связанные с RAG, потому что это очень интересная тема для любопытствующих, в том числе с инженерно-технической точки зрения. Один из проектов, который я реализую внутри фирмы - создание RAG-базы данных по внутреннему опыту компании, и, надо сказать, это действительно очень сложная задача. Даже подробно писала об эксперименте тут.

Пока я собиралась с мыслями и выступала на форумах жила обычной жизнью консалтингового юриста, Катя Якуненко @delay_RAG ❤️превратила эту тему в уникальный телеграм-канал про RAG на русском языке, в котором качественно собраны все передовые знания. Человек сам создает RAG (о чем я также писала выше) и является визионером данной темы в РФ. Советую подписаться!

По вопросам, поднятым в моей статье о фундаментальных ограничениям ИИ в юриспруденции, где затронут и RAG (см. также карточку выше), и о моей работе в частности Катя положительно высказалась у себя в канале, мне приятно!

Катя справедливо пишет, что:
<...> (RAG - прим. СС) это перспективная технология для юристов, особенно вписанная в агентские архитектуры, но вокруг неё складываются всякие мисконцепции и недооценки масштаба работы, которые нужно вести для поддержания эффективности системы. То есть буквально можно услышать «да почему они просто не сделают RAG по всему российскому законодательству???»


Я согласна с теми выводами, которые делает коллега по тому, как тема может развиваться:
🅰️ Нишевые open-source базы от энтузиастов (пример: датасет по рекламному праву, который делает Катя). Энтузиасты редки, и базы данных коммерциализирует бизнес, делая продукты.
🅰️ Компании и СПС превращают базы в закрытые активы для своих ИИ-сервисов или лицензирования. Так уже происходит с Нейроюристом (продукт) и Гарантом (поставщик данных).
🅰️ Публикация НПА сразу в машиночитаемом формате для легкой интеграции ("машиночитаемое право"). Об этом много говорят, но все же пока такой единой базы нет, умельцы ее парсят сами.

О продукте Яндекс.Нейроюрист я также писала выше - даже боюсь представить, какой на самом деле титанический труд нужно было проделать, чтобы приблизиться к такому уровню качества. Коллеги позиционируют свой продукт как "ИИ-помощник для профессиональных юристов", и это очень верно и честно, за это тоже респект.
Катя, кстати, выпускала любительский бенчмарк, в котором Нейроюрист набрал много баллов - об этом также см. пост Ромы Янковского.

В конечном счете представляется, что сложности настройки RAG только подтверждают мой ключевой тейк в роли предупреждалки - без человеческой инженерии данных ИИ не способен заменить юридическое мышление, особенно по сложным вопросам. И даже не факт, что с таковой он будет на это способен (даже если это будет не RAG, а дообучение модели (fine-tuning) на юридических данных) - но это предмет отдельного разговора и будущих исследований.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍22
Инструкция ContractBot3.0.pdf
304.2 KB
Решение для проверки несложных договоров с ИИ

Все знают, что проверять договоры нужно с соблюдением обязательств по конфиденциальности. Но что, если мы не обременены такими ограничениями и можем свободно обрабатывать договоры с публичными и мощными нейросетями? Как упростить себе подготовку протоколов разногласий?

Еще одна звезда вайбкодинга - Александр Клепцин @codextocode - создал приятный инструмент для проверки относительно несложных договоров и составления протоколов разногласий. Это может быть крайне удобно в определенных случаях. Рекомендую.

Что можно:
🟣распознавать договоры даже из jpg
🟣анализировать договор через Gemini
🟣проверять контрагента через Чекко
🟣генерировать протокол разногласий
🟣вести реестр проверенных договоров

С установкой придется немного повозиться, но результат того стоит: можно поставить проверку договоров (например, NDA) "на поток", что и сделал Александр.
Ура вайбкодингу для юристов!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥76
Датасеты как объекты сделок: сегодня и завтра

Forbes пишет, что Ассоциация больших данных (в ней весь крупный бигтех и телеком: Яндекс, Сбер, VK, МТС, Билайн, Ростелеком и другие игроки) направила в Минцифры документ с предложениями по регулированию ИИ (оригинал документа еще ищу 🙂‍↕️). Цель понятна - легализовать использование больших данных для обучения ИИ.

Ключевые предложения:

🟢Датасеты как отдельные РИД
АБД предлагает закрепить датасеты в ГК РФ и стандартах бухучета как отдельные РИД. Это, по мнению АБД, позволит оценивать их стоимость и использовать как предмет сделок.
На первый взгляд кажется, что базы данных как правовой режим могут вполне подойти для датасетов (и уже сейчас так и происходит в реальных сделках). Не совсем понятно, на чем конкретно настаивают коллеги - в пересказе Forbes указано (с цитатой АБД), что правовой режим датасетов отсутствует.

🟢Легализация PET-технологий
Предложено вывести синтетические и анонимизированные данные из-под жесткого регулирования 152-ФЗ. Это устранит «серую зону» при обучении ИИ на чувствительных массивах данных, включая данные, которые по текущему регулированию могут упасть в банковскую тайну.
А вот это уже вполне понятная инициатива. Комплаенса, правда, тут не оберёшься - как сегодня, так и завтра. Очень чувствительное предложение.

🟢Open Data и API для нефинансовых компаний
АБД выступает за обязательные стандарты открытых API для всей экономики (сейчас они есть только у финансового сектора) и по возможности бесплатный доступ к госданным. Цель заявляется благая - разрушить монополию на информацию и создать рынок с потенциалом в 1 трлн рублей.
На первый взгляд полезная инициатива. Но такие объёмы данных в обороте в конечном будут создавать беспрецедентное вмешательство в частную жизнь, так как риски злоупотребления со стороны получивших доступ к ним вырастают просто до колоссальных размеров. Если не ошибаюсь, в мире даже нет решений, аналогичных тем, что предложили АБД (сужу только по тексту новости).

Реализация этих мер, по мнению АБД, должна обеспечить рост рынка Big Data до 1,2 трлн рублей к 2030 году.

Лично я полагаю, что далеко не все предложения серьёзно повлияют на текущую ситуацию с регулированием. Государство выжидает. Бенефициаром правок в текущем виде в конечном счёте будет крупный бизнес.

Как смогу найти оригинал документа, обязательно выпущу его анализ.
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥3
Forwarded from All Things Legal
Building AI-Native Professional Services Firms.pdf
82.6 KB
В введении к новой книге Дэна Каца и Макла и Джиллиан Боммарито «Building AI-Native Professional Services Firms» до такой степени прекрасно и четко описано какая трансформация происходит сегодня на рынке юридических услуг и технологий для юристов, что хоть закрывай этот канал 😀. Каждый участник рынка - традиционный юридический консалтинг, новые «AI first фирмы, вендоры решений и корпоративные юристы - увидит те вызовы, которые перед ними стоят. Очень жду выхода книги.
🔥4🌚2
📝 EdTech: главные инсайты для инвесторов и M&A юристов (2025)

Аналитический обзор от СберОбразования и РАЦИО описывает рынок в фазе глубокой трансформации под влиянием ИИ. Оформлено все очень красиво и много знакомых лиц в комментариях. Далее выжимка для тех, кто анализирует активы и сопровождает сделки.

1️⃣Состояние рынка в цифрах

Объем рынка: ~699 млрд руб. к концу 2025 года (средний рост +32% за последние 5 лет).
Структура: B2C занимает 80% рынка (557 млрд руб.), B2B — 16% (112 млрд руб.).
Фрагментация: Суммарная доля топ-5 компаний составляет всего 9% выручки. Это сигнал о высоком потенциале для консолидации и M&A-активности.

✈️ Главный драйвер — ИИ.
ИИ перестал быть «фишкой» и стал фундаментом. Рынок ИИ-образования вырос на 48% (Y2Y) в первом полугодии 2025 года. Крупнейшие игроки сегмента уже контролируют более 80% выручки в этой нише.

💷 Что важно инвестору

1. Низкая концентрация рынка позволяет нишевым игрокам быстро расти, а крупным — поглощать перспективные стартапы для расширения экосистемы.

2. Приоритетные ниши:
STEM-обучение: 93% родителей заинтересованы в развитии междисциплинарных навыков детей.
Корпоративное обучение (B2B): Крупный бизнес (Росатом, Сибур, Норникель) строит свои академии и ищет готовые технологические платформы.
ИИ-девайсы: Растущий сегмент носимых устройств и гаджетов для обучения (диффузия пока на уровне 20–32%, большой потенциал роста).

3. LTV и удержание: Тренд на непрерывное обучение (Lifelong Learning) делает подписочные модели более устойчивыми. 72% экономически активного населения намерены учиться в 2026 году.

👨‍💻 Что важно для юриста

1. Регуляторные риски: Государство активно вводит нормы и стандарты внедрения ИИ в образование. В DD важно проверять соответствие алгоритмов требованиям прозрачности и защиты данных. Стоит также ожидать ужесточения требований к сертификации образовательных ИИ-продуктов.

2. Основная ценность EdTech-активов смещается от контента к проприетарным ИИ-агентам и LMS-системам. Важен DD прав на алгоритмы и датасеты, на которых обучались модели.

3. Использование API глобальных ИИ-гигантов (Claude, Gemini, ChatGPT) создает риски зависимости от внешних вендоров. В сделках следует обращать внимание на локализацию технологий.

🔮 Прогноз на 2026 год

Рынок пойдет по пути «агентного обучения» (персональные ИИ-наставники) и эдьютейнмента. Основная борьба развернется между бигтехами за интеграцию в государственные образовательные стандарты и создание бесшовных экосистем между школой, вузом и работодателем.
Please open Telegram to view this post
VIEW IN TELEGRAM
😱11
🚨Legal Skills в Claude Cowork

Не успел Cowork появиться (в январе 2026, пару недель назад!), как произошёл ещё один потенциальный (!) прорыв для юристов. Эта новость меня сильно впечатлила, уверена, должна впечатлить и вас.
Спасибо @allthingslegal за новость.

Anthropic выпустила plugins для Claude Cowork, включая специализированный Legal Plugin, который представляет собой систему для автоматизации юридической работы. Это событие знаменует собой официальный выход крупнейших AI-компаний на рынок Legal Tech.

Что представляет собой Legal Plugin

Legal Plugin от Anthropic — это агентная система со встроенными навыками (skills) для корпоративных юристов, которая автоматизирует рутинные процессы. Система включает несколько готовых команд:

- /review-contract — пошаговый анализ договоров с маркировкой GREEN/YELLOW/RED рисков и конкретными предложениями по правкам
- /triage-nda — быстрая предварительная оценка NDA с категоризацией (стандартное согласование, проверка юристом, полный анализ)
- /vendor-check — проверка статуса соглашений с поставщиками
- /brief — генерация юридических справок (дейли-брифы, тематические исследования, реагирование на инциденты)
- /respond — шаблонные ответы на типовые запросы.

Система настраивается через локальный файл playbook, где юристы определяют стандартные позиции компании, допустимые диапазоны отклонений и триггеры эскалации. Интеграция с системами документооборота, чатами и управлением проектами происходит через протокол MCP.

Архитектура: Skills как основа

Anthropic использует концепцию Skills — папок с инструкциями, скриптами и ресурсами, которые Claude загружает динамически для специализированных задач. Каждый skill представляет собой самодостаточную единицу с файлом SKILL.md, содержащим инструкции и метаданные.

Что все это значит?

1. Рынок больше не будет прежним

Зачем покупать отдельный инструмент, если плагин от Anthropic делает то же самое и встроен в Claude? Вопрос риторический.

2. Playbook-as-Code

Концепция настройки через локальные playbook-файлы: это фактически "юридическая логика как код". Для юристов это означает необходимость формализовать свои процессы, стандартные позиции и оценку рисков в структурированном виде.

3. MCP-интеграция: будущее уже здесь

MCP становится де-факто стандартом. Российским юридическим фирмам и департаментам стоит изучать MCP для интеграции ИИ-моделей (локальных!) с системами типа СБИС, 1С-Документооборот, Контур.Диадок.

4. Open Source = возможность кастомизации

То, что весь код открыт под Apache 2.0, открывает возможности для создания русифицированных версий с адаптацией под российское законодательство. Можно взять legal skills как основу и дополнить знаниями о российской специфике M&A, корпоративном праве, особенностях due diligence по российским активам. Но это лишь в теории...

5. Окно возможностей

Плагин находится в research preview. Это значит, что ещё есть несколько месяцев, чтобы создать свои адаптированные решения на основе этой архитектуры до массового внедрения.

📌 Бежать ли в Claude Cowork сейчас?

Во-первых, Cowork ещё в процессе тестирования (но я бы бежала в Claude Code). Плагин не защищает данные от отправки в облако — он автоматизирует эту отправку. Для проектов с чувствительностью уровня "коммерческая тайна" это допустимо только при соглашении с клиентом об использовании ИИ и наличии Enterprise-подписки с Anthropic, который юридически закрывает вопросы конфиденциальности. Для работы со строгими требованиями по локализации данных (хранение и обработка только в РФ) это решение использовать нельзя.

Во-вторых, киберриски использования ИИ-агентов просто колоссальные. Утечка данных может произойти даже если система настроена верно (из-за галлюцинаций ИИ). Злоумышленники могут украсть все данные за счёт подложного файла. В общем, это на свой страх и риск, и точно не для корпоративного использования.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥2
АЕБ_Смирнова_презентация_full.pdf
840.8 KB
Гарри Поттер и Тайная комната⚡️

С большим удовольствием выступила на заседании юридического комитета АЕБ. Мероприятие для членов ассоциации было живое, насыщенное и приятное. Я делюсь своей презентацией. В этот раз было не только про ИИ, но и про проектное управление, и про BPM-решения.

Самые ценные инсайты, как всегда, лежат в проблемах, ошибках и деталях, которые не хочется обсуждать на широкий круг незнакомых людей. Да и слайды не смогут передать всей сложности подхода к снаряду.

В этой связи я буду рада выпить чашку кофе тет-а-тет с теми, кому тоже интересен реальный и живой опыт корпоративного внедрения ИИ в процессы проектного управления и сопровождения больших и сложных проектов. Например, можно обсудить:
🟢как сложно на самом деле применять политику об использовании ИИ (даже если вы её написали)
🟢как встраивать людей в новый пайплайн
🟢как создавать свои микропроекты через вайбкодинг (и не только микро...)
🟢есть ли смысл ждать нового прорыва (например, очередного поколения моделей или нового продукта) для следующего прыжка в тему.

Если вам интересно пообщаться, то напишите мне в ЛС @sky_magenta 🙏

А если вам импонирует идея бойцовского клуба офлайн, то ставьте эмодзи единорога на пост. Кое-что грядет)
Так прорвёмся!
Please open Telegram to view this post
VIEW IN TELEGRAM
🦄163🌚1
Законопроект: ИИ в России получит «мягкое» регулирование во всем, кроме социально значимых сфер

«Коммерсантъ» выяснил детали готовящегося законопроекта о регулировании ИИ. Проект концептуально согласован у вице-премьера Григоренко и перешел в стадию технико-юридического оформления. До этого вице-премьер говорил, что регулирования не будет "года два", но видимо прогресс не стоит на месте. В России, по мнению рабочей группы, сейчас в целом один из наиболее свободных режимов в мире в отношении ИИ (но не в отношении персданных, о чем в статье и, уверена, на совещаниях умалчивается. Отсутствие прямого регулирования ИИ не равно свобода действий).

Гайки закручивать не будут, чтобы не потерять "технологическое лидерство на тонком рынке" (РФ занимает всего ~2% мирового рынка ИИ и при этом имеет 2 разработчика ИИ - Яндекс и Сбер). Однако для критических сфер вводятся серьезные новеллы.

Ключевые положения для бизнеса и юристов:

1) Регулирование будет рамочным. Главная цель — ввести понятийный аппарат (разработчик, оператор, пользователь) и исключить ведомственный разнобой, но не тормозить развитие самой технологии. Будут прописаны роли разработчиков, операторов и пользователей, зоны ответственности и обязанности (безопасность ИИ, отсутствие предвзятости, согласие на обработку данных и право отказаться от ИИ‑обработки).

НО: В медицине, обороне, безопасности и госуправлении вводится жесткий фильтр. Использовать можно будет только «доверенный ИИ», который собирается из нескольких или всех признаков далее: оператор — российское юрлицо, ЦОДы — строго внутри страны, модель — в реестре российского ПО и обучена на национальных датасетах. В здравоохранении, образовании, безопасности и биометрии планируется ограничить использование иностранных ИИ‑моделей.
Это будущий стандарт Due Diligence для Tech-сделок. Если таргет работает в чувствительной сфере на зарубежных моделях — это регуляторный риск.

2) Использование дипфейков и ИИ-инструментов при совершении преступлений (мошенничество, манипуляции на финансовых рынках, вмешательство в выборы) станет отягчающим фактором. Ответственность ложится на пользователя.

3) Контент, созданный ИИ, придется маркировать.

4) Появляется концепция прав на произведения, созданные с помощью ИИ (при наличии творческого вклада человека).

До 11 февраля Минцифры собирает фидбек, до конца февраля проект должны внести в правительство. Авторы концепции (Альянс в сфере ИИ, который состоит из лоббистов и бенефициаров данного законопроекта) уверяют, что чем меньше регулирования - тем лучше для развития отрасли и технологического развития России. В чем-то с ними невозможно не согласиться.

Для меня лично самым интересным станет описание критерия «творческого вклада» при создании чего-либо с ИИ - это сильно прояснит (нет), как проверять такие активы.

Забавно, что в данной новости нет никакой связки с этой новостью, а именно с чувствительными предложениями от Ассоциации больших данных (состоящих из тех же участников, что и Альянс в сфере ИИ).


Что надо включать в чек-листы по сделкам с ИИ-активами уже сейчас?

➡️ каковы используемые модели (свои / иностранные), их статус доработки и локализация (в т.ч. исходного кода и облачных мощностей/ЦОД)
➡️ как обеспечивается соблюдение авторских прав и ПДн‑регулирования при работе с данными
➡️ используются ли продукты компании с ИИ в медицине, образовании, биометрии и т.п.
➡️ как контролируется/ограничивается использование иностранных моделей в создании продукта
➡️ как компания проверяет включение сгенерированных ИИ результатов в продукты для клиентов (исходный код, консультация) и маркирует ли их
➡️ кто создает пайплайны с ИИ (промптит, делает архитектуру взаимодействия вокруг ИИ) и как это оформляется (промпты, архитектурные схемы)
➡️ есть ли политики по инцидент‑менеджменту (включая использование результатов генерации для незаконной деятельности) и тестированию на безопасность ИИ‑систем
➡️ Откуда берутся данные для обучения ИИ (см новость от Forbes выше).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4😱4🥱1
😐 Дисконт за ИИ-сообразительность

Financial Times опубликовали знаковый инсайд: KPMG требует от своего аудитора (Grant Thornton) снизить цены на услуги, ссылаясь на эффективность ИИ.

Материал находится за пейволлом, вот лайфхак: прочитать его с помощью Perplexity, скинув ему ссылку и попросив дословно перевести на русский язык.


Ситуация ироничная и показательная. Гигант консалтинга, который сам активно продает клиентам цифровую трансформацию и оказывает услуги с помощью внутреннего ИИ, включил закупщика в отношении собственных подрядчиков. Представители KPMG заявили, что их финансовая отчетность «не является сложной», а внедрение новых технологий аудитором должно напрямую конвертироваться в экономию для клиента, а не только в маржу провайдера. Стреляют себе в ногу товарищи.

Это первый громкий публичный кейс такого давления в секторе профессиональных услуг. Аудит - это только начало, поскольку там процессы наиболее стандартизированы. Но сигнал для юридического рынка четкий.

Теперь "зато быстро" - не аргумент. Раньше мы продвигали Legal Tech как способ сделать работу быстрее и качественнее за те же деньги. Теперь рынок разворачивается: «Если быстрее — значит дешевле».

Во многих юридических услугах львиная доля костов - это ревью документов. Если (когда) клиенты начнут массово требовать дисконт за использование ИИ при анализе договоров, экономика многих юрфирм, сидящих на почасовке, пошатнется. Ключевое - это случится, если они не смогут оцифровать свою эффективность и объяснить, в чем их добавленная стоимость.

Я считаю, что такая добавленная стоимость есть, и это наше будущее. Объяснила, почему так считаю и что на самом деле такое БЯМ, в своём материале про фундаментальные ограничения ИИ выше. Шансы объяснить сейчас все ещё высоки, так как многие не отличают "мышление" ИИ от мышления юриста.


KPMG просто озвучили то, что уже скоро будет в голове у каждого финдиректора, подписывающего договор на юридические услуги. Вопрос лишь в том, кто первым адаптирует свою бизнес-модель — мы или наши клиенты, и смогут ли юристы объяснить свою уникальную экспертизу (которая однозначно есть, но далеко не везде) в новую эпоху.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥5
Please open Telegram to view this post
VIEW IN TELEGRAM
Дамасские чернила | AI и M&A
🚨Legal Skills в Claude Cowork

Не успел Cowork появиться (в январе 2026, пару недель назад!), как произошёл ещё один потенциальный (!) прорыв для юристов. Эта новость меня сильно впечатлила, уверена, должна впечатлить и вас.
🚨Claude Cowork теперь и на Windows!

Наконец-то. Не у всех есть Mac, большая часть пользователей исторически на Windows. Теперь Cowork доступен и им. Важно подчеркнуть: удовольствие будет стоить определенных денег, но все равно - если вы хотите быть на передовой, предлагаю рассмотреть возможность уделить этому инструменту свое свободное время и деньги.

Разумеется, помним про правила техники безопасности с корпоративной информацией и не допускаем утечек.

Интересно будет прочитать обзор?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3
Анонимайзер: хороший, плохой, злой

Пост крайне актуален. Сегодня уже каждый понимает, что в публичные ИИ не стоит отправлять сколь угодно конфиденциальные данные, и страдает от отсутствия понятных и недорогих решений на рынке уровня Enterprise. Респект вайбкод-решению DocxДоДыр, которым до сих пор многие пользуются. Мы в О2 используем гибридный подход с локальной анонимизацией, о чем неоднократно писала выше.

Увидела новость, что достаточно известный на нашем legal tech рынке стартап noroots запустил лист ожидания к своему продукту Mollyx.ru. Лендинг - зачёт. Но есть пара важных добавлений, чтобы не получить от него лишние очки очарования.

Существует на мой взгляд, единственно верный архитектурный подход к подобным инструментам: Local-First + Masking. Как я понимаю, так сделали и ребята.

Ключевое в подобных решениях:
💡 Локальная нейросеть для NER (Named Entity Recognition: ликбез, н-р, тут). Данные не улетают на сервер для очистки. Модель крутится прямо у вас - например, в браузере (через WebAssembly, как у ребят) или контуре. Это может быть и полноценная локальная LLM, то есть трансформер. Очень интересно, дообучали ли ребята свою NER-модель на именованных сущностях из привычных глазу понятий, потому что по-хорошему это нужно.

😀 Маскировка. Скрипт находит ФИО, суммы, адреса, названия компаний и меняет их на токены типа [PERSON_1], [COMPANY_A], [AMOUNT_RUB]. В результате в облако уходит только обезличенная структура. Смысл сохраняется, детали — нет.

Но даже если инструмент (как тот же MollyX) заявляет правильную архитектуру, юристу верить расширению на 100% нельзя, заявление о том, что он подходит для корпоративного использования, я готова подвергать сомнению. Любой NER-инструмент может ошибиться! Он может пропустить нестандартное написание суммы, редкую фамилию или контекстную привязку (например, "тот самый завод в городе N" - и уже понятно, о чем речь, даже без названия). Никто не отменял и человеческий фактор — кто-то вставит в промпт данные “в обход” (скрином/файлом/таблицей), и тут простой скрипт не справится, тут должна быть продумана защита.

Поэтому, внедряя подобные NER-инструменты в работу команды, используйте фильтр безопасности - человеческий интеллект.

📢 Чек-лист: как выбрать/создать свой анонимайзер

Настоящая ли приватность.
Работает ли инструмент без интернета? Отключите Wi-Fi и проверьте, маскирует ли он текст. Если нет — ваши данные летят на сторонний сервер. Также может быть вшита возможность получения телеметрии, в том числе в будущем. Ценность ваших данных может быть совсем не в том, какие условия сделки, которую вы сопровождаете прямо сейчас, а что лично вы/компания предпочитаете.
А действительно ли хорошо распознает имена, или это плохой скрипт. Понимает ли он "OOO Ромашка", "Ivanov A.A.", суммы прописью? Если пропускает 1 из 10 имен — для бытового использования ок, для работы — нет.
Умеет ли в хитрую анонимизацию.
Анонимайзер может скрыть, к примеру, "ПАО Газпром", но может оставить фразу "крупнейшая газовая монополия РФ". В сделках M&A такие "хвосты" деанонимизируют актив мгновенно. Это нужно вычищать глазами, ну либо использовать продвинутый LLM-пайплайн с дообучением и тогда (скорее всего) не в формате только расширения для браузера.
Обратимость распознавания.
Умеет ли инструмент вернуть данные обратно в готовый ответ от GPT? Если вы получили идеальный пункт договора, но там везде [DATE_1], вам придется тратить время на ручную подстановку. Хороший сервис делает это сам и локально.
Предупреждает ли о правилах техники безопасности, опять.
Правило для младших юристов: никогда не нажимать Enter сразу после маскировки. Сначала — глазами пробежать текст. Анонимайзер — это помощник, а не индульгенция. Хороший сервис будет сохранять ваше внимание, а не усыплять вашу бдительность.

Инструменты типа MollyX — это шаг в правильную сторону (локальная обработка), но ответственность за утечку данных с нас никто не снимал.

#локалки
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥4😱3🦄1
Дамасские чернила | AI и M&A
Законопроект: ИИ в России получит «мягкое» регулирование во всем, кроме социально значимых сфер «Коммерсантъ» выяснил детали готовящегося законопроекта о регулировании ИИ. Проект концептуально согласован у вице-премьера Григоренко и перешел в стадию технико…
Суверенизация ИИ для КИИ/госсектора

Появилась новость, что в АЮР разработали законопроект о регулировании ИИ в госсекторе. Мэтчится с недавно обсуждавшимся общим регулированием ИИ от вице-премьера Григоренко. Выше как раз разбирали основную инфо про общий законопроект об ИИ.

В чем его ключевые пойнты:
запретить в госсекторе и на объектах КИИ ИИ, права на который принадлежат иностранным лицам;
запретить ИИ, противоречащий конституционным принципам защиты прав и свобод;
ввести классификацию по рискам и обязательную «силовую» сертификацию (ФСТЭК/ФСБ) для допуска ИИ в госструктуры и КИИ;
создать отдельный национальный центр компетенций по гос‑ИИ при правительстве.

Инициатива АЮР делает шаг дальше зарубежной мейнстрим‑модели: не только распределение моделей по рискам и аудит (как, например, в ЕС), но и жесткая «санитарная зона» вокруг госcектора/КИИ по происхождению технологий (бан иностранного ИИ), плюс силовой допуск (ФСТЭК/ФСБ). Аналогичной по жесткости связки «общий закон + суверенный внутренний контур гос‑ИИ только на своих моделях» среди крупных юрисдикций пока почти нет.

Что я думаю по этому поводу?
В эпоху, когда ИИ становится оружием для влияния на умы, суверенизация может быть логичным ответом. Однако тот же Китай идет несколько другим путем и не запрещает сразу все иностранные сервисы. Причина этому, думается, сугубо экономическая (контур защиты выстроен иначе + чтобы не потерять рынок, провайдеры будут локализовывать продукты и слушаться КПК).

Почему АЮР?
Я думаю, это такая форма легитимации законодательной инициативы (от профюристов). Потому что наличие лоббистов в предыдущих инициативах привлекло общественное внимание.

Вообще, регуляторная обвязка вокруг суверенного Рунета и КИИ обещает быть очень интересной. Разобраться с ней без юриста будет непросто, даже с ИИ. :)
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚4👍2
Forwarded from All Things Legal
Про теневое использование ИИ в компаниях написано уже много, в т.ч. в этом канале. И без того не идеально, когда сотрудник безрассудно отправляет документы в ChatGPT. Но по анализу Token Security 22% сотрудников их клиентов используют OpenClaw без ведома своих работодателей. А это уже не смешно. Как правило, первое, к чему подключат этого омара, это электронная почта. Хакерам даже не надо сканировать порт OpenClaw по умолчанию, они просто отправляют письмо с вредоносной инструкцией (prompt injection). Пора поговорить с сотрудниками.

#cybersec
😱6👍3🥱1