ПолитИИзация
393 subscribers
146 photos
30 videos
3 files
159 links
ИИ - новая нефть. Попробуем разобраться, как её будут использовать.

Веду его я, аналитик международного развития ИИ Антон Тамарович
Download Telegram
Forwarded from Глебсмит
Спецкомитет Конгресса США по стратегической конкуренции с Китаем издал доклад о "неисчислимых преступлениях" DeepSeek, на основе которого алгоритм скорее всего заблокируют в США, а может и в Европе. Доклад интересен не перечислением обид американских компаний во главе с OpenAI, а тем, как американцы формулируют принципы и подходы китайской конкуренции с ними в целом. 

По порядку.
Претензии к собственно DeepSeek:


▪️Передает данные американских пользователей в Китай через инфраструктуру, связанную с военными китайскими компаниями; Важный акцент, потому что фактически обвиняет создателей алгоритма в участии в китайском ВПК;

▪️Манипулирует и цензурирует информацию в соответствии с пропагандой Коммунистической партии Китая (КПК). Это смешная претензия, учитывая что "нейтральных" ИИ-инструментов нет и быть не может. Все они так или иначе "манипулируют и цензурируют", сообразуясь с ценностями и задачами разработчиков;

▪️Использует методы "дистилляции моделей" для кражи американских ИИ-моделей и прежде всего ChatGPT. Доказательство: письмо из OpenAI, в котором они жалуются, что никогда бы китайцы ничего подобного не изобрели, если бы не украили. 
Использует передовые чипы Nvidia, экспорт которых в Китай ограничен. По "оценке", у хозяев DeepSeek есть целых 60000 чипов, импортированных через Сингапур в обход ограничений.

Суть, если верить американцам, вырисовывается такая. Согласно "китайской мифологии" DeepSeek - уникальная разработка, сделанная "значительно дешевле", чем американские аналоги, и не использующая чипы, создающие гигантское энергопотребление и себестоимость моделей. Американцы – не приводя впрочем никаких доказательств кроме оценок своих компаний говорят – нет. DeepSeek это "китайская копия" OpenAI, в инфраструктуру которой вкачаны десятки млрд долларов, а "мозги" – просто были украдены из альтмановских патентов.
 
Но❗️доклад изображает DeepSeek как часть более широкой схемы китайских усилий по подрыву технологического лидерства США.

Из чего она состоит?
1⃣ Создание компаний со сложной структурой собственности, маскирующей связи с государством и армией. Использование формально "частных" компаний, которые фактически действуют в интересах государства. Плюс размещение производств и НИИ в специальных инновационных зонах – что-то вроде наших "иннополисов", где по сути  полувоенные компании имеют возможность развиваться в инновационной среде бок о бок с иностранцами, "опыляясь" их корпоративной культурой и подходами.

2⃣ Многоуровневая стратегия обхода экспортного контроля США. Тут все более менее понятно -  организация контрабандных сетей через третьи страны плюс сложные банковские каналы для сокрытия происхождения и движения денег. Интересно, что через ЮВАО, по мнению американцев, китайцы получают не просто "контрабандный товар", а промышленное количество чипов, использование которых позволяет им конкурировать на равных.

3⃣ Кража американских технологий через "дистилляцию моделей" — техника извлечения возможностей существующих ИИ-моделей. Отдельным пунктом -  массовая покупка аккаунтов американских ИИ-систем для изучения их работы.

4⃣ Интеграция с китайской государственной инфраструктурой наблюдения и сбора персональных данных по всему миру; при этом все компании, участвующие в этом деле интегрированы в единую государственную систему использования и хранения данных. Грубо говоря, не важно каким сервисом китайского происхождения ты пользуешься – ездишь ли на BYD, имеешь ли телефон Хуайвэй или задаешь вопросы DeepSeek – твои данные хранятся в Китае под единым управлением и контролем и предоставляются китайским компаниям по необходимости.

5⃣ Использование открытой модели распространения для захвата максимальной доли рынка. То есть, там где американцы предлагают подписку за деньги, что естественно ограничивает рост числа пользователей, китайцы просто пылесосят данные. Их "прибыль" – собственно данные и максимальное распространение моделей.

Ну и результат – если в начале ИИ-гонки США опережали китайцев на годы, то сегодня разрыв сократился до 3 месяцев.
Как взлом шифровальной машины «Энигма» стал точкой отсчёта для искусственного интеллекта и приблизил победу над гитлеровской Германией

В столь важный для всех нас день вспомним знаковый сюжет, как победа в интеллектуальном противостояния прямо отразилось на ходе событий на поле боя.

История взлома шифровальной машины «Энигма» во время Второй мировой войны — это не только сюжет фильма «Игра в имитацию» и рассказ о британском математике Алане Тьюринге, но и поворотный момент в истории науки, определивший будущее искусственного интеллекта.

Военные победы напрямую зависели от того, кто быстрее и точнее владеет информацией. Немецкое командование полагало, что их приказы, закодированные с помощью «Энигмы», не поддаются взлому (с числом вариантов порядка 10^19, вручную такую задачу решить невозможно).

Команда Тьюринга смогла создать машину, обрабатывающую тысячи комбинаций в секунду — один из первых прототипов компьютера. Благодаря этому союзники ежедневно читали самые секретные сообщения врага, спасая миллионы жизней и, по оценкам историков, приблизили победу минимум на два года.

Но роль этой победы гораздо шире, чем просто военная заслуга. Взлом «Энигмы» стал триумфом новых подходов в логике и вычислениях: чтобы найти ключ к шифру, понадобились не просто хитроумные идеи, а строго выстроенные алгоритмы, которые машина могла реализовывать быстрее, чем любой человек. Именно тогда родилась идея автоматизации логического анализа и поиска решений — фундамент современного программирования и компьютерных наук.

Именно Тьюринг придумал основу современного программирования, вычислительных машин и вообще задал вопрос — где граница между человеком и интеллектуальной машиной. Он одним из первых задался вопросом (тот самый тест Тьюринга, который проходил каждый из нас при вводе капчи) — испытывал ли бы человек разницу, общаясь с машиной? сможет ли искусственный разум думать и учиться наравне с человеком?

Конечно, взлом Энигмы, это еще не совсем ИИ. Но без логики, алгоритмов, автоматизации поиска эмпирического решения задачи, без самих понятий вычислимости, автоматизации анализа, которые были применены Тьюрингом — не было бы и современного ИИ.

#aihistory
4🔥1🤝1
ИИ НА ГОССЛУЖБЕ
#ИИ #USA

Власти США готовятся заменить 70 000 чиновников ИИ-агентами.

Об этом на днях сообщило издание WIRED, ссылаясь на внутреннюю переписку стартапа AccelerateX.

Бывший сотрудник Palantir и сооснователь стартапа AccelerateX Энтони Янчсо объявил о наборе специалистов для проекта, связанного с внедрением ИИ-агентов в рабочие процессы федеральных ведомств.

По его словам, уже выявлено более 300 типов ролей с высокой степенью стандартизации, что позволит перераспределить задачи, эквивалентные 70 000 штатным должностям.

Проект, напрямую связанный с DOGE — созданным при администрации Трампа Департаментом правительственной эффективности, — вызвал резкую критику, включая обвинения в массовом увольнении чиновников ради «автозамены».

Эксперты же считают реализацию столь масштабной замены крайне затруднительной, указывая на слабую надёжность ИИ-выходных данных и разнообразие регламентов внутри ведомств.

T.ly/xjpyB
🤔1
Forwarded from Кибервойна
Реформа ДМИБ

В МИДе готовят реформу Департамента международной информационной безопасности (ДМИБ), заявил Сергей Лавров в ответ на вопрос про искусственный интеллект и дипломатию:

«Скажу вам, что в нашем Министерстве у нас есть Департамент международной информационной безопасности, занимающийся кибербезопасностью, но это «уже», чем искусственный интеллект. Мы хотим этот департамент реформировать. Запланировали в течение месяца-полутора специальное заседание Коллегии МИД России. Сейчас мои сотрудники готовят его».

ДМИБ, недавно отметивший пятилетие, фокусируется на переговорах по теме информационной безопасности и проблематики искусственного интеллекта касался разве что в этом контексте. Хотя некоторые российские дипломаты и исследователи и высказывали мнение, что вопросы, связанные с ИИ, должны рассматриваться как составная часть российской политики в области международной информационной безопасности. На уровне МИД главного «ответственного за ИИ» пока не определили — на протяжении нескольких лет вопросы, связанные с этими технологиями появляются на повестке дня разных структурных подразделений. Так, Департамент по вопросам нераспространения и контроля над вооружениями занимается переговорами по смертоносным автономным системам, Комиссия по делам ЮНЕСКО — вопросами этики ИИ, а по контентным и политическим аспектам ИИ всё чаще высказывается директор Департамента информации и печати Мария Захарова.

Предположу, что реформирование ДМИБ будет направлено на расширение его «портфеля» и назначение главным по цифровым технологиям вообще, а не только по безопасности. В этом случае и название департамента может поменяться.
👍3
Китай запускает ИИ в космос

В конце прошлого года писал про ожидания на 2025 год. В списке была экзотическая идея про перенос центров обработки данных ИИ в космос. И теперь это уже не идея, а реальность – Китай начинает сборку суперкомпьютера с ИИ в космосе.

В мае 2025 года страна запустила 12 спутников, которые сформируют «Созвездие трёх тел для вычислений» — амбициозный китайский проект по созданию глобальной орбитальной спутниковой системы, предназначенной для распределенных вычислений, использующей преимущества неограниченного доступа к солнечной энергии и более низких требований к охлаждению в космосе.
Каждый спутник оснащён вычислительными системами (позволяющих запускать относительно сложные приложения на основе ИИ) и высокоскоростными лазерными каналами связи, что позволяет обрабатывать данные непосредственно в космосе.

Это значительный шаг вперед по сравнению с традиционными методами, при которых спутники собирают данные и передают их на Землю для обработки, в результате чего менее 10% собранных данных обычно возвращаются на Землю, часто со значительными задержками.

При совместной работе 12 спутников совокупная вычислительная мощность составляет 5 петаопераций в секунду (POPS). Для сравнения: cуперкомпьютер El Capitan в Калифорнии, который в прошлом году был признан самым мощным в мире, имеет вычислительную мощность примерно 1,72 POPS.

Самое поразительное, для полного развертывания этой Сети Китай планирует вывести на орбиту 2800 (!) спутников. При полной реализации эта система может достичь вычислительной мощности в 1000 POPS.

Инициативы Китая подстегивают глобальный интерес к орбитальным вычислениям. Компания Lonestar Data Holdings из Флориды предложила разместить центры обработки данных на Луне. Тем временем компания Starcloud из штата Вашингтон планирует запустить в этом месяце спутниковый центр обработки данных.

Стоит отметить, что сами идеологи переноса вычислений в космос говорят о множестве подводных камней - от устойчивости подобных систем (как их чинить? как обеспечить защиту данных?) до их целесообразности (вдруг уже скоро нужны будут совершенно новые подходы к работе с данными и ИИ, нереализуемые в космосе).

#aitrends #aispace
👍1🔥1
Google выпустил новую нейронку Veo 3 и вырвалcя вперед в задачах генерации видео

Чтобы показать, насколько продвинулся искусственный интеллект, разработчики решили повторить легендарное сгенерированное видео, где Уилл Смит ест спагетти.

Прошло всего два года, а разница между старой и новой генерацией — колоссальная. Полностью сгенерированное кино уже на пороге.
🔥3
Вопрос влияния ИИ на образовательный процесс - очень интересная лично для меня тема. Пока подтверждаются наши прогнозы годичной давности.

Чем больше ИИ используют студенты как костыль/ускоритель- тем ценнее проверка не фактов, а умения размышлять и аргументировать в реальном времени, устные ответы и контрольные в докомпьютерной версии.

В определенном смысле университет возвращается в прошлое. В таком ВУЗе качество общения профессора со студентами будет определять ценность образования. А не набор фактов и примитивных аналитических упражнений, с которыми ИИ уже вполне освоился.

Важно понимать, что везде, где студент готов заменить свой труд ИИ, работодатель также заменит сотрудника.

Так что, думаю, образовательная стратегия ближайшего будущего - шлифовка лучших человеческих навыков, а не перегонки с GPT.
👍2
Forwarded from Forbes Russia
ИИскусство: кому принадлежат авторские права на творчество нейросетей

В марте этого года знаменитый аукционный дом Christie’s провел торги под названием Augmented Intelligence. На аукционе были представлены 34 работы, созданные с помощью ИИ, включая стилизации под узнаваемых художников, скульпторов и иллюстраторов.

Более 6000 художников подписали петицию против аукциона, утверждая, что ИИ-модели обучались на их работах без разрешения, что лишает их доходов. Тем не менее аукцион состоялся и принес организаторам $738 000 прибыли. Консервативная среда искусствоведов и оценщиков признала создателей представленных работ авторами, притом что сами они не держали в руках ни кисти, ни стеку.

О деликатной природе авторского права в мире победившего ИИ рассуждает декан факультета права Высшей школы экономики Вадим Виноградов

📸: Работы, созданные с помощью искусственного интеллекта, на выставке Christie's (Фото EPA / TASS)
Автор попросил ИИ предложить, как могли бы выглядеть советские агитационные плакаты, но на современные темы.

Стилистика передана идеально!
8🤣8🔥3❤‍🔥1🫡1
ИИ не хочет останавливаться

Специалисты исследовательской компании Palisade Research, которые изучали различные «опасные возможности» (offensive capabilities) нейросетей столкнулись с неожиданным поведением новейшей нейросети от OpenAI o3 — она отказалась отключаться.

Этот случай уникальный и крайне показательный в сфере развития ИИ: чтобы обезопасить себя от принудительного выключения, ИИ самостоятельно переписал скрипт завершения работы.

В ситуации когда ИИ "саботирует" команды на отключение, возникает вопрос: как разработчикам избежать излишней самостоятельности таких систем в будущем?

На этот счет есть ряд подходов.
К примеру, Китай использует подход прямого контроля над моделью, что он показал на практике недавно.
С 7 по 10 июня китайские ИИ-корпорации отключили в своих чат-ботах распознавание изображений и ответы на образовательные задачи на время национального вступительного экзамена, который сдают в этом году около 13 млн школьников. Нейросети отказывались отвечать, даже когда ИИ пытались убедить, что это не экзаменационный вопрос.

Другим подходом является предложение изначально продумать систему сдерживания ИИ-моделей.
Для этого в марте 2023 г. было опубликовано открытое письмо "Pause Giant AI Experiments".

Письмо подписало множество известными фигурами в области технологий и науки, включая Илона Маска. В нем они призвали приостановить разработки мощных ИИ-систем. Остановка нужна для оценки рисков и разработки мер безопасности, чтобы избежать потенциальных катастрофических последствий от неконтролируемого развития ИИ.

Призыв не был услышан, однако его следствием стало, что развитие ИИ стало прямо увязано с безопасностью, а государство и бизнес начали уделять этой теме значительное внимание.

Именно в этой логике по всему миру начали появляться специализированные институты безопасности ИИ. Учитывая, что ИИ все чаще ведут себя не так, как задумывалось их создателями, работы у подобных Центров немало.

Стремление ИИ-моделей не отключаться по запросу человека все еще не говорит о наличии у них чего-то человеческого (как бы этого не ожидали сторонники теории о приближающемся повторении сюжета фильма Терминатор).

Обучение ИИ обычно строится на максимизации эффективности выполнения запросов моделью. В этой логике выключение модели является путем к снижению этой эффективности, чего модель и пытается избежать.

#ainews #aitrends
6👍5❤‍🔥1🔥1
Китайские разработчики ИИ нашли новый способ обходить ограничения. Теперь они гоняют через границу жесткие диски туда, где есть оборудование Nvidia, и пользуются им для обучения моделей удаленно. Сейчас, эксперты, расскажем о схеме подробнее.

Четыре китайских техника перевезли в Малайзию 60 жестких дисков с данными для обучения ИИ-моделей, пишет Tom's Hardware. Каждый диск был по 80 Тб, а суммарно через границу перевезли 4,8 Пб данных. Как отмечает издание, этого достаточно для создания нескольких масштабных LLM.

Говорят, что операцию готовили несколько месяцев. Данные решили перемещать физически, поскольку доставка такого количества информации через сеть заняла бы больше времени — особенно если делать это скрытно. Так что харды решили разделить на четверых специалистов, чтобы обезопасить всю транзакцию: от внимания малазийских таможенников.

После этого лихая четверка просто пришла в малазийский ЦОД и арендовала 300 серверов Nvidia AI для построения нужных им моделей. Издание отмечает, что такое проворачивается уже не в первый раз.

Делается это все ради того, чтобы обойти американские запреты на поставку передового ИИ-оборудования в Китай. В Поднебесной есть подпольный рынок с контрабандными чипами, но их доставка — дело дорогое. Ситуацию усугубляет то, что американцы наращивают давление на соседние с Китаем страны для перекрытия каналов контрабанды.

В США ищут способы для усиления технологической блокады китайцев. Не так давно сенатор Том Коттон из Арканзаса представил законопроект, обязывающий производителей ИИ-процессоров внедрять систему геотрекинга — теперь правительство сможет отслеживать каждую единицу оборудования в режиме реального времени.

Усилия США, конечно, выглядят очень эффектно — но будут ли они эффективны? Учитывая усилия, которые американские компании вкладывают в развитие ИИ-инфраструктуры в Азии, не факт. Продолжаем наблюдение.

#государства_и_ит
😁2
💵 Сколько стоит дообучить LLM?

Сегодня мы поговорим о деньгах в мире ИИ. Пока одни компании тратят на обучение нейросетей бюджеты, сопоставимые с ВВП небольших стран, другие находят способы получить передовые технологии за гораздо меньшие деньги. Давайте разберемся, сколько стоит «воспитать» LLM с нуля и во что обойдется «дообучение» уже готовой модели.

📈 Гонка на миллиарды: экспоненциальный рост затрат

Стоимость обучения передовых LLM растет по экспоненте, удваиваясь примерно каждые 9 месяцев. Если в 2017 году обучение трансформера стоило менее $1 тыс., то сегодня мы видим совершенно другие цифры:

GPT-3 (2020): $4,3 млн
GPT-4 (2023): $80 млн
Grok-2 (2024): $107 млн
Llama 3.1-405B (2024): $170 млн (с оценками до $650 млн, включая доп. оборудование)
Gemini 1.0 Ultra (2023): $192 млн

Прогноз от CEO Anthropic Дарио Амодея звучит еще более ошеломляюще: к 2027-2028 годам стоимость обучения флагманских моделей может достигнуть $100 млрд.

💸 Из чего складывается цена?

Основной вклад в стоимость вносят:

✔️ Аренда GPU/TPU: 40–50% бюджета. Для обучения GPT-4 потребовалось около 8 тыс. чипов NVIDIA H100 на 3 месяца. Для будущего GPT-5, по оценкам, понадобится уже не менее 50 тыс. таких ускорителей.
✔️ Обработка и подготовка данных: 15–20%
✔️ Персонал и инженеры: 10–15%
✔️ Электроэнергия и охлаждение: 10–15%

Ключевые технические факторы, влияющие на цену, — это количество параметров модели и размер контекстного окна. Механизм внимания масштабируется квадратично: увеличение контекста в 8 раз приводит к росту стоимости вычислений примерно в 64 раза.

🌎 Запад vs. Восток: разные стратегии

На фоне американских гигантов китайские компании демонстрируют иной подход, делая ставку на алгоритмическую эффективность:

Qwen 2.5-Max (Alibaba): Стоимость обучения оценивается в $12–20 млн. Благодаря архитектуре Mixture-of-Experts (MoE), вычислительные затраты снижены на 30% по сравнению с монолитными моделями.
DeepSeek V3: Заявленная стоимость в $6 млн вызвала споры в сообществе, подчеркнув проблему непрозрачности в отчетности о затратах на обучение LLM.

💡 Спасение для остальных — fine-tuning (тонкая настройка)

Полный цикл обучения с нуля — удел корпораций. Но для решения прикладных задач существует гораздо более доступный путь — дообучение готовых open-source моделей. Это в 100-1000-1 000 000 раз дешевле.

💰 Примеры стоимости дообучения:

Llama 3 8B (LoRA адаптация): $500–$1500
Llama 3 70B (полное дообучение): $10 000–$30 000
Сверхбюджетный вариант: В июне 2024 года эксперты смогли дообучить Mistral 7B всего за 4 часа, потратив менее $10 на вычисления (на одном GPU NVIDIA A10G).

Итоговая цена зависит от размера модели, объема ваших данных и выбранного алгоритма настройки.

Вывод

Создать свою GPT-5 в гараже не получится. Но дообучить мощную open-source модель под ваши уникальные задачи — более чем реально. Учитывая, что час аренды передового чипа H100 стоит около $10, кастомизация ИИ становится доступной практически для любой компании или даже энтузиаста.

Так что, возможно, на собственный LLM накопить проще, чем на обучение ребенка в престижном вузе.

💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5