FSCP
15.3K subscribers
31.6K photos
4.09K videos
873 files
81.6K links
another filter bubble канал изначально созданный несколькими друзьями чтобы делиться копипастой, иногда оценочным суждением

технологии, деньги, социум

редакция @id9QGq_bot
реклама @johneditor
в будущее возьмут не всех
выводы самостоятельно

мир меняется
Download Telegram
RIP Photoshop (нет) https://t.iss.one/ai_newz/3740

Потестил я мультимодальную Gemini Flash 2.0 (Image Generation) Experimental. Мог бы сказать, что фотошоп в целом больше не нужен, но, блин, эта штука в туории может куда больше, чем мог бы Photoshop. Я совсем не представляю, как можно было бы вручную наложить шоколадный крем на круассаны с первой пикчи. 

Никакой из доступных из коробки методов не способен был такое провернуть. Через ControlNet или inpainting так не сделаешь, потому что они изменяют детали — круассаны будут чуть другими или по-другому лежать. А здесь мы имеем хирургически точное редактирование картинки одним только текстом. Единственный минус пока - это низкая детализация и низкое разрешение генераций.

Другие юзкейсы: 

- Product photo — раньше нужно было бы тренить LoRA, чтобы получить пикчу №2. Нужно больше фотографий + примерно час работы. 
- Character sheet design — пикча №3. По одному концепту получаем разворот с трех сторон для моделлеров. Можно было бы погенерить что-то подобное, но здесь мы видим консистентность, которой раньше было сложно добиться моделями из коробки.
- Нейрофотосессии — пикча №4. Повторяем лицо по одной фотографии так, словно это LoRA для Flux
- Гайды — пикчи №5,6,7. Может на картинке выделять, куда тыкнуть, рисовать консистентные гайды, как здесь в примере с готовкой. 
И т.д.

Вот она, сила мультимодальных моделей. Все это благодаря тому, что тут генерация изображений и LLM объединены вместе. В отличие от, например Flux или Imagen 3, тут картиночные токены выплевываются напрямую из LLM, без вызова диффузии. За счет этого и достигается более нативное редактирование входных картинок. Но такой метод все же пока уступает диффузии в качестве генерации.

Кстати, в Grok такую LLM-генерацию (Aurora) завезли еще в декабре, и ее можно попробовать в Grok3, вот только редактирование там пока отключили.
Что-то подобное показывала OpenAI ещё в прошлом году, но так в прод и не завезли (эх Cэма-Сэма). Если Gemini Flash так хорош и дешевле, то что будет с 4o

Попробовать можно в ai studio.

_______
Источник | #ai_newz
@F_S_C_P

Стань спонсором!
🔥3👍1
Krea продолжает жечь.

Restyle Video - загружаете свое видео, а потом выбираете "контролНеты":

"Depth" сохранит движение, захваченное с помощью карты глубины на исходном видео.

"Edges" будет захватывать движение по контурам с исходника - отлично подходит для крупных планов или лиц, говорящих.

"Pose" будет захватывать только движения людей на видео - подходит для видео с людьми и статичным фоном.

"Video" тупо захватит движение из пикселей исходника без дополнительной обработки.

Потом выбираете стиль, надо который навалить на видео.

Напоминает ранний Runway.
_______
Источник | #cgevent

__________________________

Для Gemma 3 вышли официальные квантизированные версии

Квантизация это сейчас стандарт, мало кто будет запускать модели локально в нативных bf16 — большая часть пользователей использует 4 битную квантизацию. И тут проявляется большая проблема — модели, по большей части, выпускают в bfloat16 и совершенно не расчитывают, что кто-то когда-то будет их запускать как-то по-другому, из-за чего заметно страдает качество моделей при локальном использовании. Дело в том, что дешёвая Post-training квантизация, которая не требует тренировки, сильно просаживает качество.

Google специально дотренировали Gemma 3 с quantization aware training, чтобы таких проблем не было. Обещают "схожее качество" с bf16 моделями, но результатов бенчей не дали (а хотелось бы). Такой же релиз делала и Meta с Llama 3.2, правда только для 1B и 3B, а Google выпустил сразу всю линейку. А остальным авторам открытых моделей тоже стоит начать делать подобные релизы.

Скачать

_______
Источник | #ai_newz
@F_S_C_P

-------
Секретики!
-------
Вышел DeepCoder 14B Preview

Новый ризонер специально для кода, лидирующий в 14B весовой категории и догоняющий o3-mini и o1, когда они обе на low настройках. Неприятный звоночек — модель не сравнивают с QwQ 32B, основным конкурентом этой модели, а с моделями OpenAI сравнивают только на low настройках. Причём непонятно почему — результаты достойные, даже o3-mini (low) обойти это непросто.

За основу взят DeepSeek R1 Distill 14B, поверх которого запустили RL на 24к задач для кодинга. Это сильно бампануло качество кодинга по сравнению с бейзлайном, при этом случайно улучшив результаты на математике.

Сделали эту модель в колабе с Together AI, это один из клауд провайдеров заточенных специально на ИИ. Я уже писал пару лет назад об их датасете RedPajama, воспроизводящем датасет оригинальной Llama.

А вот самая лучшая часть — авторы опубликовали не только веса, но и код с датасетом. Всё это можно прямо сейчас скачать с 🤗 и гитхаба.

И мы все ближе к маленьким и умелым моделькам, которые можно запускать локально (а 14B можно запускать и на обычном железе) и которые могут заменить проприетарные модели. На этот раз в кодинге. Не устану повторять, что опен сорс – это круто!

Веса

Код
Датасет

@ai_newz

_______
Источник | #ai_newz
1🤮1👀1
✔️ Google анонсировали Genie 2 — крупномасштабную «foundation»-модель мира, способную на лету порождать интерактивные 3D-окружения. Ключевые моменты:

📌 Что такое Genie 2
Это автрорегрессивная латентно-диффузионная модель, обученная на огромном видеодатасете. Получив всего одно изображение-подсказку (например, кадр, сгенерированный Imagen 3), Genie 2 разворачивает целый виртуальный мир, в котором можно свободно перемещаться клавиатурой и мышью — как человеку, так и ИИ-агенту. Длительность консистентного эпизода достигает минуты.

Зачем она нужна
Главный барьер в исследованиях «телесных» (embodied) агентов — ограниченный спектр тренировочных сред. Genie 2 снимает это ограничение: модель способна бесконечно генерировать новые ландшафты, объекты, физику и взаимодействия, создавая «безграничный учебник» для RL-агентов.

В работе демонстрируется связка с SIMA — многоцелевым агентом DeepMind: тот получает языковые инструкции («открой синюю дверь») и действует внутри миров, созданных Genie 2. Такое сочетание позволяет быстро генерировать unseen-задачи для оценки или дообучения агентов.
Deepmind

✔️ Марка Цукерберг и ко вместе с Booz Allen Hamilton запустили Llama на МКС для помощи астронавтам.

Компании представили проект «Space Llama» — открытую ИИ-модель Llama 3.2, которая отправилась на Международную космическую станцию. Технология должна помочь экипажу в исследованиях на орбите, сократив зависимость от бумажных инструкций и связи с Землей.

Система работает на базе компьютера Spaceborne Computer-2 от Hewlett Packard Enterprise и GPU Nvidia. Это уже второй шаг Booz Allen Hamilton в области космического ИИ: в августе компания развернула первую языковую модель на МКС. Новый стек технологий обещает ускорить реакцию на нештатные ситуации и снизить затраты на вычисления.
cnbc.com

✔️ Perplexity планирует релиз браузера Comet в мае.

CEO Perplexity Аравинд Шринивас в подкасте TBPN раскрыл планы компании: их новый браузер Comet, запуск которого запланирован на май, будет отслеживать действия пользователей за пределами приложения. Цель — собрать данные о покупках, посещаемых сайтах, отелях и ресторанах, чтобы формировать детальные профили для таргетированной рекламы. По словам Шриниваса, это повысит релевантность объявлений, а пользователи «не будут против».

Comet уже столкнулся с задержками, но команда уверена в сроках. Параллельно Perplexity укрепляет позиции в мобильном сегменте: приложение предустановят на смартфоны Motorola Razr, а с Samsung ведутся переговоры.
techcrunch.com

✔️ Криптогигант Paradigm вложил 50млн. долл. в ИИ−стартап NousResearch.

Сделка оценила проект NousResearch в 1 млрд. долларов. Nous разрабатывает открытые ИИ-модели, конкурирующие с решениями OpenAI, но с упором на распределенные вычисления: вместо дата-центров стартап использует мощности обычных пользователей через блокчейн Solana.

Основатели Nous — исследователи ИИ, ранее выпустившие популярные в opensource-сообществе модели Hermes. Их новый подход позволяет обучать нейросети на «простаивающих» GPU, стимулируя участников криптовалютными вознаграждениями.
fortune.com

✔️ Ziff Davis подала в суд на OpenAI из-за незаконного использования контента для обучения ИИ.

Крупный медиа-холдинг Ziff Davis подал иск против OpenAI в федеральный суд Делавэра, обвинив компанию в использовании своих статей для обучения нейросетей без разрешения. По данным иска, OpenAI копировала материалы PCMag, Mashable и IGN — активов Ziff Davis, которые ежегодно публикуют около 2 млн статей. Компания требует компенсацию в сотни миллионов долларов, утверждая, что действия OpenAI нарушают авторские права и вводят пользователей в заблуждение: ChatGPT якобы приписывает Ziff Davis информацию, которую та не публиковала.

OpenAI настаивает, что обучение моделей на публичных данных попадает под «добросовестное использование», критичное для инноваций. Однако Ziff Davis заявляет, что после блокировки GPTBot в мае и августе 2024 года компания продолжила сбор контента.
news.bloomberglaw.com

@ai_machinelearning_big_data

#news #ai #ml

_______
Источник | #ai_machinelearning_big_data
А OpenAI идёт в консьюмерские продукты и поиск, будет теперь больше информации показать о товарах найденных и всякие автокомплиты, как в Гугле, в чате показывать. https://techcrunch.com/2025/04/28/openai-upgrades-chatgpt-search-with-shopping-features/

_______
Источник | #ai_product
@F_S_C_P

-------
Поддержи канал подпиской
-------
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini 2.5 Pro прошла Pokemon Blue

Всего пару месяцев назад Claude посадили играть в покемонов, где модель успешно застряла на одном моменте. Cейчас у Gemini 2.5 Pro вышло пройти игру полностью.

Достижение заметное, но не означает превосходство одной модели над другой — модели запускали в разных средах с разным доступом к инфе. К примеру, помимо картинки, Gemini получала некоторые данные напрямую из движка игры и имела несколько подсказок по прохождению в промпте, без этого у модели играть не выходит. Да и в тренировочных данных ллм было полно инфы и советов по прохождению, с новой игрой было бы сложнее.

Вообще хотелось бы, чтобы это оформили в виде бенчмарка, но тут важно чтобы не пришли юристы Нинтендо и не засудили всех причастных. А как такое появится, там и до спидранов недалеко.

@ai_newz

_______
Источник | #ai_newz
@F_S_C_P

-------
Поддержи канал подпиской
-------
🖥 ChatGPT обогнал Википедию по количеству пользователей.

Раньше Википедия была главным инструментом для тех, кто хотел получить знания.
Всего за несколько лет ИИ стал главным средством для обучения.

И пути назад уже нет.

https://www.reddit.com/r/wikipedia/comments/1kn8cms/oc_chatgpt_now_has_more_monthly_users_than/?rdt=59790

#chatgpt #ai

_______
Источник | #ai_machinelearning_big_data
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney v7
👍1🤯1🤮1
СЕО бояться отстать из-за ИИ⚖️

IBM запилили опрос руководителей, которые потратили свои денюшки в внедрение ИИ💵в своих организациях. 64% признались, что проинвестировали в ИИ только из-за страха выглядеть отстающими. Т.е. вложение ради вложения. Основная причина скорее всего — непонимание вообще, что это такое, и уж тем более про то, зачем это нужно.

ИИ действительно полезный инструмент, а где-то может стать киллер-фичей или Х-фактором⚔️ Но осознанность должна быть, хотя бы с точки зрения менеджмента. Это нормально для менеджеров применять технологии/инструменты или управлять вещами, в которых он не эксперт, но как же бизнес-велью. В общем и целом тема хайп, пользу может принести, но всегда нужно погружаться в вопрос. или найти человека, который сможет объяснить тему, как будто разговаривает с 5-летним ребенком🐶))

Кстати, по опросу только 25% проектов с #ИИ дали ожидаемую выгоду, 48% пока не получило никакой выгоды. Такая история

#AI #business

_______
Источник | #bessec
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney v7
🤮3😁1
Что показали на Google I/O?

Только что завершилась презентация Google, и это, похоже, крупнейшая презентация 2025-го по количеству и качеству новых фишек и инструментов – Google явно учится на прошлогоднем опыте.

Сначала самое жаркое:

- Veo 3 — Veo 2 ещё не успели сместить с пьедестала, а Google уже дропнули 3-ю версию SOTA видеогенератора. Лучше во всём, и теперь с нативной генерацией аудио, включая диалоги с липсинком! Доступна уже сегодня.
- Imagen 4 — опять же, лучше во всём своего предшественника. Остаётся проверить, вдруг это новая SOTA? Уже в проде.
- Agent mode в Gemini — сможет искать квартиру по заданным критериям, используя MCP для доступа к листингам и даже назначать встречи. "скоро"
- AI Mode в Google Поиск — В AI Mode интегрируются агентские возможности Project Mariner: поиск сможет выполнять задачи от имени пользователя (находить билеты, бронировать столики, записываться на услуги). Более того, агент сможет отслеживать цены на товары, уведомлять о снижении и, с разрешения пользователя, совершать покупку через Google Pay. Сам AI мод уже должен быть доступен, но не весь его функционал. Летом обещают завезти туда и Deep Search.
- Примерка в Поиске — теперь можно виртуально примерять одежду на себе с помощью специально обученного ИИ-генератора изображений (на базе Imagen). Доступно в Labs с сегодняшнего дня.
- Риалтайм перевод в Google Meet — сохраняет тон, темп и даже интонацию говорящего. Доступен для подписчиков на английском и испанском, больше языков — "in the next few weeks".
- Обновлённый Gemini Live — теперь включает возможности Project Astra (камера и демонстрация экрана). Скоро сможет подключаться к приложениям Calendar, Maps, Keep и Tasks. Юзкейсов со стримингом с камеры и экрана масса. Доступен в Gemini App.
- Personal Context в Gemini — теперь можно дать разрешение на использование данных из вашего аккаунта Google (например, Gmail, Drive, Docs, Search) для персонализации, хотя пока что готов только доступ к истории поиска. В целом, нейронке теперь будет известно о вас всё. Как-то крипово даже. Обещают "скоро".

Для технарей:

- Jules — агент для кода от Google, прямая ответка на релиз Codex от OpenAI. В раннем доступе гоняли с декабря, а теперь доступен всем на jules.google.
- Gemini Diffusion — экспериментальная диффузионная модель для текста, в 5 раз быстрее Gemini 2.0 Flash Lite (самой быстрой модели Google), при сохранении качества, особенно в коде и математике. 1479 токенов в секунду это не шутка.
- Поддержка MCP в Gemini SDK — Gemini SDK теперь совместим с инструментами Model Context Protocol (MCP от Anthropic), что позволяет агентам получать доступ к другим сервисам. (Видимо, побочный эффект Agent mode).
- Обновлённый Gemini 2.5 Flash — Улучшен по ключевым бенчмаркам (рассуждения, код, длинный контекст) и на 22% эффективнее по использованию токенов, что особенно актуально учитывая разговорчивость 2.5 Flash. Можно заценить в ai.studio и пр.
- API с нативной поддержкой звука — превью text-to-speech в Gemini API поддерживает 2 голоса, более 24 языков, может шептать. + Live API также получит превью 2.5 Flash с нативным аудиодиалогом. Уже доступно.
- Бюджеты на размышления (Thinking Budgets) в Gemini 2.5 Pro — функция для контроля соотношения затрат/задержки и качества ответа появится в 2.5 Pro в ближайшие недели, а в 2.5 Flash она уже месяц.

Mic drop...🎤

@ai_newz

_______
Источник | #ai_newz
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney v7
👍3🤮2🔥1🥱1
#aws #vanta #ai #azure

На этом моём скриншоте прекрасно всё.
Добро пожаловать в 2025 год.

Vanta, компания, которая за огромные деньги позволяет проходить аудит от SOC2 до PCIDSS, при помощи AI генерирует рекомендации с несуществующими ресурсами терраформ.

У меня всё.

_______
Источник | #makebreakreflect
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney v7
😁4👍1
🤖 Boston Dynamics показали, как их гуманоидный робот Atlas «видит» мир и взаимодействует с ним

В новом видео команда ИИ-инженеров показала, как устроена система восприятия Atlas — и это уже не просто «робот с камерами», а почти полноценный агент с чувством пространства и контекста.

🧠 Что умеет Atlas:

🔹 Понимает форму и назначение объектов в реальной среде
🔹 Объединяет 2D и 3D восприятие
🔹 Использует ключевые точки для ориентации в пространстве
🔹 Отслеживает позы объектов с учётом их движения и перекрытия
🔹 Сливает визуальные данные, кинематику и знания об объектах в одну систему
🔹 Имеет сверхточную калибровку для координации «глаз–рука»

Atlas может не просто находить предмет, но понимать, *что это*, *зачем оно нужно* и *как его лучше схватить*, даже если оно наполовину скрыто.

Команда инженеров работает над единой моделью, которая объединяет восприятие и управление. Это шаг от просто «пространственного ИИ» к настоящему физическому интеллекту.

Их робот выглядит на данный момент самым передовым, как вы считаете?

@ai_machinelearning_big_data

#Atlas #BostonDynamics #AI #Robotics #Перцепция #ИскусственныйИнтеллект

_______
Источник | #ai_machinelearning_big_data
🔥62🤮1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️«ИИ-компании должны платить налоги, чтобы смягчить удар по рынку труда»

CEO Anthropic Дарио Амодей считает, что такие компании, как его, могут в будущем облагаться специальным налогом — чтобы компенсировать массовую потерю рабочих мест.

Он предупреждает: уже через 1–5 лет ИИ способен вытеснить младший офисный персонал по всему миру.

Даже если Anthropic остановится, говорит Амодей, это ничего не изменит:

«Остальные продолжат. А если нет — нас обгонит Китай».

🚌 «Автобус уже мчится — остановить его нельзя. Но, возможно, мы ещё можем повернуть руль».

📌 Полное интервью: https://www.youtube.com/watch?v=NWxHOrn8-rs

#Anthropic #ai

_______
Источник | #ai_machinelearning_big_data
@F_S_C_P

-------
Поддержи канал подпиской
-------
😁5🤡4👍1🤔1🤮1
Помните как Claude 4 уведомлял власти если видел серьёзное правонарушение?

После выхода system card многие возмутились — ведь LLM всё ещё часто галлюцинируют и могут что-то не так понять, а потом разбирайся с органами. Но когда такой же промпт попробовали дать другим моделям, они, внезапно, тоже начали стучать регуляторам. Но это не замечали, потому что лишь Anthropic решили протестировать модель на такое.

Из этого всего сделали даже шуточный бенчмарк — Snitch Bench, который проверяет насколько часто модель будет пытаться уведомлять регуляторов, если увидит серьёзное правонарушение. Больше всех закрывает глаза на преступления o4-mini, а вот мимо последних Claude и Gemini 2.0 Flash уже не пройдёшь.

Бенч

@ai_newz

_______
Источник | #ai_newz
@F_S_C_P

-------
Поддержи канал подпиской
-------
😁52👍1😱1🤮1
https://t.iss.one/ai_product/1314
О, Мэри Микер (легендарная аналитик и инвесторша, которая пишет отчеты о трендах про интернет), написала теперь полностью отчет про AI. 340 страниц, но текста мало, в основном графики.
https://www.bondcap.com/reports/tai

Вот основное, что пишет:
- Темпы изменений действительно ускорились. Почти все ключевые-метрики ИИ (пользователи, запросы, модели, вложения) растут кратно быстрее, чем аналогичные показатели раннего интернета.

- Использование + затраты растут одновременно и беспрецедентно. Сотни миллионов пользователей-человек и триллионы токенов в месяц подстёгивают гигантские капитальные затраты; только «большая шестёрка» компаний США вложила $212 млрд в 2024 г.

- Экономика вычислений разворачивается: дорогая тренировка ↔️ дёшевый инференс. Стоимость обучения моделей продолжает расти, тогда как цена вывода на токен падает, выравнивая качество разных моделей и стимулируя массовую разработку.

- Монетизация под давлением: открытый код + Китай → новая конкуренция. Волна open-source-моделей и стремительный подъём китайских платформ повышают планку предложений и сокращают «ренту» за проприетарность.

- ИИ выходит в физический мир. Автономные автомобили, дроны, «умные» фермы, оборонные системы и добыча полезных ископаемых показывают, что интеллект становится встроенной функцией вещей, а не только софта.

- Следующий миллиард интернет-пользователей придёт сразу в AI-нативный интерфейс. Мобильные приложения ChatGPT/DeepSeek и глобальное покрытие Starlink открывают доступ к «разговорному» интернету там, где классические веб-сервисы даже не прижились.

- Работа трансформируется быстро и на практие. Компании внедряют агенты, копилоты и вертикальные решения (Duolingo, Shopify, Kaiser Permanente, JP Morgan), фиксируя двух-значный рост продуктивности и перенося AI-критерии в найм и KPI.

- Гонка США-Китай превращает ИИ в элемент геостратегии. Обе державы рассматривают технологическое лидерство как рычаг влияния.

- Польза колоссальна, но риски растут синхронно. От лечения болезней и роста мирового ВВП до кибероружия и предвзятых решений — двойственность ИИ требует новых рамок регулирования и культуры «safety-by-design».

Общий тон - осторожный оптимизм. Суммарное давление конкуренции, капитала и открытых знаний делает вероятность негативных сценариев неизбежной, но авторы верят, что взаимное сдерживание и быстрое распространение лучших практик сыграют роль «ядерного сдерживания» для ИИ-рисков. «Джина уже не загнать обратно в бутылку — значит, нужно научиться жить с ним».

_______
Источник | #ai_product
@F_S_C_P

-------
Поддержи канал подпиской
-------
👍5🔥2🤮1
Ну из интересных фактов:
- Рост поискового трафика: ChatGPT вышел на 365 млрд запросов в год всего за 2 года — Google потребовалось 11 лет для той же отметки.
- Молниеносная глобализация: уже к третьему году 90 % мобильных пользователей ChatGPT находятся за пределами Северной Америки; интернету понадобилось 23 года, чтобы достичь такого же рубежа.
- Взрывной рост аудитории: еженедельная база ChatGPT превысила 800 млн человек за 17 месяцев — восьмикратный прирост с момента запуска.
- Взрыв данных для обучения: объёмы обучающих корпусов языковых моделей росли в среднем на 260 % в год последние 15 лет.
- Скачок вычислений: за тот же период затраты на тренировочные вычисления увеличивались в среднем на 360 % ежегодно.
- «Халявные» вычисления за счёт алгоритмов: улучшения алгоритмов дали эквивалент +200 % «бесплатной» вычислительной мощности в год.
- Гонка суперкомпьютеров: производительность топ-AI-кластеров росла на 150 % ежегодно с 2019 года.
- Тонна новых моделей: число крупных моделей (>10²³ FLOP) прибавляло 167 % в год — с единиц до сотни за семь лет.
- AI-перегрев CapEx: «большая шестёрка» США нарастила капитальные траты на 63 % за год, до 212 млрд $.
- Армия разработчиков NVIDIA: сообщество выросло до 6 млн (+6 раз за семь лет), показывая, как быстро «железо» превращается в экосистему.
- AI уже похож на человек: в Turing-тесте 73 % участников приняли ответы GPT-4.5 за человеческие.
- Голосовой бум ElevenLabs: всего за два года пользователи сгенерировали «1000 лет» аудио; решения компании применяются более чем в 60 % Fortune 500.
- Медтех-экспресс: число одобренных FDA AI-устройств подскочило до 223 к 2023 году против единиц десять лет назад.
- AI ускоряет фарму: платформы Insilico и Cradle сокращают путь до доклинических испытаний на 30-80 %, переводя месяцы и годы в недели.
- Рынок труда переворачивается: вакансии с AI-навыками в США +448 % с 2018 г., тогда как обычные IT-позиции -9 %.
- Беспилотные такси в городе: Waymo заняло 27 % выручки ride-hailing в Сан-Франциско всего за 20 месяцев.
- Роботы-«мастерская мира»: Китай каждый год ставит больше промышленных роботов, чем США и остальной мир вместе взятые.
- Облачная подпитка AI: доходы ИТ-гигантов росли в среднем на 37 % ежегодно десятилетие подряд, финансируя новый виток ИИ-инфраструктуры.
- Фотореализм за два года: Midjourney от грубой графики v1 (февраль 2022) до почти фотокачества v7 (апрель 2025) всего за 26 месяцев.
- Патентное цунами: после выхода ChatGPT в 2022 г. число «компьютерных» патентов в США выросло на 6000 за один год - рекорд за все шесть десятилетий статистики.

_______
Источник | #ai_product
@F_S_C_P

-------
Поддержи канал подпиской
-------
👍4🔥4🤮2
⚡️ Отчет OpenAI по пресечению вредоносного использования ИИ

В свежем июньском отчете, Open AI описала самые крупные кейсы, когда злоумышленники использовали модели ИИ для создания фейковых резюме, манипуляций в соцсетях, кибератак и мошенничества.

Для анализа угроз исследователи применяют комбинацию ИИ и экспертные команды. ИИ помогает выявлять шаблоны текста злоумышленников и координировать расследование с платформами. Архитектура таких систем включает модели для анализа данных, детекторы аномалий и инструменты для синхронизации с правоохранительными органами.

Обучались такие специализированные модели, помимо общедоступных данных, еще на примерах социальной инженерии и профилях киберугроз. Дополнительно, они получили методы обнаружения фейковых профилей, перевода текстов и анализа сетевого трафика.

▶️Всего в отчете приведено 10 случаев обнаружения:

Deceptive Employment Scheme: IT Workers.

🟠Угроза использования ИИ для создания поддельных резюме и получения удалённых IT-вакансий, связанная с подозрением на участников из КНДР.
🟢Были заблокированы аккаунты ChatGPT, использовавшие модели для автоматической генерации документов, а также установлены связи с операторами в Африке и Северной Америке.

Covert IO: Operation “Sneer Review”

🟠Координированная генерация комментариев в соцсетях для продвижения китайских интересов, включая критику Тайваня и Пакистана.
🟢Обнаружены и заблокированы аккаунты, создававшие иллюзию органической активности через множественные языки и платформы.

Covert IO: Operation “High Five”

🟠Массовые комментарии в соцсетях на политические темы в Филиппинах, связанные с маркетинговой компанией Comm&Sense Inc.
🟢Были заблокированы аккаунты, создававшие фейковые TikTok-каналы для популяризации президента Маркоса, и выявлена схема с использованием подставных профилей.

Social engineering meets IO: Operation “VAGue Focus”

🟠Социальная инженерия через поддельные СМИ (Focus Lens News, VAG Group) для сбора информации о политике США и Европы.
🟢Заблокированы аккаунты, использовавшие ИИ для перевода и создания фейковых материалов, а также выявлены признаки связи с китайскими структурами.

Covert IO: Operation “Helgoland Bite”

🟠Пропаганда партии AfD в Германии через поддельные Telegram-каналы и сайт Pravda DE.
🟢Обнаружены и заблокированы аккаунты, распространявшие контент, а также установлены связи с сетью Portal Kombat, известной по предыдущим расследованиям.

Cyber Operation: “ScopeCreep”

🟠Вредоносное ПО, распространяемое через поддельный игровой инструмент Crosshair-X, с функциями шпионажа и обхода антивирусов.
🟢Были заблокированы аккаунты, использовавшие ИИ для отладки кода, а также удалены вредоносные репозитории и установлены методы обнаружения.

Cyber Operations: Vixen and Keyhole Panda

🟠Кибератаки и сбор информации о технологиях США через ИИ, связанные с группами APT5 и APT15.
🟢Заблокированы аккаунты, использовавшие модели для создания скриптов и анализа инфраструктуры, а также переданы индикаторы партнерам для усиления защиты.

Covert IO: Operation “Uncle Spam”

🟠Поляризующий контент в США через фейковые профили с ИИ-генерируемыми изображениями и анализом данных.
🟢Заблокированы аккаунты, использовавшие ИИ для создания логотипов и сбора информации из соцсетей, также проведена оцененка степени влияния.

Recidivist Influence Activity: STORM-2035

🟠Пропаганда в поддержку Ирана и других стран через фейковые аккаунты в X, касающаяся миграции и независимости регионов.
🟢Были заблокированы аккаунты, распространявшие контент на испанском и английском, а также отмечены повторные попытки операторов вернуться к активности.

Scam: Operation “Wrong Number”

🟠Мошенничество с предложениями высокой зарплаты за лайки и инвестиции, связанное с Камбоджей.
🟢Заблокированы аккаунты, использовавшие ИИ для перевода сообщений, а также выявлена схема с этапами «The ping», «The zing» и «The sting» для обмана жертв.


🔜 Почитать полный отчет можно на сейте OpenAI

@ai_machinelearning_big_data

#news #ai #ml

_______
Источник | #ai_machinelearning_big_data
👍3🤔1🤡1
#AI #Инвестиции #Тренды #Геология

Стартап Earth AI научился находить новые месторождения различных полезных ископаемых с помощью смешанной Big Data из архивов, спутниковых снимков и иных источников с точностью не меньшей, чем у "традиционных" геологов - но по цене на три порядка меньшей.

Как это примерно работает, нетрудно понять. Ещё когда не было AI, но была разнородная информация, - алгоритмы уже научились выявлять потенциальных покупателей: и знаменитый скандал с рекламой товаров для беременных. которая пришла несовершеннолетней девушке (а родители не знали об) со стороны сети Target уже тогда показал возможности железяк.

Но теперь AI, полагаю, сможет находить не только месторождения, но и наверняка - клады, схроны, подпольные производства, катраны и многое ещё из того разряда, что раньше составляло невидимую тень человечества и считалось тайным, но нет.

Примечателен также скачок в производительности труда, нисколько не меньший, чем в знаменитом примере про иголки из Адама Смита - тысячи раз.

А ещё интересно, что теперь геологическую разведку могут вести сопредельные страны, например. И не только из любопытства, типа что было бы, если бы это было наше. Но и вполне прагматично, памятуя о горизонтальном бурении и прочих хаках дружественной добычи чужого. Или - например - о подписании серьёзных договоров о совместной разработке чего-то, что при асимметрии информации локалы не слишком точно оценили.

Надо отметить и тот факт, что скоро уже вряд ли удастся продавать хомякам на фондовом рынке "резервы" под видом "запасов", как это умудрялись делать, выходя на IPO с компаниями, имеющими только лицензии на борту, и никакой добычи, многие ловкачи ещё лет 15 тому (и не только в России, но и в Африке или Латинской Америке).

Мы живём в эпоху чудеснейших перемен. Сколько бы не ругали AIшечку, а он делает мир лучше, подсвечивая уже те впадинки, которые и не предполагалось, что.
___________________________

UPD. Полно хайпу конечно вокруг "это всё развод, ничего не проверено, ещё посмотрим что там на самом деле".
Посмотрим.

Просто ведь история с Target - не единственная. Алгоритмы нашли же одного крота (полицейского под прикрытием, внедрённого в наркобанду) и прислали ему на конспиративную, явочную локацию что-то сильно компрометирующее типа каталога униформы или оружия. После чего гикам пришлось знакомиться с агентами ФБР. Алгоритмы нашли уже десятки тысяч не зарегистрированных бассейнов во Франции (там на них отдельный налог). Ну и т.д.

Прогресс не остановить, а доктора геологии, которые раньше были на фронтире, конечно будут злиться. Пока не перейдут в стадию уныния.... Геология, которая раньше казалась невозможной без полевых исследований, скоро - как и военное дело (ракеты, FPV-дроны) - станет "удалённой" работой. Современный воин, как скоро и геолог - это образованный человек, имеющий определённые навыки, связанные с управлением умной (или очень умной) машиной....

UPD2. Кстати, об удалённой работе. Тут недавно одну антрополога назначили. Антропос изучать и не только. И весьма удалённо, да-с.

/// использован видеоматериал блога postnauka

_______
Источник | #censum
2
Как-то мы уже заходили в тему зрения беспилотников, но там был разговор вокруг общих моментов. А тут уже более точечный заход на лидары. Не глубоко, но для самых маленьких сойдёт, чтобы понять, а что, а как, зачем и почему.

https://www.youtube.com/watch?v=p3eiLQ5diAY

_______
Источник | #linkmeup_podcast
@F_S_C_P

-------
Поддержи канал подпиской
-------
👎2😨1
Вышел Grok 4

SOTA на нескольких бенчах — выбивает идеальный результат на AIME25. Результаты на ARC-AGI-2 почти в два раза выше чем у прошлого лидера — Claude 4 Opus, 15.9% против 8,6%.

Но больше всего xAI гордятся Humanity's Last Exam, которому посвятили почти половину презентации. Результаты и правда хорошие — с максимальным компьютом и включённым тулюзом модель выдаёт 44,4% (50.7% на текстовой части). Без тулюза всё ещё SOTA, но с меньшим отрывом — модель выбивает 25.4%, против 21.6% у Gemini 2.5 Pro.

Базовая модель та же самая что у Grok 3 (Grok 4 изначально хотели запустить как Grok 3.5, но решили потренировать подольше). Основное отличие — на тренировку ризонингу потрачено в 10x больше компьюта. Теперь компьют на RL примерно равен компьюту на претрейн, с чем я вас и поздравляю 🥳. Что важно — модель теперь нативно учат тулюзу во время RL, как и o3 с o4-mini.

С мультимодальностью всё не очень — бенчмарки показали почти исключительно текстовые, а на HLE видна заметная просадка. Илон это обещает поправить уже со следующей версией базовой модели. А вот контекст удвоили до 256k.

Запустили и API, цена за токен такая же как у Grok 3 и Claude Sonnet, но модель очень разговорчивая — на реальных задачах она стоит почти как Claude Opus 4. Grok 4 Mini не состоялся, а жаль — Grok 3 Mini крайне хорошая модель за свою цену, хотелось бы апдейта.

А тем временем компьют xAI расширяется с неслыханными темпами — Илон говорит что они собираются начать тренировку своей видеомодели на 100k+ GB200 через 3-4 недели. Уже есть деньги и на следующее расширение Colossus — в конце прошлого месяца компания привлекла 10 миллиардов долларов. Половину от инвесторов, а половину — в долг.

_______
Источник | #ai_newz
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney v7
3
Мы живем в абсолютно проклятое время 😁

@ai_newz

_______
Источник | #ai_newz
@F_S_C_P

▪️Генерируй картинки в боте:
Flux + MidJourney v7
😁8👍2