Технозаметки Малышева

ChatGPT Pulse

Теперь ChatGPT может проактивно ресёрчить топики которые считает важными и выдавать репорт каждое утро. Темы выбираются на основе недавних чатов, памяти, подключенных приложений и пожеланий пользователей. Уже доступно подписчикам Pro уровня в новой версии мобильного приложения.

@ai_newz

🔥8👍3

2.34K views18:40

Технозаметки Малышева

2:51

This media is not supported in your browser

VIEW IN TELEGRAM

Рейстлину

в 2001м году такая вот песня сложилась в армии по следам прочтения серии книг Dragonlance

Теперь можно озвучить.

#Suno
———
@tsingular

🔥29❤3

1.85K viewsedited 19:48

Технозаметки Малышева

2:45

This media is not supported in your browser

VIEW IN TELEGRAM

А еще для Премьер подписки Суно выпустил студию-редактор похожий на Fl-Studio

Studio

#Suno #Studio
———
@tsingular

🔥9❤2❤‍🔥1

1.77K viewsedited 21:05

Технозаметки Малышева

📊 OpenAI выпустили GDPval — бенчмарк для измерения реальной экономической ценности AI-моделей

Забудьте про академические тесты типа MMLU. OpenAI представили метрику, которая проверяет модели на том, за что платят деньги в реальном бизнесе.

Техническая архитектура:
- 1320 специализированных задач (220 в открытом доступе)
- 44 профессии из 9 ведущих отраслей экономики США
- Задачи создавали профессионалы с опытом 14+ лет в своих отраслях

Слепое сравнение: эксперты не знают, где работа AI, а где человека

Что внутри задач:
От юридических брифов и инженерных чертежей до планов ухода за пациентами и презентаций в PowerPoint.

Т.е. это не просто текстовые промпты — каждая задача включает референсные файлы, контекст и требует создания реальных рабочих документов.

Результаты тестирования:
- Claude Opus 4.1 — лидер с 47.6% паритета с экспертами (особенно силён в эстетике документов)
- GPT-5 high — 38.8%, хорошо показывает себя в точности и доменных знаниях

Прогресс OpenAI за год: от GPT-4o (12.4%) до GPT-5 (38.8%) — рост в 3+ раза
Скорость: модели выполняют задачи в 100x быстрее и 100x дешевле экспертов

Ограничения v1 теста:
- Пока только one-shot задачи без итераций и обратной связи.
- В реальности работа требует контекста, правок и неоднозначных решений — это в планах на следующие версии.

Датасеты и полная информация доступны тут: evals.openai.com и HF

Т.е. AI уже сейчас справляется с хорошо структурированными рутинными задачами на уровне профессионалов.
Дальше уже будет развитие доменной специфики и покрытие многоходовых сценариев.

#GDPval #OpenAI #бенчмарки
———
@tsingular

🔥8⚡3✍3👌1

1.61K views04:43

Технозаметки Малышева

Японская партия "Путь к Возрождению" назначила ИИ своим лидером

Партия Path to Rebirth стала первой в Японии, где ИИ используется для принятия гос решений.

Основатель партии Синдзи Исимару запустил проект в январе 2024-го. ИИ будет направлять внутренние решения пока в режиме консультанта.

Официально зарегистрированным лидером остается Окумура.

Детали модели, метрики оценки и меры безопасности партия пока не раскрывает. Неизвестно, какие данные использовались для обучения и как предотвращают манипулирование системой.

Партия позиционирует ИИ как способ представить "упущенные голоса" избирателей.

Что ж, +1 страна в списке "под ИИ управлением" официально.

Кстати, ИИ агенты - представители избирателей, - следующий шаг, похоже.

#Japan #госуправление
———
@tsingular

5🔥4🤩2

3.44K views07:30

Технозаметки Малышева

2:14

Media is too big

VIEW IN TELEGRAM

Кстати у Suno ещё есть режим радио

https://suno.com/explore

Т.е. они теперь полностью покрывают весь процесс, от создания на уровне сэмплов и даже MIDI, до публикации и стриминга.

Ещё видео и авторские добавить и будем потом ютубы и спотифай вспоминать с ностальгией.

#Suno
———
@tsingular

🔥5❤1

1.86K views10:17

Технозаметки Малышева

3:37

This media is not supported in your browser

VIEW IN TELEGRAM

Пятничный деплой

вайбкодеры в чате? :)

#Suno
———
@tsingular

🔥17👍7❤1

2.68K views15:05

Технозаметки Малышева

Встречаются как-то два директора по маркетингу и один другого спрашивает:
— Как использовать ИИ для маркетинга?
— Могу рассказать...
— Рассказать и я могу, как использовать?

source

#юмор
------
@tsingular

😁36🔥7❤1👏1

5.94K viewsedited 04:55

Технозаметки Малышева

Microsoft Photos получил авто-категоризацию на базе ИИ

Windows 11 тестирует новую функцию в приложении Фото - автоматическое распределение изображений по категориям с помощью ИИ.

- умная сортировка по категориям
- работает для всех языков
- пока только 4 категории - скриншоты, рецепты, идентификационные документы и заметки

Функция доступна участникам программы Windows Insider начиная с версии 2025.11090.25001.0 и выше.

Работает локально на NPU (если он у вас есть).

#Microsoft #Windows #Photos
———
@tsingular

👍5

1.35K views05:18

Технозаметки Малышева

🤖 Google запускает 5-дневный интенсив по ИИ-агентам

После успеха GenAI курса (420К+ участников) Google поднимает планку и теперь выпускает курс только по агентам. От архитектур до продакшена за 5 дней.

Программа:
День 1: Агентные архитектуры vs традиционные LLM приложения
День 2: MCP (Model Context Protocol) — стандарт для взаимодействия с инструментами
День 3: Контекст-инжиниринг — кратко/долгосрочная память для мультитурновых задач
День 4: Observability, логирование, метрики — как строить надёжные системы
День 5: Agent2Agent (A2A) Protocol — мульти-агентные системы в продакшене

Формат обучения:
📚 Ежедневные задания (1-2 часа) — whitepapers + codelabs + подкасты от NotebookLM
💬 Discord канал для обсуждений с экспертами Google
🎥 Лайвстримы 45-60 мин с авторами курса + AMA сессии
🏆 Capstone проект на ADK (Agent Development Kit) — реальное портфолио + призы

Требования:
Python + базовые AI концепты + Google AI Studio (доступен в ограниченных регионах) + Kaggle аккаунт с верифицированным телефоном.

Бесплатно, записи будут доступны после курса. Топ-10 capstone проектов получат swag + продвижение в соцсетях Google.

Записываемся. За 5 дней влетаем в агентостроение.

#Google #Kaggle #обучение
———
@tsingular

✍7❤4👍4⚡3

2.72K views05:27

Технозаметки Малышева

Вьетнам делает ИИ основой экономики

На NVIDIA AI Day в Хошимине заместитель директора Национального центра инноваций Вьетнама заявил о планах поставить искусственный интеллект в центр экономической стратегии.

Вьетнам уже показывает серьезную динамику: 39% рост внедрения ИИ год к году, 18% компаний используют технологии.

К 2040 году ИИ может добавить 120-130 миллиардов долларов к экономике страны. Страна развивает проект ViGen - крупнейшую базу данных на вьетнамском языке для обучения ИИ.

Интересно, что параллельно идут переговоры с NVIDIA о создании суверенного ИИ, учитывая американские ограничения на экспорт чипов.

Все метят в чемпионы, но хватит ли на всех GPU?!

#Vietnam #NVIDIA #SovereignAI
------
@tsingular

✍3⚡2

1.81K viewsedited 05:39

Технозаметки Малышева

1:41

Media is too big

VIEW IN TELEGRAM

Gemini Robotics 1.5 выводит ИИ-агентов в физический мир

Google DeepMind запустили Gemini Robotics 1.5 - платформу для создания роботов с возможностями детальных рассуждений и агентским функционалом.

Самое главное, - агентное поведение.

Роботы теперь могут решать сложные многоэтапные задачи, планировать действия и адаптироваться к новым ситуациям.

Платформа поддерживает перенос навыков между разными роботами. Научили одного - остальные тоже умеют.

В комплекте SDK для разработчиков, который позволяет настраивать поведение под конкретные задачи.

Ну что, как и было предсказано, - 2025й год воплощённого ИИ.
Мультиагенты уже загружаются в гуманоидов.

Хорошая новость, - это все opensource, - можно настроить под себя.

#Gemini #роботы #DeepMind
———
@tsingular

⚡4🔥3👾3💯2

1.55K views05:55

Технозаметки Малышева

Forwarded from Neural Kovalskii

Circuit Tracing от Anthropic: как мы в R&D by red_mad_robot решили заглянуть внутрь LLM при использовании в RAG-пайплайнах

Ищем галлюцинации под микроскопом!

29 мая Anthropic выложили в open-source свои инструменты Circuit Tracing методологию механической интерпретируемости, которую мы в R&D подразделении red_mad_robot первыми применили для решения практической задачи детекции галлюцинаций в RAG-системах!

В начале 2025 года, когда я возглавил новое R&D направление, я поставил амбициозную задачу: не просто оценивать качество ответов LLM "снаружи", а заглянуть внутрь процесса генерации и понять, откуда берутся галлюцинации.

Почему именно RAG-пайплайны и Circuit Tracing?

Проблема была очевидна: RAG-системы часто смешивают информацию из контекста с "внутренними знаниями" модели, создавая правдоподобные, но неточные ответы
Существующие методы детекции работают post-factum, а нам нужно было понять механизм принятия решений в реальном времени

Circuit Tracing от Anthropic давал именно это возможность построить атрибуционные графы и проследить, как токены входного контекста влияют на финальный ответ модели

Конкретные результаты нашего исследования

85% точность детекции галлюцинаций вот что мы получили на тестовом датасете с нашей реализацией на базе Qwen2.5-7B.

Как отмечает наш исследователь Ирина Кошкина:
"Основная идея — измерение доли влияния от токенов входа, соответствующих контексту, среди всего влияния от всех активных токенов."

Наша метрика Groundedness включает:
- Контекстную долю влияния (Gctx)
- Replacement Score — качество признаков vs ошибок
- Completeness Score — полнота объяснения через атрибуционный граф

Технические вызовы и решения

Cross-Layer Transcoders (CLT) стали ключевым компонентом системы
Вместо анализа отдельных слоев мы научились отслеживать влияние признаков между несколькими архитектурными уровнями трансформера

Основные проблемы, которые пришлось решать:
1. Вычислительная сложность процедура анализа на порядки медленнее генерации
2. Зависимость от качества обученного транскодера
3. Токен-уровневое сопоставление, приводящее к ложным срабатываниям

Но результат того стоил мы получили рабочий инструмент для анализа внутренних процессов модели во время генерации ответов в RAG-системах

Отдельное спасибо отделу маркетинга red_mad_robot за подготовку детальной статьи оформления и валидации на Хабре

Отдельное спасибо Саше (@dealerAI) за экспертную валидацию нашей гипотезы на старте проекта

Когда предлагаешь исследовать "атрибуционные графы для детекции галлюцинаций в RAG", поддержка опытных друзей по цеху критически важна для получения ресурсов и мотивации команды

Полный технический разбор с кодом, формулами и результатами экспериментов доступен в нашей статье на Хабре закидываем в закладки и ставим +

Хабр

Circuit Tracing: как заглянуть в галлюцинации модели и найти там смысл

Всем привет! Меня зовут Ирина, я NLP-инженер в red_mad_robot, занимаюсь научными исследованиями интерпретируемости LLM и анализом механизмов внутренних вычислений моделей, чтобы применять полученные...

⚡6✍4❤3🔥1😁1

1.32K views10:07

Технозаметки Малышева

Morgan Stanley понижает рейтинг Adobe: ИИ может потопить 42-летнего софтверного гиганта

Morgan Stanley понизил рейтинг Adobe (ADBE) с overweight до equal-weight, понизив целевую цену с $520 до $450 (-15%). Акции компании уже показывают -20.6% с начала года.

Основная проблема
Аналитики видят критический провал между ИИ-инновациями Adobe и их реальной монетизацией:

Adobe заявляет о $5 млрд AI-influenced ARR и $250 млн от AI-first продуктов
При этом общий рост Digital Media ARR замедлился с 12.1% до 11.7% год к году

99% компаний из Fortune 100 используют ИИ в продуктах Adobe, но это не конвертируется в ускорение роста выручки

Конкурентное давление
Новые и существующие игроки активно захватывают рынок:

- ChatGPT: 700 млн пользователей в неделю, формирует новые ожидания у пользователей
- Canva: 220 млн активных пользователей функций "Magic", активно идет в enterprise-сегмент
- Figma: внедряет ИИ-агентов и code-aware workflows
- Big Tech (Google, Microsoft) также наступают на традиционные рынки Adobe
- Нейростартапы RunWay, Kling, Wan и десятки других так же отъедают аудиторию

Кейс Adobe демонстрирует классическую проблему: технологическое лидерство не гарантирует рыночное доминирование в эпоху ИИ-трансформации.

Даже софтверный гигант с 42х летней историей может столкнуться с угрозой от растущих конкурентов с эффективными ИИ-решениями.

#Adobe #MorganStanley
———
@tsingular

✍3⚡2👍2

1.77K views05:30

Технозаметки Малышева

Awesome Reviewers от стартапа BAZ, - библиотека промптов для code review

Разработчики из BAZ запустили AwesomeReviewers библиотеку, собрав сотни промптов для автоматизации проверки кода.

Проанализировали 1000+ open source проектов (Next.js, LangChain, FastAPI) и извлекли паттерны лучших ревьюеров.

- 470+ промптов для 15 языков программирования (фокус на Python, TypeScript, Go)
- Реальные кейсы: проверка конфигураций в Fastify, security warnings, performance tips
- Интеграция через MCP с Cursor, Claude Code, VS Code и др.

По сути, отличное дополнение MCP context7

Ну в целом, - полезно почитать для обучения. Промпты годные.

Лицензия Apache 2.0

Пробуем тут: awesomereviewers.com
Github

#CodeReview #BAZ #AwesomeReviewers #обучение
———
@tsingular

✍2👍2❤1

3.08K views06:03

Технозаметки Малышева

2:09

Media is too big

VIEW IN TELEGRAM

🔥 HunyuanImage 3.0 — прорыв в open-source генерации изображений

Tencent выпустили самую мощную открытую модель генерации изображений с 80 млрд параметров (13 млрд активных). Качество сопоставимо с топовыми закрытыми решениями.

Техническая революция:
- MoE архитектура с Transfusion - глубокая интеграция Diffusion + LLM в единую систему
- Массивный датасет: 5 млрд изображений + 6 трлн токенов текста
- Понимание контекста: промпты до 1000 слов с пониманием модели мира
- Точная генерация текста внутри изображений
- Основана на Hunyuan-A13B - мультимодальной LLM

Сейчас доступен только режим text-to-image. В планах: image-to-image, редактирование, мультитерновые диалоги.

Пробуем тут:
https://hunyuan.tencent.com/image/zh
GitHub
HuggingFace (полный вес 170 гигов)

#HunyuanImage #OpenSource #TextToImage
———
@tsingular

⚡3👍3❤2🔥1

5.92K views06:34

Технозаметки Малышева

Microsoft показала самый мощный ИИ-датацентр в мире

Новый датацентр в Висконсине потребляет столько энергии, сколько весь регион Новой Англии.

ЦОД управляет одним огромным кластером серверов NVIDIA GB200 и миллионами вычислительных ядер и эксабайтами хранилища, спроектированных для мощных ИИ нагрузок.

Каждая стойка содержит 72 графических процессора NVIDIA Blackwell, связанных вместе в одном домене NVLink, который обеспечивает 1,8 терабайта полосы пропускной способности между графическими процессорами и дает каждому GPU доступ к 14 терабайтам объединенной памяти.

Стойка работает как один гигантский ускоритель, способный обрабатывать 865 000 токенов в секунду.

ЦОД ИИ в Норвегии и Великобритании будут использовать аналогичные кластеры и использовать следующие версии чипа ИИ от NVIDIA (GB300), который предлагает еще больше объединенной памяти на стойку.

Проблема в том, что Microsoft пока потребляет 50% энергии из угольных и газовых источников. Выбросы углерода выросли на 23,4% с 2020 года именно из-за новых ИИ-датацентров.

Инвестиции составили 80 миллиардов долларов и покрывают более 25 новых регионов Azure.

Получается, чтобы учить ИИ модели беречь планету, мы продолжаем жечь уголь и газ.
Такая вот зелёная революция.

#Microsoft #Datacenter #Wisconsin
------
@tsingular

😁107🔥21❤6👍4

8.71K viewsedited 10:18

Технозаметки Малышева

Perplexity запустил Search API для разработчиков

Perplexity открыл доступ к своей поисковой инфраструктуре через API. Разработчики получили ту же глобальную базу из сотен миллиардов веб-страниц, что использует сам сервис.

Основные фишки:
- поиск на уровне фрагментов документов, а не целых страниц
- обновление индекса десятками тысяч запросов в секунду
- структурированные ответы, готовые для ИИ-приложений
- открытый фреймворк для тестирования search_evals

Компания утверждает, что обходит конкурентов по качеству и скорости при меньших затратах. API стартует от $5 в месяц.

Поисковые войны переходят в новую фазу - теперь каждый сможет встроить конкурента Google в свое приложение.

#Perplexity #Search #API
———
@tsingular

🔥9❤2🤩1

5.57K views12:02

Технозаметки Малышева

Prompt Packs от OpenAI Academy

OpenAI выпустила Prompt Packs - готовые наборы промптов для различных сценариев.

Полезно не только для обучения,- разные промпты в одинаковых задачах могут давать разницу результатов от 8.8% до 62.9% на одинаковой модели.

Парсим, загоняем в RAG по задачам,- профит :)

Ну или просто учимся сами.

#PromptPacks #OpenAI #промпты #обучение
------
@tsingular

✍5🔥5⚡2

4.09K views12:45

About

Blog

Apps

Platform