Одно из наиболее результативных направлений разработки моделей генеративного ИИ является проектирование специализированных моделей , ориентированных на какую либо единственную проблему, в отличии от "пути AGI". Ниже - о еще одной такой модели, нацеленной на медицинское прогнозирование.
Вот описание словами коллеги по цеху.
Delphi-2M - это новая генеративная модель ИИ, которая умеет строить персональные прогнозы здоровья по более чем тысяче заболеваний на десятки лет вперед.
Она уже протестирована в реальности: сначала обучена на сотнях тысяч записей из UK Biobank, а потом проверена на почти 2 миллионах датских пациентов.
Самое интересное, что точность при переносе между системами здравоохранения не упала - для горизонта в 10 лет она в среднем 0,76, а для 20 лет - 0,70. Особенно хорошо модель предсказывает долгосрочные риски вроде сердечно-сосудистых заболеваний и деменции.
Мне нравится, как элегантно устроен ее подход: каждый диагноз в истории пациента трактуется как «слово» в предложении. ИИ учит «грамматику болезней», то есть закономерности их появления. Как только в медкарте появляется новый факт, например, свежий анализ крови или другой диагноз, - прогноз обновляется.
Применений у этого много. С одной стороны, индивидуальные советы пациенту: на что обратить внимание, какие привычки стоит менять, чтобы снизить риски. С другой стороны, большие сценарные прогнозы для здравоохранения в целом.
Например, можно смоделировать вариант: что будет с продолжительностью жизни населения, если снизить заболеваемость раком или инфарктами. Плюс больницы и клиники получают инструмент для планирования ресурсов на годы вперед, а не «тушения пожаров» в моменте.
Разработчики заложили в модель этические механизмы. Ее можно обучать даже на синтетических данных, чтобы сохранить приватность, и она объяснима для врачей - видно, какие именно факторы легли в основу предсказания. То есть это не «черный ящик», а инструмент, с которым реально можно работать в клинике.
И если раньше ИИ в медицине воспринимался как что-то вспомогательное, вроде калькулятора для отдельных задач, то сейчас мы приближаемся к новой роли - полноценного партнера, который умеет собирать всю картину и смотреть далеко вперед.
Сергей Булаев AI 🤖 - об AI и не только
Вот описание словами коллеги по цеху.
Delphi-2M - это новая генеративная модель ИИ, которая умеет строить персональные прогнозы здоровья по более чем тысяче заболеваний на десятки лет вперед.
Она уже протестирована в реальности: сначала обучена на сотнях тысяч записей из UK Biobank, а потом проверена на почти 2 миллионах датских пациентов.
Самое интересное, что точность при переносе между системами здравоохранения не упала - для горизонта в 10 лет она в среднем 0,76, а для 20 лет - 0,70. Особенно хорошо модель предсказывает долгосрочные риски вроде сердечно-сосудистых заболеваний и деменции.
Мне нравится, как элегантно устроен ее подход: каждый диагноз в истории пациента трактуется как «слово» в предложении. ИИ учит «грамматику болезней», то есть закономерности их появления. Как только в медкарте появляется новый факт, например, свежий анализ крови или другой диагноз, - прогноз обновляется.
Применений у этого много. С одной стороны, индивидуальные советы пациенту: на что обратить внимание, какие привычки стоит менять, чтобы снизить риски. С другой стороны, большие сценарные прогнозы для здравоохранения в целом.
Например, можно смоделировать вариант: что будет с продолжительностью жизни населения, если снизить заболеваемость раком или инфарктами. Плюс больницы и клиники получают инструмент для планирования ресурсов на годы вперед, а не «тушения пожаров» в моменте.
Разработчики заложили в модель этические механизмы. Ее можно обучать даже на синтетических данных, чтобы сохранить приватность, и она объяснима для врачей - видно, какие именно факторы легли в основу предсказания. То есть это не «черный ящик», а инструмент, с которым реально можно работать в клинике.
И если раньше ИИ в медицине воспринимался как что-то вспомогательное, вроде калькулятора для отдельных задач, то сейчас мы приближаемся к новой роли - полноценного партнера, который умеет собирать всю картину и смотреть далеко вперед.
Сергей Булаев AI 🤖 - об AI и не только
Nature
Which diseases will you have in 20 years? This AI accurately predicts your risks
Nature - A modified large language model called Delphi-2M analyses a person’s medical records and lifestyle to provide risk estimates for more than 1,000 diseases.
👍6❤3👎1
https://zml.ai/
Весьма любопытный сервис. Кто реально попробует очень прошу прокомментировать. И , кстати , написан на необычном языке.
Весьма любопытный сервис. Кто реально попробует очень прошу прокомментировать. И , кстати , написан на необычном языке.
zml.ai
ZML.ai - High Performance AI Inference
High performance inference. Any model. Any hardware. No compromise.
👍7🔥1
Сегодня впечатляющий набор обновлений от Anthropic:
Anthropic выпустила Claude Sonnet 4.5, заявив лучший уровень по кодированию (SWE Bench), использованию компьютера и рассуждению/математике. Модель демонстрирует возможность распараллеливать и эффективно решать сложные многоэтапные задачи, сохранять концентрацию при работе над задачей более 30 часов.
Новая версия Claude Code получила чекпоинты (сохранение прогресса и мгновенный откат), официальное расширение для VS Code, обновленный SDK с поддержкой сабагентов и хуков и улучшенный терминал. Теперь можно безопасно (по мнению Anthropic) поручать ему более сложные и длительные задачи — от рефакторинга до автономной разработки с фоновыми процессами.
Anthropic добавила в Claude Developer Platform новые инструменты управления контекстом: context editing и memory tool. Они позволяют агентам автоматически очищать устаревшие данные и сохранять важную информацию во внешней памяти, чтобы работать дольше и точнее без потери прогресса.
Успели уже что-нибудь попробовать?
Anthropic выпустила Claude Sonnet 4.5, заявив лучший уровень по кодированию (SWE Bench), использованию компьютера и рассуждению/математике. Модель демонстрирует возможность распараллеливать и эффективно решать сложные многоэтапные задачи, сохранять концентрацию при работе над задачей более 30 часов.
Новая версия Claude Code получила чекпоинты (сохранение прогресса и мгновенный откат), официальное расширение для VS Code, обновленный SDK с поддержкой сабагентов и хуков и улучшенный терминал. Теперь можно безопасно (по мнению Anthropic) поручать ему более сложные и длительные задачи — от рефакторинга до автономной разработки с фоновыми процессами.
Anthropic добавила в Claude Developer Platform новые инструменты управления контекстом: context editing и memory tool. Они позволяют агентам автоматически очищать устаревшие данные и сохранять важную информацию во внешней памяти, чтобы работать дольше и точнее без потери прогресса.
Успели уже что-нибудь попробовать?
Anthropic
Introducing Claude Sonnet 4.5
Claude Sonnet 4.5 is the best coding model in the world, strongest model for building complex agents, and best model at using computers.
❤5💩3👍2
Media is too big
VIEW IN TELEGRAM
О сценарном подходе к созданию системных промптов для диалоговых агентов рассказывает Сергей Гевлич — основатель платформы для масштабирования компетенций «Джипититор».
Разбираем, почему сложно стабилизировать оркестровку больших (от 20К знаков) системных промптов и как создать стабильный системный промпт, моделирующий работу экспертов.
Запись лекции доступна здесь и на других площадках:
➡️ YouTube
➡️ ВКонтакте
➡️ ЯндексМузыка
Разбираем, почему сложно стабилизировать оркестровку больших (от 20К знаков) системных промптов и как создать стабильный системный промпт, моделирующий работу экспертов.
Запись лекции доступна здесь и на других площадках:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3👎1
Говорим о безопасности LLM с Сергеем Зыбневым — тимлидом-пентестером (белым хакером), специалистом по безопасности больших языковых моделей и создателем телеграм-канала "Похек".
Обсудим:
🔵 тестирование безопасности LLM и обнаружение уязвимостей;
🔵 использование ИИ для поиска багов и тестирования безопасности;
🔵 практический опыт работы с безопасностью ChatGPT и других LLM;
🔵 вайб-кодинг: как изменилась разработка с приходом LLM;
🔵 реальные кейсы из практики пентестинга;
🔵 будущее AI в кибербезопасности.
⏰ Запускаем трансляцию завтра, 7 октября, в 17:30!
Смотрите на YouTube, в ВК или прямо в этом канале!
Обсудим:
⏰ Запускаем трансляцию завтра, 7 октября, в 17:30!
Смотрите на YouTube, в ВК или прямо в этом канале!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8💩1
Вчера прошёл OpenAI DevDay 2025. Вектор развития понятен — строят экосистему. Снова как App Store, только с ИИ и с еще более высокими заборами по периметру.
Мы попробовали новый Agent Builder, визуальный конструктор для создания собственных AI-агентов без кода - для простых сценариев выглядит удобно. Обещают встроенные Datasets (контексты данных для обучения и теста) и Evals — инструменты для оценки и сравнения качества ответов. Скоро будет ясно насколько эффективно для сложных задач и захочет ли большой бизнес запирать себя внутри экосистемы OpenAI. Self-hosting и open source всё ещё явная ценность, но компании вроде n8n, Make.com, Zapier насторожились.
Apps SDK — способ делать полноценные приложения (вызывать свои API и показывать интерфейсы) прямо внутри ChatGPT, доступен в тестовом режиме разработчикам. На демо показали встроенные вызовы приложений Canva, Figma, Spotify. Трансформация в платформу с каталогом приложений и монетизацией для разработчиков.
Кто-нибудь уже опубликовал своего агента? Присылайте посмотреть!
Мы попробовали новый Agent Builder, визуальный конструктор для создания собственных AI-агентов без кода - для простых сценариев выглядит удобно. Обещают встроенные Datasets (контексты данных для обучения и теста) и Evals — инструменты для оценки и сравнения качества ответов. Скоро будет ясно насколько эффективно для сложных задач и захочет ли большой бизнес запирать себя внутри экосистемы OpenAI. Self-hosting и open source всё ещё явная ценность, но компании вроде n8n, Make.com, Zapier насторожились.
Apps SDK — способ делать полноценные приложения (вызывать свои API и показывать интерфейсы) прямо внутри ChatGPT, доступен в тестовом режиме разработчикам. На демо показали встроенные вызовы приложений Canva, Figma, Spotify. Трансформация в платформу с каталогом приложений и монетизацией для разработчиков.
Кто-нибудь уже опубликовал своего агента? Присылайте посмотреть!
Anthropic пару месяцев назад выпустили Claude Code Security Reviewer - бот-ревьюер, который ищет уязвимости в GitHub-репо и советует, что починить. Теперь Google DeepMind ответил своим CodeMender — агентом, который не советует, а сразу лезет чинить код сам: патчит, тестит, откатывает, и т.д. Пока что оба под присмотром людей. Гугл заявляет, что в процессе разработки за полгода CodeMender уже внёс 72 security-фикса в open source-проекты, включая те, где кода под 4,5 миллиона строк.
Google DeepMind
Introducing CodeMender: an AI agent for code security
CodeMender is a new AI-powered agent that improves code security automatically. It instantly patches new software vulnerabilities, and rewrites and secures existing code, eliminating entire...
👍2
Пост в блоге кодинг агента Cline о том, что открытые модели стремительно догоняют закрытые в области агентов редактирования кода. Новая модель GLM-4.6 ( от Zhipu / Z.ai одной из китайских компаний-«ИИ-тигров»)
показала 94.9% успеха в тестах Cline против 96.2% у Claude 4.5, при этом стоит в 8 раз дешевле (или open source, если есть где развернуть).
PS: на картинке кажется перепутали Sonnet 4 и 4.5
показала 94.9% успеха в тестах Cline против 96.2% у Claude 4.5, при этом стоит в 8 раз дешевле (или open source, если есть где развернуть).
PS: на картинке кажется перепутали Sonnet 4 и 4.5
🔥5
Еще одни создатели кодинг-агента Augment Code сравнили Sonnet 4.0 и 4.5 — и... 4.5 оказался быстрее и качественнее. Кто бы мог подумать. Их результаты такие:
Приложение с нуля:
- 4.5: 20 мин, работающие приложение.
- 4.0: 40+ мин, качество хуже.
Простое изменение кода:
- 4.5: 3 вызова, корректный апдейт.
- 4.0: более длинная цепочка, такой же результат.
Сложный рефакторинг:
- 4.5: быстрее + тесты пройдены.
- 4.0: медленнее + тесты завалены.
Приложение с нуля:
- 4.5: 20 мин, работающие приложение.
- 4.0: 40+ мин, качество хуже.
Простое изменение кода:
- 4.5: 3 вызова, корректный апдейт.
- 4.0: более длинная цепочка, такой же результат.
Сложный рефакторинг:
- 4.5: быстрее + тесты пройдены.
- 4.0: медленнее + тесты завалены.
YouTube
Claude Sonnet 4.5 is HERE - And It's Insanely Fast (Side by Side Comparison)
Anthropic's new Claude Sonnet 4.5 is finally here, and it's a massive leap forward for AI code generation! We got early access to this long-awaited update and have already integrated it into Augment Code. Is it really a big improvement over the old Sonnet…
👍4
Вайб-кодинг — это не просто новый тренд, это философия разработки, где интуиция важнее идеального плана, а ИИ становится твоим со-пилотом в потоке.
Вместе с Александром Агафонцевым, экспертом по автоматизации с ИИ и автором телеграм-канала "ИИзи Бизнес", разберем:
🔵 Что такое вайб-кодинг и почему это будущее разработки?
🟣 Как ИИ меняет подход к написанию кода?
🔵 Почему "идеальная архитектура" иногда убивает скорость?
🟣 Как найти баланс между хаосом и структурой?
🔵 Реальные кейсы: что можно автоматизировать уже сегодня?
🟣 Почему молодое поколение разработчиков кодит по-другому?
⏰ Запускаем трансляцию сегодня, 15 октября, в 18:00!
Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Александру!
Поспорим с классическими подходами в разработке☺️
Вместе с Александром Агафонцевым, экспертом по автоматизации с ИИ и автором телеграм-канала "ИИзи Бизнес", разберем:
⏰ Запускаем трансляцию сегодня, 15 октября, в 18:00!
Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Александру!
Поспорим с классическими подходами в разработке
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👎2😁1