AI4Dev — AI for Development
4.09K subscribers
122 photos
35 videos
5 files
247 links
Что надо знать, чтобы остаться востребованным ИТ специалистом в мире с LLM?

• Обзоры продуктов, фреймворков и способы взаимодействия с LLM для разработки софта

• Реальные кейсы, pet и бизнес проекты с LLM

• Публичные лекции

В будущее берут не всех!
Download Telegram
Live stream started
Live stream finished (1 hour)
Одно из наиболее результативных направлений разработки моделей генеративного ИИ является проектирование специализированных моделей , ориентированных на какую либо единственную проблему, в отличии от "пути AGI". Ниже - о еще одной такой модели, нацеленной на медицинское прогнозирование.
Вот описание словами коллеги по цеху.

Delphi-2M - это новая генеративная модель ИИ, которая умеет строить персональные прогнозы здоровья по более чем тысяче заболеваний на десятки лет вперед.

Она уже протестирована в реальности: сначала обучена на сотнях тысяч записей из UK Biobank, а потом проверена на почти 2 миллионах датских пациентов.

Самое интересное, что точность при переносе между системами здравоохранения не упала - для горизонта в 10 лет она в среднем 0,76, а для 20 лет - 0,70. Особенно хорошо модель предсказывает долгосрочные риски вроде сердечно-сосудистых заболеваний и деменции.

Мне нравится, как элегантно устроен ее подход: каждый диагноз в истории пациента трактуется как «слово» в предложении. ИИ учит «грамматику болезней», то есть закономерности их появления. Как только в медкарте появляется новый факт, например, свежий анализ крови или другой диагноз, - прогноз обновляется.

Применений у этого много. С одной стороны, индивидуальные советы пациенту: на что обратить внимание, какие привычки стоит менять, чтобы снизить риски. С другой стороны, большие сценарные прогнозы для здравоохранения в целом.

Например, можно смоделировать вариант: что будет с продолжительностью жизни населения, если снизить заболеваемость раком или инфарктами. Плюс больницы и клиники получают инструмент для планирования ресурсов на годы вперед, а не «тушения пожаров» в моменте.

Разработчики заложили в модель этические механизмы. Ее можно обучать даже на синтетических данных, чтобы сохранить приватность, и она объяснима для врачей - видно, какие именно факторы легли в основу предсказания. То есть это не «черный ящик», а инструмент, с которым реально можно работать в клинике.

И если раньше ИИ в медицине воспринимался как что-то вспомогательное, вроде калькулятора для отдельных задач, то сейчас мы приближаемся к новой роли - полноценного партнера, который умеет собирать всю картину и смотреть далеко вперед.

Сергей Булаев AI 🤖 - об AI и не только
👍63👎1
https://zml.ai/

Весьма любопытный сервис. Кто реально попробует очень прошу прокомментировать. И , кстати , написан на необычном языке.
👍7🔥1
Сегодня впечатляющий набор обновлений от Anthropic:

Anthropic выпустила Claude Sonnet 4.5, заявив лучший уровень по кодированию (SWE Bench), использованию компьютера и рассуждению/математике. Модель демонстрирует возможность распараллеливать и эффективно решать сложные многоэтапные задачи, сохранять концентрацию при работе над задачей более 30 часов.

Новая версия Claude Code получила чекпоинты (сохранение прогресса и мгновенный откат), официальное расширение для VS Code, обновленный SDK с поддержкой сабагентов и хуков и улучшенный терминал. Теперь можно безопасно (по мнению Anthropic) поручать ему более сложные и длительные задачи — от рефакторинга до автономной разработки с фоновыми процессами.

Anthropic добавила в Claude Developer Platform новые инструменты управления контекстом: context editing и memory tool. Они позволяют агентам автоматически очищать устаревшие данные и сохранять важную информацию во внешней памяти, чтобы работать дольше и точнее без потери прогресса.

Успели уже что-нибудь попробовать?
5💩3👍2
Media is too big
VIEW IN TELEGRAM
О сценарном подходе к созданию системных промптов для диалоговых агентов рассказывает Сергей Гевлич — основатель платформы для масштабирования компетенций «Джипититор».

Разбираем, почему сложно стабилизировать оркестровку больших (от 20К знаков) системных промптов и как создать стабильный системный промпт, моделирующий работу экспертов.

Запись лекции доступна здесь и на других площадках:

➡️ YouTube
➡️ ВКонтакте
➡️ ЯндексМузыка
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3👎1
Говорим о безопасности LLM с Сергеем Зыбневым — тимлидом-пентестером (белым хакером), специалистом по безопасности больших языковых моделей и создателем телеграм-канала "Похек".

Обсудим:
🔵тестирование безопасности LLM и обнаружение уязвимостей;
🔵использование ИИ для поиска багов и тестирования безопасности;
🔵практический опыт работы с безопасностью ChatGPT и других LLM;
🔵вайб-кодинг: как изменилась разработка с приходом LLM;
🔵реальные кейсы из практики пентестинга;
🔵будущее AI в кибербезопасности.

Запускаем трансляцию завтра, 7 октября, в 17:30!

Смотрите на YouTube, в ВК или прямо в этом канале!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8💩1
Вчера прошёл OpenAI DevDay 2025. Вектор развития понятен — строят экосистему. Снова как App Store, только с ИИ и с еще более высокими заборами по периметру.

Мы попробовали новый Agent Builder, визуальный конструктор для создания собственных AI-агентов без кода - для простых сценариев выглядит удобно. Обещают встроенные Datasets (контексты данных для обучения и теста) и Evals — инструменты для оценки и сравнения качества ответов. Скоро будет ясно насколько эффективно для сложных задач и захочет ли большой бизнес запирать себя внутри экосистемы OpenAI. Self-hosting и open source всё ещё явная ценность, но компании вроде n8n, Make.com, Zapier насторожились.

Apps SDK — способ делать полноценные приложения (вызывать свои API и показывать интерфейсы) прямо внутри ChatGPT, доступен в тестовом режиме разработчикам. На демо показали встроенные вызовы приложений Canva, Figma, Spotify. Трансформация в платформу с каталогом приложений и монетизацией для разработчиков.

Кто-нибудь уже опубликовал своего агента? Присылайте посмотреть!
Live stream started
Live stream finished (55 seconds)
Live stream started
Live stream finished (2 minutes)
Live stream started
Live stream finished (1 hour)
Anthropic пару месяцев назад выпустили Claude Code Security Reviewer - бот-ревьюер, который ищет уязвимости в GitHub-репо и советует, что починить. Теперь Google DeepMind ответил своим CodeMender — агентом, который не советует, а сразу лезет чинить код сам: патчит, тестит, откатывает, и т.д. Пока что оба под присмотром людей. Гугл заявляет, что в процессе разработки за полгода CodeMender уже внёс 72 security-фикса в open source-проекты, включая те, где кода под 4,5 миллиона строк.
👍2
Пост в блоге кодинг агента Cline о том, что открытые модели стремительно догоняют закрытые в области агентов редактирования кода. Новая модель GLM-4.6 ( от Zhipu / Z.ai одной из китайских компаний-«ИИ-тигров»)
показала 94.9% успеха в тестах Cline против 96.2% у Claude 4.5, при этом стоит в 8 раз дешевле (или open source, если есть где развернуть).

PS: на картинке кажется перепутали Sonnet 4 и 4.5
🔥5
Еще одни создатели кодинг-агента Augment Code сравнили Sonnet 4.0 и 4.5 — и... 4.5 оказался быстрее и качественнее. Кто бы мог подумать. Их результаты такие:

Приложение с нуля:
- 4.5: 20 мин, работающие приложение.
- 4.0: 40+ мин, качество хуже.

Простое изменение кода:
- 4.5: 3 вызова, корректный апдейт.
- 4.0: более длинная цепочка, такой же результат.

Сложный рефакторинг:
- 4.5: быстрее + тесты пройдены.
- 4.0: медленнее + тесты завалены.
👍4
Вайб-кодинг — это не просто новый тренд, это философия разработки, где интуиция важнее идеального плана, а ИИ становится твоим со-пилотом в потоке.

Вместе с Александром Агафонцевым, экспертом по автоматизации с ИИ и автором телеграм-канала "ИИзи Бизнес", разберем:
🔵Что такое вайб-кодинг и почему это будущее разработки?
🟣Как ИИ меняет подход к написанию кода?
🔵Почему "идеальная архитектура" иногда убивает скорость?
🟣Как найти баланс между хаосом и структурой?
🔵Реальные кейсы: что можно автоматизировать уже сегодня?
🟣Почему молодое поколение разработчиков кодит по-другому?

Запускаем трансляцию сегодня, 15 октября, в 18:00!

Смотрите на YouTube, в ВК или прямо в этом канале — и задавайте вопросы Александру!

Поспорим с классическими подходами в разработке ☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👎2😁1
Live stream started