AI4Dev — AI for Development
3.75K subscribers
103 photos
22 videos
5 files
206 links
Что надо знать, чтобы остаться востребованным ИТ специалистом в мире с LLM?

• Обзоры продуктов, фреймворков и способы взаимодействия с LLM для разработки софта

• Реальные кейсы, pet и бизнес проекты с LLM

• Публичные лекции

В будущее берут не всех!
Download Telegram
Live stream started
Перевёл для Хабра статью разработчика, недавно уволившегося из OpenAI. Он рассказывает, как устроена работа изнутри: культура снизу вверх, отсутствие планов, вся коммуникация через Slack, техстекиз Azure, monorepo, Python, как создавали Codex (агент-программист) делали 8 разработчиков (всего 17 человек) за 7 недель, работая до 4 утра.

Выжимки из статьи уже появлялись в каналах, но я прочитал оригинал и там много интересного. Возможно, не самый объективный обзор, но заглянуть внутрь OpenAI всё равно любопытно.
🔥9👍2🤷‍♂1👌1
Live stream finished (1 hour)
Vibe Coding News этой недели:

Qwen 3 Coder - новая open-source модель уровня Claude Sonnet-4 (по версии производителя, отчет с бенчмарками прилагается). 480 миллиардов параметров (35B активных), окно контекста 256K токенов, расширяемое до 1 миллиона. Специализация - генерация кода, инструментальное использование и агентные задачи. Полная модель доступна в чате; локально потребует десятки GPU. Если она вдруг действительно работает на уровне Sonnet-4, это может существенно удешевить работу в Cursor да и вообще позволить работать без облака. Наши коллеги, впрочем, пока не спешат переключаться на Qwen 3 Coder. Подождём отзывов и тестов.

Квантизованные модели Qwen 3 Coder, конечно, уже тоже сделали. Например, здесь инструкции по установке и квантизованные модели (Unsloth Dynamic 2.0) GGUF (8–16 бит) с поддержкой до 1M токенов контекста.

Mini-SWE-Agent - новый open-source агент программирования всего из 100 строк кода, достигающий 65% точности на задачах SWE-bench без использования специальных инструментов. 100 строк кода на python - можно быстро посмотреть как это устроено.

Figma запустила AI-генератор дизайна приложений, сайтов и прототипов чего угодно. Создаёшь по текстовому описанию — получаешь готовый макет, который можно доработать вручную. Уже можно попробовать, и пока даже бесплатно! Работает на базе Sonnet 4.

Google запустила в тестовом режиме Opal - систему быстрого создания мини-приложений, что-то вроде Claude Artifacts в рамках Google Labs. Пользователи с IP из США уже могут попробовать. Мы попробовали - работает вполне неплохо, принципиально нового пока не увидели. Пишешь или наговариваешь суть приложения, затем получаешь схему данных, которую можно отредактировать и создаёшь формы. Уметь программировать не нужно.

Забыли что-то интересное?
3👍3
Media is too big
VIEW IN TELEGRAM
🔊Говорим о клонировании голоса
Кто побеждает в гонке вооружений между дипфейками и детекторами? Рассказывает Виктор Загускин — ML-руководитель платформы речевых технологий в MWS AI.

Разбираем:
🟣Эволюция синтеза: как технологии клонирования голоса достигли почти идеальной естественности — от роботизированной речи до неотличимых дипфейков.
🟣Zero-shot революция: как клонировать голоса за 3 секунды и почему это доступно даже непрофессионалам.
🟣Детектирование в действии: как современные алгоритмы «ловят» синтетику и почему это напоминает вечную игру в кошки-мышки.
🟣Этика и угрозы: реальные кейсы мошенничества, регуляторные вызовы и тонкая грань между инновацией и преступлением.
🟣Будущее биометрии: куда движется гонка технологий — от водяных знаков до квантовых методов защиты.

Запись лекции доступна здесь и на других площадках:

➡️ YouTube
➡️ ВКонтакте
➡️ ЯндексМузыка
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
На Kaggle стартовал новый AI-конкурс K Prize (Konwinski Prize) от сооснователя Databricks и Perplexity Энди Конвински.
Главная идея проверить, смогут ли open-source AI-модели решать реальные задачи разработки. Особенность конкурса: модели отправляются заранее, а тестовые задачи выбираются позже из свежих GitHub-issues, появившихся уже после дедлайна. Конвински обещает выплатить $1 млн первой модели, которая решит более 90% задач, но кажется что пока деньги в безопасности.

Оценка моделей проходит:
• Офлайн: без доступа в интернет.
• Ограниченные ресурсы: не больше 4-х GPU (L4), предоставленных Kaggle.
• Проверка основана только на новых GitHub-issues, что исключает возможность заранее подготовить модель.

Первый тур показал, насколько это сложно: лучшая модель справилась лишь с 7,5% задач. Тут надо учесть, что все закрытые модели типа Claude/OpenAI сюда не попадают. Открытые модели типа Qwen 3 только в сильно квантизованном виде (аппаратные ограничения).

Сам Конвински считает, что подобный подход к тестированию, взятый из соревнований по прогнозированию рынка, полностью исключает возможность заранее «подогнать» модель под тестовые данные. «Пока мы не можем приблизиться даже к 10% задач из бенчмарка, о замене программистов на AI говорить рано», — говорит Конвински (тут стоит напомнить, что большие проприетарные модели участвовали). Ветка на Reddit.
👍52
Сейчас в эфире:

Интервью: Правда о чипах в мозге: эксперт разбирает Neuralink и российские аналоги

Сергей Шишкин, руководитель группы нейрокогнитивных интерфейсов Московский государственный психолого-педагогический университет (МГППУ) и один из пионеров российских brain-computer interface, честно рассказывает о реальном положении дел в индустрии нейротехнологий.

🔥 ЧТО ВЫ УЗНАЕТЕ:

Почему проект Neuralink называют "провальным" и что на самом деле умеют пациенты Маска
Как обезьяна "обманывала" систему в знаменитом эксперименте с игрой Pong
Какие российские нейроинтерфейсы уже превосходят зарубежные аналоги
Когда обычные люди смогут купить "читалки мыслей" в магазине
Реальны ли планы Neuralink по восстановлению зрения в 2025 году
Кто действительно лидирует в гонке нейрочипов: Маск, Gabe Newell или китайцы

🎯 ОБ ЭКСПЕРТЕ:
Сергей Львович Шишкин - доктор наук, автор 170+ научных публикаций, создатель первого в России working brain-computer interface. Его исследования цитируются в ведущих мировых журналах. В отличие от многих экспертов, он лично работал с реальными пациентами и знает технологию "изнутри".

Смотреть тут https://www.youtube.com/watch?v=wH3hH6Cah94
и тут https://vkvideo.ru/video-39755794_456239434

И тут в телеграмм.
🔥5
Live stream started
Live stream finished (1 hour)
Кодирующий агент ИИ Warp обходит Claude Code и занимает первое место в рейтинге Terminal-Bench
Warp только что запустил первую среду разработки Agentic, созданную для разработчиков, желающих получать результаты быстрее. Это лучший в целом агент кодирования, опередивший Claude Code на 20%, ставший агентом № 1 в Terminal-Bench и набравший 71% в SWE-bench Verified.

Длительные команды: то, что не может поддерживать ни один другой инструмент

Многопоточность агентов: запуск нескольких агентов параллельно — все под вашим контролем

На протяжении всего жизненного цикла разработки: настройка → кодирование → развертывание

Отзывы незамедлительно последовали:
«Просто потрясающе. Это полностью изменило мой рабочий процесс». — Яш Патил, технический специалист OpenAI . Знакомьтесь - https://www.warp.dev/
Vibe Coding News этой недели:

Опрос Stackoverflow 2025 об ИИ, технологиях и зарплатах. Широкое внедрение ИИ, но скепсис к точности среди разработчиков, 16% разработчиков все еще не планируют использовать ИИ в работе, Установщик uv python самая упоминаемая технология, разрыв зарплат между USA и Индией сохраняется.

Статья о работе с контекстом. Главная мысль – несмотря на огромные контекстные окна не стоит запихивать в контекст все подряд. Советы как это реализовать на практике: Не используем лишнюю и противоречивую информацию, RAG все еще актуален, изоляция контекста – мультиагентные системы, в которых делим задачу на отдельные подзадачи, каждая со своим контекстом, а потом собираем. А также обрезка, саммаризация и выгрузка - храним часть данных вне окна контекста.

AgentSmith CMS система хранения промптов с открытым исходным кодом, построенная поверх OpenRouter, кажется может пригодиться для оптимизации инженерии промптов/контекста.

Meta планирует позволить кандидатам использовать ИИ во время собеседований по программированию.

В ChatGPT появился режим обучения. Вместо готовых ответов модель задаёт наводящие вопросы и помогает пошагово разобраться в теме.

Пропустили что-то интересное?
🔥61