AI4Dev — AI for Development – Telegram

AI4Dev — AI for Development

3.78K subscribers

109 photos

24 videos

5 files

214 links

Что надо знать, чтобы остаться востребованным ИТ специалистом в мире с LLM?

• Обзоры продуктов, фреймворков и способы взаимодействия с LLM для разработки софта

• Реальные кейсы, pet и бизнес проекты с LLM

• Публичные лекции

В будущее берут не всех!

Download Telegram

About

Blog

Apps

Platform

AI4Dev — AI for Development

3.78K subscribers

AI4Dev — AI for Development

GitHub Next анонсировали запуск AI агента создающего веб приложения - Spark. Подобные заявления мы, конечно, уже слышали десятки раз, но не от таких уважаемых компаний. Заявление гораздо более скромное чем все предыдущие Devinы, Devikи и прочие SWE агенты и в то же время кажется достаточно перспективное. Речь идет не об универсальном агенте, а скорее о платформе для создания мини приложений, которые выполняют буквально одну функцию, например "Карточки для заучивания иностранных слов". В основе концепции 4 главных идеи:

• Встроенный хостинг
• Готовые темы для дизайна
• Наличие хранилища данных
• Возможность встраивать LLM в приложение

Вы набрасываете в чате идею вашего приложения, уточняете в несколько итераций, подстраиваете дизайн и делитесь с друзьями. Залезать в код руками тоже можно, но акцент не на этом.

Те кто застал интернет до социальных сетей возможно вспомнят эпоху так называемых «хомяков» - homepage, т.е. домашних страниц пользователей на проектах типа narod.ru. Кажется, GitHub изобрел что-то подобное, только в 2024м и на новый лад, теперь это HomeApp. Мы, конечно, записались в вейтлист!

👍7🔥1

1.15K viewsAndrey S., edited 14:16

AI4Dev — AI for Development

Microsoft представляет Magentic-One, новую универсальную многоагентную систему, предназначенную для обработки сложных веб- и файловых задач.

Она использует агент Orchestrator, который управляет четырьмя специализированными агентами: WebSurfer для операций браузера, FileSurfer для управления файлами, Coder для задач программирования и ComputerTerminal для консольных операций.

Magentic-One достигает конкурентоспособной производительности в нескольких тестах, включая GAIA, AssistantBench и WebArena, без необходимости внесения изменений в свою базовую архитектуру.

Созданная на основе фреймворка AutoGen от Microsoft, Magentic-One использует уникальную двухконтурную архитектуру, в которой Orchestrator управляет как задачами, так и регистрами прогресса.

Система имеет открытый исходный код, как и AutoGenBench, новый инструмент оценки для тестирования систем на основе агентов.

Пока еще может рано, но это новое движение по созданию универсальных агентных систем — то, за чем стоит следить. Кроме того, другие текущие приложения на основе LLM, такие как RAG, также выиграют от этого типа системы, которая строится поверх нескольких специализированных агентов.

https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/

Microsoft Research

Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks - Microsoft Research

By Adam Fourney, Principal Researcher; Gagan Bansal, Senior Researcher; Hussein Mozannar, Senior Researcher; Victor Dibia, Principal Research Software Engineer; Saleema Amershi, Partner Research Manager Contributors: Adam Fourney, Gagan Bansal, Hussein Mozannar…

👍5🔥3

1.28K viewsVladimir, 05:55

AI4Dev — AI for Development

Хорошая новость для тех, кто любит кодить на вершине горы Эверест, в Марианской впадине или из пасти дикого льва в африканской саванне (там, где качество доступа в интернет оставляет желать лучшего). Qwen 2.5.1 Coder 7B!

На днях в сеть (похоже случайно) утекла новая версия модели для программирования от Alibaba, а сегодня ее уже выложили официально. Эта модель весом в 7 миллиардов параметров демонстрирует очень достойные результаты на бенчмарке редактирования кода Aider: всего на несколько процентов отстает от GPT-4-1106-preview (модель от 6 ноября 2023), но работает полностью оффлайн! Находка для тех, кто хочет иметь под рукой мощную языковую модель без необходимости постоянного подключения к сети. Официальная версия тут (там вся линейка новых моделей и полные и 7B в том числе). Утекшая версия тут, но т.к. вышла официальная то смысла в ней особенно нет.

🔥6👍2

1.67K viewsAndrey S., edited 12:19

AI4Dev — AI for Development

Месяц назад (мы писали) команда Chatbot Arena (ранее LMSYS - платформа соревнований LLM в виде чатов) выпустила плагин copilot для VSCode (один из известных редакторов кода от Microsoft). Внутри плагина встроена арена оценки различных LLM как копайлотов для программирования. Работает это так:

• Пользователь в IDE вызывает плагин чтобы дополнить какой-то кусок кода
• Плагин передает запрос паре случайно выбранных LLM и возвращает два обезличенных ответа
• Затем пользователь “вслепую” выбирают из двух вариантов какой ответ ему больше подходит
• Пользователь получает нужный код (copilot работает бесплатно), а команда LMSYS статистику ответы каких моделей предпочитают разработчики.

Вчера команда Copilot Arena опубликовали первые результаты исследования. Как водится в современном мире ИИ вчерашние результаты уже немного устарели т.к. вчера же вышли новые версии моделей QWEN которые явно претендуют на высокие места в рейтинге написания кода, но по очевидным причинам еще не успели в нем поучаствовать. Тем не менее результаты любопытные, кажется это первое исследование моделей (именно в режиме копайлотов) с более-менее уверенными статистическими показателями и на настоящем коде.

На основе 10000+ запросов к копайлотам (200-250 постоянных пользователей в день в течение месяца) появилась вот такая таблица топ-9ти соревнующихся моделей.

Из интересных подробностей: Чаще всего плагином пользовались питонисты, сильно меньше JS, потом все остальные. Медианный размер запросов с кодом в пять раз больше, чем текстовые запросы на обычной арене - 530 токенов против 100. Остальное в блоге создателей.

🔥4👍2

1.52K viewsAndrey S., edited 15:17

AI4Dev — AI for Development

Завтра, 21 ноября, в 12:00 доктор технических наук Владимир Крылов расскажет, всё ли могут знать LLM ☺️

На лекции обсудим:
🔸Что значит «знать» что-то? Можно ли свести все человеческие знания к тексту?
🔸Какова связь между языком и реальностью? Существуют ли знания вне языка?
🔸Как приобретают знания люди и LLM? Что говорят результаты первых нейропсихологических исследований LLM?

Подключайтесь! Будем транслировать на наш YouTubе и в этот телеграм-канал.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8🔥5

1.54K viewsАнастасия Паршина, 09:00

AI4Dev — AI for Development

Live stream started

09:04

AI4Dev — AI for Development

Live stream finished (59 minutes)

10:03

AI4Dev — AI for Development

https://llmresourceshub.vercel.app/

Здесь есть все, ну почти...

LLM Resources Hub

A comprehensive collection of Large Language Model (LLM) resources, tools, and learning materials.

👍3

1.03K viewsVladimir, 14:35

AI4Dev — AI for Development

Новые возможности разработки с использованием LLM от Anthropic: Сегодня мы открываем исходный код Model Context Protocol (MCP), нового стандарта для подключения помощников ИИ к системам, где находятся данные, включая репозитории контента, бизнес-инструменты и среды разработки. Его цель — помочь передовым моделям выдавать более качественные и релевантные ответы.

👍5

868 viewsVladimir, edited 04:48

AI4Dev — AI for Development

https://www.anthropic.com/news/model-context-protocol

Introducing the Model Context Protocol

The Model Context Protocol (MCP) is an open standard for connecting AI assistants to the systems where data lives, including content repositories, business tools, and development environments. Its aim is to help frontier models produce better, more relevant…

937 viewsVladimir, 04:48

AI4Dev — AI for Development

История из жизни для тех, кто ближе к бизнесу, чем к нейропсихологии LLM. Кейс как человек пытается применить LLM с точки зрения развития своего проекта:
Автор небольшого проекта Percentagescalculator " Я немного погуглил и обнаружил, что от 100 000 до 1 миллиона человек ищут Percentage Calculator каждый день. Ссылка номер 1 — это очень простой одностраничный веб-сайт с едва ли каким-либо SEO. У него просто хорошие обратные ссылки.

Так что я немного пообщался с Клодом, мы создали этот веб-сайт за несколько минут (буквально за 10 минут), затем я поискал URL-адреса сайтов с рейтингом номер 1 в Google в кавычках, чтобы найти, где он появляется на других сайтах, и я начал собирать адреса электронной почты владельцев сайтов везде, где он появлялся, и заставлял chatGPT писать убедительные письма, сообщая им о преимуществах моего процентного калькулятора. Я также нашел форумы, где люди обсуждали его, поэтому также рассказал им об этом инструменте. Где бы ни была их ссылка, там будет и моя ссылка.

Клод помог мне создать калькулятор расширений Chrome, который даст мне обратную ссылку на домен Google за 5 долларов (стоимость регистрации разработчика), чего у них нет.

Если я смогу получить хотя бы 10% от этого объема поиска, это будет чертовски много трафика."

🔥3

909 viewsVladimir, edited 06:29

AI4Dev — AI for Development

This media is not supported in your browser

VIEW IN TELEGRAM

Вышло обновление IDE Cursor в котором появились агенты. На приложенном видео агент ловко создает приложение тайм-трекер c бэкендом на Node.js, фронтэндом на чистом JS и даже запускает приложение. Пора пробовать на собственных задачах. На Реддите впрочем, есть жалобы что Composer (мощная фича Cursor, которая позволяет редактировать код сразу в нескольких файлах) в новой версии стал сильно тормозить, разработчики недовольны.

❤3

868 viewsAndrey S., 10:39

AI4Dev — AI for Development

Завтра, 28 ноября, в 12:00 директор центра разработки Artezio Леонид Лифшиц расскажет, как создать ML-cистему для аннотирования текстов в условиях ограниченных ресурсов.

На лекции обсудим:
▪️классификацию задач по аннотированию тестов;
▫️основные подходы в условиях ограничения ресурсов;
▪️суммаризацию англоязычных и русскоязычных текстов;
▫️Text2Speech модели и ресурсы для локального развертывания моделей.

Подключайтесь! Будем транслировать на наш YouTubе и в этот телеграм-канал.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

1.21K viewsАнастасия Паршина, 13:46

AI4Dev — AI for Development

Появился еще один весьма полный ресурс https://github.com/SylphAI-Inc/LLM-engineer-handbook полезных материалов по разработкам с использованием LLM. - Справочник инженера LLM
Обзор
Библиотеки, фреймворки и инструменты
Приложения
Предварительная подготовка
Тонкая настройка
Обслуживание
Оперативное управление
Наборы данных
Показатели
Учебные ресурсы для LLM
Приложения
Агент
Моделирование
Обучение
Тонкая настройка
Основы
Книги
Информационные бюллетени
Автооптимизация
Понимание LLM
Социальные аккаунты и сообщества
Социальные аккаунты
Сообщество

GitHub - SylphAI-Inc/LLM-engineer-handbook: A curated list of Large Language Model resources, covering model training, serving…

A curated list of Large Language Model resources, covering model training, serving, fine-tuning, and building LLM applications. - SylphAI-Inc/LLM-engineer-handbook

👍6

1.41K viewsVladimir, 18:51

AI4Dev — AI for Development

Live stream started

09:05

AI4Dev — AI for Development

Live stream finished (50 minutes)

09:55

AI4Dev — AI for Development

🎥 "ИИ вместо Тьюринга, Дали и Пушкина. Есть ли предел творческому потенциалу LLM?" — новое интервью на нашем YouTube-канале. Взяли его у Бориса Орехова — кандидата филологических наук, доцента ВШЭ и старшего научного сотрудника Пушкинского Дома.

Поговорили об отношении людей к машинному творчеству, о потенциале нейросетей в области поэзии и о собственных ML-проектах Бориса, которые вы можете посмотреть на HuggingFace.

🎙Интервью выложили и в виде подкаста.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

861 viewsАнастасия Паршина, 09:45

AI4Dev — AI for Development

Open AI запустили серию из 12 ежедневных трансляций, в которых в камерном формате планируют рассказывать о… не очень понятно точно о чем, но вероятно об обновлениях и планах на будущее. Вчера был анонсирован выход модели o1 (полной, а не preview), работает быстрее и умнее, работает с картинками (с аудио файлами не работает), уже доступна из Штатов, а скоро по всему миру для платных подписчиков. Также запустили еще более усиленный режим работы - o1 pro (длиннее рассуждения), который доступен по отдельной подписке в $200. Следить можно вот тут или на youtube, впрочем мы все посмотрим и напишем о самом важном и итересном.

12 Days of OpenAI

12 Days of OpenAI: 12 days. 12 livestreams. A bunch of new things, big and small.

👍6

957 viewsAndrey S., 12:20

AI4Dev — AI for Development

"Мир - это текст? Всё ли могут знать LLM" — новая лекция доктора технических наук Владимира Крылова на нашем YouTube-канале. Есть в виде подкаста.

Из лекции вы узнаете:
🔸Что значит «знать» что-то? Можно ли свести все человеческие знания к тексту?
🔸Какова связь между языком и реальностью? Существуют ли знания вне языка?
🔸Как приобретают знания люди и LLM? Что говорят результаты первых нейропсихологических исследований LLM?

Появились вопросы — задавайте в комментариях!

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5

1.19K viewsАнастасия Паршина, 14:01

AI4Dev — AI for Development

"Как аннотировать тексты с помощью ML, если ресурсы ограничены?" — лекция директора центра разработки Artezio Леонида Лифшица на нашем YouTube-канале.

В лекции обсуждаем:
🟣классификацию задач по аннотированию тестов;
🔵основные подходы в условиях ограничения ресурсов;
🟣суммаризацию англоязычных и русскоязычных текстов;
🔵Text2Speech модели и ресурсы для локального развертывания моделей.

➡️ Лекция есть в виде подкаста.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥1

1.16K viewsАнастасия Паршина, 08:00