AI4Dev — AI for Development – Telegram

AI4Dev — AI for Development

3.79K subscribers

109 photos

24 videos

5 files

214 links

Что надо знать, чтобы остаться востребованным ИТ специалистом в мире с LLM?

• Обзоры продуктов, фреймворков и способы взаимодействия с LLM для разработки софта

• Реальные кейсы, pet и бизнес проекты с LLM

• Публичные лекции

В будущее берут не всех!

Download Telegram

About

Blog

Apps

Platform

AI4Dev — AI for Development

3.79K subscribers

AI4Dev — AI for Development

Microsoft встроили в Visual Studio искусственный интеллект в механизм создания брейкпоинтов с условиями. IDE на прокачку, как в старом шоу на MTV: «Чтобы ты мог использовать LLM, когда дебажишь свой код написанный LLM, для проекта, использующего LLM».

Речь идет о брейкпоинтах со сложными условиями, в духе пропустить 5000 циклов for и отловить вызов функции с определёнными значениями параметров. Вот тут AI сам предложит вам эти самые значения (предположу, что ориентируясь на граничные значения допустимых диапазонов). Не уверен, что это очень полезная функция, но если рассматривать ее как часть процесса, в котором роботы сами пишут код и сами же исправляют ошибки, то начинает просматриваться ценность.

Supercharge C++ Debugging with AI-Generated breakpoint expressions

Learn how to use AI-generated expressions for conditional breakpoints and tracepoints in Visual Studio 2022 to debug your C++ code faster and easier than ever before.

🔥5

1.22K viewsAndrey S., edited 10:44

AI4Dev — AI for Development

Если кто не знает, есть такое направление в разработке ПО называется Automated Program Repair (APR). Качество инструментов для фикса багов измеряется на бенчмарке QiixBugs. Исследователи попробовали пофиксить с помощью новых моделей OpenAI o1-preview и o1-mini. Получились такие результаты : в тестах последних итераций QiixBugs модель успешно исправила все 40 ошибок, превзойдя производительность предыдущих версий по различным показателям, таким как уровень успешного фикса и эффективность реагирования. Может теперь останутся только фичи, а багов не будет совсем? https://theministryofai.org/from-bugs-to-breakthroughs-how-gpt-01-is-revolutionizing-the-world-of-automated-code-repair/

Ministry Of AI - The Authoritative Place for AI Learning and Education

From Bugs to Breakthroughs: How GPT-01 is Revolutionizing the World of Automated Code Repair - Ministry Of AI

From Bugs to Breakthroughs: How GPT-01 is Revolutionizing the World of Automated Code Repair Hello, fellow developers and AI enthusiasts! Today, we're diving headfirst into the world of coding and bug-fixing through the lens of cutting-edge AI technology.…

👍9

1.39K viewsVladimir, 15:54

AI4Dev — AI for Development

По бенчмарку QuixBugs см https://jkoppel.github.io/QuixBugs/

QuixBugs Benchmark

A multi-lingual program repair benchmark set based on the Quixey Challenge

👍3

1.21K viewsVladimir, 15:58

AI4Dev — AI for Development

Уже завтра, 3 октября, в 12:00 доктор технических наук Владимир Крылов расскажет о бенчмарках для LLM в своей новой лекции. Рассмотрим современные методы оценивания способностей больших языковых моделей решать различные задачи.

Вы узнаете:
🔸какие бенчмарки для определения лучших моделей сейчас наиболее типичны;
🔸как применяется шахматный рейтинг ELO для бенчмаркинга;
🔸что такое Leaderboard Arena;
🔸какие частные, но важные бенчмарки применяются для проблемно ориентированных моделей и мультимодальных LLM.

Подключайтесь! В этот раз будем транслировать не только на наш YouTubе, но и прямо здесь — в этот телеграм-канал. Выбирайте, где вам удобнее ☺️

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17👏1

1.22K viewsАнастасия Паршина, 13:05

AI4Dev — AI for Development

Live stream started

09:01

AI4Dev — AI for Development

Live stream finished (1 hour)

10:37

AI4Dev — AI for Development

Многие приложения , работающие с локальными данными и использующие LLM, как правило содержат решения, основанные на RAG. Разработчиков может оказаться интересным ознакомиться с итогами недавно завершившегося РАГатона в https://github.com/trustbit/RAGathon . Есть все исходники победителей. Нет только самих данных. Но они доступны в Сети.

GitHub - trustbit/RAGathon

Contribute to trustbit/RAGathon development by creating an account on GitHub.

❤4

1.31K viewsVladimir, 05:52

AI4Dev — AI for Development

Live stream started

06:53

AI4Dev — AI for Development

Live stream finished (33 minutes)

07:27

AI4Dev — AI for Development

https://github.com/Doriandarko/o1-engineer

Инструмент командной строки, разработанный для помощи разработчикам в эффективном управлении и взаимодействии с их проектами. Используя мощь API OpenAI, o1-engineer предоставляет такие функции, как генерация кода, редактирование файлов, планирование проекта и обзор кода, чтобы оптимизировать ваш рабочий процесс разработки. Не хотите попробовать o1 в разработке кода?

GitHub - Doriandarko/o1-engineer: o1-engineer is a command-line tool designed to assist developers in managing and interacting…

o1-engineer is a command-line tool designed to assist developers in managing and interacting with their projects efficiently. Leveraging the power of OpenAI's API, this tool provides functi...

👍1

1.15K viewsVladimir, 17:58

AI4Dev — AI for Development

В продолжение:

Для этого проект использует две модели o1-mini (можно изменить в настройках), одна говорит что добавлять и менять, а вторая - исполняет. Как пишет автор, первым делом он подключил своего агента к работе над собственным же кодом.

1.12K viewsVladimir, 18:07

AI4Dev — AI for Development

"Как сравнивают LLM: бенчмарки" — новая лекция доктора технических наук Владимира Крылова на нашем YouTube-канале. Есть и в виде подкаста.

Из лекции вы узнаете:
🔸какие бенчмарки для определения лучших моделей сейчас наиболее типичны;
🔸как применяется шахматный рейтинг ELO для бенчмаркинга;
🔸что такое Leaderboard Arena;
🔸какие частные, но важные бенчмарки применяются для проблемно ориентированных моделей и мультимодальных LLM.

Появились вопросы — задавайте в комментариях!

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

934 viewsАнастасия Паршина, 12:52

AI4Dev — AI for Development

Взяли интервью у Дмитрия Рожкова, автора канала Senior Software Vlogger, чтобы обсудить результаты его тестирования шести AI-программистов. Дмитрий рассказал, способны ли современные ИИ-агенты справиться с реальными задачами и как эти кремниевые разработчики повлияют на ИТ-индустрию.

Смотрите интервью на нашем YouTube-канале или слушайте подкаст!

👍9🔥4

930 viewsАнастасия Паршина, 11:00

AI4Dev — AI for Development

Во вторник, 15 октября, в 12:00 Анна Авдюшина расскажет об архитектуре и проектировании ML-систем на нашем YouTube-канале.

Анна преподаёт на факультете «Программная инженерия и компьютерная техника» и является инженером центра «Сильный искусственный интеллект в промышленности» университета ИТМО.

На лекции рассмотрим ключевые аспекты разработки и развертывания систем на основе машинного обучения: выбор компонентов и их интеграции, управление данными, оркестрацию важных этапов жизненного цикла ML-проектов, от исследования данных и разработки модели до её масштабирования и поддержки на этапе эксплуатации.

Подключайтесь! Будем транслировать не только на наш YouTubе, но и прямо здесь — в этот телеграм-канал.

👍7👏1

935 viewsАнастасия Паршина, 11:01

AI4Dev — AI for Development

"Мощь ИИ в вашем ПК: генеративные модели на потребительском оборудовании" — лекция, с которой выступит СТО компании Raft Александр Константинов 16 октября в 12:00.

Вы узнаете, как разворачивать и использовать модели Llama 3.1 на видеокартах вроде RTX 4090 и получить преимущества ИИ прямо у себя дома или в офисе.

Подключайтесь и задавайте вопросы!

👍11

1.13K viewsАнастасия Паршина, 11:02

AI4Dev — AI for Development

Live stream started

09:05

AI4Dev — AI for Development

Live stream finished (1 hour)

10:15

AI4Dev — AI for Development

Perplexity представили внутренний поиск по знаниям для бизнес клиентов. Теперь пользователи смогут одновременно искать информацию как в файлах своей организации, так и в интернете.

Кроме того, компания запускает Spaces (не только для бизнеса) - ИИ хабы для совместной работы, которые можно настроить под конкретные нужды команды, будь то исследовательский проект, подготовка коммерческих предложений или создание учебных материалов.

Новые возможности:

- Загружать и хранить файлы (поддерживаются форматы pdf, txt, csv, xlsx, pptx, docx)
- Искать информацию в файлах и в интернете
- Выбирать предпочтительную модель ИИ
- Задавать собственные инструкции для получения нужных ответов
- Приглашать других пользователей для совместной работы

Для корпоративных клиентов Perplexity обещает высокий уровень безопасности и конфиденциальности данных. В ближайшем будущем планируется добавить интеграцию с Crunchbase и FactSet.

Perplexity is a free AI-powered answer engine that provides accurate, trusted, and real-time answers to any question.

👍7

974 viewsVladimir, 12:31

AI4Dev — AI for Development

This media is not supported in your browser

VIEW IN TELEGRAM

Авторы Chatbot Arena выпустили бесплатное расширение для VS Code, которое даёт возможность тестировать LLM модели для программирования.

Copilot Arena предлагает на выбор несколько вариантов автодополнений от разных моделей. Кажется отдельная арена в виде плагина может поднять на новый уровень процесс оценки моделей для кода, особенно учитывая, что автодополнения не особенно охвачены бенчмарками, рейтингами и исследованиями. В режиме арены, с постоянно новыми пользовательскими данными нет конкретного набора задач (бенчмарка), на которых можно было бы переобучить (overfitting) модель ради попадания в топ рейтинга без реально хорошего результата, а значит результаты будут относительно точными.

PS: Не забывайте, что ваш код будет отправляться хостерам моделей на арене. Для опенсорсных проектов или личных экспериментов это вполне ок, но если вы создаете что-то коммерческое, наверняка вы подписывали договор, что никому не будете показывать ваш код.

👍6

755 viewsAndrey S., 10:50

AI4Dev — AI for Development

Anthropocene представил далеко идущую новаторскую новую возможность: использование LLM для работы с компьютером. Доступно сегодня в API , с разработчики могут направлять Клода на использование компьютеров так, как это делают люди, — глядя на экран, перемещая курсор, нажимая кнопки и печатая текст. Claude 3.5 Sonnet — первая передовая модель ИИ, предлагающая использование компьютера в публичной бета-версии. На данном этапе она все еще экспериментальная — порой громоздкая и подверженная ошибкам. Открыта бета-версия использование компьютера для получения отзывов от разработчиков и ожидается, что со временем эта возможность будет быстро улучшаться. Картина робот за клавиатурой компьютера стала реальностью.

Developing a computer use model

👍4

780 viewsVladimir, 17:40

AI4Dev — AI for Development

Денис Ширяев опубликовал первые результаты его "эмпирического тестирования" . С лету все выглядит сырым, но привлекательным! Что заметил из тестов:
– Агент отказывается писать комментарии или посты (в канал отказался постить, хотя нашел и я залогинился – должен был обозвать вас кожаными мешками)
– У него проблемы со скролом страницы поиска, и он так зависает (случайно попадает в футер и не знает что делать)
– Пока ощущения будто дурачка за компьютер посадил, но понятно куда идет
– Нашел мне место где можно выпить вкусного пива и отметил его на карте, всем пока.

👍3👏2

826 viewsVladimir, 19:51