28 августа в 12:00 Кирилл Серов, технический директор компании PIX Robotics, расскажет о том, как искусственный интеллект поменял автоматизацию бизнес-процессов.
На лекции обсудим:
🔸 как встроить процесс внедрения ИИ в разработку IT-продукта;
▪️ проблемы и возможности применения ИИ в автоматизации деятельности пользователей;
🔸 как создать дополнительную ценность продукта при помощи ИИ;
▪️ ограничения и преимущества использования Open Source LLM;
🔸 кейсы реализации.
Смотрите трансляцию на YouTube-канале AI4Dev и задавайте вопросы в чате — ответим сразу после лекции в прямом эфире!
На лекции обсудим:
Смотрите трансляцию на YouTube-канале AI4Dev и задавайте вопросы в чате — ответим сразу после лекции в прямом эфире!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2
Андрей Карпаты (один из ведущих мировых разработчиков из мира нейросетей - основатель Open AI, Head of AI Tesla и т.д.) в январе 2023го написал в своих соц. сетях: "The hottest new programming language is English / Самый популярный новый язык программирования – английский"! Этот пост до сих пор висит у него в закреплённых.
А вот его пост три дня назад:
«Программирование меняется так быстро... Я пробую VS Code Cursor + Sonnet 3.5 вместо GitHub Copilot, и Cursor побеждает. За последние несколько дней большая часть моего «программирования» была на английском (промптинг, а затем просмотр и редактирование сгенерированного кода) и «полукодирования», когда вы пишете первый фрагмент кода, который вам нужен, может быть, немного комментируете его, чтобы LLM поняла задумку, а затем tab-tab-tab - автодополнение. И вот готов 100-строчный кусок кода который корректно работает, на что раньше уходило не меньше 10 минут.
Я все еще не привык к этому новому подходу. Я как будто заново учусь программировать, но я уже не могу себе представить, что вернусь к классическому «самостоятельному» программированию, что было единственной возможностью всего три года назад.»
Кстати, курс по prompt engineering от Anthropics можно найти здесь
А вот его пост три дня назад:
«Программирование меняется так быстро... Я пробую VS Code Cursor + Sonnet 3.5 вместо GitHub Copilot, и Cursor побеждает. За последние несколько дней большая часть моего «программирования» была на английском (промптинг, а затем просмотр и редактирование сгенерированного кода) и «полукодирования», когда вы пишете первый фрагмент кода, который вам нужен, может быть, немного комментируете его, чтобы LLM поняла задумку, а затем tab-tab-tab - автодополнение. И вот готов 100-строчный кусок кода который корректно работает, на что раньше уходило не меньше 10 минут.
Я все еще не привык к этому новому подходу. Я как будто заново учусь программировать, но я уже не могу себе представить, что вернусь к классическому «самостоятельному» программированию, что было единственной возможностью всего три года назад.»
Кстати, курс по prompt engineering от Anthropics можно найти здесь
👍4❤1
Перевели статью об автоматизации Code Review с LLM. В большой продуктовой компании LLM автоматически проверяет общие требования для каждого pull request - заголовки, описания, покрытие тестами, стили.
Полный лонгрид (на 7 мин) о том как это работает на Хабре.
Полный лонгрид (на 7 мин) о том как это работает на Хабре.
👍7
Компания Magic (работает над вычислениями с длинным контекстом для создания безопасного AGI в области кода) представила модель LTM-2-Mini (LTM - Long-Term Memory) с контекстным окном 100 миллионов токенов, это 10 миллионов строчек кода. По словам разработчиков, модель имеет большой потенциал для применения в разработке ПО. Например, для синтеза кода. Модели можно передать в контексте весь массив данных проекта: и уже готовый код, и документацию и библиотеки.
Кроме размера, Magic используют принципиально новый подход для оценки эффективности и обучения модели - HashHop. Вместо классической «иголки в стоге сена» - в большой текст (контекст) добавляют случайный факт («иглу») и просят модель найти его, в Magic настраивают модель на поиск пар случайных хешей или даже цепочек последовательностей хешей (Лайкните если интересно - сделаем статью, как это работает). В итоге (по утверждению Magic) модель способна к более сложным рассуждениям и удерживанию внимания в нескольких точках контекста по сравнению с традиционными моделями.
Magic заявляют, что получили $465 млн инвестиций и партнерство с Google Cloud и NVIDA. Не исключено, что учебники по RAG скоро можно будет сдать в макулатуру (такую цифровую макулатуру, где устаревшие PDF перерабатывают в байты для новых знаний). Ваш проект поместится в 10 млн. строчек кода?
Кроме размера, Magic используют принципиально новый подход для оценки эффективности и обучения модели - HashHop. Вместо классической «иголки в стоге сена» - в большой текст (контекст) добавляют случайный факт («иглу») и просят модель найти его, в Magic настраивают модель на поиск пар случайных хешей или даже цепочек последовательностей хешей (Лайкните если интересно - сделаем статью, как это работает). В итоге (по утверждению Magic) модель способна к более сложным рассуждениям и удерживанию внимания в нескольких точках контекста по сравнению с традиционными моделями.
Magic заявляют, что получили $465 млн инвестиций и партнерство с Google Cloud и NVIDA. Не исключено, что учебники по RAG скоро можно будет сдать в макулатуру (такую цифровую макулатуру, где устаревшие PDF перерабатывают в байты для новых знаний). Ваш проект поместится в 10 млн. строчек кода?
❤8🔥1
YouTube
Токенизация данных: зачем и как?
29 августа в 12:00 по МСК Владимир Крылов, доктор технических наук и научный консультант по применению ИИ в разработке ПО, рассказал о важной ступени конвейера обработки данных в генеративных предобученных трансформерных моделях – преобразования последовательности…
"Токенизация данных: зачем и как" — новая лекция доктора технических наук Владимира Крылова на нашем YouTube-канале. Есть и в виде подкаста.
Из лекции вы узнаете:
▪️ что такое токены и как работает токенизатор;
▪️ почему входной поток данных трансформера перед эмбеддингом представляют токенами, а не символами или словами;
▪️ как конструируются токены в больших мультимодальных моделях, работающих с изображениями и аудиопотоками.
Вы всегда можете задать вопрос в комментариях!
Из лекции вы узнаете:
Вы всегда можете задать вопрос в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
YouTube
Зачем нужен MLOps в вашем проекте?
30 августа в 12:00 по МСК Михаил Коротеев, заведующий кафедрой искусственного интеллекта в Финансовом университете при правительстве РФ, рассказал о роли MLOps в ИИ-проектах.
Из лекции узнаете:
- почему DevOps не работает в ИИ-проектах;
- три главных…
Из лекции узнаете:
- почему DevOps не работает в ИИ-проектах;
- три главных…
Михаил Коротеев, заведующий кафедрой искусственного интеллекта в Финансовом университете при правительстве РФ, рассказал о роли MLOps в ИИ-проектах.
В лекции:
▪️ почему DevOps не работает в ИИ-проектах;
▪️ три главных аспекта ML-инженерии;
▪️ жизненный цикл ИИ-проектов;
▪️ модели интеграции ИИ с прикладными приложениями;
▪️ модель зрелости ML-инфраструктуры.
Если неудобно смотреть, включайте наш подкаст!
В лекции:
Если неудобно смотреть, включайте наш подкаст!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Разобрал в небольшой статье на Habr как работает HashHop (бенчмарк для тренировки внимания LLM на всю информацию в контекстном окне, альтернатива «иголки в стоге сена»). При более внимательном рассмотрении анонс Magic.dev про их модель на 100 млн. токенов (был пост на прошлой неделе), увы, звучит не очень убедительно, но буду рад, если я ошибаюсь.
Хабр
Новый метод оценки HashHop вместо «иголка в стоге сена», RULER и 100 млн. токенов контекста
Посмотрим на анонс LLM с новым алгоритмом внимания, в контекстное окно которой можно поместить проект по разработке ПО целиком с библиотеками и документацией. Обсудим почему пока...
👍3
Replit, достаточно популярная Web-Based IDE, выпустили своего агента-программиста. Чуда кажется не произошло - агент бодро создает простые приложения на видео, но в комментариях пользователи пишут, что с чем-то более сложным, чем гостевая книга или расстановка точек на карте (как в примерах) агент не справляется даже после пяти итераций. Из интересного – вы можете сразу посмотреть на свое приложение (что-то типа Artifacts в Claude 3.5 Sonnet), и агент умеет деплоить приложение. Cам настроит окружение, создаст базы данных и т.д. Идея что у вас прямо в IDE, которая является совместной средой разработки, добавляется кроме копайлота еще и агент-подмастерье – кажется очень разумной, впрочем с серьезными задачами агенты пока, увы, не справляются.
Replit
Replit – Build apps and sites with AI
Replit is an AI-powered platform for building professional web apps and websites.
Только что появилась новая LLM от Open AI - встречайте!
Представляем OpenAI o1-preview — новую серию ИИ-моделей для решения сложных задач в науке, кодировании и математике. Модели тратят больше времени на размышления, улучшая процесс принятия решений и исправляя ошибки. Первая модель серии уже доступна в ChatGPT и API. На тестах модель превзошла GPT-4, решив 83% задач на отборочных экзаменах IMO (Международная математическая олимпиада) и достигнув 89 процентиль в соревнованиях Codeforces. Подробнее про исследования.
Модель в статусе preview и пока не имеет доступа к вебу, не работает с картинками и файлами. Так же у модели работают новые правила безопасности. В тестах по защите модель набрала 84 из 100 баллов. Подробности в исследованиях. Модель полезна для сложных задач в науке и разработке, таких как аннотирование данных или генерация формул.
Представляем OpenAI o1-preview — новую серию ИИ-моделей для решения сложных задач в науке, кодировании и математике. Модели тратят больше времени на размышления, улучшая процесс принятия решений и исправляя ошибки. Первая модель серии уже доступна в ChatGPT и API. На тестах модель превзошла GPT-4, решив 83% задач на отборочных экзаменах IMO (Международная математическая олимпиада) и достигнув 89 процентиль в соревнованиях Codeforces. Подробнее про исследования.
Модель в статусе preview и пока не имеет доступа к вебу, не работает с картинками и файлами. Так же у модели работают новые правила безопасности. В тестах по защите модель набрала 84 из 100 баллов. Подробности в исследованиях. Модель полезна для сложных задач в науке и разработке, таких как аннотирование данных или генерация формул.
Openai
Learning to reason with LLMs
We are introducing OpenAI o1, a new large language model trained with reinforcement learning to perform complex reasoning. o1 thinks before it answers—it can produce a long internal chain of thought before responding to the user.
Посмотрели, хитрые (и не очень) задачки из Linguistic Benchmark Questions вроде той что на картинке или про братьев и сестер новая OpenAI o1-preview решает - надо пробовать с программированием!
Подоспели первые комментарии от https://t.iss.one/sergiobulaev Сергея:
Сегодня она довольно часто думала больше минуты. А представьте, что будет, если она будет думать часами? Это ведь уже вполне реально представить.
Вот примеры промптов от OpenAI:
[CODE]
или
или
Кстати, через Open Router o1 доступна всем (прямо всем), если что.
Сергей Булаев AI 🤖 - об AI и не только
1. Не думайте о ней как об обычной чат-модели. Это полноценный агент, работающий самостоятельно. Используйте её как умного друга, которому вы отправляете сообщение с просьбой разобраться в вопросе. Она ответит продуманными разъяснениями, разложенными по шагам. (И да, не нужно просить её думать по шагам — она и так так делает.)
2. Запишите и спроектируйте свой промпт заранее, в заметках или с помощью другой модели. Сделайте его подробным, распишите шаги и процессы, дайте как можно больше полезной информации.
3. Используйте o1-mini для задач, не требующих обширных знаний, но требующих пошагового размышления.
4. o1 обычно выдаёт сначала части решения, а потом и полное решение. o1-mini — шаги решения.
5. Как бы смешно это ни казалось, когда просите что-то изменить или дополнить, потратьте время на чёткое объяснение. Модели будет проще рассуждать, опираясь на ваши пояснения.
Сегодня она довольно часто думала больше минуты. А представьте, что будет, если она будет думать часами? Это ведь уже вполне реально представить.
Вот примеры промптов от OpenAI:
Instructions:
- Given the React component below, change it so that nonfiction books have red
text.
- Return only the code in your reply
- Do not include any additional formatting, such as markdown code blocks
- For formatting, use four space tabs, and do not allow any lines of code to
exceed 80 columns
[CODE]
или
I want to build a Python app that takes user questions and looks them up in a
database where they are mapped to answers. If there ia close match, it retrieves
the matched answer. If there isn't, it asks the user to provide an answer and
stores the question/answer pair in the database. Make a plan for the directory
structure you'll need, then return each file in full. Only supply your reasoning
at the beginning and end, not throughout the code.
или
What are three compounds we should consider investigating to advance research
into new antibiotics? Why should we consider them?
Кстати, через Open Router o1 доступна всем (прямо всем), если что.
Сергей Булаев AI 🤖 - об AI и не только
👍3
Microsoft встроили в Visual Studio искусственный интеллект в механизм создания брейкпоинтов с условиями. IDE на прокачку, как в старом шоу на MTV: «Чтобы ты мог использовать LLM, когда дебажишь свой код написанный LLM, для проекта, использующего LLM».
Речь идет о брейкпоинтах со сложными условиями, в духе пропустить 5000 циклов for и отловить вызов функции с определёнными значениями параметров. Вот тут AI сам предложит вам эти самые значения (предположу, что ориентируясь на граничные значения допустимых диапазонов). Не уверен, что это очень полезная функция, но если рассматривать ее как часть процесса, в котором роботы сами пишут код и сами же исправляют ошибки, то начинает просматриваться ценность.
Речь идет о брейкпоинтах со сложными условиями, в духе пропустить 5000 циклов for и отловить вызов функции с определёнными значениями параметров. Вот тут AI сам предложит вам эти самые значения (предположу, что ориентируясь на граничные значения допустимых диапазонов). Не уверен, что это очень полезная функция, но если рассматривать ее как часть процесса, в котором роботы сами пишут код и сами же исправляют ошибки, то начинает просматриваться ценность.
Microsoft News
Supercharge C++ Debugging with AI-Generated breakpoint expressions
Learn how to use AI-generated expressions for conditional breakpoints and tracepoints in Visual Studio 2022 to debug your C++ code faster and easier than ever before.
🔥5
Если кто не знает, есть такое направление в разработке ПО называется Automated Program Repair (APR). Качество инструментов для фикса багов измеряется на бенчмарке QiixBugs. Исследователи попробовали пофиксить с помощью новых моделей OpenAI o1-preview и o1-mini. Получились такие результаты : в тестах последних итераций QiixBugs модель успешно исправила все 40 ошибок, превзойдя производительность предыдущих версий по различным показателям, таким как уровень успешного фикса и эффективность реагирования. Может теперь останутся только фичи, а багов не будет совсем? https://theministryofai.org/from-bugs-to-breakthroughs-how-gpt-01-is-revolutionizing-the-world-of-automated-code-repair/
Ministry Of AI - The Authoritative Place for AI Learning and Education
From Bugs to Breakthroughs: How GPT-01 is Revolutionizing the World of Automated Code Repair - Ministry Of AI
From Bugs to Breakthroughs: How GPT-01 is Revolutionizing the World of Automated Code Repair Hello, fellow developers and AI enthusiasts! Today, we're diving headfirst into the world of coding and bug-fixing through the lens of cutting-edge AI technology.…
👍9
Уже завтра, 3 октября, в 12:00 доктор технических наук Владимир Крылов расскажет о бенчмарках для LLM в своей новой лекции. Рассмотрим современные методы оценивания способностей больших языковых моделей решать различные задачи.
Вы узнаете:
🔸 какие бенчмарки для определения лучших моделей сейчас наиболее типичны;
🔸 как применяется шахматный рейтинг ELO для бенчмаркинга;
🔸 что такое Leaderboard Arena;
🔸 какие частные, но важные бенчмарки применяются для проблемно ориентированных моделей и мультимодальных LLM.
Подключайтесь! В этот раз будем транслировать не только на наш YouTubе, но и прямо здесь — в этот телеграм-канал. Выбирайте, где вам удобнее☺️
Вы узнаете:
Подключайтесь! В этот раз будем транслировать не только на наш YouTubе, но и прямо здесь — в этот телеграм-канал. Выбирайте, где вам удобнее
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17👏1
Многие приложения , работающие с локальными данными и использующие LLM, как правило содержат решения, основанные на RAG. Разработчиков может оказаться интересным ознакомиться с итогами недавно завершившегося РАГатона в https://github.com/trustbit/RAGathon . Есть все исходники победителей. Нет только самих данных. Но они доступны в Сети.
GitHub
GitHub - trustbit/RAGathon
Contribute to trustbit/RAGathon development by creating an account on GitHub.
❤4