Perplexity представили внутренний поиск по знаниям для бизнес клиентов. Теперь пользователи смогут одновременно искать информацию как в файлах своей организации, так и в интернете.
Кроме того, компания запускает Spaces (не только для бизнеса) - ИИ хабы для совместной работы, которые можно настроить под конкретные нужды команды, будь то исследовательский проект, подготовка коммерческих предложений или создание учебных материалов.
Новые возможности:
Для корпоративных клиентов Perplexity обещает высокий уровень безопасности и конфиденциальности данных. В ближайшем будущем планируется добавить интеграцию с Crunchbase и FactSet.
Кроме того, компания запускает Spaces (не только для бизнеса) - ИИ хабы для совместной работы, которые можно настроить под конкретные нужды команды, будь то исследовательский проект, подготовка коммерческих предложений или создание учебных материалов.
Новые возможности:
- Загружать и хранить файлы (поддерживаются форматы pdf, txt, csv, xlsx, pptx, docx)
- Искать информацию в файлах и в интернете
- Выбирать предпочтительную модель ИИ
- Задавать собственные инструкции для получения нужных ответов
- Приглашать других пользователей для совместной работы
Для корпоративных клиентов Perplexity обещает высокий уровень безопасности и конфиденциальности данных. В ближайшем будущем планируется добавить интеграцию с Crunchbase и FactSet.
Perplexity AI
Perplexity is a free AI-powered answer engine that provides accurate, trusted, and real-time answers to any question.
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Авторы Chatbot Arena выпустили бесплатное расширение для VS Code, которое даёт возможность тестировать LLM модели для программирования.
Copilot Arena предлагает на выбор несколько вариантов автодополнений от разных моделей. Кажется отдельная арена в виде плагина может поднять на новый уровень процесс оценки моделей для кода, особенно учитывая, что автодополнения не особенно охвачены бенчмарками, рейтингами и исследованиями. В режиме арены, с постоянно новыми пользовательскими данными нет конкретного набора задач (бенчмарка), на которых можно было бы переобучить (overfitting) модель ради попадания в топ рейтинга без реально хорошего результата, а значит результаты будут относительно точными.
PS: Не забывайте, что ваш код будет отправляться хостерам моделей на арене. Для опенсорсных проектов или личных экспериментов это вполне ок, но если вы создаете что-то коммерческое, наверняка вы подписывали договор, что никому не будете показывать ваш код.
Copilot Arena предлагает на выбор несколько вариантов автодополнений от разных моделей. Кажется отдельная арена в виде плагина может поднять на новый уровень процесс оценки моделей для кода, особенно учитывая, что автодополнения не особенно охвачены бенчмарками, рейтингами и исследованиями. В режиме арены, с постоянно новыми пользовательскими данными нет конкретного набора задач (бенчмарка), на которых можно было бы переобучить (overfitting) модель ради попадания в топ рейтинга без реально хорошего результата, а значит результаты будут относительно точными.
PS: Не забывайте, что ваш код будет отправляться хостерам моделей на арене. Для опенсорсных проектов или личных экспериментов это вполне ок, но если вы создаете что-то коммерческое, наверняка вы подписывали договор, что никому не будете показывать ваш код.
👍6
Anthropocene представил далеко идущую новаторскую новую возможность: использование LLM для работы с компьютером. Доступно сегодня в API , с разработчики могут направлять Клода на использование компьютеров так, как это делают люди, — глядя на экран, перемещая курсор, нажимая кнопки и печатая текст. Claude 3.5 Sonnet — первая передовая модель ИИ, предлагающая использование компьютера в публичной бета-версии. На данном этапе она все еще экспериментальная — порой громоздкая и подверженная ошибкам. Открыта бета-версия использование компьютера для получения отзывов от разработчиков и ожидается, что со временем эта возможность будет быстро улучшаться. Картина робот за клавиатурой компьютера стала реальностью.
Anthropic
Developing a computer use model
👍4
Денис Ширяев опубликовал первые результаты его "эмпирического тестирования" . С лету все выглядит сырым, но привлекательным! Что заметил из тестов:
– Агент отказывается писать комментарии или посты (в канал отказался постить, хотя нашел и я залогинился – должен был обозвать вас кожаными мешками)
– У него проблемы со скролом страницы поиска, и он так зависает (случайно попадает в футер и не знает что делать)
– Пока ощущения будто дурачка за компьютер посадил, но понятно куда идет
– Нашел мне место где можно выпить вкусного пива и отметил его на карте, всем пока.
– Агент отказывается писать комментарии или посты (в канал отказался постить, хотя нашел и я залогинился – должен был обозвать вас кожаными мешками)
– У него проблемы со скролом страницы поиска, и он так зависает (случайно попадает в футер и не знает что делать)
– Пока ощущения будто дурачка за компьютер посадил, но понятно куда идет
– Нашел мне место где можно выпить вкусного пива и отметил его на карте, всем пока.
👍3👏2
Завтра, 24 октября, в 12:00 доктор технических наук Владимир Крылов расскажет о программной оптимизации текстов (и промптов) в своей новой лекции. Она обещает быть очень насыщенной ☺️
Вы узнаете:
🔸 Как работают фреймворки TextGrad и DSPy?
🔸 Какие задачи позволяют решить эти технологии оптимизации?
🔸 Как строить RAG с использованием DSPy и что это позволяет достигнуть?
🔸 Как можно оценить перспективы использования технологий программной генерации промптов?
Подключайтесь! Будем транслировать на наш YouTubе и в этот телеграм-канал.
Вы узнаете:
Подключайтесь! Будем транслировать на наш YouTubе и в этот телеграм-канал.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤1🔥1
МТС вслед за Яндексом представили свой on-premise сервис генерации и автодополнения кода Kodify. Обещают: Генерация и автодополнение кода, Повышение продуктивности, Анализ и оптимизация кода, Многоязычная поддержка (пока Python и Java). Попробовать можно прямо на странице с описанием или запросить коммерческое предложение. Мы попробовали, и оно действительно что-то автопродлевает, а вот сгенерить код по описанию не удалось.
Попробуйте лучшие на сегодня многоязычные модели. Aya Expanse — семейство моделей с открытым весом для многоязычных возможностей; выпускает модель параметров 8B и 32B, включая одну из крупнейших на сегодняшний день коллекций многоязычных наборов данных. Aya Expanse 32B превосходит Gemma 2 27B, Mistral 8x22B и Llama 3.1 70B, модель в 2 раза больше ее. (статья | твит). Русский язык поддерживается.
29го октября вышел пост с итогами третьего квартала 2024го от Сундара Пичаи (CEO Google и Alphabet).
«Today, more than a quarter of all new code at Google is generated by AI, then reviewed and accepted by engineers. This helps our engineers do more and move faster.» Сегодня более четверти нового кода в Google создается искусственным интеллектом, затем проходит code review и принимается инженерами. Судя по информации, которая публиковалась ранее, для генерации кода в Google используют внутреннее решение, созданное посредством дообучения (fine tuning) Gemini на собственном репозитории кода.
«Today, more than a quarter of all new code at Google is generated by AI, then reviewed and accepted by engineers. This helps our engineers do more and move faster.» Сегодня более четверти нового кода в Google создается искусственным интеллектом, затем проходит code review и принимается инженерами. Судя по информации, которая публиковалась ранее, для генерации кода в Google используют внутреннее решение, созданное посредством дообучения (fine tuning) Gemini на собственном репозитории кода.
В лекции рассматриваем ключевые аспекты разработки и развертывания систем на основе машинного обучения: выбор компонентов и их интеграции, управление данными, оркестрацию важных этапов жизненного цикла ML-проектов, от исследования данных и разработки модели до её масштабирования и поддержки на этапе эксплуатации.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Просим обратной связи
Как вы знаете, доктор технических наук В. В. Крылов каждый месяц читает лекции о развитии и применении ИИ на нашем YouTube-канале. Сейчас выбираем тему для следующей, ноябрьской, лекции. Пожалуйста, напишите в комментариях, о чём вы хотели бы узнать, и/или проголосуйте за самую интересную тему ниже.
Владимир Владимирович и вся команда AI4Dev будут рады услышать ваше мнение!
Как вы знаете, доктор технических наук В. В. Крылов каждый месяц читает лекции о развитии и применении ИИ на нашем YouTube-канале. Сейчас выбираем тему для следующей, ноябрьской, лекции. Пожалуйста, напишите в комментариях, о чём вы хотели бы узнать, и/или проголосуйте за самую интересную тему ниже.
Владимир Владимирович и вся команда AI4Dev будут рады услышать ваше мнение!
Какую лекцию сделать в ноябре?
Anonymous Poll
30%
Нейропсихология больших языковых моделей
32%
Как выглядят слова внутри нейросети
38%
Мир — это текст? Всё ли могут знать большие языковые модели
"Мощь ИИ в вашем ПК: генеративные модели на потребительском оборудовании" — лекция СТО компании Raft Александра Константинова на нашем YouTube-канале.
Вы узнаете, как разворачивать и использовать модели Llama 3.1 на видеокартах вроде RTX 4090 и получить преимущества ИИ прямо у себя дома или в офисе.
➡️ Лекция есть в виде подкаста.
Вы узнаете, как разворачивать и использовать модели Llama 3.1 на видеокартах вроде RTX 4090 и получить преимущества ИИ прямо у себя дома или в офисе.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
"TextGrad и DSPy: программная оптимизация промптов" — новая лекция доктора технических наук Владимира Крылова на нашем YouTube-канале. Есть в виде подкаста.
Из лекции вы узнаете:
🔸 Как работают фреймворки TextGrad и DSPy?
🔸 Какие задачи позволяют решить эти технологии оптимизации?
🔸 Как строить RAG с использованием DSPy и что это позволяет достигнуть?
🔸 Как можно оценить перспективы использования технологий программной генерации промптов?
Появились вопросы — задавайте в комментариях!
Из лекции вы узнаете:
Появились вопросы — задавайте в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
GitHub Next анонсировали запуск AI агента создающего веб приложения - Spark. Подобные заявления мы, конечно, уже слышали десятки раз, но не от таких уважаемых компаний. Заявление гораздо более скромное чем все предыдущие Devinы, Devikи и прочие SWE агенты и в то же время кажется достаточно перспективное. Речь идет не об универсальном агенте, а скорее о платформе для создания мини приложений, которые выполняют буквально одну функцию, например "Карточки для заучивания иностранных слов". В основе концепции 4 главных идеи:
• Встроенный хостинг
• Готовые темы для дизайна
• Наличие хранилища данных
• Возможность встраивать LLM в приложение
Вы набрасываете в чате идею вашего приложения, уточняете в несколько итераций, подстраиваете дизайн и делитесь с друзьями. Залезать в код руками тоже можно, но акцент не на этом.
Те кто застал интернет до социальных сетей возможно вспомнят эпоху так называемых «хомяков» - homepage, т.е. домашних страниц пользователей на проектах типа narod.ru. Кажется, GitHub изобрел что-то подобное, только в 2024м и на новый лад, теперь это HomeApp. Мы, конечно, записались в вейтлист!
• Встроенный хостинг
• Готовые темы для дизайна
• Наличие хранилища данных
• Возможность встраивать LLM в приложение
Вы набрасываете в чате идею вашего приложения, уточняете в несколько итераций, подстраиваете дизайн и делитесь с друзьями. Залезать в код руками тоже можно, но акцент не на этом.
Те кто застал интернет до социальных сетей возможно вспомнят эпоху так называемых «хомяков» - homepage, т.е. домашних страниц пользователей на проектах типа narod.ru. Кажется, GitHub изобрел что-то подобное, только в 2024м и на новый лад, теперь это HomeApp. Мы, конечно, записались в вейтлист!
👍7🔥1
Microsoft представляет Magentic-One, новую универсальную многоагентную систему, предназначенную для обработки сложных веб- и файловых задач.
Она использует агент Orchestrator, который управляет четырьмя специализированными агентами: WebSurfer для операций браузера, FileSurfer для управления файлами, Coder для задач программирования и ComputerTerminal для консольных операций.
Magentic-One достигает конкурентоспособной производительности в нескольких тестах, включая GAIA, AssistantBench и WebArena, без необходимости внесения изменений в свою базовую архитектуру.
Созданная на основе фреймворка AutoGen от Microsoft, Magentic-One использует уникальную двухконтурную архитектуру, в которой Orchestrator управляет как задачами, так и регистрами прогресса.
Система имеет открытый исходный код, как и AutoGenBench, новый инструмент оценки для тестирования систем на основе агентов.
Пока еще может рано, но это новое движение по созданию универсальных агентных систем — то, за чем стоит следить. Кроме того, другие текущие приложения на основе LLM, такие как RAG, также выиграют от этого типа системы, которая строится поверх нескольких специализированных агентов.
https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/
Она использует агент Orchestrator, который управляет четырьмя специализированными агентами: WebSurfer для операций браузера, FileSurfer для управления файлами, Coder для задач программирования и ComputerTerminal для консольных операций.
Magentic-One достигает конкурентоспособной производительности в нескольких тестах, включая GAIA, AssistantBench и WebArena, без необходимости внесения изменений в свою базовую архитектуру.
Созданная на основе фреймворка AutoGen от Microsoft, Magentic-One использует уникальную двухконтурную архитектуру, в которой Orchestrator управляет как задачами, так и регистрами прогресса.
Система имеет открытый исходный код, как и AutoGenBench, новый инструмент оценки для тестирования систем на основе агентов.
Пока еще может рано, но это новое движение по созданию универсальных агентных систем — то, за чем стоит следить. Кроме того, другие текущие приложения на основе LLM, такие как RAG, также выиграют от этого типа системы, которая строится поверх нескольких специализированных агентов.
https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/
Microsoft Research
Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks - Microsoft Research
By Adam Fourney, Principal Researcher; Gagan Bansal, Senior Researcher; Hussein Mozannar, Senior Researcher; Victor Dibia, Principal Research Software Engineer; Saleema Amershi, Partner Research Manager Contributors: Adam Fourney, Gagan Bansal, Hussein Mozannar…
👍5🔥3
Хорошая новость для тех, кто любит кодить на вершине горы Эверест, в Марианской впадине или из пасти дикого льва в африканской саванне (там, где качество доступа в интернет оставляет желать лучшего). Qwen 2.5.1 Coder 7B!
На днях в сеть (похоже случайно) утекла новая версия модели для программирования от Alibaba, а сегодня ее уже выложили официально. Эта модель весом в 7 миллиардов параметров демонстрирует очень достойные результаты на бенчмарке редактирования кода Aider: всего на несколько процентов отстает от GPT-4-1106-preview (модель от 6 ноября 2023), но работает полностью оффлайн! Находка для тех, кто хочет иметь под рукой мощную языковую модель без необходимости постоянного подключения к сети. Официальная версия тут (там вся линейка новых моделей и полные и 7B в том числе). Утекшая версия тут, но т.к. вышла официальная то смысла в ней особенно нет.
На днях в сеть (похоже случайно) утекла новая версия модели для программирования от Alibaba, а сегодня ее уже выложили официально. Эта модель весом в 7 миллиардов параметров демонстрирует очень достойные результаты на бенчмарке редактирования кода Aider: всего на несколько процентов отстает от GPT-4-1106-preview (модель от 6 ноября 2023), но работает полностью оффлайн! Находка для тех, кто хочет иметь под рукой мощную языковую модель без необходимости постоянного подключения к сети. Официальная версия тут (там вся линейка новых моделей и полные и 7B в том числе). Утекшая версия тут, но т.к. вышла официальная то смысла в ней особенно нет.
🔥6👍2