Perplexity запустила обновленную версию поисковой модели Sonar, которая основана на Llama 3.3 70B и работает на мощностях от Cerebras Systems. Внутренние тесты, проведенные Perplexity показали, что Sonar превосходит GPT-4o mini и Claude 3.5 Haiku по удовлетворенности пользователей и сравнивается с GPT-4o и Claude 3.5 Sonnet в поисковых задачах.
Cerebras Systems использует уникальные Wafer Scale Engines, позволяющие Sonar обрабатывать 1200 токенов в секунду, что дает почти мгновенные ответы. Доступ к Sonar ограничен для платных пользователей Pro, но Perplexity планирует сделать его более широко доступным в будущем.
perplexity.ai
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье мы разберем 12 задач, которые помогут лучше понять применение теории вероятностей на практике с использованием Python.
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
✔ DeepHermes-3 Preview
Новый LLM, который объединяет возможности логического рассуждения и интуитивного языка. Модель использует новые данные для рассуждений на основе Hermes 3 Datamix, позволяет включать или выключать длинные цепочки рассуждений, обеспечивая точность за счет большего времени на вычисления. Это большое преимущество перед другими моделями, так как дает гибкость в выборе требуемой точности, при этом экономя ресурсы, если цепочка рассуждений не нужна.
▪ DeepHermes-3 Preview.
@machinelearning_interview
Новый LLM, который объединяет возможности логического рассуждения и интуитивного языка. Модель использует новые данные для рассуждений на основе Hermes 3 Datamix, позволяет включать или выключать длинные цепочки рассуждений, обеспечивая точность за счет большего времени на вычисления. Это большое преимущество перед другими моделями, так как дает гибкость в выборе требуемой точности, при этом экономя ресурсы, если цепочка рассуждений не нужна.
▪ DeepHermes-3 Preview.
@machinelearning_interview
Forwarded from Machinelearning
Oumi - открытая платформа для разработки, файнтюна, оценки и экспериментов с языковыми и мультимодальными моделями, созданная совместными усилиями исследователей из 13 ведущих университетов.
Oumi предоставляет инструменты и рабочие процессы для разработки и запуска масштабных экспериментов на кластере, развертывания моделей в рабочей среде и поддерживает методы распределенного обучения (FSDP, DDP):
В репозитории проекта собраны готовые ноутбуки и скрипты для каждого из этапов жизненного цикла моделей, а подробная документация по использованию поможет легко освоить эту платформу.
@ai_machinelearning_big_data
#AI #ML #Oumi #Framework
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
Курс содержит пошаговые инструкции с примерами кода, которые помогут научиться создавать автономных агентов с использованием машинного обучения.
Фокус на AI-агентах:
Если вас интересует именно разработка агентов — например, для симуляций, игр или интерактивных систем — данный курс будет полезен.
Каждый урок включает в себя:
- Лекцию, (видео уроки появятся в марте 2025 года)
- Примеры кода на Python с поддержкой Azure AI Foundry и Github Models
- Практические задания
- Ссылки на полезные дополнительные ресурсы
Если это ваш первый опыт работы с агентами, у Microsoft есть еще 1 курс «Генеративный ИИ для начинающих», который содержит 21 урок по построению моделей с помощью GenAI, лучше начать с него.
Переведен на 9 различных языков (русского нет).
▪ Github
@ai_machinelearning_big_data
#course #Microsoft #aiagents #ai #ml #opensource #freecourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
⭐️ Awesome-LLM-Synthetic-Data - курируемый список ресурсов, инструментов и исследований, связанных с использованием синтетических данных для больших языковых моделей (LLM).
Чем полезен:
- Централизованная база знаний:
Вместо того чтобы самостоятельно искать статьи, библиотеки и исследования по синтетическим данным, здесь собрана готовая, структурированная подборка материалов.
- Актуальные инструменты и методы:
Репозиторий включает ссылки на инструменты для генерации синтетических данных, методы оценки их качества и примеры интеграции в пайплайны обучения LLM. Для практикующего специалиста это может стать источником идей для оптимизации процессов обучения и экспериментов с новыми методами.
- Поддержка исследований и разработки:
Если ваша работа связана с решением проблем, где реальных данных не хватает или данные зашумлены, использование синтетически данных может значительно улучшить результаты. Этот репозиторий поможет изучить современные подходы к генерации и использованию синтетических данных, что особенно актуально при разработке и тестировании новых моделей.
▪ Github
@machinelearning_interview
Чем полезен:
- Централизованная база знаний:
Вместо того чтобы самостоятельно искать статьи, библиотеки и исследования по синтетическим данным, здесь собрана готовая, структурированная подборка материалов.
- Актуальные инструменты и методы:
Репозиторий включает ссылки на инструменты для генерации синтетических данных, методы оценки их качества и примеры интеграции в пайплайны обучения LLM. Для практикующего специалиста это может стать источником идей для оптимизации процессов обучения и экспериментов с новыми методами.
- Поддержка исследований и разработки:
Если ваша работа связана с решением проблем, где реальных данных не хватает или данные зашумлены, использование синтетически данных может значительно улучшить результаты. Этот репозиторий поможет изучить современные подходы к генерации и использованию синтетических данных, что особенно актуально при разработке и тестировании новых моделей.
▪ Github
@machinelearning_interview