В этой статье мы разберем 12 задач, которые помогут лучше понять применение теории вероятностей на практике с использованием Python.
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
✔ DeepHermes-3 Preview
Новый LLM, который объединяет возможности логического рассуждения и интуитивного языка. Модель использует новые данные для рассуждений на основе Hermes 3 Datamix, позволяет включать или выключать длинные цепочки рассуждений, обеспечивая точность за счет большего времени на вычисления. Это большое преимущество перед другими моделями, так как дает гибкость в выборе требуемой точности, при этом экономя ресурсы, если цепочка рассуждений не нужна.
▪ DeepHermes-3 Preview.
@machinelearning_interview
Новый LLM, который объединяет возможности логического рассуждения и интуитивного языка. Модель использует новые данные для рассуждений на основе Hermes 3 Datamix, позволяет включать или выключать длинные цепочки рассуждений, обеспечивая точность за счет большего времени на вычисления. Это большое преимущество перед другими моделями, так как дает гибкость в выборе требуемой точности, при этом экономя ресурсы, если цепочка рассуждений не нужна.
▪ DeepHermes-3 Preview.
@machinelearning_interview
Forwarded from Machinelearning
Oumi - открытая платформа для разработки, файнтюна, оценки и экспериментов с языковыми и мультимодальными моделями, созданная совместными усилиями исследователей из 13 ведущих университетов.
Oumi предоставляет инструменты и рабочие процессы для разработки и запуска масштабных экспериментов на кластере, развертывания моделей в рабочей среде и поддерживает методы распределенного обучения (FSDP, DDP):
В репозитории проекта собраны готовые ноутбуки и скрипты для каждого из этапов жизненного цикла моделей, а подробная документация по использованию поможет легко освоить эту платформу.
@ai_machinelearning_big_data
#AI #ML #Oumi #Framework
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
Курс содержит пошаговые инструкции с примерами кода, которые помогут научиться создавать автономных агентов с использованием машинного обучения.
Фокус на AI-агентах:
Если вас интересует именно разработка агентов — например, для симуляций, игр или интерактивных систем — данный курс будет полезен.
Каждый урок включает в себя:
- Лекцию, (видео уроки появятся в марте 2025 года)
- Примеры кода на Python с поддержкой Azure AI Foundry и Github Models
- Практические задания
- Ссылки на полезные дополнительные ресурсы
Если это ваш первый опыт работы с агентами, у Microsoft есть еще 1 курс «Генеративный ИИ для начинающих», который содержит 21 урок по построению моделей с помощью GenAI, лучше начать с него.
Переведен на 9 различных языков (русского нет).
▪ Github
@ai_machinelearning_big_data
#course #Microsoft #aiagents #ai #ml #opensource #freecourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
⭐️ Awesome-LLM-Synthetic-Data - курируемый список ресурсов, инструментов и исследований, связанных с использованием синтетических данных для больших языковых моделей (LLM).
Чем полезен:
- Централизованная база знаний:
Вместо того чтобы самостоятельно искать статьи, библиотеки и исследования по синтетическим данным, здесь собрана готовая, структурированная подборка материалов.
- Актуальные инструменты и методы:
Репозиторий включает ссылки на инструменты для генерации синтетических данных, методы оценки их качества и примеры интеграции в пайплайны обучения LLM. Для практикующего специалиста это может стать источником идей для оптимизации процессов обучения и экспериментов с новыми методами.
- Поддержка исследований и разработки:
Если ваша работа связана с решением проблем, где реальных данных не хватает или данные зашумлены, использование синтетически данных может значительно улучшить результаты. Этот репозиторий поможет изучить современные подходы к генерации и использованию синтетических данных, что особенно актуально при разработке и тестировании новых моделей.
▪ Github
@machinelearning_interview
Чем полезен:
- Централизованная база знаний:
Вместо того чтобы самостоятельно искать статьи, библиотеки и исследования по синтетическим данным, здесь собрана готовая, структурированная подборка материалов.
- Актуальные инструменты и методы:
Репозиторий включает ссылки на инструменты для генерации синтетических данных, методы оценки их качества и примеры интеграции в пайплайны обучения LLM. Для практикующего специалиста это может стать источником идей для оптимизации процессов обучения и экспериментов с новыми методами.
- Поддержка исследований и разработки:
Если ваша работа связана с решением проблем, где реальных данных не хватает или данные зашумлены, использование синтетически данных может значительно улучшить результаты. Этот репозиторий поможет изучить современные подходы к генерации и использованию синтетических данных, что особенно актуально при разработке и тестировании новых моделей.
▪ Github
@machinelearning_interview
⚡️ Разбор собеседования по машинному обучению в Озон 2025
https://uproger.com/razbor-sobesedovaniya-po-mashinnomu-obucheniyu-v-ozon-2025/
@machinelearning_interview
https://uproger.com/razbor-sobesedovaniya-po-mashinnomu-obucheniyu-v-ozon-2025/
@machinelearning_interview
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
Проект объединяет использование LLM, векторные базы данных для выполнения задач поиска, оценки, ризонинга на основе предоставленных данных (файлы, текст, источники).
Позиционируется разработчиками как инструмент для управления знаниями предприятия, интеллектуальных QA-систем и сценариев поиска информации.
DeepSearcher умеет использовать при необходимости информацию из интернета, совместим с векторными базами Milvus и их сервис-провайдером Zilliz Cloud, эмбедингами Pymilvus, OpenAI и VoyageAI. Есть возможность подключения LLM DeepSeek и OpenAI по API напрямую или через TogetherAI и SiliconFlow.
Поддерживается локальная загрузка файлов, подключение веб-краулеров FireCrawl, Crawl4AI и Jina Reader.
В ближайших планах - добавление возможности веб-клиппера, расширение списка поддерживаемых векторных баз, создание RESTful API интерфейса.
# Clone the repository
git clone https://github.com/zilliztech/deep-searcher.git
# Create a Python venv
python3 -m venv .venv
source .venv/bin/activate
# Install dependencies
cd deep-searcher
pip install -e .
# Quick start demo
from deepsearcher.configuration import Configuration, init_config
from deepsearcher.online_query import query
config = Configuration()
# Customize your config here
config.set_provider_config("llm", "OpenAI", {"model": "gpt-4o-mini"})
init_config(config = config)
# Load your local data
from deepsearcher.offline_loading import load_from_local_files
load_from_local_files(paths_or_directory=your_local_path)
# (Optional) Load from web crawling (`FIRECRAWL_API_KEY` env variable required)
from deepsearcher.offline_loading import load_from_website
load_from_website(urls=website_url)
# Query
result = query("Write a report about xxx.") # Your question here
@ai_machinelearning_big_data
#AI #ML #Agents #DeepSearcher
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM