Machine learning Interview
34.3K subscribers
1.36K photos
105 videos
13 files
920 links
Разбираем вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейронным сетям, Python.

Вопросы - @notxxx1


@itchannels_telegram -🔥лучшие it каналы

РКН: clck.ru/3FmwRz
Download Telegram
🧠 Hallucination Risk Toolkit for LLMs

Этот инструмент позволяет оценивать риск галлюцинаций в больших языковых моделях без повторного обучения. Он преобразует запросы, используя закон декомпрессии, чтобы определить, стоит ли отвечать или отказываться, основываясь на целевом уровне обслуживания.

🚀Основные моменты:
- Оценка риска галлюцинаций с помощью математической модели.
- Поддержка двух режимов: с контекстом и без.
- Использует только API Chat Completions от OpenAI.
- Прозрачные математические расчеты для принятия решений.

📌 GitHub: https://github.com/leochlon/hallbayes

#python
10👍8🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Генерация видео из кода с Code2Video

Code2Video предлагает инновационный подход к созданию образовательных видео на основе кода. Проект позволяет визуализировать программные концепции, превращая код в наглядные видеоматериалы, что упрощает обучение и понимание.

🚀Основные моменты:
- Генерация видео на основе программного кода.
- Поддержка различных учебных тем.
- Визуализация сложных концепций в доступной форме.
- Открытый доступ к проекту и данным.

📌 GitHub: https://github.com/showlab/Code2Video

#python
🔥2310😁3😭3🥰1
🧠 LIMIT: Исследование пределов извлечения на основе эмбеддингов

Репозиторий содержит набор данных LIMIT, созданный для проверки моделей эмбеддингов на теоретических принципах. Исследование показывает, что даже современные модели не могут вернуть определенные документы, подчеркивая ограничения текущего подхода с использованием одно-векторных эмбеддингов.

🚀Основные моменты:
- Набор данных для тестирования моделей эмбеддингов.
- Включает 50k документов и 1000 запросов.
- Подчеркивает теоретические ограничения извлечения информации.
- Код для генерации данных и экспериментов доступен в репозитории.

📌 GitHub: https://github.com/google-deepmind/limit

#python
👍98🥰1
🎙️ VoxCPM: Инновационная TTS-система для реалистичной генерации речи

VoxCPM — это передовая система синтеза речи без токенизации, обеспечивающая контекстно-осознанное создание речи и точное клонирование голоса. Она использует диффузионную архитектуру для генерации непрерывных представлений речи, что позволяет достичь высокой выразительности и стабильности.

🚀Основные моменты:
- Контекстно-осознанная генерация речи с естественной интонацией.
- Точное клонирование голоса с минимальным количеством образцов.
- Высокая эффективность синтеза, поддержка потоковой передачи.

📌 GitHub: https://github.com/OpenBMB/VoxCPM

#python
15👍8🔥1
🤖 Многоагентная система кодинга

Этот проект представляет собой многоагентную ИИ-систему, которая использует оркестратор для координации работы исследовательских и кодирующих агентов. Оркестратор разбивает задачи на подзадачи и управляет процессом, обеспечивая стратегический подход к решению задач.

🚀 Основные моменты:
- Достижения: 12-е место в TerminalBench, превосходя Claude Code.
- Оркестратор управляет делегированием и верификацией задач.
- Агенты работают с уникальными контекстами и инструментами.
- Инновационный подход к совместному использованию знаний через контекстный хранилище.

📌 GitHub: https://github.com/Danau5tin/multi-agent-coding-system

#python
10👍6🔥4