Machine learning Interview
24.4K subscribers
1.04K photos
69 videos
12 files
700 links
Разбираем вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейронным сетям, Python.

Вопросы - @notxxx1


@itchannels_telegram -🔥лучшие it каналы

РКН: clck.ru/3FmwRz
Download Telegram
⚡️ Advanced Machine Learning Engineer Roadmap

Full Stack ML (Machine Learning) включает в себя изучение необходимых навыков и технологий, чтобы освоить машинное обучения.

🖥 Github
Please open Telegram to view this post
VIEW IN TELEGRAM
📖 В Яндексе рассказали, как учат YandexGPT понимать культурный контекст

🌟 Чтобы оценить, как модель считывает особенности нашей культуры, команда разработала большой бенчмарк — для этого потребовалось оцифровать и классифицировать понятие “культурный код”. Также для создания бенчмарка выяснили, понимает ли нейросеть цитаты и мемы, что помогло составить тестовый бенч на 200 вопросов. Позже он расширился в 2000 вопросов, на которые ответили AI-тренеры — их результаты были отобраны в средний скор, ставший контрольной группой для сравнения с ответами Yandex GPT.

🔗 Ссылка: *клик*

@machinelearning_interview

#AI #ML
Please open Telegram to view this post
VIEW IN TELEGRAM
✔️ NVIDIA LogitsProcessor — библиотека для управления генерацией текста с помощью модификации вероятностного распределения токенов.

NVIDIA опубликовала LogitsProcessorZoo, коллекцию гибких и мощных инструментов для обработки логитов, позволяющих решать задачи контроля длины последовательностей, выделения ключевых фраз или управление ответами с несколькими вариантами.

Библиотека позволяет корректировать логиты, предоставляя возможность контроля над поведением модели. Например, GenLengthLogitsProcessor позволяет изменять длину генерируемого текста, CiteFromPromptLogitsProcessor - стимулирует модель использовать вводные данные, а ForceLastPhraseLogitsProcessor включает заданную фразу перед завершением вывода. Библиотека полностью совместима с методом generate из Transformers.

huggingface.co

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
⚡️ QVQ-72B-Preview: VLM с ризонингом от Qwen.

QVQ-72B-Preview - экспериментальная VLM на основе Qwen2-VL-72B , разработанная Qwen, со способностями к аналитическому мышлению и новым уровнем когнитивных навыков.

Проведенная в Qwen оценка QVQ-72B-Preview на бенчмарках MMMU, MathVista, MathVision и OlympiadBench показала результат 70.3 на MMMU, 71.4 на MathVista, 35.9 в MathVision и 20.4 на наборе OlympiadBench, подчеркнув ее способность к комплексному пониманию и рассуждению в мультидисциплинарных задачах.

⚠️ Несмотря на высокие результаты, QVQ-72B-Preview - предварительная версия модели, которая имеет ограничения:

🟠возможность смешения языков и переключения между ними;
🟠склонность к зацикливанию в логических рассуждениях;
🟠постепенная потеря концентрации на визуальном контенте при многоступенчатом рассуждении, что может приводить к галлюцинациям.

Неофициальные квантованные версии QVQ-72B-Preview в формате GGUF с диапазоном разрядностей от 1-bit (23.7GB) до 8-bit (77.26GB) и MLX-версии от mlx community в разрядностях от 4-bit до 16-bit.

📌Лицензирование: Qwen License.


🟡Статья
🟡Модель
🟡Demo
🟡Набор GGUF
🟡Набор MLX
🟡Сообщество в Discord
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #VLM #Qwen #Reasoning
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
✔️ AGUVIS: платформа для автономных агентов GUI на основе компьютерного зрения.

Salesforce Research представил AGUVIS, фреймворк, использующий компьютерное зрение для автономных агентов GUI пользователя, работающего с web, mobile и PC-интерфейсами. AGUVIS использует единые визуальные данные и согласованное пространство действий для повышения обобщаемости в GUI-средах.

Модель обладает возможностями планирования и рассуждения и использует набор траекторий агентов GUI с многомодальным основанием. AGUVIS показал среднюю точность 89,2% в GUI-задачах, превзойдя другие методы, и снижение затрат на вывод на 93% по сравнению с GPT-4o.
Веса модели и код инференса - в планах, код для тренировки, траектории планирования и рассуждений доступны на Github.
aguvis-project.github.io

✔️ Google повела итоги года в области ИИ: 60 главных анонсов 2024 года.

Google подвела итоги 2024 года, отметив значительный прогресс в области развития технологий ИИ. За год было сделано 60 крупных анонсов: в начале 2024 года были представлены обновления для Gemini, Chrome, Pixel и Search и функция Circle to Search. В феврале дебютировала модель Gemini 1.5, а Bard стал Gemini. В марте акцент был сделан на использовании ИИ в здравоохранении, а в мае на конференции Google I/O были представлены новые продукты и функции на базе ИИ.

В течение года Google запустила новые инструменты для Google Workspace, образования, перевода, поиска и покупок. В декабре была представлена Gemini 2.0, модель нового поколения наступающей агентной эры ИИ.
blog.google

✔️ Лазерный искусственный нейрон имитирует функции нервных клеток со скоростью света.

Исследователи Университета Гонконга разработали лазерный искусственный нейрон, который полностью имитирует функции, динамику и обработку информации биологического градиентного нейрона. Новая разработка достигает скорости обработки сигнала в 10 ГБод, что в миллиард раз быстрее, чем у биологических аналогов.

Лазерный градиентный нейрон преодолевает ограничения скорости фотонных версий спайковых нейронов и имеет потенциал для еще более быстрой работы. Ученые использовали его для создания системы резервуарных вычислений, которая демонстрирует исключительную производительность в задачах распознавания образов и прогнозирования последовательностей. Тестовая среда обработала данные 100 миллионов сердечных сокращений или 34,7 миллиона рукописных цифровых изображений всего за одну секунду.
eurekalert.org

✔️ xAI выпустила мобильное приложение Grok для iOS с возможностью генерации изображений.

xAI выпустила Grok для iOS, которое в настоящее время находится на стадии бета-тестирования в Австралии и некоторых других регионах. Приложение имитирует основные функции Grok и использует модель искусственного интеллекта Grok-2.

Приложение может переписывать и обобщать текст, отвечать на вопросы и создавать изображения на основе текстовых запросов, а также получать доступ к данным из интернета и X в режиме реального времени. Одной из отличительных особенностей Grok - возможность генерации изображений, которая не имеет таких строгих ограничений, как у некоторых конкурентов, и позволяет анализировать изображения, загруженные пользователями.
techradar.com

✔️ Соучредитель Anthropic прогнозирует "еще более резкий" прогресс в развитии ИИ в 2025 году.

Джек Кларк, соучредитель Anthropic, в своей публикации на LinkedIn предположил, что в 2025 году темпы развития ИИ значительно ускорятся, благодаря сочетанию традиционных методов масштабирования моделей и масштабирования вычислительных ресурсов во время выполнения, используемое в моделях o-серии OpenAI. Кларк уверен, что сочетание традиционного масштабирования с новыми методами приведет к "еще более резким" достижениям в области ИИ в 2025 году.

Anthropic пока не выпустила модель, конкурирующую с o-серией OpenAI или Gemini от Google. Их модель Opus 3.5 была отложена из-за высоких затрат, но она помогла в разработке Sonnet 3.5.
the-decoder.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥Актуальные плейлисты и руководства для дата сайентистов.

1. Полный плейлист по аналитике данных и науке о данных на Python
100 вопросов с собеседований Python
100 вопросов с собеседований Python Часть 2
Лучшие бесплатные курсы и книги по Python
Python. Разбор реальных вопросов.
Python на английском языке
Тинькофф разбор заданий на стажировку
Плейлист на русском

100 вопросов c собесов в Data Science и ML

100 вопросов с собеседований Data Science
Вопросы с собеседований Читать
Data Science разбор реальной задачи с собеседования

2. Плейлист по статистике для аналитики данных и науки о данных
Математика машинного обучения полный курс
Лекции и семинары по курсу "Математическая статистика" на русском
. Статистика на английском языке
Плейлист статистики на английском языке

3. Полный SQL для аналитики и науки о данных
Полный плейлист по SQl на английском языке
Базовый курс по SQL для аналитиков и менеджеров на русском

4. Учебники по Git и Github
Учебники по Git и Github на английском языке
Git курс

5. EDA и Feature Engineering и Feature Selection
Плейлист по Feature Engineering
Выбор функций

6. Плейлист по машинному обучению
Плейлист курс ML на английском языке
Новый плейлист курс ML на английском языке.
Машинное обучение на английском языке:
Машинное обучение на русском

7. Полный плейлист по глубокому обучению и NLP
NLP плейлист
Полный плейлист NLP Live на английском языке

8. Важные фреймворки для производственных развертываний
Подробный плейлист по Flask на английском языке
BentoML Tutorial
Gradio Crash Course

9. Полный комплект инструментов AWS Sagemaker и Sagemaker Studio
Плейлист Sagemaker

10. Полное руководство по MLOPS
Полный комплект Dockers In One Shot Английский язык
Учебные пособия MLFLOW с развертыванием
Мониторинг модели Evidently AI

11. Конечные проекты ML, DL и NLP - весь жизненный цикл до развертывания с использованием инструментов с открытым исходным кодом
Плейлист End To End ML Projects на английском языке

12. Генеративный ИИ и открытый ИИ Плейлист
OPENAI Playlist English(In Progress)
Langchain Playlist(In Progress)
Полное руководство по Pyspark
Плейлист Pyspark

@machinelearning_interview
🎄 С Новым годом!

Желаем вам всего самого лучшего в году 1³ + 2³ + 3³ + 4³ + 5³ + 6³ + 7³ + 8³ + 9³.

@machinelearning_interview
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Hugging Face выпустили библиотеку «smolagents», которая позволяет легко создавать AI-агентов, требуя минимум усилий и кода.

Библиотека поддерживает модели от OpenAI и Anthropic, а также модели, доступные на платформе Hugging Face Hub.

Это минималистичная библиотека для создания умных агентов, которые выполняют свои задачи, генерируя и исполняя Python-код!

🌟 Агенты могут взаимодействовать с инструментами, управлять другими агентами и выполнять сложные задачи, используя мощные языковые модели (LLM), такие как OpenAI, Anthropic или модели из Hugging Face. Библиотека акцентирует внимание на простоте и легкости интеграции, предоставляя разработчикам базовые строительные бл

С ее помощью можно значительно упростить работу.

📌 GitHub

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 nn-zero-to-hero — учебный проект, который охватывает создание нейронных сетей с нуля!

🌟 В репозитории содержатся подробные шаги для создания простой нейронной сети, начиная с базовых понятий и заканчивая более сложными архитектурами, включая различные типы слоев, оптимизаторы и методы обучения.

🔐 Лицензия: MIT

🖥 Github

#курс #machinelearning

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Новый мощный генератор кода — OpenHands!

С одного промпта он создает полноценные приложения!

🎯 Один запрос — готовое приложение;
🔧 Исправляет ошибки, работает с API, собирает данные с сайтов и даже копирует код с StackOverflow;
Быстрая установка, интуитивно понятный интерфейс;
🆓 Абсолютно бесплатно.

▪️ GitHub

@machinelearning_interview
🔎 Обнаружение аномалий: обзор области за последние 10 лет

51 страница PDF

Читать

@machinelearning_interview
Forwarded from Machinelearning
⚡️🔥 Недавно Google Cloud выпустил «Руководство разработчика PyTorch по основам JAX».

Jax – это фреймворк для машинного обучения, подобный PyTorch и TensorFlow.

Его разработали в Deepmind, хотя он не является официальным продуктом Google, он остается популярным.

Jax объединяет Autograd и XLA (Accelerated Linear Algebra - компилятор с открытым исходным кодом для машинного обучения) для обеспечения высокопроизводительных численных вычислений.

Созданный на основе NumPy, его синтаксис следует той же структуре, что делает его простым выбором для разработчиков.

В этом руководстве содержится пошаговый гайд по реализации простой нейтронной сети на Pytorch (JAX + Flax NNX) для тех, кто хочет начать работать с JAX.

📌 Читать
📌Документация Jax

@ai_machinelearning_big_data


#jax #pytorch #google
👨‍🎓 Курс по математике от Гарварда

Материал представлен очень подробно, так что у вас будет возможность глубоко разобраться в каждой теме.

охватывает три ключевые темы:
- теорию вероятностей
- статистику
- линейную алгебру.

Это отличный курс для входа а перейти к машинное обучение и продвинутое программирования на Python.

📌 Курс

@machinelearning_interview
📞 code2prompt — это инструмент командной строки для подготовки промптов, содержащих структуру и содержимое исходного кода, специально адаптированных для работы с большими языковыми моделями, такими как GPT!

🌟 Инструмент сканирует кодовую базу, строит дерево файлов, включающее ключевые файлы или изменения в проекте, и формирует из них текстовый промпт. Это особенно полезно для анализа кода, документирования или генерации автоматических обзоров.

💡 Инструмент поддерживает такие функции, как использование шаблонов на основе Handlebars, фильтрацию файлов через .gitignore, вычисление количества токенов для обеспечения совместимости с лимитами моделей, и автоматическое добавление Git-диффов.

🔐 Лицензия: MIT

🖥 Github

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Выпущена новая открытая модель Omni!

MiniCPM-o 2.6 - это новая мультимодальная модель с 8B параметрами, работающая на edge девайсах.

🧠 8B параметров (SigLip-400M + Whisper-300M + ChatTTS-200M + Qwen2.5-7B)
🔥 Превосходит GPT-4V в vision задачах с 70. 2 баллами на OpenCompass
🎙️ Лучшие в своем классе возможности двуязычной речи с разговором в реальном времени и клонированием голоса
🎬 Поддержка мультимодальной потоковой передачи с поддержкой непрерывной обработки видео/аудио
📱 Работает на iPad и телефонах и поддерживает 30+ языков
🖼️ Обрабатывает изображения размером до 1. 8M пикселей (1344x1344) с возможностью OCR
🛠️ Легкая интеграция с популярными фреймворками (llama.cpp, vLLM, Gradio)
🤗 Доступна на huggingface

🔗 HF: https://huggingface.co/openbmb/MiniCPM-o-2_6
📌MiniCPM-o доступна на LLaMA-Factory: https://github.com/hiyouga/LLaMA-Factory
Media is too big
VIEW IN TELEGRAM
🎲 Вероятностные модели и функции потерь. Машинное обучение полный курс. Урок 8

- Видео
- Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 /
- Урок6/ Урок7
- Colab
-Полный курс

#ml #math #mlmath #probability #машинноеобучение
ФИЗМАТ - топовый канал про Физику, Математику и ИТ.

С помощью картинок и шортcов даже новички разберутся в сложных концепциях и формулах.

Присоединяйтесь: t.iss.one/fizmat