Machine learning Interview

🔥 TorchOpt — мощная библиотека для дифференцируемой оптимизации, построенная поверх PyTorch. Она предлагает три режима дифференцирования (явный, неявный и нулевого порядка), что делает её универсальным инструментом для задач, где требуется оптимизация с учётом градиентов, включая метаобучение и двууровневую оптимизацию.

Библиотека сочетает гибкость функционального подхода с привычным объектно-ориентированным API PyTorch. Это позволяет легко интегрировать её в существующие проекты, не жертвуя производительностью. TorchOpt поддерживает распределённые вычисления через PyTorch RPC и ускоренные операции на CPU/GPU, что особенно полезно для масштабируемых экспериментов.

🤖 GitHub

@machinelearning_interview

🔥6❤3👍3

2.93K views11:00

Machine learning Interview

Forwarded from Machinelearning

📌

SemDiD: Семантическое разнообразие ответов для LLM.

Исследователи из из Гонконгского университета и инженеры Alibaba научили LLM генерировать семантически разные ответы, заставляя их «думать» в ортогональных направлениях.

Наверняка каждый, кто работает с LLM, сталкивался с их любовью к самоповторам. Запрашиваешь несколько вариантов решения, а получаешь одну и ту же мысль, просто перефразированную.

Стандартные подходы к декодированию, temperature sampling или diverse beam search, создают лишь лексическое разнообразие, но пасуют, когда требуется семантическое. Это серьезная проблема для Best-of-N или RLHF. Ведь без по-настоящему разных идей и подходов к решению задачи эти методы теряют свою силу: выбирать лучший вариант не из чего, а обучать модель на однотипных примерах неэффективно.

Решение предложили в методе SemDiD (Semantic-guided Diverse Decoding). Его суть, если кратко, перестать играть с токенами на поверхности и начать управлять генерацией напрямую в пространстве эмбеддингов.

🟡Метод работает так.

Сначала, на старте, он принудительно направляет разные группы beams по ортогональным векторам в семантическом пространстве. Грубо говоря, это как дать команду разным поисковым группам двигаться строго на север, юг и запад, чтобы они гарантированно разошлись.

По мере генерации, когда жесткие директивы могут стать неоптимальными, включается второй механизм - inter-group repulsion. Он просто следит, чтобы смысловые траектории ответов не сближались, сохраняя их уникальность до самого конца.

Но как, гоняясь за разнообразием, не получить на выходе бессвязный бред?

SemDiD подходит к контролю качества уникально. Он не пытается слепо максимизировать вероятность последовательности, а использует ее лишь как нижнюю границу, чтобы отсечь совсем уж плохие варианты.

Кроме того, алгоритм корректирует системные искажения, когда вероятность токенов искусственно завышается в зависимости от их позиции в тексте.

Для баланса между качеством и разнообразием используется адаптивный механизм на основе гармонического среднего, который в каждый момент времени уделяет больше внимания той метрике, которая проседает.

🟡В тестах метод показал неплохие результаты.

На бенчмарках для Best-of-N, от MMLU-Pro+ до GSM8K, SemDiD увеличивает покрытие (шанс найти верный ответ) на 1.4%-5.2% по сравнению с аналогами.

🟡

Но главный прорыв - в RLHF.

Генерируя для GRPO или RLOO семантически богатые наборы ответов, SemDiD предоставляет им более качественный материал для обучения. Это ускоряет сходимость на 15% и повышает финальную точность моделей.

🟡

Arxiv

@ai_machinelearning_big_data

#AI #ML #LLM #SemDiD

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11👍7🔥4

2.53K views14:33

Machine learning Interview

⚡️ Почему лучшие разработчики всегда на шаг впереди?

Потому что они знают, где брать настоящие инсайд!
Оставь “программирование в вакууме” в прошлом, выбирай свой стек — подпишись и погружайся в поток идей, лайфхаков и знаний, которые не найдёшь в открытом доступе.

ИИ: t.iss.one/ai_machinelearning_big_data
Python: t.iss.one/pythonl
Linux: t.iss.one/linuxacademiya
Мл собес t.iss.one/machinelearning_interview
C++ t.iss.one/cpluspluc
Docker: t.iss.one/DevopsDocker
Хакинг: t.iss.one/linuxkalii
МЛ: t.iss.one/machinelearning_ru
Devops: t.iss.one/DevOPSitsec
Data Science: t.iss.one/data_analysis_ml
Javascript: t.iss.one/javascriptv
C#: t.iss.one/csharp_ci
Java: t.iss.one/java_library
Базы данных: t.iss.one/sqlhub
Python собеседования: t.iss.one/python_job_interview
Мобильная разработка: t.iss.one/mobdevelop
Golang: t.iss.one/Golang_google
React: t.iss.one/react_tg
Rust: t.iss.one/rust_code
ИИ: t.iss.one/vistehno
PHP: t.iss.one/phpshka
Android: t.iss.one/android_its
Frontend: t.iss.one/front
Big Data: t.iss.one/bigdatai
МАТЕМАТИКА: t.iss.one/data_math
Kubernets: t.iss.one/kubernetc
Разработка игр: https://t.iss.one/gamedev
Физика: t.iss.one/fizmat
SQL: t.iss.one/databases_tg

Папка Go разработчика: t.iss.one/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.iss.one/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.iss.one/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.iss.one/addlist/mzMMG3RPZhY2M2Iy

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
😆ИТ-Мемы: t.iss.one/memes_prog
🇬🇧Английский: t.iss.one/english_forprogrammers
🧠ИИ: t.iss.one/vistehno

🖥 Chatgpt для кода в тг: @Chatgpturbobot

📕Ит-книги: https://t.iss.one/addlist/BkskQciUW_FhNjEy
💼ИТ-вакансии t.iss.one/addlist/_zyy_jQ_QUsyM2Vi

Подпишись, чтобы всегда знать, куда двигаться дальше!

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍1

2.93K views10:04

Machine learning Interview

🦠 Как писать код так, чтобы open-source проект рос сам по себе (как колония бактерий)

Неожиданный, но полезный принцип: код стоит писать как бактерии пишут ДНК.
Звучит странно, но у природы за миллиарды лет выработался стиль, который идеально подходит для быстрого роста и масштабирования. И он отлично ложится на open-source.

Что делает "бактериальный код" особенным:

– Он маленький — потому что каждая строка «стоит энергии»
– Он модульный — код разбит на независимые блоки (как опероны в генах)
– Он самодостаточный — кусок кода можно просто скопировать и вставить в другой проект, без зависимостей

Теперь представьте, что ваш код читают как библиотеку сниппетов.
Можно ли выдернуть одну функцию — и она сразу принесёт пользу?
Можно ли вставить ваш класс в чужой проект — и он просто заработает?

Если да, значит код "бактериальный" — и это хорошо.

Почему это работает:
Такой код легко распространяется, переиспользуется, адаптируется. Люди могут взять только нужное, не вникая в архитектуру всего проекта. И это ключ к живому open-source: когда код «живет отдельно от автора».

Теперь про монорепы.
Сложные проекты всё равно требуют структуры — как организм требует согласованной работы органов.
Это уже стиль "эукариот" — более крупный, связанный, менее гибкий, но подходящий для системного масштаба.

Вывод:
Хочешь сложную платформу — строй "монорепу".
Хочешь, чтобы твой open-source проект рос, развивался и жил без тебя — пиши код как бактерии:
маленько, модульно, автономно, копируемо.

Это стиль, который колонизировал всё: от термальных источников до вакуума в космосе. И он работает.

▶️

Оригинал пост от Karpathy

#opensource #кодстиль #cleanCode #dev #community #softwaredesign

Please open Telegram to view this post

VIEW IN TELEGRAM

X (formerly Twitter)

Andrej Karpathy (@karpathy) on X

How to build a thriving open source community by writing code like bacteria do 🦠. Bacterial code (genomes) are:

- small (each line of code costs energy)
- modular (organized into groups of swappable operons)
- self-contained (easily "copy paste-able" via…

❤17👍3🔥3

3.21K views11:05

Machine learning Interview

🚀Kafka must-have инструмент для современных проектов MLOps!

Присоединяйся к вебинару и узнай, как настроить Kafka для обработки потоковых данных и интегрировать её в MLOps-проекты. Вебинар проходит в рамках подписки на курсы OTUS, которая даёт возможность приобрести 3 курса по цене одного.

🔑 Что будет:
— Практическое и теоретическое руководство по настройке Kafka в Docker и взаимодействию с ней через Python.
— Обзор инструментов для работы с Kafka: поднятие UI-интерфейса и управление потоками данных.
— Примеры использования Kafka для связи микросервисов и обзор ключевых функций, делающих её незаменимой брокером сообщений.
— Как использовать Kafka в MLOps: сбор данных для ML-моделей, мониторинг их работы и интеграция предсказаний в реальном времени.

🚀Регистрация по ссылке - https://otus.pw/18rU/
Подробнее о подписке OTUS - https://otus.pw/SMQu/

👉 Запишись сейчас, количество мест ограничено!

❤5👍2

2.95K views10:03

Machine learning Interview

🧬 Чат-боты ИИ в 5 раз повысили шанс создания биооружия.
Риск глобальной пандемии вырос с 0.3% до 1.5%.

Исследователи показали: топовые ИИ помогают обойти сложные лабораторные этапы и дают точные инструкции, которые раньше были доступны только экспертам.
Теперь даже непрофессионалы могут собрать опасный вирус.

🔒 Что делать:

1. ИИ должен отказываться отвечать на опасные запросы, быть устойчивым к джейлбрейкам и не распространяться в открытом виде без ограничений.
2. Лаборатории обязаны проверять заказы на синтетические гены и подтверждать личности клиентов.

Если внедрить эти меры — риск почти вернётся к прежнему уровню.
Учёные призывают внедрять такие правила до, а не после кризиса.

📌 Подробнее

❤9👍6🔥4🤔2😴2

3.25K views12:04

Machine learning Interview

📊 AI4TS — энциклопедия по анализу временных рядов с помощью ИИ. Этот масштабный GitHub-репозиторий собрал всё, что нужно для работы с временными рядами: от свежих исследований с NeurIPS и ICML до практических руководств по аномалиям и прогнозированию.

Автор не просто перечисляет публикации, а структурирует их по годам, конференциям и задачам — будь то классификация, обнаружение аномалий или прогнозирование. Проект включает не только PDF-статьи, но и ссылки на официальные реализации моделей вроде Time-LLM или iTransformer. Раздел с обзорными работами помогает быстро погрузиться в тему, например, через сравнение методов на основе трансформеров или графовых нейросетей.

🤖 GitHub

@machinelearning_interview

🔥10👍6🥰2❤1

3.5K views05:04

Machine learning Interview

📚 Awesome-Pytorch-list — исчерпывающая коллекция ресурсов вокруг PyTorch. В этом репозитории собраны сотни инструментов, туториалов и реализаций статей, связанных с PyTorch. Проект охватывает все направления: от компьютерного зрения и NLP до гауссовских процессов и рекомендательных систем.

Особенно полезен раздел с готовыми имплементациями моделей вроде BERT, Tacotron и OpenNMT. Репозиторий включает как популярные проекты, так и нишевые решения для задач вроде coreference resolution и speaker diarization.

🤖 GitHub

@machinelearning_interview

❤9👍5🥰2

3.52K views11:04

Machine learning Interview

1:31

This media is not supported in your browser

VIEW IN TELEGRAM

🖼️ JarvisArt — ИИ, который редактирует фото как профессионал, просто по текстовому описанию.

Никаких слайдеров, кривых и масок — задаем промыт, что нужно («сделай свет мягче», «винтажный стиль», «удали шум»), и JarvisArt делает всё сам. Причём не наугад, а точно так, как это сделал бы человек с опытом в Lightroom.

💡 Что под капотом:
- Мультимодальная LLM, натренированная на 55 000 реальных ретушей
- Управление 200+ инструментами Lightroom через текст
- Интеграция со Stable Diffusion для генерации и обработки изображений
- Точность и качество выше GPT-4o по специальной бенчмарке MMArt‑Bench

📦 Всё в опенсорсе, есть демо и облегчённая версия для запуска в Colab:

🔗 Project: https://jarvisart.vercel.app
🔗 GitHub: https://github.com/LYL1015/JarvisArt

❤8👍6🔥4

3.33K views06:49

Machine learning Interview

🧪 Google выпустили MatFormer Lab для Gemma 3n — лабораторию кастомных LLM

Google запустила MatFormer Lab — инструмент для кастомизации моделей Gemma 3n на базе архитектуры MatFormer.

🔧 Что позволяет Lab:
- Использовать технологию Mix-n-Match для создания собственной модели
- Разрезать базовую E4B и собрать версию с эффективным размером от 2B до 4B параметров
- Исследовать компромисс между качеством и масштабом
- Делиться кастомными моделями с сообществом

💡 MatFormer — это модульный подход, где каждый компонент может быть адаптирован под конкретные цели: от лёгких inference‑моделей до более точных решений для RAG, ассистентов и т.д.

🔗 Попробовать: https://goo.gle/gemma3n-matformer-lab

👍9❤3🔥3🥰1

3.38K viewsedited 13:36

Machine learning Interview

⚡Крутейший релиз от Anthropic — парни выпустили собственные бесплатные курсы!

Вы нижете десятки лекций, тесты и даже сертификаты по различным темам: от Anthropic API до MCP и лучших практик Claude Code. Всё с реальными примерами от разработчиков.

Забираем здесь.

👍12🔥5🥰3🤣2

3.56K views06:40

Machine learning Interview

Forwarded from Machinelearning

5:22

Media is too big

VIEW IN TELEGRAM

✔️

Северная Корея будет развивать собственный ИИ.

Власти КНДР объявили о реформе системы образования, в рамках которой в ведущих университетах страны создаются новые специальности, связанные с искусственным интеллектом. Согласно официальной партийной газете «Нодон синмун», это нужно для подготовки талантов, необходимых для «требований времени».

Этот шаг подтверждает давний интерес страны к передовым технологиям. Исследовательский институт ИИ при Университете имени Ким Ир Сена уже заявил о цели «использовать технологию GPT для замены умственного труда человека». Ранее сообщалось об использовании в институте американского ChatGPT, а научные издания страны посвящали спецвыпуски этой технологии. Аналитики полагают, что Пхеньян намерен применять ИИ не только для технологического развития, но и для укрепления государственного контроля и в разведывательной деятельности.
Lianhe Zaobao

✔️

OpenAI выпустит свой браузер.

OpenAI готовится в течение нескольких недель запустить собственный веб-браузер с глубокой интеграцией искусственного интеллекта. Новый продукт будет построен на Chromium, но предложит уникальные функции: встроенное окно для общения в стиле ChatGPT и поддержку ИИ-агентов. Эти агенты смогут автономно выполнять задачи пользователей, от бронирования отелей до заполнения онлайн-форм.

Ключевая идея состоит в удержании пользователя внутри интерфейса браузера, а не перенаправлять на внешние сайты. как это происходит сейчаc в ChatGPT. Если OpenAI удастся привлечь хотя бы часть из 500 миллионов еженедельных пользователей ChatGPT, это может серьезно пошатнуть рекламную бизнес-модель Google, которая во многом опирается на данные, собираемые через Chrome.
reuters.com

✔️

NovelAI выложила в открытый доступ веса своей модели Diffusion Anime V2.

Модель генерации изображений в стиле аниме основана на Stable Diffusion 1.5, генерирует в разрешении до 1024x1024 пикселей и использует предпоследний слой энкодера CLIP.

Diffusion Anime V2 распространяется под двойной лицензией, которая допускает только некоммерческое использование с обязательным указанием авторства. NovelAI напоминает, что V2 является устаревшей версией, а все новые модели остаются проприетарными и эксклюзивными для их веб-сервиса. Веса Diffusion Anime V2 доступны на Hugging Face.
blog.novelai.net

✔️

YouTube обновит правила монетизации для борьбы с ИИ-контентом.

С 15 июля YouTube вводит более строгие правила для своей партнерской программы, нацеленные на борьбу с массово создаваемыми и повторяющимися видео. Это ответ сервиса на рост генеративных ИИ-инструментов, которые значительно упрощают производство подобного контента.

Хотя представители платформы называют это «незначительным обновлением» и утверждают, что такой контент и раньше не подлежал монетизации, новые правила вносят больше ясности. Ужесточение рассматривается как превентивная мера для защиты YouTube от наплыва низкокачественных видео, способных нанести ущерб репутации и ценности платформы.
techcrunch.com

✔️

Google заменяет Assistant на Gemini в умных часах с Wear OS.

Google начала развертывание своего ИИ-ассистента Gemini на умных часах, заменяя Google Assistant на носимых устройствах. Обновление уже доступно для Pixel Watch и в ближайшие недели появится на моделях от Samsung, OPPO, OnePlus, Xiaomi и других производителей под управлением Wear OS 4 или новее.

Новый ассистент на часах поддерживает текстовые, голосовые и графические запросы. Активировать Gemini можно привычной командой «Hey Google» или долгим нажатием боковой кнопки. Благодаря глубокой интеграции с сервисами Google, пользователи смогут выполнять многошаговые команды прямо с запястья: просить создать плейлист в YouTube Music или кратко изложить содержание последних писем в Gmail.

Вместе с этим, компания улучшила функцию визуального поиска Circle to Search, добавив в нее специальный "AI Mode" для получения контекстной информации. Улучшение доступно пока только для США и Индии на Android и iOS.
9to5google.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2🔥2🥰2

2.65K views07:55

Machine learning Interview

🧠

Phi-4-mini-flash-reasoning —новая компактная модель от Microsoft с мощной математической логикой

Модель Phi-4-mini-flash-reasoning — это часть семейства Phi‑4 от Microsoft. Она специально создана для глубокого математического мышления, при этом остаётся лёгкой, быстрой и экономной по ресурсам.

🔍 Что делает её особенной

- Модель на 3.8B параметров, но приближается по качеству к 7B–8B аналогам.
- Контекст до 64K токенов — идеально для задач с длинной цепочкой логики.
- Оптимизирована под математику: подходит для доказательств, символьных вычислений, задач с несколькими шагами и сложных текстовых задач.

🚀 Достижения:

| Модель                            | AIME24 | AIME25 | Math500 | GPQA |
|----------------------------------|--------|--------|---------|------|
| Phi-4-mini-**Flash**-Reasoning   | **52.29** | **33.59** | **92.45** | **45.08** |
| Phi-4-mini-Reasoning             | 48.13  | 31.77  | 91.20   | 44.51 |
| DeepSeek-R1-Qwen-1.5B            | 29.58  | 20.78  | 84.50   | 37.69 |
| DeepSeek-R1-LLaMA-8B             | 43.96  | 27.34  | 87.48   | 45.83 |
| Bespoke-Stratos-7B               | 21.51  | 18.28  | 80.73   | 38.51 |

📈 *Модель превосходит другие по точности, несмотря на компактный размер.*

⚙️ Производительность

- Модель построена на гибридной архитектуре decoder + SSM, что даёт:
- модель способна генерировать длинные ответы примерно в 10 раз быстрее, чем её базовая версия
- почти линейный рост задержки (в отличие от квадратичного у обычных моделей)
- Тестировалась на A100-80GB, без tensor parallelism.

📌 *Идеальна для мобильных устройств и приложений с ограниченными ресурсами.*
⚠️ На что стоит обратить внимание

- Оптимизирована только под математическое мышление, не предназначена для общего NLP.
- Из-за размера ограничена в фактических знаниях — желательно использовать с поиском или RAG.

Phi-4-mini-flash-reasoning — это пример того, как небольшая модель может быть очень умной, если её правильно обучить и оптимизировать под конкретные задачи.

📌 Модель: https://huggingface.co/microsoft/Phi-4-mini-flash-reasoning

Подпишись: @machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍5🥰1

4.51K views11:17

Machine learning Interview

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

Эндрю Ын (Andrew Ng) считает, что шумиха вокруг AGI (искусственного общего интеллекта) сильно преувеличена — люди ещё долго будут играть важную роль.

💡 Главное — не создавать ИИ с нуля, а уметь заставить компьютер делать то, что нужно именно вам с его помощью.

🧰 Не обязательно самому разрабатывать инструменты — достаточно научиться ими пользоваться.

📈 В будущем те, кто умеет работать с ИИ, будут гораздо сильнее и эффективнее тех, кто не умеет.

❤25👍8🔥2

3.82K views08:47

Machine learning Interview

📄 Хотите, чтобы резюме работало на вас? Teal — нейросеть, которая поможет выделиться даже на фоне кандидатов уровня FAANG

Что делает Teal:

• Подгоняет резюме под вакансии — анализирует описание должностей и ключевые слова, чтобы предложить точные и релевантные формулировки.

• Готовит к интервью — на основе анализа вакансии предлагает вопросы и советы, как подать себя максимально убедительно.

• Удобный интерфейс — онлайн-конструктор с шаблонами + возможность импортировать профиль из LinkedIn.

Если вы хотите, чтобы ваше резюме действительно заметили — начните с правильного инструмента.

https://tealhq.com/

@machinelearning_interview

👍9❤4🔥4

3.93K views08:39

About

Blog

Apps

Platform