Мишин Лернинг 🇺🇦🇮🇱 – Telegram

Мишин Лернинг 🇺🇦🇮🇱

@mishin_learning

7.88K subscribers

1.17K photos

141 videos

4 files

635 links

Субъективный канал об искусстве машинного обучения, нейронных сетях и новостях из мира искусственного интеллекта.

Download Telegram

About

Blog

Apps

Platform

Мишин Лернинг 🇺🇦🇮🇱

7.88K subscribers

Мишин Лернинг 🇺🇦🇮🇱

🔥 Сегодня Mistral AI представила новые модели — Ministral 3B и Ministral 8B

Ministral 3B и Ministral 8B, разработанные для on-device вычислений. Эти модели предлагают превосходную производительность в задачах reasoning, commonsense и function-calling, поддерживая контекст до 128k токенов.

⚙️ Ministral 3B разработана для сверхэффективного использования на устройствах с ограниченными ресурсами (e.g.: смартфоны). Ministral 8B предлагает больше возможностей для сложных задач. Обе модели поддерживают до 128k контекста и используют передовые методы pruning и quantization для снижения нагрузки на железо.

Бенчмарки показывают неплохой буст в сравнение с существующими Llama 3.1 / 3.2 и Gemma 2 моделями.

🤖 Ministral 8B: ссылка на модель

👍33❤6🔥2🏆1👾1

8.02K views16:47

Мишин Лернинг 🇺🇦🇮🇱

Новая диффузионная модель от Nvidia: Sana

Основные особенности:

— DC-AE энкрдер, (если интересно вот ссылка) который понижает в 32 раза, вместо привычных 8ми для vqVAE, без сильных потерь

— Линейный DiT: по сути ViT, где фьюз происходит не через аттеншен, а через марицу рангом d << n (где, n это количество image token’ов). Подробнее про метод у Яныка на ютубе. Имхо это не аттеншн, но называйте как хотите.

— Вместо T5 взяли small LLM (decoder only), не прошло и 2 лет…

— Кастомный сэмплер: Flow-DPM-Solver

Обещают может и не лучшее качество, но супер быструю скорость и резолюшн 4096х4096 (благодаря DC-AE).

💻 Code (будет тут)
📝 paper
😈 demo на градио

p.s.: погененрил в демо, 1024х1024 работает норм, но пишет с ошибками.

❤13👍8🔥4🤬1

6.26K views00:46

Мишин Лернинг 🇺🇦🇮🇱

Состоялся релиз Stable Diffusion 3.5 8B Large

https://huggingface.co/stabilityai/stable-diffusion-3.5-large

❤16👍4👀3💊1

6.43K viewsedited 14:17

Мишин Лернинг 🇺🇦🇮🇱

This media is not supported in your browser

VIEW IN TELEGRAM

📍 CoTracker3 — новый подход к трекингу точек

Модель команды Meta AI и Visual Geometry Group из Оксфорда обучали на реальных видео без аннотаций, используя псевдоразметку.

Особенности CoTracker3:
— Обучение на реальных видео в semi-supervised-режиме.
— Упрощённая архитектура требует 1000 раз меньший датасет без потери качества.
— Поддержка трекинга через окклюзии с другими объектами.

Результаты:
Модель значительно превосходит предыдущие трекеры (например, BootsTAPIR и LocoTrack) в задачах с обширной окклюзией и более стабильна. CoTracker3 демонстрирует высокую точность на стандартных бенчмарках. Из ограничений выделю трудности с трекингом на поверхностях без характерных особенностей, таких как небо или вода.

📄 paper
🤗 demo
💻 code

🔥20❤3👍2👏1

7.18K viewsedited 14:05

Мишин Лернинг 🇺🇦🇮🇱

This media is not supported in your browser

VIEW IN TELEGRAM

🔍 OpenAI выкатили ChatGPT Search

подробнее тут

❤20⚡1

8.88K views00:12

Мишин Лернинг 🇺🇦🇮🇱

🕊40❤11🤔6💊4💅3👎2🤬2😢2☃1🔥1

7.34K views17:23

Мишин Лернинг 🇺🇦🇮🇱

✨ Стрим от OpenAI, День 2

Напоминаю, что вчера открыли доступ к полноценной o1, и представили новую pro подписку. Что было:

— Файнтюн o1 модели (позволяют обучать типу рассуждений, что полезно в узкоспециализированных доменах: право, генетика, etc)

👉 https://youtu.be/fMJMhBFa_Gc

12 Days of OpenAI: Day 2

Begins at 10am PT

Join Mark Chen, SVP of OpenAI Research, Justin Reese, Computational Researcher in Environmental Genomics and Systems Biology, Berkeley Lab, and some team members from OpenAI as they demo and discuss Reinforcement Fine-Tuning.

❤11👌1

6.39K viewsedited 18:01

Мишин Лернинг 🇺🇦🇮🇱

Forwarded from Denis Sexy IT 🤖

Media is too big

VIEW IN TELEGRAM

По Sora утекло новое видео, говорят показывают v2

* 1-минутные видео на выходе
* текст в видео
* текст+изображение в видео
* текст+видео в видео

Не долго мы жили без cam-rip в АИ видео ☕️

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥29👍8❤3😱3

6.86K views19:36

Мишин Лернинг 🇺🇦🇮🇱

Microsoft AI представили Phi-4 — Small Language Model 14 млрд

Так, результаты сопоставимы с гораздо более крупными моделями, такими как GPT-4 и Llama-3.

Ключевые особенности Phi-4:
• Synthetic Data Generation: Используются подходы вроде chain-of-thought prompting для создания данных, стимулирующих системное мышление, ~~завещание у нотариуса, кофе душистый~~
• Post-Training Refinement: Direct Preference Optimization и rejection sampling для улучшения логической согласованности и точности ответов.
• Extended Context Length: Увеличенная длина контекста до 16K токенов для сложных задач с длинными цепочками рассуждений.

Результаты:
• GPQA: 56.1 (лучше GPT-4o с 40.9 и Llama-3 с 49.1).
• MATH: 80.4

📝 Phi-4 Технический Репорт

👍24🔥11❤6❤‍🔥3

9.39K views22:30

Мишин Лернинг 🇺🇦🇮🇱

З Новим роком! שנה טובה С Новым годом! 🎄

❤118🥰16🎉15❤‍🔥10🥴7💊4👍3🕊2👾1

8.02K views00:11

Мишин Лернинг 🇺🇦🇮🇱

NVIDIA / CES 2025
началось

https://www.youtube.com/live/k82RwXqZHY8?si=npSm8kNKuO2R8ANv

NVIDIA CEO Jensen Huang Keynote at CES 2025

Watch NVIDIA CEO Jensen Huang unveil groundbreaking RTX 50 series GPUs powered by the Blackwell architecture. Witness revolutionary advancements in AI, accelerated computing, and industrial digitalization transforming every industry.

0:00:00 CES 2025 Keynote…

❤15👍5

7.84K views02:35

Мишин Лернинг 🇺🇦🇮🇱

OpenAI запускают агента Operator

Упрощает рутину: от бронирования столика или покупки билетов в браузере до более сложного ассистирования.

🖥️ https://www.youtube.com/live/CSE77wAdDLg?si=-ZZQJ-zCByXW3NIB

Introduction to Operator & Agents

Begins at 10am PT

Join Sam Altman, Yash Kumar, Casey Chu, and Reiichiro Nakano as they introduce and demo Operator.

👍18🥴9

7.79K views22:35

Мишин Лернинг 🇺🇦🇮🇱

2 нейронки от китайского режима подряд

Сначала deepseek, теперь qwen2.5-max. Холодная ии война

👍27🥴12❤4😈3🤔1🦄1

7.16K views15:23

Мишин Лернинг 🇺🇦🇮🇱

Deep Research от OpenAI

Автоматизация исследования. Наверняка помнишь себя, гуглящую, сидящую на форумах, пересматривающую видео в поисках ответа. Благодаря Deep Research можно делегировать это GPT.

По сути это эволюция медленного мышления (chain-of-thought), которое мы наблюдали в o1 и о3 с тюном (o3 fine-tune) в строну работы с поисковиком и экстракции и обработки найденой информации.

Трансляция началась:
https://youtu.be/jv-lpIsnLOo

Introduction to Deep Research

Begins at 9am JST / 4pm PT

Join Mark Chen, Josh Tobin, Neel Ajjarapu, and Isa Fulford from Tokyo as they introduce and demo deep research.

❤21👍7😢1😭1

6.32K viewsedited 00:00

Мишин Лернинг 🇺🇦🇮🇱

✳️ Claude 3.7 Sonnet доступна всем!

Anthropic представили Claude 3.7 Sonnet (лучшую на этой неделе) LLM в их линейке, обладающий гибридным режимом рассуждения. Это означает, что модель может выдавать мгновенные ответы или работать в расширенном reasoning-режиме.

🖥 Claude Code – интеллектуальный агент для разработки

Anthropic также представили Claude Code – инструмент для автоматизации программирования прямо из командной строки. Он умеет:
🔹 Анализировать код и редактировать файлы
🔹 Запускать тесты и отлаживать программы
🔹 Автоматически коммитить и пушить изменения в GitHub
🔹 Использовать командную строку для выполнения сложных задач

Результаты раннего тестирования показывают, что Claude Code сокращает время на выполнение сложных задач с 45 минут до одного запроса (прям так и пишут, ок, цитирую).

Но самое крутое то, что модель доступна всем, даже бесплатным пользователям!

💻 Го тестить: https://claude.ai/

❤31🔥10👍3🦄2

5.41K views19:00

Мишин Лернинг 🇺🇦🇮🇱

This media is not supported in your browser

VIEW IN TELEGRAM

🤯 Я сейчас не шучу, Дональд Трамп сгенерировал видео и выложил на своей платформе Truth Social. Какая же это дичь..

https://truthsocial.com/@realDonaldTrump/posts/114068387897265338

😁51🙈35🥴15🔥10🤯7👍4🤪2🗿2🌚1👀1

7.12K viewsedited 09:25

Мишин Лернинг 🇺🇦🇮🇱

📄 Вышла системная карточка GPT-4.5

https://cdn.openai.com/gpt-4-5-system-card.pdf

Если коротко, лучше 4o, хуже o3-mini

❤11

5.49K viewsedited 19:36

Мишин Лернинг 🇺🇦🇮🇱

Трансляция GPT-4.5

Pro — скоро
Plus юзеры — следующая неделя

Основная мысль: очень много претрейна (на нескольких датацентрах), что дало возможность получить лучшую unsupervised модель, они уже прогнали supervised-fine-tune и rlfh, получив отличные результаты базовой нон-ризонинг модели, и намекнули, что потенциальная новая ризонинг модель на базе GPT-4.5 может быть еще лучше, что логично.

https://www.youtube.com/live/cfRYp0nItZ8?si=QdHB5-bcFJd7KLq3

Introduction to GPT-4.5

Mia Glaese, Rapha Gontijo Lopes, Youlong Cheng, Jason Teplitz, and Alex Paino introduce and demo GPT-4.5.

👍16

6.99K viewsedited 20:08