gonzo-обзоры ML статей – Telegram

gonzo-обзоры ML статей

23.3K subscribers

2.43K photos

2 videos

3 files

1.17K links

Авторы:
Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика.
Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

Download Telegram

About

Blog

Apps

Platform

gonzo-обзоры ML статей

23.3K subscribers

gonzo-обзоры ML статей

Прикольная работа прошлого года, которая в этом году доехала до ICML 2025:
https://t.iss.one/gonzo_ML_podcasts/397

Внутри VLM формируются кросс-модальные репрезентации задач, и их можно извлечь и использовать.

gonzo_ML_podcasts

Vision-Language Models Create Cross-Modal Task Representations
Authors: Grace Luo, Trevor Darrell, Amir Bar
Paper: [ICML 2025] https://openreview.net/forum?id=77ziPGdQct, https://arxiv.org/abs/2410.22330
Code: https://vlm-cross-modal-reps.github.io/

Англ…

❤8👍3

5.98K views14:46

gonzo-обзоры ML статей

❤1

5.91K views14:47

gonzo-обзоры ML статей

Думай осторожно, наблюдение возможно!

https://t.iss.one/gonzo_ML_podcasts/410

gonzo_ML_podcasts

Early Signs of Steganographic Capabilities in Frontier LLMs
Authors: Artur Zolkowski, Kei Nishimura-Gasparian, Robert McCarthy, Roland S. Zimmermann, David Lindner
Paper: https://arxiv.org/abs/2507.02737
Code: https://github.com/arturzolkowski/steganographic…

😁8

5.16K views13:25

gonzo-обзоры ML статей

Постепенно зарождается новый класс решений по управлению памятью в LLM. Вот один из свежих заходов (уже были Mem0 и прочие):

https://t.iss.one/gonzo_ML_podcasts/421

Авторы смотрят далеко, мне особенно нравится «обмен памятью между LLM» (Cross-LLM Memory Sharing) и «масштабируемый рынок памяти» (Scalable Memory Marketplace).

Обещают также новый scaling law, на основе памяти. Посмотрим.

gonzo_ML_podcasts

MemOS: A Memory OS for AI System
Authors: Zhiyu Li, Shichao Song, Chenyang Xi, Hanyu Wang, Chen Tang, Simin Niu, Ding Chen, Jiawei Yang, Chunyu Li, Qingchen Yu, Jihao Zhao, Yezhaohui Wang, Peng Liu, Zehao Lin, Pengyuan Wang, Jiahao Huo, Tianyi Chen, Kai Chen…

🔥21🤯3

4.9K views20:45

gonzo-обзоры ML статей

https://t.iss.one/gonzo_ML_podcasts/435

gonzo_ML_podcasts

❤4🙈1

4.65K views20:46

gonzo-обзоры ML статей

Назад в будущее, к полным encoder-decoder архитектурам!

Google выложил T5Gemma https://developers.googleblog.com/en/t5gemma/

Google for Developers Blog - News about Web, Mobile, AI and Cloud

Explore T5Gemma – a new collection of encoder-decoder LLMs offering superior performance and efficiency – especially for tasks requiring deep input understanding, like summarization and translation, built on Gemma 2 models.

🔥22👀10❤3🥱2

5.23K views21:30

gonzo-обзоры ML статей

5K views21:30

gonzo-обзоры ML статей

🔥2

4.92K views21:30

gonzo-обзоры ML статей

😢1

5.1K views21:31

gonzo-обзоры ML статей

5.28K views21:31

gonzo-обзоры ML статей

А вот и Эндрю Ын подоспел!

https://youtu.be/RNJCfif1dPY

🔥9👍4❤2

5.17K views17:31

gonzo-обзоры ML статей

Популярная новость сегодняшнего дня :)

https://www.reuters.com/business/ai-slows-down-some-experienced-software-developers-study-finds-2025-07-10/

Before the study, the open-source developers believed using AI would speed them up, estimating it would decrease task completion time by 24%. Even after completing the tasks with AI, the developers believed that they had decreased task times by 20%. But the study found that using AI did the opposite: it increased task completion time by 19%.

Сорс: https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

AI slows down some experienced software developers, study finds

Contrary to popular belief, using cutting-edge artificial intelligence tools slowed down experienced software developers when they were working in codebases familiar to them, rather than supercharging their work, a new study found.

😁40😱9🔥4❤2👍2💯1

6.54K viewsedited 19:52

gonzo-обзоры ML статей

🔥6😁5😱5❤1

5.47K views19:58

gonzo-обзоры ML статей

Интересная архитектурная инновация: трилинейное внимание, где каждому Q соответствует не один K, а два разных. Ценный бонус — более хорошая экспонента для скейлинга, что значит можно обучать более хорошие модели на том же количестве данных.

https://t.iss.one/gonzo_ML_podcasts/436

gonzo_ML_podcasts

Fast and Simplex: 2-Simplicial Attention in Triton
Aurko Roy, Timothy Chou, Sai Surya Duvvuri, Sijia Chen, Jiecao Yu, Xiaodong Wang, Manzil Zaheer, Rohan Anil
Статья: https://arxiv.org/abs/2507.02754

Англ версия: https://arxiviq.substack.com/p/fast-and-simplex…

1👍22❤3

5.34K views18:08

gonzo-обзоры ML статей

https://t.iss.one/gonzo_ML_podcasts/439

gonzo_ML_podcasts

5.3K views18:08

gonzo-обзоры ML статей

И прекрасного пятничного вам в ленту!

🔥62🤣53❤10✍3👍2😁1

5.68K views19:24

gonzo-обзоры ML статей

В шаббат разбирать статьи не будем, но вот вам на почитать, если ещё не видели.

Шмидхубух про историю современного AI.
https://people.idsia.ch/~juergen/deep-learning-history.html

people.idsia.ch

Timeline: artificial neural networks, deep learning, etc

Annotated history of modern AI and deep learning

🔥19👍8🤡3❤2👎2

5.13K viewsedited 10:12

gonzo-обзоры ML статей

А также на посмотреть.

2001: A Space Odyssey

😁15❤‍🔥6

5.29K views10:15

gonzo-обзоры ML статей

Не могу не поделиться

2🔥66❤8

6.25K views13:51