эйай ньюз
75.3K subscribers
1.66K photos
876 videos
7 files
1.98K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

В свободное время работаю как Staff Research Scientist в Meta Generative AI в Швейцарии.

Aвтор: @asanakoy

PR: @ssnowysnow
Download Telegram
Mustread канала @ai_newz: Топ-10 постов 2024 года!

Год подходит к концу, а я продолжаю подводить итоги. Это был крайне насыщенный и плодотворный год для меня в плане карьеры (промо на Staff Research Scientist в Meta GenAI), так и для области в целом с множеством крутых AI новостей.

Вот 10 самых интересных постов за год (в хронологическом порядке):

1) Подборки пейперов про ускорение диффузии — я рассказал как и про дистилляцию, так и про другие методы ускорения.
2) Промо на Staff Research Scientist — мой личный апдейт и достижение года.
3) Инженерные грейды в бигтехе — что такое Staff Research Scientist , и почему Senior — это ещё не всё
4) Ликбез по оптимизации SD3-Turbo — Latent Adversarial Diffusion Distillation в деталях.
5) Что такое Mixture of Experts (MoE) — детальнейший разбор простым языком.
6) Командировка в Калифорнию — о том, как я веду дела и двигаюсь по карьерной лестнице.
7) Автономные агенты в Minecraft — которые позже (но от другой компании) построили цивилизацию из 1000 ботов.
8) О карьерных траекториях в AI — нужен ли PhD?
9) О компенсации в FAANG+ — или где бабки, Лебовски?
10) Movie Gen — 30B text2video модель, где есть и мой вклад!

Ну и самое главное на эти выходные — про отдых с отключением.

Хороших праздников! 🎉

#дайджест
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Нейродайджест за (две) недели (#51)
Первый дайджест в новом году.

Про канал
- Этот год на канале — было много сходок, стримов, постов и всякого-всякого.
- Mustread года — подборка главных постов 2024 года, которые до сих пор остаются актуальными.
- Сходка — создал чатик для того, чтобы встретиться с вами на Бали. Как оказалось, желающих было очень много — уже встретились!

LLM
- Grok 3 на подходе — Маск хвастается, что претрейн уже завершён.
- Qwen Chat — совсем бесплатно и с хорошим функционалом.

Генеративные модели
- Text-to-CAD — интересная попытка научить нейросети работать в 3D при помощи кода. Костыль? Да, костыль.
- JEN-1.5 — самый легальный (и, наверное, единственный) генератор музыки на лицензионном датасете. Для тех, кто любит атмосферу лифта или задаётся вопросом, почему важен хороший датасет.

Железо (Nvidia)
- RTX 5090 — свежие флагманы для пользовательского сегмента от Nvidia. Наконец-то есть на чём тянуть Flux!
- Digits — мини-ПК от Nvidia — убийца Mac Mini. Очень мощный, но по цене сравним с техникой Apple.
- Нейросети против дезинформации — неудачный пример от X.

> Читать дайджест #50

#дайджест
@ai_newz
Нейродайджест за неделю (#52)

LLM
- Codestral 25.01 — обновление LLM от Mistal: модель стала значительно умнее и быстрее.
- MiniCPM-o 2.6 — омни-моделька, которая работает локально, даже на iPad!
- ChatGPT Tasks — теперь ChatGPT может напомнить вам, например, помыть посуду вечером.
- Арена чатбот-комиков — бездушные боты борются за звание самого угарного мемодела. Можно протестировать самому!

Генеративные модели
- Ray 2 — Luma возвращается! Новая моделька вернула компанию в гонку видео-моделей.

Прочее
- Retro — Сэм Альтман инвестирует в стартап, который совместно с GPT-4b micro пытается создать «зелье бессмертия».

> Читать дайджест #51

#дайджест
@ai_newz
Нейродайджест за неделю (#53)

DeepSeek R1
Китайцы выложили в общий доступ свою reasoning-модель, на уровне o1 от OpenAI!
- Веса — для запуска потребуется 8xH200, для тех кто не может себе позволить есть дешевые API и бесплатный чат.
- Бенчи — R1 особенно хороша в коде и математике.
- Дистилляты — их есть целый спектр и даже 1.5B моделька по бенчам обходит 4o в узких задачах.
- Генерируем видосы в стиле 3Blue1Brown — Manim позволяет создавать самые разнообразные визуализации и презентации (не только математические) с помощью кода, и с этим R1 справляется на ура.
- Поиск с R1 — у DeepSeek и так был один из лучших AI-поисковиков, у тут с reasoning он стал ещё лучше.

LLM другое

- Gemini Flash Thinking — очередная "малявка" от Google, хороша, но где флагманы Google?
- Последний экзамен человечества — что будет, если всем миром собрать пул из 6000 самых сложных задач? LLM решат меньше 10% из них.
- Operator — агент, который может брать под контроль браузер от OpenAI. Уже доступен за $200.

Инфраструктура для LLM
- Stargate — $500B потекут рекой прямо в залив AI с лёгкой руки Трампа. Ни о каких регуляциях для больших разработчиков и уж тем более калифорнийском проекте запретов речи уже не идёт.
- 2GW датацентр от Meta — Марк анонсировал огромный датацентр размером с Манхэттен.

Прочее

- Kling Elements — мои тесты для видеогенерации с заданными объектам: костыль есть костыль.

Читать дайджест #52

#дайджест
@ai_newz
Нейродайджест за неделю (#54)

LLM
- DeepSeek — топ 1 — текущее состояние апсторов.
- R1 + Perplexity — один из лучших AI-поисковиков добавил режим с DeepSeek R1.
- Кратко о релизах Qwen — Qwen 2.5 VL (визуальная модель), новый интерфейс, Qwen 2.5-1M с 1 млн токенов контекста.
- Qwen 2.5 Max — тестируем в чате. Это не лучше, чем R1, но есть много фич, например, генерация картинок и артефакты.
- Mistral Small 3 — довольно маленькая, зато можно погонять на 3090. А лицензия Apache просто сок — можно юзать в проде без заморочек.
- Трамп про DeepSeek — успехи китайцев дошли даже до президента. Когда тебя так нагибают, нужно что-то сказать.
- Сброс лимитов в Claude – датамайнеры нашли ещё не анонсированную фичу, которая обещает стать спасением для тех, кто любит потранжирить токены.
- OpenAI o3-mini — главный релиз недели! Топ-1 в коде. OpenAI не хочет отдавать первенство и поспешил с релизом. Можно потыкаться даже без подписки.

Генеративные модели
- YuE — добротный генератор музыки с открытым исходным кодом. Станет ли он Stable Diffusion в мире музыки — пока неясно, но движение в этом направлении есть.
- Qwen Video — таинственный видеогенератор из чата Qwen. О нём совсем нет информации, но генерит он сносно, да ещё и бесплатно.

Чуть про меня

- Сходка на Бали — отчёт с фотками со встречи. Как всегда, прекрасно поболтали! + Анонс новой сходки сегодня (2 февраля) на Кипре.
- Моя первая принятая статья на ICLR — впервые работаю непосредственно над LLM. Ускоряем 405B модель.

Прочее
- Сколько зарабатывает OpenAI? — The Information слил примерные цифры.

> Читать дайджест #53

#дайджест
@ai_newz
Нейродайджест за неделю (#55)

LLM
- Deep Research – самый умный поиск от OpenAI, основанный на еще не релизнутой O3.
- Gemini 2.0 Flash – лучший в своей весовой категории.
- Le Chat – французы сделали самого быстрого бота на Диком Западе, генерит в 30 раз быстрее, чем ChatGPT, на неплохом уровне. Там же теперь можно потыкать Flux 1.1 Ultra.

Гайды
- LLM с нуля с Карпатым – гений гайдов из OpenAI взялся за основы.

Прочее
- Илья Суцкевер ту зе мун! – стартап по разработке AGI без прибыли собираются оценить в 20 миллиардов зеленых.
- Pickle – ваш виртуальный двойник с реалтайм липсинком для митов. Лежим на диване, пока ваш клон отсиживается на мите.

> Читать дайджест #54

#дайджест
@ai_newz
Нейродайджест за неделю (#56)

Finance
- Ответ Stargate — французы вложат 109 миллиардов евро в AI. Mistral питаются от счастья.
- Лучше не злить Маска — бифф с OpenAI продолжается. Илон предложил почти 100 миллиардов долларов за выкуп OpenAI у нонпрофита, чтобы помешать превращению OpenAI в коммерческую организацию.

Занимательные графики
- Прогресс LLM — клёвый график, где видно, как двигался SOTA-перформанс на разных бенчах со временем.
- Прогресс VLM — они растут не так быстро, как LLM-ки.

LLM
- Бесплатный Deep Research — Perplexity утерли нос OpenAI со своими 5 запросами в день. Конечно, он не лучше оригинала, но отстаёт не так сильно.
- В o1 и o3-mini теперь поддерживается загрузка документов и картинок. Лимиты o3-mini-high повысили до 50 запросов в день для Plus подписчиков. А ещё OpenAI выкатили новую версию 4o.
- Grok 3 — Маск обещает побить OpenAI o3. Хотелось бы верить, но верится с трудом. Но пощупать будет крайне интересно.

Другое
- Первый собственный чип OpenAI — уже в этом году. Пока что он нужен в основном для торгов с Nvidia, но направление очень перспективное.

> Читать дайджест #55

#дайджест
@ai_newz
Нейродайджест за неделю (#57)

LLM
- Grok 3 — новая топовая LLM от Маска идет в релиз малыми шажками. Сначала вышла неризонинг версия, обещает быть лучше в своем классе. Но никаких данных пока нет. Можно потесть ее в X.

Image & video модели
- Лекция от создателя Flux — запись первого доклада про лучшую txt2img модель.
- Veo 2 — топовая видео-модель от Google стала доступна во Freepik и FAL.AI.


Роботы

- Helix — Figure собрали робота на полностью локальной VLM.
- Neo Gamma — 1X сняли демку своего робо-приспешника. Выглядит сасно, как будто бы даже юзабельно.

Прочее
- Про регуляции AI в Швейцарии — теперь я точно могу себя ни в чем не ограничивать) ждите скайнет от меня 😘
- Ultra-Scale Playbook — книга-гайд с кучей красивых графиков о том, как наиболее эффективно использовать GPU кластер для тренировки ЛЛМ.

> Читать дайджест #56

#дайджест
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Видео Нейродайджест:
2025 год видео моделей и думающих LLM

- Veo 2 — Гугловский монстр вырвался на волю. Доступен на Freepik (Premium+ юзерам за тонну токенов) и на fal.ai ($1.25 за 5-секундный видосик). Цена кусается, пока только txt2img, но качество — космос.

- Luma Ray 2 — Теперь с img-2-video и video-2-sfx (саунд). Не дотягивает до Veo 2 по картинке, зато цена норм и фичи удобные: анлим за $95 для тех, кому надо.

- Pika’s Pikadditions & Pikaswaps — Чуваки идут путём мемов и VFX. Pikadditions пихает объекты с фоток в видео, Pikaswaps меняет банки ягуара на колу. 8 бесплатных генераций в месяц, но глюки — часть веселья: лица корежит, физика выходит из чата.

- Adobe Firefly Video — Чистый датасет, симпатичная картинка. Идеально для монтажа: продлить, расширить (да, есть расширение), накинуть VFX. Идеальный add-on для Премьера.

- Topaz Starlight — Диффузионный реставратор видео на 6B+ параметров. Вытягивает даже самые убитые кассеты. 10 сек бесплатно, 5 мин за бабки (немалые). Ждём концерт Queen в 4K.


И ещё 1000 и 1 опенсорс-проект — Lumina Video, Magic 1-For-1 и прочие. Статус “юзабельно” всё ближе, а кому-то уже и так норм.

> Читать Топ-10 постов 2024 года.

#дайджест
@ai_newz
Нейродайджест за неделю (#58)

LLM
- Deep Research — дали всем подписчикам ChatGPT, Plus подписка даёт 10 запросов в месяц, для Pro расширили до 120.
- Claude против покемонов — на твиче запустили стрим где Claude проходит оригинальный Pokémon.
- YandexGPT 5 — хороший перформанс Про модели, а Лайт версию выложили в опенсорс.
- GPT 4.5 — модель слабее предшественников в коде (потому что не reasoner), но её главная фишка это креатив и нормальный стиль живого человека.
- Подгоны от DeepSeek — авторы R1 выложили значительную часть своего внутреннего стака в открытый доступ (обзор скоро будет).
- Claude Sonnet 3.7 Extended Thinking — Антропик обзавелась своей ризонинг моделью, говорят лучшая для кодеров.

Генеративные модели
- Alibaba Wan 2.1 — мощнейший видеогенератор с открытым исходным кодом! Умеет в txt и img2video + имеет при себе два вида контроллера для video2video, и даже inpainting.
- Видео дайджест — собрал все новости с просторов txt2video за последние два месяца. Veo 2 в общем доступе, моделька Adobe и другое.

Гайды
- Prompt engineering от Карпатого — гений гайдов по ллм записал 2-х часовой advanced гайд по написанию промптов. Мастхев для каждого юзера ChatGPT и прочих.

Прочее
- Alexa стала умнее — колонке завезли настоящие мозги. Интегрируется со всем, что можно себе представить, включая доставку еды.
- Обмен каналами — делимся любимыми авторами и пиарим свои блоги про AI/ML и прочее.


> Читать дайджест #57

#дайджест
@ai_newz