Интересное что-то
517 subscribers
2.71K photos
253 videos
138 files
4.51K links
Материалы и мысли, понадерганные отовсюду
Блог: https://t.iss.one/asisakov_channel
Чат: https://t.iss.one/youknowds_chat
Download Telegram
Forwarded from Варим МЛ
Сегодня выступил на ИТМ с докладом про практики проектирования и разработки LLM-систем в медицине, а при подготовке доклада, естественно, использовал LLM. Рассказываю об этом, а также о других прикольных кейсах использования элэлэмок в работе в своём новом посте.

Ещё у моих друзей из издательства Питер вышло несколько новых книг об ML на бумаге, одну из них (Строим LLM с нуля) я читал на английском, вроде, даже в канале упоминал. У Рашки (хехе) всегда хорошие материалы, сейчас жду его Build a Reasoning Model (From Scratch). Если любите книги на бумаге или на русском - велком!

Обращаю ваше внимание, что как всегда рекомендую только бесплатно и только хорошие вещи) Теперь есть ещё одна веская причина не брать платную рекламу, если вы понимаете, о чём я.

#Жека #llm
Forwarded from TechSparks
Иногда древние технологии изумляют не хуже суперсовременных. Изумляют, например, изяществом. Про многотонных каменных идолов с острова Пасхи давно было известно, что жившие 800 лет назад (а культурно - в каменном веке) их создатели умудрялись как-то их перемещать на достаточно большие расстояния. И, на первый (и многие последующие) взгляд задачка казалась неразрешимой. Отсюда гипотезы про чудеса, пришельцев и тому подобное. Легенды, изустно передававшиеся веками из поколения в поколение, гласили, что статуи ходили сами — но как может ходить 90-тонный кусок камня?? Оказалось, легенды были достаточно точны. Пусть не сами, а с некоторой человечьей помощью статуи действительно «ходили» — внешне оно именно так и выглядело.
Археологи сначала погоняли компьютерные модели, а потом поставили и натурный эксперимент (со статуей полегче, весом в 4,35 т., а не в десятки). Оказалось, что правильно раскачивая истукана с помощью веревок, 18 человек за 40 минут переместили его на 100 метров. Посмотрите на видео, как камень «идет», переваливаясь, по специально подготовленной грунтовой дороге :)) Бодренько идет. Вот уж действительно пример экспериментальной истории.
https://arstechnica.com/science/2025/10/how-easter-islands-giant-statues-walked-to-their-final-platforms/
Forwarded from PRACTICAL AI Broadcast
Три ключевых инсайта с митапа по продвижению в AI:
как попасть в выдачу GPT, Gemini и других LLM.


Друзья, спасибо всем, кто был на митапе!
Разобрали, как сделать AI инструменты ещё одним каналом продаж и коммуникации.

Для тех, кто не смог присоединиться, или хочет освежить в памяти, основные моменты:

📌 «Свой сайт — это база и он должен быть готов к индексации AI».
Чтобы попасть в выдачу нейросетей, сайт должен быть технически оптимизирован так, чтобы его мог проиндексировать Bing (да, Bing!) или Google.

Ключевое для AI, это блок с вопросами и ответами (FAQ).
Это золотая жила: AI-модели обожают индексировать этот формат, чтобы выдавать прямые ответы пользователям.

📌 «Делайnt контент не для поисковика, а для людей и AI».
AI ищет экспертность и полноту раскрытия темы, а не SEO оптимизированные тексты.

Новое правило игры:
Кроме семантического ядра используйте сущности (entities).
В каждой статье указывайте, что этот контент создан вашей компанией, вашими экспертами. Таким образом вы прокачиваете доверие AI к своему бренду.

📌 «Трафик из нейронок — это горячие лиды».
Люди, которые приходят из AI поиска знают, что ищут.
Это не просто трафик, это потенциальные клиенты с конкретным запросом.

Основные поинты работы с AI трафиком:
Консистентность:
Убедитесь, что человек, пришедший по AI-запросу, попадает на страницу с соответствующим контентом.

Гиперперсонализация:
Увеличивайте количество контента по темам, по которым находят ваши продукты. Если людям интересен матрас на хачапури, сделайт про него отдельный пост с фотками и сторителлингом.

Используйте AI, чтобы оптимизировать сайт под AI:
Например, можно использовать LLM для анализа конкурентов и выявления слов и фраз, которых тебе не хватает на сайте, чтобы попасть в выдачу.

Бонусный тейк:
AI любит маленькие локальные ресурсы, которые часто обновляются. Используйте это, чтобы увеличить информационное присутствие.


Полезные материалы:
-Исчерпывающих чек лист как оптимизировать сайт под выдачу в AI по этой ссылке
- Обновляемый дашборд с самыми цитируемыми доменами ChatGPT
- Выступление по GEO с основными тезисами

👋Запись выступления на YouTube

А для всех участников комьюнити наша команда Practical AI, подготовила подарок - бесплатную диагностическую сессию по внедрению AI автоматизации.
Запишитесь, если хотите создать дорожную карту внедрения AI инструментов в свой бизнес.

Что из рекомендаций вы уже пошли внедрять после митапа?
Расскажите про ваши кейсы и задайте ваши вопросы в комментариях.👇
This media is not supported in your browser
VIEW IN TELEGRAM
Находка для тех, кто пилит видосы 📹

Gling AI берет сырую запись, превращает речь в текст и автоматом вырезает длинные паузы, слова-паразиты и неудачные дубли. Дальше вы правите видео как обычный документ: удалили абзац — исчез кусок ролика, переставили фразы — поменялись склейки.

Дополнительно сервис генерирует субтитры, применяет умный зум под говорящего в кадре и чистит аудиодорожку на уровне профессиональных редакторов. Для YouTube создает заголовки и главы под SEO-алгоритмы платформы.

Готовый ролик экспортируется напрямую в MP4 или отправляется в Premiere Pro, DaVinci Resolve и Final Cut Pro для финальной полировки. Есть бесплатный триал 🤩

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from max.sh
Дошли руки прочитать пост про LoRA от Thinking Machines и Джона Шульмана (co-founder OpenAI; у него в личном блоге тоже есть интересные заметки, например, зашла такая: An Opinionated Guide to ML Research).

Главный посыл в том, что LoRA вполне может тягаться по качеству с фулл-файнтюном под новую задачу, если обучать адаптеры правильно:

*датасет для целевой задачи имеет small-to-medium размер;
*у адаптера достаточно ёмкости, и LoRA применяется не только к attention-матрицам, но и к MLP- и MoE-компонентам (в литературе же все еще популярен первый вариант);
*гиперпараметры подобраны корректно, в частности, большой batch size негативно влияет на сходимость;
*RL-тюнинг с LoRA-адаптерами работает так же хорошо, как и фулл-файнтюн.

В 2024 году, когда я ещё работал в Амазоне, мы обучали мультимодальные LLM, которые умели работать с текстом, изображениями и речью. Отдельно стояла задача поэкспериментировать: можно ли адаптировать модель под ситуации, где требуется эффективный файнтюн, чтобы заскейлить модальность. В качестве тестовой выбрали задачу Voice Cloning: есть N минут речи спикера (N варьируется от минут до часов), и хочется научиться клонировать его голос (тембр, интонацию, акцент, просодию). Задача идеальная: есть потенциальная выгода для бизнеса здесь и сейчас( например, озвучивание аудиокниг), а файнтюнить веса базовой модели каждый раз под новый голос — совсем не вариант. Поэтому всем было интересно посмотреть, что получится.

По большому счёту, мы прошли тот же путь экспериментов, что и команда Шульмана: перебирали гиперпараметры обучения, ранги, слои, в которых вставлять адаптеры, и веса, к которым их применять. Выводы сильно коррелировали: большой batch оказывает вредное влияние, а адаптеры нужно применять в первую очередь к FC-слоям трансформера. В итоге получили адаптируемый рецепт под разное количество обучающих данных.

Качество voice cloning оказалось достаточным для прода: реплики были в разы стабильнее, чем zero-shot voice cloning, и не уступали фулл-тюну (бэйзлайн), оставаясь при этом легко масштабируемыми, по крайней мере, с точки зрения ресерча. С точки зрения продакшена же адаптеры не достаются бесплатно (есть эффект на latency, плюс интеграция десятков тысяч адаптеров отдельная инфраструктурная задача). Но это уже другая история.

Успех эксперимента был моментальным и в сентябре того же года начались активные пилоты. Инициативу расширили и наняли отдельную команду, чтобы развивать именно этот продукт. Многих запромоутили или дали хороший бонус.

Также должна была выйти статья, чтобы зафиксировать эффективность метода LoRA для задачи voice cloning. Увы, вот она уже она утонула в потоке бюрократии и более глобальных перестановок в компании.
Forwarded from Sinекура
А в курсе глубокого обучения в прошлый четверг обсуждали механизмы внимания:

СПбГУ — 2025.10.02 — Состязательные примеры и механизмы внимания
(слайды и доска на странице курса)

Начали с состязательных примеров — ну тех самых, которые из панды делают гиббона, рояль или что угодно другое маленьким шумом.

А потом перешли к понятию внимания; это очень интересная штука и с точки зрения нейробиологии (хотя там я мало что понимаю), и, как выясняется, с точки зрения искусственных нейросетей. Начали с первых работ о внимании (Larochelle, Hinton, 2010, например), потом обсудили рекуррентные модели внимания и где там возникает RL, а потом перешли к уже более современным архитектурам: encoder-decoder with attention вроде Show, Attend, and Tell.

В этот раз до self-attention не дошли, но на следующей лекции отступать будет уже некуда, будем о трансформерах говорить.)
Forwarded from Sinекура
Прошедшую в четверг лекцию курса "Глубокое обучение" долго представлять не надо:

СПбГУ — 2025.10.09 — Self-attention и архитектура трансформера
(слайды и доска на странице курса)

Трансформер — буквально самая главная архитектура нейросетей практически с самого своего появления в 2017 году. В Google Scholar у статьи "Attention is All You Need" уже почти двести тысяч цитирований; это не абсолютный рекорд (есть статьи с сотнями тысяч цитирований про стандартные экспериментальные методы, которые везде потом применялись), но наверняка рекорд за прошедшие неполные восемь лет, и влияние трансформеров в 2025 пока не ослабевает.

В лекции я постарался максимально подробно и не торопясь обсудить всё, что можно было обсудить о самовнимании и архитектуре трансформера: от абстрактно-мотивационной идеи self-attention, приходящей из информационного поиска, до токенизации и позиционных вложений. Многое из того, что будет дальше, — это применения и развития идей этой лекции, так что пропускать её стоит только если вы и так уже всё это хорошо знаете.
Forwarded from Sinекура
Начинаю уже запутываться в контенте; столько всего происходит, что даже взятый мной темп по одному посту в день начинает трещать по швам. Тем не менее пока попробую оставаться в этом ритме, и сегодня выберу доклад, публикации которого жду не только я, но и его автор, Александр Панов:

Семинар Markov Lab — 2025.10.08 — AI Scientist
(Слайды на странице семинара)

Александр дал обзор того, как сейчас работают AI-системы, помогающие в научных исследованиях, рассказал о том, что об этом думает его лаборатория в AIRI и в каком направлении она работает. Главная мысль, которую он проводил (насколько я понял), была в том, что успешный AI scientist должен быть в каком-то смысле embodied, то есть должен получить другие модальности непосредственного опыта, не только токены текста и картинок/видео.

Как мне кажется, весьма интересной была и дискуссия после доклада. Мои читатели знают, что AI scientist'ы разного рода — это моя любимая тема, и в этом отношении я настроен очень... хм, хотел сказать "оптимистично", но не уверен, что это правильное слово.) В общем, верю я в AI scientist'ов, и даже в то, что для существенной трансформации всего научного поиска новых мегапрорывов до "AI-Эйнштейнов" совершенно не требуется; на днях выложу ещё один свой недавний доклад об этом, кстати.

Так что поспорили мы знатно; надеюсь, разошлись всё-таки друзьями. :)
HF_ULTRASCALE_PLAYBOOK.pdf
10.6 MB
HF книжка по megatron, fsdp и прочему для обучения реально больших моделей