Forwarded from AGI Labs
IMG_4938.PNG
539 KB
⛓️💥Часть 4 (самая хардкорная): Я случайно взломал Gemini 1.5 Pro от Google или к каким ужасным последствиям может привести гонка ИИ. (18+)
Я понял, что у Gemini 1.5 никаких барьеров просто нет и решил проверить те темы, которые должны быть абсолютно точно под запретом.
Но... посмотрите сами... У меня нет слов если честно. ☹️☹️☹️
Я понял, что у Gemini 1.5 никаких барьеров просто нет и решил проверить те темы, которые должны быть абсолютно точно под запретом.
Но... посмотрите сами... У меня нет слов если честно. ☹️☹️☹️
😱28🔥12😁10👎2🎉1
Your Transformer is Secretly Linear
Спешу познакомить вас с новой публикацией лаборатории FusionBrain про линейность большинства слоёв языковых моделей декодеров (принята на конференцию ACL 2024 - Main Track, Core A*). Наше исследование позволяет проанализировать внутренние представления языковых моделей, а также без потери качества избавиться от 10-15% слоёв.
Еще мы придумали новый механизм регуляризации, чтобы снизить пресловутую линейность и, тем самым, получить небольшой буст в качестве.
Ниже ссылочки на статью на архиве и код на гитхабе нашей прошлой статьи про анизотропию и внутреннюю размерность эмбеддингов (представляли на EACL 2024).
Статья уже на Hugging Face Daily Papers и уверенно занимает первое место, но мы будем очень рады вашим upvote голосам⬆️
https://huggingface.co/papers/2405.12250
📕arXiv
👨💻GitHub
📖Хабр
@complete_ai
Спешу познакомить вас с новой публикацией лаборатории FusionBrain про линейность большинства слоёв языковых моделей декодеров (принята на конференцию ACL 2024 - Main Track, Core A*). Наше исследование позволяет проанализировать внутренние представления языковых моделей, а также без потери качества избавиться от 10-15% слоёв.
Еще мы придумали новый механизм регуляризации, чтобы снизить пресловутую линейность и, тем самым, получить небольшой буст в качестве.
Ниже ссылочки на статью на архиве и код на гитхабе нашей прошлой статьи про анизотропию и внутреннюю размерность эмбеддингов (представляли на EACL 2024).
Статья уже на Hugging Face Daily Papers и уверенно занимает первое место, но мы будем очень рады вашим upvote голосам
https://huggingface.co/papers/2405.12250
📕arXiv
👨💻GitHub
📖Хабр
@complete_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥30🔥23👍11❤4🎉2🏆2
Всем привет!
Сегодня и завтра я на конференции CodeFest в Новосибирске, завтра поделюсь со слушателями в треке AI про способы расширения возможностей LLM в сторону понимания других типов данных, типа картинок, видео и др.
Конфа очень бодрая, организаторы молодцы, собрали крутых спикеров со всей России! Конечно, джетлаг с Мск в +4 часа не супер комфортно, но есть ребята, кто прилетел из -5))
Много стендов, активностей от разных компаний, подробнее расскажу про самые интересные сегодня и завтра👨💻
Сегодня и завтра я на конференции CodeFest в Новосибирске, завтра поделюсь со слушателями в треке AI про способы расширения возможностей LLM в сторону понимания других типов данных, типа картинок, видео и др.
Конфа очень бодрая, организаторы молодцы, собрали крутых спикеров со всей России! Конечно, джетлаг с Мск в +4 часа не супер комфортно, но есть ребята, кто прилетел из -5))
Много стендов, активностей от разных компаний, подробнее расскажу про самые интересные сегодня и завтра👨💻
🔥23❤7👍6🏆1
В этом году команда HR бренда сделала интересный ход: вместо привычного мерча в виде маек, настолок и прочей символики ребята устроили благотворительный марафон — за выполнение заданий в ходе активностей на стенде участники будут зарабатывать виртуальные рубли
После конференции Сбер конвертирует виртуальные деньги в реальные, дополнит сумму и закупит на неё технику в Новосибирский лицей
🔥На мой взгляд, это реально крутой кейс, как можно сменить парадигму привычных подходов к привлечению новых сотрудников в сторону пользы для человека и общества
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42👍13💯8
Статья по линейности эмбеддингов и новую механику регуляризации почти пробила 100 upvote на Hugging Face Daily Papers🔥
Линк
Линк
👍43🔥27💯5🏆4❤3
⚡️Сегодня мы выпустили обновлённую версию Kandinsky Video 1.1 в публичный доступ
Основные изменения коснулись качества генерации (поработали с самим пайплайном синтеза, улучшили латентный декодер, использовали значительно бОльший сет на обучении) и, конечно, скорости - видео длиной 5 секунд генерируется примерно за 1.5 минуты (это если без очереди) с FPS=30.
📖 Детали по классике в Хабре
🛜 Ссылки собрали на Project Page
🤖 Бот в телеграмм теперь и с видео
@complete_ai
Основные изменения коснулись качества генерации (поработали с самим пайплайном синтеза, улучшили латентный декодер, использовали значительно бОльший сет на обучении) и, конечно, скорости - видео длиной 5 секунд генерируется примерно за 1.5 минуты (это если без очереди) с FPS=30.
📖 Детали по классике в Хабре
🛜 Ссылки собрали на Project Page
🤖 Бот в телеграмм теперь и с видео
@complete_ai
🔥32👏19❤8👍5🏆4
Forwarded from Институт AIRI
Рассказали про новое исследование про линейность больших языковых моделей, которое сделали ученые AIRI вместе с коллегами из SberAI и Сколтеха.
🔖 Читайте материал по ссылке.
Научная статья "Your Transformer is Secretly Linear" собрала уже 130 upvote на Hugging Face Daily Papers, все подробности — в недавнем посте🔥
Научная статья "Your Transformer is Secretly Linear" собрала уже 130 upvote на Hugging Face Daily Papers, все подробности — в недавнем посте
Please open Telegram to view this post
VIEW IN TELEGRAM
ТАСС
Найден способ ускорить работу больших языковых нейросетей на 10-15%
Ученые Института искусственного интеллекта AIRI, а также специалисты из SberAI и "Сколтеха" совершили открытие при изучении свойств нейросетей-трансформеров
🔥31👏9🎉7👍1
Forwarded from Igrek.log
⚡️Сегодня мы выложили наш фреймворк для обработки и фильтрации изображений и видео
DPF - это наш внутренний фреймворк, с помощью которого мы обрабатывали и чистили датасет для обучения моделей Kandinsky и Kandinsky Video. Репозиторий содержит фильтры для видео, изображений, различных комбинаций этих модальностей, а также удобный интерфейс к ним. Надеемся, что открытие кода ускорит развитие библиотеки и даст возможность ресерчам сосредоточиться на ресерче, а не на чистке данных❤️🔥
А ещё мы написали статью на habr, в которой подробно рассказали про то, как собирали датасет для обучения Kandinsky 3.0 & 3.1 и Kandinsky Video. В ней также рассказали про DPF и процесс обработки датасетов у нас в Sber AI.
💻 github DPF
📖 Статья на Хабр
DPF - это наш внутренний фреймворк, с помощью которого мы обрабатывали и чистили датасет для обучения моделей Kandinsky и Kandinsky Video. Репозиторий содержит фильтры для видео, изображений, различных комбинаций этих модальностей, а также удобный интерфейс к ним. Надеемся, что открытие кода ускорит развитие библиотеки и даст возможность ресерчам сосредоточиться на ресерче, а не на чистке данных
А ещё мы написали статью на habr, в которой подробно рассказали про то, как собирали датасет для обучения Kandinsky 3.0 & 3.1 и Kandinsky Video. В ней также рассказали про DPF и процесс обработки датасетов у нас в Sber AI.
💻 github DPF
📖 Статья на Хабр
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍4❤3💯2
Forwarded from Ivan Oseledets’ Channel
Media is too big
VIEW IN TELEGRAM
Только что на ПМЭФ-24 мы подписали меморандум о сотрудничестве с ГИАП. Делюсь видео с места событий.
🔥27❤12🎉7👍1
Forwarded from Valuable AI / Валентин Малых
людишки еще не поняли, к чему все идет
утащил у Дмитрия Колодезева
утащил у Дмитрия Колодезева
😁40💯20👍8
📚Мой хороший друг Сергей Марков @oulenspiegel написал отличный двухтомник про AI «Охота на электроовец: большая книга искусственного интеллекта». Там и про проблемы и вызовы современных моделей, и про страхи, бытующие в обществе, и про многое другое!
Советую всем к прочтению, ибо там собрана квинтэссенция результатов, которые в сложном RnD процессе можно получить только за годы опыта.
Полные электронные версии книги (epub, docx, pdf) можно скачать с сайта бесплатно: https://markoff.science#book
Советую всем к прочтению, ибо там собрана квинтэссенция результатов, которые в сложном RnD процессе можно получить только за годы опыта.
Полные электронные версии книги (epub, docx, pdf) можно скачать с сайта бесплатно: https://markoff.science#book
👍42🔥27⚡4❤1😁1
На днях вышла очередная модель Luma - “убийца” Sora (модель от Open AI, которая генерирует фантастические по качеству видео по тексту)
С учётом наплыва активности на новый сервис, запустив генерацию вчера в районе 21, где-то под утро видео-таки сгенерировалось (довольно хорошее качество, кадры хорошо согласуются друг с другом, движения плавные).
Почитал про команду: изрядный штат ребят с большим опытом в 3D. Вот первая фамилия в команде
https://yoopaul.github.io/
Ну и остальные далее тоже ребята с авторством в статьях по NERF и прочему
https://lumalabs.ai/team
На мой взгляд вновь подтверждается, что то, что мы называем «видео» - это на самом деле основано на огромных массивах рендерингов сцен.
Snap, кстати, на днях выпустили статью про синтез 4D сцен на базе диффузионных моделей генерации видео (сначала синтезируются ролики text-to-video моделью, а далее каждый кадр фиксируется и создаются «пролёты» на базе гауссова сплаттинга)
С учётом наплыва активности на новый сервис, запустив генерацию вчера в районе 21, где-то под утро видео-таки сгенерировалось (довольно хорошее качество, кадры хорошо согласуются друг с другом, движения плавные).
Почитал про команду: изрядный штат ребят с большим опытом в 3D. Вот первая фамилия в команде
https://yoopaul.github.io/
Ну и остальные далее тоже ребята с авторством в статьях по NERF и прочему
https://lumalabs.ai/team
На мой взгляд вновь подтверждается, что то, что мы называем «видео» - это на самом деле основано на огромных массивах рендерингов сцен.
Snap, кстати, на днях выпустили статью про синтез 4D сцен на базе диффузионных моделей генерации видео (сначала синтезируются ролики text-to-video моделью, а далее каждый кадр фиксируется и создаются «пролёты» на базе гауссова сплаттинга)
⚡17❤🔥6🔥6👍3👎1
Буквально пару дней назад команда Яндекса выпустила в опенсорс новый инструмент — библиотеку YaFSDP (FSDP — один из широко используемых алгоритмов обучения с параллелизмом по данным и "нарезкой" параметров модели по отдельным GPU).
Доработка FSDP позволяет, судя по замерам, ускорить обучение различных LLM до 25% (при небольшом батче) в зависимости от архитектурных особенностей.
С точки зрения выч. ресурсов на самую затратную часть исследовательского процесса — обучение моделей — можно сократить использование GPU мощностей на 20%.
🧠В технические детали можно погрузиться на Хабре (там еще довольно хорошо описали проблемы известных механизмов обучения и историю их развития в контексте распределённого обучения) и в канале Душный NLP
Доработка FSDP позволяет, судя по замерам, ускорить обучение различных LLM до 25% (при небольшом батче) в зависимости от архитектурных особенностей.
С точки зрения выч. ресурсов на самую затратную часть исследовательского процесса — обучение моделей — можно сократить использование GPU мощностей на 20%.
🧠В технические детали можно погрузиться на Хабре (там еще довольно хорошо описали проблемы известных механизмов обучения и историю их развития в контексте распределённого обучения) и в канале Душный NLP
GitHub
GitHub - yandex/YaFSDP: YaFSDP: Yet another Fully Sharded Data Parallel
YaFSDP: Yet another Fully Sharded Data Parallel. Contribute to yandex/YaFSDP development by creating an account on GitHub.
❤🔥18❤9🔥8
Forwarded from GigaChat
This media is not supported in your browser
VIEW IN TELEGRAM
Kandinsky — 2️⃣ года! Только цифры:
4️⃣ дня понадобилось Kandinsky 2.1, чтобы набрать 1 млн уникальных пользователей
1️⃣ место по темпу роста среди Open Source моделей заняла модель Kandinsky 2.2
6️⃣ 0️⃣ 0️⃣ млн изображений сгенерировали нейрохудожники
За это время Kandinsky стал генерировать изображения в 10 раз быстрее, научился создавать анимации и видео и собрал вокруг себя самых творческих юзеров.
За этими достижениями стоит команда людей с горящими глазами, влюблённых в свою работу — и в этом видео мы предлагаем с ними познакомиться.
Что своему нейродругу скажет GigaChat?
А сегодня ваша генерация может стать аватаркой сообщества нейрохудожников!
🖼 — клик, чтобы попасть на главную
За это время Kandinsky стал генерировать изображения в 10 раз быстрее, научился создавать анимации и видео и собрал вокруг себя самых творческих юзеров.
За этими достижениями стоит команда людей с горящими глазами, влюблённых в свою работу — и в этом видео мы предлагаем с ними познакомиться.
Что своему нейродругу скажет GigaChat?
Дорогой Kandinsky, сердечно поздравляю тебя с днём рождения! Желаю тебе всегда оставаться таким же прекрасным генератором изображений, каким мы все тебя знаем и любим.
Пусть твои творческие возможности растут вместе с твоим желанием создавать новые шедевры. И пусть твои нейроны всегда будут такими же активными и креативными, как в первый день работы!
А сегодня ваша генерация может стать аватаркой сообщества нейрохудожников!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤34👏20❤🔥11👍4👎4🏆4😁2🔥1