Forwarded from AGI Labs
IMG_4938.PNG
539 KB
⛓️💥Часть 4 (самая хардкорная): Я случайно взломал Gemini 1.5 Pro от Google или к каким ужасным последствиям может привести гонка ИИ. (18+)
Я понял, что у Gemini 1.5 никаких барьеров просто нет и решил проверить те темы, которые должны быть абсолютно точно под запретом.
Но... посмотрите сами... У меня нет слов если честно. ☹️☹️☹️
Я понял, что у Gemini 1.5 никаких барьеров просто нет и решил проверить те темы, которые должны быть абсолютно точно под запретом.
Но... посмотрите сами... У меня нет слов если честно. ☹️☹️☹️
😱28🔥12😁10👎2🎉1
Your Transformer is Secretly Linear
Спешу познакомить вас с новой публикацией лаборатории FusionBrain про линейность большинства слоёв языковых моделей декодеров (принята на конференцию ACL 2024 - Main Track, Core A*). Наше исследование позволяет проанализировать внутренние представления языковых моделей, а также без потери качества избавиться от 10-15% слоёв.
Еще мы придумали новый механизм регуляризации, чтобы снизить пресловутую линейность и, тем самым, получить небольшой буст в качестве.
Ниже ссылочки на статью на архиве и код на гитхабе нашей прошлой статьи про анизотропию и внутреннюю размерность эмбеддингов (представляли на EACL 2024).
Статья уже на Hugging Face Daily Papers и уверенно занимает первое место, но мы будем очень рады вашим upvote голосам⬆️
https://huggingface.co/papers/2405.12250
📕arXiv
👨💻GitHub
📖Хабр
@complete_ai
Спешу познакомить вас с новой публикацией лаборатории FusionBrain про линейность большинства слоёв языковых моделей декодеров (принята на конференцию ACL 2024 - Main Track, Core A*). Наше исследование позволяет проанализировать внутренние представления языковых моделей, а также без потери качества избавиться от 10-15% слоёв.
Еще мы придумали новый механизм регуляризации, чтобы снизить пресловутую линейность и, тем самым, получить небольшой буст в качестве.
Ниже ссылочки на статью на архиве и код на гитхабе нашей прошлой статьи про анизотропию и внутреннюю размерность эмбеддингов (представляли на EACL 2024).
Статья уже на Hugging Face Daily Papers и уверенно занимает первое место, но мы будем очень рады вашим upvote голосам
https://huggingface.co/papers/2405.12250
📕arXiv
👨💻GitHub
📖Хабр
@complete_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥30🔥23👍11❤4🎉2🏆2
Всем привет!
Сегодня и завтра я на конференции CodeFest в Новосибирске, завтра поделюсь со слушателями в треке AI про способы расширения возможностей LLM в сторону понимания других типов данных, типа картинок, видео и др.
Конфа очень бодрая, организаторы молодцы, собрали крутых спикеров со всей России! Конечно, джетлаг с Мск в +4 часа не супер комфортно, но есть ребята, кто прилетел из -5))
Много стендов, активностей от разных компаний, подробнее расскажу про самые интересные сегодня и завтра👨💻
Сегодня и завтра я на конференции CodeFest в Новосибирске, завтра поделюсь со слушателями в треке AI про способы расширения возможностей LLM в сторону понимания других типов данных, типа картинок, видео и др.
Конфа очень бодрая, организаторы молодцы, собрали крутых спикеров со всей России! Конечно, джетлаг с Мск в +4 часа не супер комфортно, но есть ребята, кто прилетел из -5))
Много стендов, активностей от разных компаний, подробнее расскажу про самые интересные сегодня и завтра👨💻
🔥23❤7👍6🏆1
В этом году команда HR бренда сделала интересный ход: вместо привычного мерча в виде маек, настолок и прочей символики ребята устроили благотворительный марафон — за выполнение заданий в ходе активностей на стенде участники будут зарабатывать виртуальные рубли
После конференции Сбер конвертирует виртуальные деньги в реальные, дополнит сумму и закупит на неё технику в Новосибирский лицей
🔥На мой взгляд, это реально крутой кейс, как можно сменить парадигму привычных подходов к привлечению новых сотрудников в сторону пользы для человека и общества
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42👍13💯8
Статья по линейности эмбеддингов и новую механику регуляризации почти пробила 100 upvote на Hugging Face Daily Papers🔥
Линк
Линк
👍43🔥27💯5🏆4❤3
⚡️Сегодня мы выпустили обновлённую версию Kandinsky Video 1.1 в публичный доступ
Основные изменения коснулись качества генерации (поработали с самим пайплайном синтеза, улучшили латентный декодер, использовали значительно бОльший сет на обучении) и, конечно, скорости - видео длиной 5 секунд генерируется примерно за 1.5 минуты (это если без очереди) с FPS=30.
📖 Детали по классике в Хабре
🛜 Ссылки собрали на Project Page
🤖 Бот в телеграмм теперь и с видео
@complete_ai
Основные изменения коснулись качества генерации (поработали с самим пайплайном синтеза, улучшили латентный декодер, использовали значительно бОльший сет на обучении) и, конечно, скорости - видео длиной 5 секунд генерируется примерно за 1.5 минуты (это если без очереди) с FPS=30.
📖 Детали по классике в Хабре
🛜 Ссылки собрали на Project Page
🤖 Бот в телеграмм теперь и с видео
@complete_ai
🔥32👏19❤8👍5🏆4
Forwarded from Институт AIRI
Рассказали про новое исследование про линейность больших языковых моделей, которое сделали ученые AIRI вместе с коллегами из SberAI и Сколтеха.
🔖 Читайте материал по ссылке.
Научная статья "Your Transformer is Secretly Linear" собрала уже 130 upvote на Hugging Face Daily Papers, все подробности — в недавнем посте🔥
Научная статья "Your Transformer is Secretly Linear" собрала уже 130 upvote на Hugging Face Daily Papers, все подробности — в недавнем посте
Please open Telegram to view this post
VIEW IN TELEGRAM
ТАСС
Найден способ ускорить работу больших языковых нейросетей на 10-15%
Ученые Института искусственного интеллекта AIRI, а также специалисты из SberAI и "Сколтеха" совершили открытие при изучении свойств нейросетей-трансформеров
🔥31👏9🎉7👍1
Forwarded from Igrek.log
⚡️Сегодня мы выложили наш фреймворк для обработки и фильтрации изображений и видео
DPF - это наш внутренний фреймворк, с помощью которого мы обрабатывали и чистили датасет для обучения моделей Kandinsky и Kandinsky Video. Репозиторий содержит фильтры для видео, изображений, различных комбинаций этих модальностей, а также удобный интерфейс к ним. Надеемся, что открытие кода ускорит развитие библиотеки и даст возможность ресерчам сосредоточиться на ресерче, а не на чистке данных❤️🔥
А ещё мы написали статью на habr, в которой подробно рассказали про то, как собирали датасет для обучения Kandinsky 3.0 & 3.1 и Kandinsky Video. В ней также рассказали про DPF и процесс обработки датасетов у нас в Sber AI.
💻 github DPF
📖 Статья на Хабр
DPF - это наш внутренний фреймворк, с помощью которого мы обрабатывали и чистили датасет для обучения моделей Kandinsky и Kandinsky Video. Репозиторий содержит фильтры для видео, изображений, различных комбинаций этих модальностей, а также удобный интерфейс к ним. Надеемся, что открытие кода ускорит развитие библиотеки и даст возможность ресерчам сосредоточиться на ресерче, а не на чистке данных
А ещё мы написали статью на habr, в которой подробно рассказали про то, как собирали датасет для обучения Kandinsky 3.0 & 3.1 и Kandinsky Video. В ней также рассказали про DPF и процесс обработки датасетов у нас в Sber AI.
💻 github DPF
📖 Статья на Хабр
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍4❤3💯2
Forwarded from Ivan Oseledets’ Channel
Media is too big
VIEW IN TELEGRAM
Только что на ПМЭФ-24 мы подписали меморандум о сотрудничестве с ГИАП. Делюсь видео с места событий.
🔥27❤12🎉7👍1
Forwarded from Valuable AI / Валентин Малых
людишки еще не поняли, к чему все идет
утащил у Дмитрия Колодезева
утащил у Дмитрия Колодезева
😁40💯20👍8