Forwarded from Нейроэстетика
This media is not supported in your browser
VIEW IN TELEGRAM
Товарищи художники из артстейшн, решили устроить протестную акцию!
Помню в 2017 делал лекцию в Киеве по генеративному ИИ. Вот тогда ИИ никто не воспринимал всерьез... Прошло 5 лет.. Ну, получите распишитесь.
И да, в мире есть вещи похуже ИИ для тех же художников, например "обезьна с гранатой". Ну что, запасаемся попкорном и смотрим как далеко задейт ИИ и как появится движение ИИ-борцев, меч своя на нейронный отпрыск сатаны поднявших и щитом вставших во спасениЯ искусства Человеческого, не машинного!
Только один вопрос.. Если это искусство машинное, чего вы боитесь? Человек же О КАКОЙ!, а машина же бездушная, так? Разве может этот бездушный алгоритм составить вам конкуренцию?
p.s.: знай своих героев, против ИИ свой твит поднявших https://twitter.com/FromHappyRock
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🌚23👎10🐳8❤🔥3⚡1❤1👌1💯1💋1
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
The Washington Post сделал офигенную статью для не технических людей, о том как работает диффузионные модели и все эти генераторы артов:
https://www.washingtonpost.com/technology/interactive/2022/ai-image-generator/
Все на пальцах, рекомендую.
Особенно желательно к просмотру тем, кто думает что нейронка «сшивает» картинки из чужих работ – никакого коллажирования, чистый синтез
https://www.washingtonpost.com/technology/interactive/2022/ai-image-generator/
Все на пальцах, рекомендую.
Особенно желательно к просмотру тем, кто думает что нейронка «сшивает» картинки из чужих работ – никакого коллажирования, чистый синтез
❤50👍9
🤖👨🔬 Пока мы все приходили в себя от ChatGPT — вышла PubMedGPT 2.7B
PubMedGPT 2.7B — это новая языковая модель, обученная исключительно биомедицинским рефератам и статьям из The Pile. Эта GPT может достигать высоких результатов в различных биомедицинских задачах НЛП.
PubMedGPT была разработана Stanford CRFM и MosaicML.
Так что, если ты на биофаке и тебе пора писать диплом, ты знаешь что делать.. PubMedGPT + ChatGPT и погнали.
🧪 потестить демо на 🤗
PubMedGPT 2.7B — это новая языковая модель, обученная исключительно биомедицинским рефератам и статьям из The Pile. Эта GPT может достигать высоких результатов в различных биомедицинских задачах НЛП.
PubMedGPT была разработана Stanford CRFM и MosaicML.
Так что, если ты на биофаке и тебе пора писать диплом, ты знаешь что делать.. PubMedGPT + ChatGPT и погнали.
🧪 потестить демо на 🤗
🔥62👍9❤3👎3
😈 Режим бога в Тиндере — ChatGPT
«Напиши ей так, чтобы аж ...»
Не, ну а что? В любви все методы хороши.
🔥 П Р О Э Т О
«Напиши ей так, чтобы аж ...»
Не, ну а что? В любви все методы хороши.
🔥 П Р О Э Т О
❤🔥63🔥14👍4❤1🥰1😍1🐳1💋1
РФ! СДОХНИ!
Желаю всем освобождения от Путинского режима! И россиянам в первую очередь!
Желаю всем освобождения от Путинского режима! И россиянам в первую очередь!
👎839👍448❤71❤🔥39🕊34😢25🔥19🙏13💔11🥰5
🎄 Лучший способ поддержать канал — поддержать Украину! Ссылки для тех, кому не все равно!
👉 https://u24.gov.ua/
👉 https://savelife.in.ua/
p.s.: Всех с наступающим!
Даша, спасибо тебе!
Діма, спасибо!
Олексiй, спасибо!
Volodymyr, спасибо!
Саша, спасибо!
Натали, спасибо!
Алексей, спасибо!
Виталий, спасибо!
Антон, спасибо!
👉 https://u24.gov.ua/
👉 https://savelife.in.ua/
p.s.: Всех с наступающим!
Даша, спасибо тебе!
Діма, спасибо!
Олексiй, спасибо!
Volodymyr, спасибо!
Саша, спасибо!
Натали, спасибо!
Алексей, спасибо!
Виталий, спасибо!
Антон, спасибо!
👎311❤268👍33🔥12❤🔥7🕊3🌚2🤯1😢1💔1
🚀 ЧТО-ТО ПРОИСХОДИТ! И ЭТО ОПЯТЬ STABILITY AI
Эмад что-то мутит.. Твит следующий: две девушки, у обеих (не поверите) 5 пальцев!
Левая с серьезным лицом держит руку, как нечто среднее между "Vulcan Salute" и "Enough" — 🖖🏼 Enough 2022
Правая с улыбкой приветствует нас — 🖐🏾 Welcome 2023
Давайте попробуем разобраться, что же за подарок готовит Stability в 2023 году?
Вот комментарии под постом:
— Ну наконец то!! спасибо Эмад
— Ох, пять пальцев, похоже, многообещающий 2023 год😂
— IF? Вы тизерите новую модель текст-2-изображение?🤨
— Теперь получите SD 3.0 это поражает🤯
— Я ЛЮБЛЮ эти руки
— SD 3.0 неужели!?
— Что значит "IF" в нижнем углу!?
Попробуем сделать выводы:
— Что это вообще?
— Были мысли, что это файнтюн. Но Эмад бы не делал такой громкий пост, разделяя 2022 и 2023. Я думаю, что стабилити готовит большой релиз: новую Text-2-Image модель в 2023!
— Нас ждет SD 3.0?
— Возможно, но почему IF и что такое IF?? Да и если IF просто внутренне имя проекта, то зачем делать для него вотермарку?
— Насколько качественная будет модель?
— Судя по рукам, это что-то действительно серьезное и умное. Плюс мы видим сцены, цвет платья, расу, позу, прическу.
— Скоро ждать новую модель?
— +- Месяц. Почему? Эмад очень открытый человек, и скорее всего поделился промежуточными результатами. Но они уже поражают, несмотря на некоторые проблемы с детализацией (волосы, глаза, зубы у девушки справа). Мне кажется, что это не финальный чекпоинт. Помню как Эмад показывал результаты SD за +- месяц до релиза.
— Что такое IF?
— Тут я хз. 🤔 Мне вспоминается одна из самых трогательных песен группы пинк флойд — IF:
If I were a swan, I'd be gone
If I were a train, I'd be late again
If I were a good man, I'd talk with you more often than I do
Но а так я понятия не имею, что это значит...
p.s.: Видна еще пачка генерация под квадратом с правой девушкой. Возможно намек на новые улики? но меня волнует другое...
Ч Т О Ж Е Т А К О Е IF ?
👾 Твит Эмада
@ м и ш и н л е р н и н г
Эмад что-то мутит.. Твит следующий: две девушки, у обеих (не поверите) 5 пальцев!
Левая с серьезным лицом держит руку, как нечто среднее между "Vulcan Salute" и "Enough" — 🖖🏼 Enough 2022
Правая с улыбкой приветствует нас — 🖐🏾 Welcome 2023
Давайте попробуем разобраться, что же за подарок готовит Stability в 2023 году?
Вот комментарии под постом:
— Ну наконец то!! спасибо Эмад
— Ох, пять пальцев, похоже, многообещающий 2023 год😂
— IF? Вы тизерите новую модель текст-2-изображение?🤨
— Теперь получите SD 3.0 это поражает🤯
— Я ЛЮБЛЮ эти руки
— SD 3.0 неужели!?
— Что значит "IF" в нижнем углу!?
Попробуем сделать выводы:
— Что это вообще?
— Были мысли, что это файнтюн. Но Эмад бы не делал такой громкий пост, разделяя 2022 и 2023. Я думаю, что стабилити готовит большой релиз: новую Text-2-Image модель в 2023!
— Нас ждет SD 3.0?
— Возможно, но почему IF и что такое IF?? Да и если IF просто внутренне имя проекта, то зачем делать для него вотермарку?
— Насколько качественная будет модель?
— Судя по рукам, это что-то действительно серьезное и умное. Плюс мы видим сцены, цвет платья, расу, позу, прическу.
— Скоро ждать новую модель?
— +- Месяц. Почему? Эмад очень открытый человек, и скорее всего поделился промежуточными результатами. Но они уже поражают, несмотря на некоторые проблемы с детализацией (волосы, глаза, зубы у девушки справа). Мне кажется, что это не финальный чекпоинт. Помню как Эмад показывал результаты SD за +- месяц до релиза.
— Что такое IF?
— Тут я хз. 🤔 Мне вспоминается одна из самых трогательных песен группы пинк флойд — IF:
If I were a swan, I'd be gone
If I were a train, I'd be late again
If I were a good man, I'd talk with you more often than I do
Но а так я понятия не имею, что это значит...
p.s.: Видна еще пачка генерация под квадратом с правой девушкой. Возможно намек на новые улики? но меня волнует другое...
Ч Т О Ж Е Т А К О Е IF ?
👾 Твит Эмада
@ м и ш и н л е р н и н г
👍59❤🔥5👎5🥰2❤1🤯1😍1🏆1
Мишин Лернинг 🇺🇦🇮🇱
🚀 ЧТО-ТО ПРОИСХОДИТ! И ЭТО ОПЯТЬ STABILITY AI Эмад что-то мутит.. Твит следующий: две девушки, у обеих (не поверите) 5 пальцев! Левая с серьезным лицом держит руку, как нечто среднее между "Vulcan Salute" и "Enough" — 🖖🏼 Enough 2022 Правая с улыбкой приветствует…
🎄 UPD; Скорее всего речь идет про файнтюн и дистил
Все что далее — не более чем догадки комьюнити, но прошло уже несколько дней и можно сделать выводы на основании сообщений Эмада и комментариев под его постом:
> https://fortune.com/2022/12/07/a-i-luminaries-expressed-awe-and-caution-at-the-technologys-breakthrough-moment/ <
— Обещает 30x по-скорости в сравнение с SD 1,2
— Скорее всего IF это дистил — Implicit Fine-tune (a.k.a denoising diffusion implicit models (DDIM) distillation)
— Руки тоже могли быть улучшены на этапе файнтюна модели учителя.
tl;dr DDIM distillation, идея берущая начало в ddim и Progressive Distillation for Fast Sampling of Diffusion Models, позволяет сократить кол-во шагов с 50-250 до 8-16 с сохранение с качества.
Подход предполагает дистил семплинга ddim из учителя в 512-шагового студента, затем студент становится учителем и учит следующего студента в 256 шагов и т.д.
Все что далее — не более чем догадки комьюнити, но прошло уже несколько дней и можно сделать выводы на основании сообщений Эмада и комментариев под его постом:
> https://fortune.com/2022/12/07/a-i-luminaries-expressed-awe-and-caution-at-the-technologys-breakthrough-moment/ <
— Обещает 30x по-скорости в сравнение с SD 1,2
— Скорее всего IF это дистил — Implicit Fine-tune (a.k.a denoising diffusion implicit models (DDIM) distillation)
— Руки тоже могли быть улучшены на этапе файнтюна модели учителя.
tl;dr DDIM distillation, идея берущая начало в ddim и Progressive Distillation for Fast Sampling of Diffusion Models, позволяет сократить кол-во шагов с 50-250 до 8-16 с сохранение с качества.
Подход предполагает дистил семплинга ddim из учителя в 512-шагового студента, затем студент становится учителем и учит следующего студента в 256 шагов и т.д.
Fortune
Even A.I. experts are awed by the power of the latest Generative A.I. tools
Fortune's Brainstorm A.I. conference showed the power and potential of Generative A.I., and the need for the industry to tread cautiously.
👍33⚡3🐳3🕊2👨💻2😢1
😈 Тут Мэттью Беллами отложил гитару и выпустил Pereto SOTA Text-to-Image — MUSE
Все знают, что Мэттью Беллами не любил авторегрессировать и его мутило от диффуза:
Отойдя от мейнстримной диффузии, пропустив скучную Parti, и оставив DALL-E в дали, Метью Беллами выбралBERT 3B Muse: Text-To-Image Generation via Masked Generative Transformers.
И что, подход оказался Сотой? Да. Вот уж действительно — suck & see.
Рецепт композиции прост:
— Замораживаем T5, как известно энкодер в text2image, чаще всего, это блюдо, которое подают холодным.
— VQ-GAN двух размеров: 256 для главного блюда, и 512 для супер-реза
— Подаем картинку в VQ-vae-GAN, аккуратно и с Вниманием «нарезаем» на токены
— Все это дело вместе с кросс-аттеншен прокручиваем через Vaswani et al., 2017
— Обучаем по Cosine scheduling через зашумление — маскировку токенов.
— Инферить, постепенно предсказывая замаскированные токены от 100% до 0.
— При удачной генерации в 256, подать на супер-рез
— Такой подход можно из коробки использовать для разных форм инпеинтинга и аутпентинга.
Интересно то, что получается очень эффективная сеть по Pereto: COCO FID@30K 7.88 при CLIP score = 0.32
А это, прям очень очень сильно!
Вместо вывода: Трансформеры наносят ответный удар, или не диффузом единым
p.s.: Другими словами это Paella здорового человека: «Маскировочный» Muse гомологичен диффузионному Imagen (с блекджеком, кросс аттеншн и t5 xxl), тогда как «маскировочный» «мама, я ПАЕЛЛА» гомологична диффузионному DALL-E 2.
И быстрая вещь, как Paella. Скорость 0.5 sec на 256 и еще 1.3 sec на 512!
💻 Проект MUSE от GOOGLE
📄 paper MUSE
Все знают, что Мэттью Беллами не любил авторегрессировать и его мутило от диффуза:
Отойдя от мейнстримной диффузии, пропустив скучную Parti, и оставив DALL-E в дали, Метью Беллами выбрал
И что, подход оказался Сотой? Да. Вот уж действительно — suck & see.
Рецепт композиции прост:
— Замораживаем T5, как известно энкодер в text2image, чаще всего, это блюдо, которое подают холодным.
— VQ-GAN двух размеров: 256 для главного блюда, и 512 для супер-реза
— Подаем картинку в VQ-vae-GAN, аккуратно и с Вниманием «нарезаем» на токены
— Все это дело вместе с кросс-аттеншен прокручиваем через Vaswani et al., 2017
— Обучаем по Cosine scheduling через зашумление — маскировку токенов.
— Инферить, постепенно предсказывая замаскированные токены от 100% до 0.
— При удачной генерации в 256, подать на супер-рез
— Такой подход можно из коробки использовать для разных форм инпеинтинга и аутпентинга.
Интересно то, что получается очень эффективная сеть по Pereto: COCO FID@30K 7.88 при CLIP score = 0.32
А это, прям очень очень сильно!
Вместо вывода: Трансформеры наносят ответный удар, или не диффузом единым
p.s.: Другими словами это Paella здорового человека: «Маскировочный» Muse гомологичен диффузионному Imagen (с блекджеком, кросс аттеншн и t5 xxl), тогда как «маскировочный» «мама, я ПАЕЛЛА» гомологична диффузионному DALL-E 2.
И быстрая вещь, как Paella. Скорость 0.5 sec на 256 и еще 1.3 sec на 512!
💻 Проект MUSE от GOOGLE
📄 paper MUSE
🔥49👍11❤2💋2❤🔥1🤯1
Microsoft готовятся к интеграции поисковика Bing с ChatGPT
💻 bloomberg
Это самая важная новость за сегодня?
💻 bloomberg
Это самая важная новость за сегодня?
❤56🔥27🤯17👎5👍1
Очень советую подписаться, чтобы не пропустить сегодняшний супер важный твит!
👉 https://twitter.com/_bra_ket
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥47👎18👍9❤🔥2🕊2❤1🤯1🌚1🍓1💋1
📰 В The Neuron Daily статья про то, что, вероятно, нас ожидает новая модель!
Дальше перевод статьи источника The Neuron Daily:
***
Это просто совпадение или какое-то дружеское соревнование?
Вчера мы говорили о новой text2image модели Muse от Google . Небольшая деталь, которую мы не указали: на странице их проекта изображения, на которых написано «Muse».
Исследователи подмечают, что Muse отлично генерирует изображения, содержащие текст. С чем, кстати, не справляются ни DALL-E 2, ни Stable Diffusion!
Сегодня в твиттере появлись несколько картинок, которые намекают: «Смотрите какой сложный текст мы можем генерировать».
Выводы: Скорее всего, это новая модель под названием IF (см. правый нижний угол изображений), разработанная новой лабой DeepFloyd .
Некоторые надеются, что это еще и долгожданная «дистиллированная» модель, способная ускорить генерацию изображений в 20 раз. Это тоже была одна из центральных тем Muse!
Наконец, Stability AI — это Stability AI .
Пока ничего официального, и мы можем ошибаться. Мы вернемся, когда у нас будут новости о IF и DeepFloyd.
***
мишин лернинг
Дальше перевод статьи источника The Neuron Daily:
***
Это просто совпадение или какое-то дружеское соревнование?
Вчера мы говорили о новой text2image модели Muse от Google . Небольшая деталь, которую мы не указали: на странице их проекта изображения, на которых написано «Muse».
Исследователи подмечают, что Muse отлично генерирует изображения, содержащие текст. С чем, кстати, не справляются ни DALL-E 2, ни Stable Diffusion!
Сегодня в твиттере появлись несколько картинок, которые намекают: «Смотрите какой сложный текст мы можем генерировать».
Выводы: Скорее всего, это новая модель под названием IF (см. правый нижний угол изображений), разработанная новой лабой DeepFloyd .
Некоторые надеются, что это еще и долгожданная «дистиллированная» модель, способная ускорить генерацию изображений в 20 раз. Это тоже была одна из центральных тем Muse!
Наконец, Stability AI — это Stability AI .
Пока ничего официального, и мы можем ошибаться. Мы вернемся, когда у нас будут новости о IF и DeepFloyd.
***
мишин лернинг
🔥37👍8❤🔥4🌚2💯2👎1😍1🐳1