Ну вот, собственно, и Stable Diffusion 3 Medium вышел
StabilityAI выложили 3 версии модели:
sd3_medium.safetensors включает веса MMDiT и VAE, но не включает никаких текстовых енкодеров.
sd3_medium_incl_clips_t5xxlfp8.safetensors содержит все необходимые веса, включая версию текстового энкодера T5XXL fp8, обеспечивающую баланс между качеством и требованиями к ресурсам.
sd3_medium_incl_clips.safetensors включает в себя все необходимые веса, за исключением текстового энкодера T5XXL. Требует минимальных ресурсов, но производительность модели будет отличаться без текстового кодера T5XXL.
Скачать модель можно с HuggingFace
Там же можно найти готовые воркфлоу для ComfyUI
@neurogen_news
#sd #txt2img #sd3
StabilityAI выложили 3 версии модели:
sd3_medium.safetensors включает веса MMDiT и VAE, но не включает никаких текстовых енкодеров.
sd3_medium_incl_clips_t5xxlfp8.safetensors содержит все необходимые веса, включая версию текстового энкодера T5XXL fp8, обеспечивающую баланс между качеством и требованиями к ресурсам.
sd3_medium_incl_clips.safetensors включает в себя все необходимые веса, за исключением текстового энкодера T5XXL. Требует минимальных ресурсов, но производительность модели будет отличаться без текстового кодера T5XXL.
Скачать модель можно с HuggingFace
Там же можно найти готовые воркфлоу для ComfyUI
@neurogen_news
#sd #txt2img #sd3
Omost Portable by Neurogen v1.0
Omost - это новый подход к генерации изображений. Под капотом смесь из специально обученной языковой модели и SD XL.
Как это работает:
- Вы пишите запрос в свободной форме на удобном вам языке, например "нарисуй как дракон атакует средневековый замок".
- После чего, языковая модель составит детальную инструкцию для SD XL. После генерации инструкции вы можете сгенерировать изображение.
- Если вы хотели бы что-то поменять, просто напишите, например "замени дракона на вертолет".
Особенности сборки:
- По умолчанию используется JuggernautXL 8 вместо RealVisXL
- Обновлены необходимые библиотеки
Omost Portable доступен всем для бесплатного скачивания в моем Boosty
#sd #txt2img
@neurogen_news
Omost - это новый подход к генерации изображений. Под капотом смесь из специально обученной языковой модели и SD XL.
Как это работает:
- Вы пишите запрос в свободной форме на удобном вам языке, например "нарисуй как дракон атакует средневековый замок".
- После чего, языковая модель составит детальную инструкцию для SD XL. После генерации инструкции вы можете сгенерировать изображение.
- Если вы хотели бы что-то поменять, просто напишите, например "замени дракона на вертолет".
Особенности сборки:
- По умолчанию используется JuggernautXL 8 вместо RealVisXL
- Обновлены необходимые библиотеки
Omost Portable доступен всем для бесплатного скачивания в моем Boosty
#sd #txt2img
@neurogen_news
boosty.to
Omost Portable by Neurogen - Neurogen
Omost - это новый подход к генерации изображений. Под капотом смесь из специально обученной языковой модели и SD XL.
Как это работает:
- Вы пишите запрос в свободной форме на удобном вам языке, например "нарисуй как дракон атакует средневековый замок". …
Как это работает:
- Вы пишите запрос в свободной форме на удобном вам языке, например "нарисуй как дракон атакует средневековый замок". …
MidJourney запустила бесплатные генерации на своем веб-сайте
Одна из главных новостей сегодняшнего дня - MidJourney вновь открыли возможность бесплатных генераций.
После авторизации на их веб-сайте через Google или Discord для вас доступно 25 генераций.
Залогиниться и начать творить можно тут.
#txt2img #aiart #mj #midjourey
Neurogen - подпишись, тут рассказывают про нейросети
Одна из главных новостей сегодняшнего дня - MidJourney вновь открыли возможность бесплатных генераций.
После авторизации на их веб-сайте через Google или Discord для вас доступно 25 генераций.
Залогиниться и начать творить можно тут.
#txt2img #aiart #mj #midjourey
Neurogen - подпишись, тут рассказывают про нейросети
CogVideoX-5B и Topaz Video AI
Почему-то очень многие прошли мимо CogVideoX-5B, хотя все так долго ждали нормальную нейросеть для локальной генерации видео по тексту. Видимо, многих отпугнуло, что видео генерируется с разрешением 720x480 и в 8 FPS.
Но по факту, и это не проблема, ведь у нас есть и другие нейросети, увеличивающие как разрешение, так и количество кадров.
Наиболее простым тут будет Topaz Video AI. Продукт быстрый, не сильно требовательный, а также платный, но тут я думаю вы сами понимаете, что можно придумать😏
В целом, как раз можете посмотреть до и после: 720х480 было увеличено до 1920x1080, а количество кадров поднято с 8 до 24
#aivideo #ai #txt2img
Почему-то очень многие прошли мимо CogVideoX-5B, хотя все так долго ждали нормальную нейросеть для локальной генерации видео по тексту. Видимо, многих отпугнуло, что видео генерируется с разрешением 720x480 и в 8 FPS.
Но по факту, и это не проблема, ведь у нас есть и другие нейросети, увеличивающие как разрешение, так и количество кадров.
Наиболее простым тут будет Topaz Video AI. Продукт быстрый, не сильно требовательный, а также платный, но тут я думаю вы сами понимаете, что можно придумать
В целом, как раз можете посмотреть до и после: 720х480 было увеличено до 1920x1080, а количество кадров поднято с 8 до 24
#aivideo #ai #txt2img
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
AI новости последней недели: Вышел Flux 1.1 [pro], OpenAI анонсировала Realtime API для Voice Engine
Flux 1.1
Пока что доступна только Pro версия, речи о dev версии пока не идет. Что же касается Pro версии, то на данный момент она является лучшей моделью для генерации изображений, при этом генерация изображения происходит в несколько раз быстрее, по сравнению с прошлой версией.
Протестировать можно тут. Также бесплатно (пока что) и быстро протестировать модель можно на сервисе BlinkShot.
Realtime API
Realtime API позволяет разработчикам внедрить в свои продукты speech-to-speech, который будет работать с минимальной задержкой, по сравнению с текущими известными решениями. По факту, это позволяет использовать ряд возможностей из нового VoiceEngine, создавая продвинутых голосовых ассистентов. Новый функционал доступен в рамках модели gpt-4o-audio-preview. C документацией уже можно ознакомиться тут.
Цена использования API:
Текст: 5$/1M токенов на вход и 20$/1M токенов на выходе
Аудио: 100$/1M на вход и 200$/1M токенов на выход, или же 0.06$ за 1 минуту аудио на входе и 0.24$ за минуту на выходе.
Пока что для работы будет поддерживаться текст и аудио, но в будущем планируется также добавить поддержку видео. Также планируется выпустить поддержку realtime api на основе gpt-4o-mini
#ainews #chatgpt #flux #txt2img
Neurogen - подпишись, тут рассказывают про нейросети
Flux 1.1
Пока что доступна только Pro версия, речи о dev версии пока не идет. Что же касается Pro версии, то на данный момент она является лучшей моделью для генерации изображений, при этом генерация изображения происходит в несколько раз быстрее, по сравнению с прошлой версией.
Протестировать можно тут. Также бесплатно (пока что) и быстро протестировать модель можно на сервисе BlinkShot.
Realtime API
Realtime API позволяет разработчикам внедрить в свои продукты speech-to-speech, который будет работать с минимальной задержкой, по сравнению с текущими известными решениями. По факту, это позволяет использовать ряд возможностей из нового VoiceEngine, создавая продвинутых голосовых ассистентов. Новый функционал доступен в рамках модели gpt-4o-audio-preview. C документацией уже можно ознакомиться тут.
Цена использования API:
Текст: 5$/1M токенов на вход и 20$/1M токенов на выходе
Аудио: 100$/1M на вход и 200$/1M токенов на выход, или же 0.06$ за 1 минуту аудио на входе и 0.24$ за минуту на выходе.
Пока что для работы будет поддерживаться текст и аудио, но в будущем планируется также добавить поддержку видео. Также планируется выпустить поддержку realtime api на основе gpt-4o-mini
#ainews #chatgpt #flux #txt2img
Neurogen - подпишись, тут рассказывают про нейросети
NeuroIMG.ART - Персональная галерея пользователя
Вы просили - мы сделали. Теперь у каждого пользователя есть Персональная галерея сгенерированных изображений.
У каждого изображения сохраняется позитивные и негативные промпты так ряд других основных параметров.
Обратите внимание, что в целях оптимизации нагрузки на наш сервер, хранятся лишь последние 50 изображений.
#neuroimg #txt2img #img2img
Вы просили - мы сделали. Теперь у каждого пользователя есть Персональная галерея сгенерированных изображений.
У каждого изображения сохраняется позитивные и негативные промпты так ряд других основных параметров.
Обратите внимание, что в целях оптимизации нагрузки на наш сервер, хранятся лишь последние 50 изображений.
#neuroimg #txt2img #img2img