Neurogen

Ну вот, собственно, и Stable Diffusion 3 Medium вышел

StabilityAI выложили 3 версии модели:

sd3_medium.safetensors включает веса MMDiT и VAE, но не включает никаких текстовых енкодеров.

sd3_medium_incl_clips_t5xxlfp8.safetensors содержит все необходимые веса, включая версию текстового энкодера T5XXL fp8, обеспечивающую баланс между качеством и требованиями к ресурсам.

sd3_medium_incl_clips.safetensors включает в себя все необходимые веса, за исключением текстового энкодера T5XXL. Требует минимальных ресурсов, но производительность модели будет отличаться без текстового кодера T5XXL.

Скачать модель можно с HuggingFace
Там же можно найти готовые воркфлоу для ComfyUI

@neurogen_news

#sd #txt2img #sd3

9.3K viewsRoman Sedykh [Neurogen], edited 14:08

Neurogen

Omost Portable by Neurogen v1.0

Omost - это новый подход к генерации изображений. Под капотом смесь из специально обученной языковой модели и SD XL.

Как это работает:
- Вы пишите запрос в свободной форме на удобном вам языке, например "нарисуй как дракон атакует средневековый замок".
- После чего, языковая модель составит детальную инструкцию для SD XL. После генерации инструкции вы можете сгенерировать изображение.
- Если вы хотели бы что-то поменять, просто напишите, например "замени дракона на вертолет".

Особенности сборки:
- По умолчанию используется JuggernautXL 8 вместо RealVisXL
- Обновлены необходимые библиотеки

Omost Portable доступен всем для бесплатного скачивания в моем Boosty

#sd #txt2img

@neurogen_news

boosty.to

Omost Portable by Neurogen - Neurogen

Omost - это новый подход к генерации изображений. Под капотом смесь из специально обученной языковой модели и SD XL.
Как это работает:
- Вы пишите запрос в свободной форме на удобном вам языке, например "нарисуй как дракон атакует средневековый замок". …

10.9K viewsedited 18:51

Neurogen

MidJourney запустила бесплатные генерации на своем веб-сайте

Одна из главных новостей сегодняшнего дня - MidJourney вновь открыли возможность бесплатных генераций.

После авторизации на их веб-сайте через Google или Discord для вас доступно 25 генераций.

Залогиниться и начать творить можно тут.

#txt2img #aiart #mj #midjourey

Neurogen - подпишись, тут рассказывают про нейросети

10.9K viewsedited 17:16

Neurogen

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

CogVideoX-5B и Topaz Video AI

Почему-то очень многие прошли мимо CogVideoX-5B, хотя все так долго ждали нормальную нейросеть для локальной генерации видео по тексту. Видимо, многих отпугнуло, что видео генерируется с разрешением 720x480 и в 8 FPS.
Но по факту, и это не проблема, ведь у нас есть и другие нейросети, увеличивающие как разрешение, так и количество кадров.

Наиболее простым тут будет Topaz Video AI. Продукт быстрый, не сильно требовательный, а также платный, но тут я думаю вы сами понимаете, что можно придумать 😏

В целом, как раз можете посмотреть до и после: 720х480 было увеличено до 1920x1080, а количество кадров поднято с 8 до 24

#aivideo #ai #txt2img

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

11.8K views01:12

AI новости последней недели: Вышел Flux 1.1 [pro], OpenAI анонсировала Realtime API для Voice Engine

Flux 1.1

Пока что доступна только Pro версия, речи о dev версии пока не идет. Что же касается Pro версии, то на данный момент она является лучшей моделью для генерации изображений, при этом генерация изображения происходит в несколько раз быстрее, по сравнению с прошлой версией.

Протестировать можно тут. Также бесплатно (пока что) и быстро протестировать модель можно на сервисе BlinkShot.

Realtime API

Realtime API позволяет разработчикам внедрить в свои продукты speech-to-speech, который будет работать с минимальной задержкой, по сравнению с текущими известными решениями. По факту, это позволяет использовать ряд возможностей из нового VoiceEngine, создавая продвинутых голосовых ассистентов. Новый функционал доступен в рамках модели gpt-4o-audio-preview. C документацией уже можно ознакомиться тут.

Цена использования API:
Текст: 5$/1M токенов на вход и 20$/1M токенов на выходе
Аудио: 100$/1M на вход и 200$/1M токенов на выход, или же 0.06$ за 1 минуту аудио на входе и 0.24$ за минуту на выходе.

Пока что для работы будет поддерживаться текст и аудио, но в будущем планируется также добавить поддержку видео. Также планируется выпустить поддержку realtime api на основе gpt-4o-mini

#ainews #chatgpt #flux #txt2img

Neurogen - подпишись, тут рассказывают про нейросети

10.7K views10:27

Neurogen

NeuroIMG.ART - Персональная галерея пользователя

Вы просили - мы сделали. Теперь у каждого пользователя есть Персональная галерея сгенерированных изображений.

У каждого изображения сохраняется позитивные и негативные промпты так ряд других основных параметров.

Обратите внимание, что в целях оптимизации нагрузки на наш сервер, хранятся лишь последние 50 изображений.

#neuroimg #txt2img #img2img

16.1K viewsedited 13:52

About

Blog

Apps

Platform