Forwarded from Tensor Banana
Flux - новая диффузная модель для генерации картинок.
Заточена на фотореализм и анатомию. Модель весит 24 гига, но уже научились запускать на видеокартах с 12 GB vram (fp8 вместо fp16).
Гайд чтобы запустить локально в comfyUI https://comfyanonymous.github.io/ComfyUI_examples/flux/
Нужен сам ComfyUI portable https://github.com/comfyanonymous/ComfyUI и скачать указанные модели в нужные папки. Затем перетащить скачаную из гайда аниме картинку в comfy, она подгрузит workflow.
Запустил локально в comfyUI в точности fp8. жрет 12.5 GB VRAM + 30 GB RAM. Занимает около 2-х минут на генерацию 1 картинки 1024*768 на 2080ti-22GB. А если запускать в оригинальном качестве fp16 то жрет 21 GB VRAM и тратит 8 минут на 1 картинку.
В comfy у меня первая генерация жрет 12.5 GB, а последующие почему-то 17.5 GB. Видимо какая-то модель не выгружается, клип t5 или vae, можно попробовать
Есть 2 варианта модели - Dev и Schnell, размер одинаковый. Dev - качественнее, Schnell - быстрее (генерирует всего за 4 шага, а не за 20). Schnell я не тестил.
Пока не могу ее заставить полноценное nsfw генерировать. Бубисы хорошо рисует, а вот первычные признаки не может - то трусы там нарисует, то вообще боком или спиной развернет 😁 Надеюсь, поправят файнтюнами. Довольно неплохо рисует пальцы (наконец-то).
Иногда почему-то получаются размытые картинки (и по API и локально) как будто в низком разрешении, хз почему.
Довольно хорошо умеет писать текст на картинках на английском. Кириллицу не любит.
анонс https://blackforestlabs.ai/
веса https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/main
генерировать онлайн https://fal.ai/models/fal-ai/flux/dev?ref=blog.fal.ai
колаб https://colab.research.google.com/github/camenduru/flux-jupyter/blob/main/flux.1-schnell_jupyter.ipynb#scrollTo=mOcigZBrHp5S
Заточена на фотореализм и анатомию. Модель весит 24 гига, но уже научились запускать на видеокартах с 12 GB vram (fp8 вместо fp16).
Гайд чтобы запустить локально в comfyUI https://comfyanonymous.github.io/ComfyUI_examples/flux/
Нужен сам ComfyUI portable https://github.com/comfyanonymous/ComfyUI и скачать указанные модели в нужные папки. Затем перетащить скачаную из гайда аниме картинку в comfy, она подгрузит workflow.
Запустил локально в comfyUI в точности fp8. жрет 12.5 GB VRAM + 30 GB RAM. Занимает около 2-х минут на генерацию 1 картинки 1024*768 на 2080ti-22GB. А если запускать в оригинальном качестве fp16 то жрет 21 GB VRAM и тратит 8 минут на 1 картинку.
В comfy у меня первая генерация жрет 12.5 GB, а последующие почему-то 17.5 GB. Видимо какая-то модель не выгружается, клип t5 или vae, можно попробовать
--lowvram
. Пишут что на 4090 генерация занимает около 30 секунд.Есть 2 варианта модели - Dev и Schnell, размер одинаковый. Dev - качественнее, Schnell - быстрее (генерирует всего за 4 шага, а не за 20). Schnell я не тестил.
Пока не могу ее заставить полноценное nsfw генерировать. Бубисы хорошо рисует, а вот первычные признаки не может - то трусы там нарисует, то вообще боком или спиной развернет 😁 Надеюсь, поправят файнтюнами. Довольно неплохо рисует пальцы (наконец-то).
Иногда почему-то получаются размытые картинки (и по API и локально) как будто в низком разрешении, хз почему.
Довольно хорошо умеет писать текст на картинках на английском. Кириллицу не любит.
анонс https://blackforestlabs.ai/
веса https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/main
генерировать онлайн https://fal.ai/models/fal-ai/flux/dev?ref=blog.fal.ai
колаб https://colab.research.google.com/github/camenduru/flux-jupyter/blob/main/flux.1-schnell_jupyter.ipynb#scrollTo=mOcigZBrHp5S
RopeMod Portable by Neurogen v 2.5 [Nvidia] | Video, IMG, WebCam Deepfake
Видеообзор базовой версии Rope 2.0
Что нового:
- Вернулась поддержка TensorRT (экспериментально), а также он обновлен до версии TensorRT 10.2
- Добавлена возможность выбора FPS вебкамеры.
Пример работы с вебкамерой можно посмотреть тут.
- Добавлена новая модель улучшения лица VQFR
- Добавлена возможность тонкой настройки глаз, можно оставить радужку от оригинала для лучшей замены
- Добавлена возможность тонкой настройки губ и рта.- Исправление некоторых ошибок.
Сборка доступна на Boosty для подписчиков с уровня Патрон. Найти ее можно по ссылке ниже:
Скачать RopeMod v2.5
#deepfake #rope #portable
@neurogen_news
Видеообзор базовой версии Rope 2.0
Что нового:
- Вернулась поддержка TensorRT (экспериментально), а также он обновлен до версии TensorRT 10.2
- Добавлена возможность выбора FPS вебкамеры.
Пример работы с вебкамерой можно посмотреть тут.
- Добавлена новая модель улучшения лица VQFR
- Добавлена возможность тонкой настройки глаз, можно оставить радужку от оригинала для лучшей замены
- Добавлена возможность тонкой настройки губ и рта.- Исправление некоторых ошибок.
Сборка доступна на Boosty для подписчиков с уровня Патрон. Найти ее можно по ссылке ниже:
Скачать RopeMod v2.5
#deepfake #rope #portable
@neurogen_news
LivePortrait Portable by Neurogen v1.1.0
LivePortrait - нейросеть, позволяющая анимировать изображения (а теперь и видео), захватывая мимику с видеофайла. Это потенциально отличный инструмент для аниматоров и разработчиков игр, так как позволяет достаточно просто перенести мимику для их персонажей. Кроме этого, при помощи этой программы можно создать своего цифрового аватара.
Что нового (по сравнению с первой сборкой):
- Код обновлен до актуального на момент 03.08.2024
- Появилась возможность работы video-to-video: на вход мы можем подавать не статичное изображение, а видео.
- Добавлена возможность анимации животных
Скачать сборку LivePortrait Portable
Системные требования: необходимо примерно от 4 до 6 гигабайт видеопамяти и видеокарта Nvidia.
Для запуска используйте файл start_nvidia_portable.bat
#liveportrait #lipsync #aiavatar
Neurogen - подпишись и будь в курсе новинок из мира нейросетей.
LivePortrait - нейросеть, позволяющая анимировать изображения (а теперь и видео), захватывая мимику с видеофайла. Это потенциально отличный инструмент для аниматоров и разработчиков игр, так как позволяет достаточно просто перенести мимику для их персонажей. Кроме этого, при помощи этой программы можно создать своего цифрового аватара.
Что нового (по сравнению с первой сборкой):
- Код обновлен до актуального на момент 03.08.2024
- Появилась возможность работы video-to-video: на вход мы можем подавать не статичное изображение, а видео.
- Добавлена возможность анимации животных
Скачать сборку LivePortrait Portable
Системные требования: необходимо примерно от 4 до 6 гигабайт видеопамяти и видеокарта Nvidia.
Для запуска используйте файл start_nvidia_portable.bat
#liveportrait #lipsync #aiavatar
Neurogen - подпишись и будь в курсе новинок из мира нейросетей.
Последнее время думаю над выпуском в видео-формате проекта "На коленке" , посвященному созданию очень дешевого, но относительного шустрого компа для работы с нейросетями.
По предварительным подсчетам, за 35-40 тысяч рублей, можно собрать машинку со следующими характеристиками:
Процессор: 12 ядер, 24 потока
Оперативная память: 16 гигабайт DDR4 (либо 32, если хватит бюджета)
Видеокарта: Nvidia, с видеопамятью на 10 Гигабайт (поколения RTX 2000, а значит есть тензорные ядра)
SSD: 1 TB NVME
Разумеется, в цену заложены корпус, БП и все остальные базовые нужды для сборка системного блока. В планах после сборки погонять его по различным программам и сравнить с RTX 3060 12GB и чем-то еще. В общем, такой вот нейро-техно-блог.
Опытные сборщики уже понимают, куда я клоню, но не будем раскрывать всех карт сразу☕️
Хотел бы услышать ваше мнение: Интересно ли будет смотреть такой формат, будет ли оно для вас полезным?
По предварительным подсчетам, за 35-40 тысяч рублей, можно собрать машинку со следующими характеристиками:
Процессор: 12 ядер, 24 потока
Оперативная память: 16 гигабайт DDR4 (либо 32, если хватит бюджета)
Видеокарта: Nvidia, с видеопамятью на 10 Гигабайт (поколения RTX 2000, а значит есть тензорные ядра)
SSD: 1 TB NVME
Разумеется, в цену заложены корпус, БП и все остальные базовые нужды для сборка системного блока. В планах после сборки погонять его по различным программам и сравнить с RTX 3060 12GB и чем-то еще. В общем, такой вот нейро-техно-блог.
Опытные сборщики уже понимают, куда я клоню, но не будем раскрывать всех карт сразу
Хотел бы услышать ваше мнение: Интересно ли будет смотреть такой формат, будет ли оно для вас полезным?
Please open Telegram to view this post
VIEW IN TELEGRAM
CogVideoX-2B - локальная SORA-подобная модель для генерации видео.
Модель является самой первой и одновременно младшей из серии моделей CogVideoX. В будущем, разработчики обещают выпустить более крупные версии.
По характеристикам:
Разрешение видео: 720x480
Частота кадров: 8 кадров в секунду
Длина видео: 6 секунд
Требуется минимум 18 Гигабайт видеопамяти при использовании SAT или 36 гигабайт при использовании diffusers в качестве бэкенда.
Если что, то как раз таки версия с веб интерфейсом работает на diffusers.
Разработчики обещают позже оптимизировать работу через diffusers и снизить требования к памяти.
Исходный код проекта можно найти на GitHub.
Попытаться потестить можно тут:
CogVideoX Online Demo
Воркфлоу для ComfyUI:
ComfyUI-CogVideoXWrapper
#text2video #aivideo #sora #video
Neurogen - подпишись, тут рассказывают про нейросети
Модель является самой первой и одновременно младшей из серии моделей CogVideoX. В будущем, разработчики обещают выпустить более крупные версии.
По характеристикам:
Разрешение видео: 720x480
Частота кадров: 8 кадров в секунду
Длина видео: 6 секунд
Требуется минимум 18 Гигабайт видеопамяти при использовании SAT или 36 гигабайт при использовании diffusers в качестве бэкенда.
Если что, то как раз таки версия с веб интерфейсом работает на diffusers.
Разработчики обещают позже оптимизировать работу через diffusers и снизить требования к памяти.
Исходный код проекта можно найти на GitHub.
Попытаться потестить можно тут:
CogVideoX Online Demo
Воркфлоу для ComfyUI:
ComfyUI-CogVideoXWrapper
#text2video #aivideo #sora #video
Neurogen - подпишись, тут рассказывают про нейросети
OpenAI выпустили новую, в два раза более дешевую, версию GPT-4o
Новая модель доступна через API под именем gpt-4o-2024-08-06
Отличия от прошлой версии пока неизвестны, кроме цены, она позволяет экономить 50% на входных данных ($2,50/1 млн входных токенов) и 33% на выходных данных ($10,00/1 млн выходных токенов) по сравнению с gpt-4o-2024-05-13
#chatgpt #openai
Neurogen - подпишись, тут рассказывают про нейросети
Новая модель доступна через API под именем gpt-4o-2024-08-06
Отличия от прошлой версии пока неизвестны, кроме цены, она позволяет экономить 50% на входных данных ($2,50/1 млн входных токенов) и 33% на выходных данных ($10,00/1 млн выходных токенов) по сравнению с gpt-4o-2024-05-13
#chatgpt #openai
Neurogen - подпишись, тут рассказывают про нейросети
Кто уже какое-то время изучает нейросети, в частности ChatGPT, Claude и другие языковые модели, наверное уже успели заметить, что каналов которые учат чему-то полезному на просторах ТГ довольно мало.
Либо вам пытаются продать какие-то курсы с секретным доступом к ChatGPT, где в подарок идут "15 промптов совершенно бесплатно!!1!", либо же автор пишет таким языком, что для чтения его канала нужна докторская степень.
Сам я не так много пишу про работу с облачными языковыми моделями и составление промптов, но могу посоветовать канал Ppprompt | пппро AI.
Алексей, автор канала, как раз пишет про тонкости и лайфхаки работы с ChatGPT и в целом пишет про кучу интересных новинок из мира AI. Например, вот относительно недавно он тестировал промпты подписчиков в GEN-3. Из наиболее интересного, рекомендую глянуть:
#Промпт: саммари, которые вставляет читать
Claude 3 Opus vs GPT 4 Updated: чем пользоваться?
#промпт: что подарить?
Кстати, для представителей бизнеса очень полезно ознакомиться с "Как использовать Fathom и Zapier для крутых саммари встреч". Это мини-воркшоп про то, как получать итоги разговора после встречи и автоматической отправки результата в Телеграм бота.
И по горячим следам, а точнее по мотиву 8 часового подкаста Илона Маска:
Конспект + промпт для саммари: Маск + команда Neuralink в подкасте у Лекса Фридмана
А также все, что помечено хештегом #промпт на канале, так и промпты писать научитесь и кучу полезных себе заберете. Некоторые я сам использовал в своих коммерческих продуктах☕️
Так что подписывайтесь, это точно будет полезно!
Либо вам пытаются продать какие-то курсы с секретным доступом к ChatGPT, где в подарок идут "15 промптов совершенно бесплатно!!1!", либо же автор пишет таким языком, что для чтения его канала нужна докторская степень.
Сам я не так много пишу про работу с облачными языковыми моделями и составление промптов, но могу посоветовать канал Ppprompt | пппро AI.
Алексей, автор канала, как раз пишет про тонкости и лайфхаки работы с ChatGPT и в целом пишет про кучу интересных новинок из мира AI. Например, вот относительно недавно он тестировал промпты подписчиков в GEN-3. Из наиболее интересного, рекомендую глянуть:
#Промпт: саммари, которые вставляет читать
Claude 3 Opus vs GPT 4 Updated: чем пользоваться?
#промпт: что подарить?
Кстати, для представителей бизнеса очень полезно ознакомиться с "Как использовать Fathom и Zapier для крутых саммари встреч". Это мини-воркшоп про то, как получать итоги разговора после встречи и автоматической отправки результата в Телеграм бота.
И по горячим следам, а точнее по мотиву 8 часового подкаста Илона Маска:
Конспект + промпт для саммари: Маск + команда Neuralink в подкасте у Лекса Фридмана
А также все, что помечено хештегом #промпт на канале, так и промпты писать научитесь и кучу полезных себе заберете. Некоторые я сам использовал в своих коммерческих продуктах
Так что подписывайтесь, это точно будет полезно!
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Ppprompt | Sexy AI Prompts & Experiments | by @ponchiknews
Авторский канал про AI и технологии от Алексея Иванова @ponchiknews. Про рекламу можно спросить Женю: @RealPonchikTeam
Media is too big
VIEW IN TELEGRAM
Black Forest Labs тизерят модель генерации видео
Разработчики нашумевшей модели Flux тизерят свою новую разработку, направленную на генерацию видео.
Подробностей, касаемо характеристик и будет ли модель в открытом доступе - пока нет.
#video #aivideo #sora
Neurogen - подпишись, тут рассказывают про нейросети
Разработчики нашумевшей модели Flux тизерят свою новую разработку, направленную на генерацию видео.
Подробностей, касаемо характеристик и будет ли модель в открытом доступе - пока нет.
#video #aivideo #sora
Neurogen - подпишись, тут рассказывают про нейросети
Обновление Neurogen Artbot: Бесплатный ChatGPT-4o-mini, и десятки новых моделей SD.
Artbot позволяет бесплатно генерировать изображения, на основе моделей семейств. Stable Diffusion 1.5, Stable Diffusion XL или же Stable Diffusion 3. При этом, бот понимает промпты на русском языке и автоматически переводит их в английский.
Что нового:
👉 При генерации с SD и при чате с LLM он понимает голосовые сообщения.
👉 Добавлена поддержка LLM. По умолчанию включен ChatGPT-4o-mini. Начать чат с LLM можно по команде /llm. Закончить по команде /stop. Бот помнит последние 15 сообщений к нему.
👉 Изменить LLM модель можно в настройках, отправив команду /settings.
👉 Также полностью переработан перевод и реплики бота.
👉 Добавлен магазин SD моделей. Разбито по категориям. На данный момент доступно более 300 SD моделей на выбор.
Также напоминаю, что с прошлого обновления, вы можете создать собственного бота с функционалом нашего Артбота, подробнее тут:
Большое обновление Neurogen Artbot! Клонирование и заработок с Telegram Stars 🚀
Artbot позволяет бесплатно генерировать изображения, на основе моделей семейств. Stable Diffusion 1.5, Stable Diffusion XL или же Stable Diffusion 3. При этом, бот понимает промпты на русском языке и автоматически переводит их в английский.
Что нового:
👉 При генерации с SD и при чате с LLM он понимает голосовые сообщения.
👉 Добавлена поддержка LLM. По умолчанию включен ChatGPT-4o-mini. Начать чат с LLM можно по команде /llm. Закончить по команде /stop. Бот помнит последние 15 сообщений к нему.
👉 Изменить LLM модель можно в настройках, отправив команду /settings.
👉 Также полностью переработан перевод и реплики бота.
👉 Добавлен магазин SD моделей. Разбито по категориям. На данный момент доступно более 300 SD моделей на выбор.
Также напоминаю, что с прошлого обновления, вы можете создать собственного бота с функционалом нашего Артбота, подробнее тут:
Большое обновление Neurogen Artbot! Клонирование и заработок с Telegram Stars 🚀
Telegram
Neurogen Artbot: Flux / SD XL / SD 3
Бесплатный бот по созданию картинок при помощи Flux, Stable Diffusion XL и SD3
Работает на базе https://neuroapi.host
Работает на базе https://neuroapi.host
GPT4FREE Portable by Neurogen - Бесплатный доступ к ChatGPT 4o, Claude-3 и SD XL / SD 3
Данная сборка основана на базе проекта gpt4free, который позволяет путем реверс-инжиниринга получать бесплатный доступ к различным нейросетям. Проект поддерживает множество моделей, таких как:
GPT-4o
GPT-4o-mini
Claude-3
LLaMa-3.1 r
Qwen-2
а также моделей для генерации изображений, таких как Stable Diffusion XL и Stable Diffusion 3.
Скачать сборку GPT4FREE Portable by Neurogen
Стоит сразу отметить, что так доступ получается «обходными путями», то работа может быть нестабильной. В случае ошибок иногда помогает перегенерация запроса.
#chatgpt #llm #portable
Neurogen - подпишись, тут рассказывают про нейросети
Данная сборка основана на базе проекта gpt4free, который позволяет путем реверс-инжиниринга получать бесплатный доступ к различным нейросетям. Проект поддерживает множество моделей, таких как:
GPT-4o
GPT-4o-mini
Claude-3
LLaMa-3.1 r
Qwen-2
а также моделей для генерации изображений, таких как Stable Diffusion XL и Stable Diffusion 3.
Скачать сборку GPT4FREE Portable by Neurogen
Стоит сразу отметить, что так доступ получается «обходными путями», то работа может быть нестабильной. В случае ошибок иногда помогает перегенерация запроса.
#chatgpt #llm #portable
Neurogen - подпишись, тут рассказывают про нейросети
Там Google в рамках ивента MadeByGoogle, показывают Gemini Nano и Gemini Live
Это самая легкая модель из семейства Gemini, которая будет плотно интегрирована в экосистему Android.
Модель мультимодальная, умеет работать с изображениями, видео и аудио.
По факту, Gemini Nano ответ компании Apple с AI функционалом, который был заявлен на презентации iOS 18: языковая модель от Google плотно интегрируется в Android и является AI Ассистентом.
Gemini Live: набор голосом, синтез речи, 10 голосов AI ассистента. По сути, Gemini Live - это ответ на ChatGPT-4o
Обещают, что новые модели будут доступные через пару недель на Google Pixel и ряде других телефонах на базе Android.
#llm #gemini
Это самая легкая модель из семейства Gemini, которая будет плотно интегрирована в экосистему Android.
Модель мультимодальная, умеет работать с изображениями, видео и аудио.
По факту, Gemini Nano ответ компании Apple с AI функционалом, который был заявлен на презентации iOS 18: языковая модель от Google плотно интегрируется в Android и является AI Ассистентом.
Gemini Live: набор голосом, синтез речи, 10 голосов AI ассистента. По сути, Gemini Live - это ответ на ChatGPT-4o
Обещают, что новые модели будут доступные через пару недель на Google Pixel и ряде других телефонах на базе Android.
#llm #gemini
Вышла Grok-2: новая версия языковой модели от Илона Маска.
Grok-2 - значительный шаг вперед по сравнению с предыдущей моделью Grok-1.5, с передовыми возможностями в области чата, программирования и логических рассуждений.
Ранняя версия Grok-2 "sus-column-r" превосходит Claude 3.5 Sonnet и GPT-4-Turbo в таблице лидеров LMSYS.
Grok-2 и Grok-2 mini находятся в стадии бета-тестирования на 𝕏 и будут доступны через корпоративный API.
Grok-2 демонстрирует значительные улучшения в работе с контентом и инструментами, такими как определение недостающей информации и анализ последовательности событий.
Grok-2 и Grok-2 mini достигают уровня производительности, конкурентоспособного с другими передовыми моделями в различных областях, включая научные знания, общие знания и математические задачи.
Также заявлено, что Grok-2 отлично справляется с задачами распознавания изображений, обеспечивая современную производительность в области визуальных математических рассуждений и ответов на вопросы на основе документов.
#ai #llm #groq
Grok-2 - значительный шаг вперед по сравнению с предыдущей моделью Grok-1.5, с передовыми возможностями в области чата, программирования и логических рассуждений.
Ранняя версия Grok-2 "sus-column-r" превосходит Claude 3.5 Sonnet и GPT-4-Turbo в таблице лидеров LMSYS.
Grok-2 и Grok-2 mini находятся в стадии бета-тестирования на 𝕏 и будут доступны через корпоративный API.
Grok-2 демонстрирует значительные улучшения в работе с контентом и инструментами, такими как определение недостающей информации и анализ последовательности событий.
Grok-2 и Grok-2 mini достигают уровня производительности, конкурентоспособного с другими передовыми моделями в различных областях, включая научные знания, общие знания и математические задачи.
Также заявлено, что Grok-2 отлично справляется с задачами распознавания изображений, обеспечивая современную производительность в области визуальных математических рассуждений и ответов на вопросы на основе документов.
#ai #llm #groq