Нейронавт | Нейросети в творчестве
9.52K subscribers
3.7K photos
3.18K videos
40 files
4.14K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Lindy

Новая веха ИИ-агентов


Платформа для создания, управления и совместного использования AI-агентов. В последней версии Lindy 3.0 представлены новые функции: Agent Builder, Autopilot и возможности для командной работы. Autopilot позволяет агентам работать с компьютерами в облаке, а Agent Builder упрощает процесс создания мощных AI-агентов, достаточно просто описать желаемое, и система создаст агента за считанные минуты.

На старте кажется дают кредиты (я давно зарегался). И есть рефералка

#agent #assistant
👍6
Qwen-Image-DF11

Пишут что DF11 это сжатие без потерь. Веса на 28Гб, пиковая загрузка VRAM с GPU Offloading - 16.68 GB

Не ради создания а ради редактирования!

Реддит
————————

ComfyUI Initial support for qwen image model
Начальная поддержка qwen-Image в #ComfyUI

Веса
воркфлоу (WIP)
————————

Бонусом новость:

.safetensors не такой уж "safe"

Вчера после выхода Qwen-Image появился репозиторий Qwen-Image NF4 с весами в формате .safetensors, который HF пометил как опасные. Я своими глазами видел эту кроваво-красную метку

Что именно они там нашли неизвестно. Сейчас репозиторий удален.

Обсуждение на реддит -там отписался и автор формата .safetensors

#news #text2image #imageediting
👍4🔥2
Media is too big
VIEW IN TELEGRAM
Tasker AI

Персональный ассистент для помощи в повседневных задачах, таких как управление электронной почтой, планирование встреч, просмотр веб-страниц и др.

Представляет собой команду AI-агентов, действующих от имени пользователя.

Поддерживает интеграцию с Google Sheets

Обещают локальную версию для приватного инференса

Есть расширение для Chrome

#agent #assistant
👎4👍2🌚2🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
LeVo: High-Quality Song Generation with Multi-Preference Alignment

Генератор музыки к тексту (по музыкальному и текстовому промптам) от Tencent

Поет только на англйском и китайском. Но эй, можно и инструментал делать, в том числе по аудиопромпту

Гитхаб
ComfyUI
Pinokio
Демо
Веса

Спасибо @Dmitriy_Ru6ts0v

#music #text2music
1🔥13👍3👨‍💻2
qwen-image-gguf-test

а вот и #GGUF под Qwen-Image

Для работы в #ComfyUI обновите его и отредактируйте файл ComfyUI/custom_nodes/ComfyUI-GGUF/loader.py - см карточку модели по ссылке

реддит

#text2image
🔥5👍21🍾1
This media is not supported in your browser
VIEW IN TELEGRAM
Появился демоспейс оживлятора персонажей OmniAvatar.
Сейчас ему плохо, можно чекнуть чуть позже

Демо

#portraitanimation #characteranimation #lipsync
1👍10
This media is not supported in your browser
VIEW IN TELEGRAM
3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding

Базовая визуально-языковая модель понимания 3D сцен/
Умеет описывать сцены, отвечать на вопросы о них, планировать действия в виртуальном пространстве

Код
Веса

#vlm #3d #3dvlm #assistant #captioning
🔥8👍1
Flux Krea Realism LoRA

активация: in the style of R34L <your prompt>

настройки:

CFG: 5
LORA SCALE: 0.7-0.8

#fluxkrea #LoRa
👍8🤔1🌚1
Genie 3: A new frontier for world models

Новое поколение модели от Googleб #SOTA в создании игровых миров с навигацией по ним

Я тут перечислял что он умеет но тг сожрал текст и сказал что ничего не было.
Да и пофиг, потому что попробовать все равно не дают а только хвастаются

#text2world #research #text2game
👍4🔥4😁4
Media is too big
VIEW IN TELEGRAM
Eleven Music

У Elevenlabs свой генератор музыки с блэкджеком и ш который может полностью контролировать жанр, стиль и структуру композиций. Знает разные языки. Можно редактировать звук и текст отдельных секций или всей песни.

Работает на бесплатном тарифе. Чтобы задать ему слова песни, в конце промпта пишем lyrics: и дальше свой текст

#text2music #musicediting #music
6👍9👎21
Forwarded from Сиолошная
OpenAI разродились двумя опенсурсными моделями, на 120b и 20b параметров.

Модели рассуждающие, поддерживают 3 типа длины рассуждений: low, medium, high.

Ссылки:
https://openai.com/open-models/
https://openai.com/index/gpt-oss-model-card/
https://cookbook.openai.com/articles/openai-harmony
https://gpt-oss.com/ - тут можно поиграть с моделью

Судя по лендингу, модели уже сегодня будут доступны на Groq и Cerebas, предлагая очень быструю генерацию. И почти все инференс-движки уже поддерживают модель.

И самое крутое — как и o3, модели поддерживают вызов инструментов (поиск, Python, etc) в цепочке рассуждений.
1🔥92👍1
Wan2.2 Image | Krea

Все, генерацию картинок силами #WAN22 завезли на Krea.ai

Бесплатных кредитов хватило на две генерации

#text2image #image2image #neuronaut_art
👍4😁31