Claude Opus 4.1
Ну, да, выпустили. Модель улучшена в области решения агентских задач, реального кодирования и логического мышления. доступна для платных пользователей
#news #assistant
Ну, да, выпустили. Модель улучшена в области решения агентских задач, реального кодирования и логического мышления. доступна для платных пользователей
#news #assistant
👍4
Нейронавт | Нейросети в творчестве
qwen-image-gguf-test а вот и #GGUF под Qwen-Image Для работы в #ComfyUI обновите его и отредактируйте файл ComfyUI/custom_nodes/ComfyUI-GGUF/loader.py - см карточку модели по ссылке реддит #text2image
city96/Qwen-Image-gguf
Нормальные #GGUF Qwen-Image
Кто скачал старые - перекачайте отсюда
Если не запускается, попробуйте обновить ComfyUI-GGUF
Альтернативные GGUF спасибо @ArtNeiroDz
ворклоу
#text2image #workflow
Нормальные #GGUF Qwen-Image
Кто скачал старые - перекачайте отсюда
Если не запускается, попробуйте обновить ComfyUI-GGUF
Альтернативные GGUF спасибо @ArtNeiroDz
ворклоу
#text2image #workflow
huggingface.co
city96/Qwen-Image-gguf at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
1👍6😈1
This media is not supported in your browser
VIEW IN TELEGRAM
Kitten TTS
#sota маленьких голосовых моделей.
Работает без GPU, всего 15М параметров. Оптимизирована для рилтайма
По языкам нет информации. Должна завестись даже на Raspberry Pi
Младшая весит всего 25 мегабайт.
За две недели сделали - огонь!
Код
Веса
#tts #text2speech #realtime
#sota маленьких голосовых моделей.
Работает без GPU, всего 15М параметров. Оптимизирована для рилтайма
По языкам нет информации. Должна завестись даже на Raspberry Pi
Младшая весит всего 25 мегабайт.
За две недели сделали - огонь!
Код
Веса
#tts #text2speech #realtime
🔥12😱2🤔1
MiDashengLM
Модель понимания аудио от Xiaomi, #sota
Распознает тембр голоса, музыкальные инструменты, прочие звуки, отвечает на вопросы
Код
Демо
Веса ~50Гб
#audio2text #alm #assistant
Модель понимания аудио от Xiaomi, #sota
Распознает тембр голоса, музыкальные инструменты, прочие звуки, отвечает на вопросы
Код
Демо
Веса ~50Гб
#audio2text #alm #assistant
🔥5👍2🤔1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Browser MCP
Автоматизация задач в браузере
Устанавливаем браузерное расширение, дальше вас проведут через процесс настройки
Гитхаб
#mcp #agent
Автоматизация задач в браузере
Устанавливаем браузерное расширение, дальше вас проведут через процесс настройки
Гитхаб
#mcp #agent
👍8
LoRA Training for Qwen-Image
Ладно, интересных картинок от qwen image из коробки получить не удалось. Может с лорами она себя покажет?
Есть смельчаки-первопроходцы обучить лору?
Инструмент для обучения подогнали FlyMy.ai
А также опубликовали лору реализм
qwen-image-realism-lora
#TEXT2IMAGE #LORA #FINETUNING
Ладно, интересных картинок от qwen image из коробки получить не удалось. Может с лорами она себя покажет?
Есть смельчаки-первопроходцы обучить лору?
Инструмент для обучения подогнали FlyMy.ai
А также опубликовали лору реализм
qwen-image-realism-lora
#TEXT2IMAGE #LORA #FINETUNING
👍8❤4
Seed Diffusion Preview
экспериментальная языковая модель от ByteDance Seed для генерации кода на основе дискретной диффузии.
работает в два этапа: сначала заполняет пропуски в коде, а потом исправляет его, проверяя на глобальные ошибки.
Быстрее в 4-5 раз авторегрессионных моделей схожего масштаба
Попробовать - меня не пускают говорят встань в очередь
#assistant #coding
экспериментальная языковая модель от ByteDance Seed для генерации кода на основе дискретной диффузии.
работает в два этапа: сначала заполняет пропуски в коде, а потом исправляет его, проверяя на глобальные ошибки.
Быстрее в 4-5 раз авторегрессионных моделей схожего масштаба
Попробовать - меня не пускают говорят встань в очередь
#assistant #coding
👍8❤1🔥1
Skywork UniPic: Unified Autoregressive Modeling for Visual Understanding and Generation
Генератор-пониматор-редактор картинок на авторегрессии.
Редактирует по текстовым указаниям
1.5B параметров.
На создание изображения 1024х1024 расходует меньше 15Гб VRAM
Код
Веса
Демо
#vlm #imageediting #text2image
Генератор-пониматор-редактор картинок на авторегрессии.
Редактирует по текстовым указаниям
1.5B параметров.
На создание изображения 1024х1024 расходует меньше 15Гб VRAM
Код
Веса
Демо
#vlm #imageediting #text2image
👍7
Qwen3-4B-Instruct-2507
недумающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
—————————
Qwen3-4B-Thinking-2507
думающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
#assistant
недумающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
—————————
Qwen3-4B-Thinking-2507
думающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
#assistant
🔥7❤1👍1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
AI Video Inpainting Plugin for After Effects
Плагин к #aftereffects для инпейнтинга на wan2.1 по маске и #wan22 по промпту но качественнее
Работает через API fal.ai так что готовьте денежки
В процессе разработки
Код
#videoinpainting
Плагин к #aftereffects для инпейнтинга на wan2.1 по маске и #wan22 по промпту но качественнее
Работает через API fal.ai так что готовьте денежки
В процессе разработки
Код
#videoinpainting
👍6🔥2
Арена видеогенераторов запущена. Даже две
Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo
Text-to-Video Arena
Image-to-Video Arena
#text2image #image2image #arena #leaderboard
Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo
Text-to-Video Arena
Image-to-Video Arena
#text2image #image2image #arena #leaderboard
👍7🤔1
Смотрите как умеет Genie 3
Сгенерил видео в котором кожаный мешок взаимодействует с Genie 3, пока по телевизору идет симуляция Genie 3. Все синхронизировано
Автор видео - из команды разработчиков Genie 3
Второе видео - сцена из фильма Космобольцы
#text2world #research #text2game
Сгенерил видео в котором кожаный мешок взаимодействует с Genie 3, пока по телевизору идет симуляция Genie 3. Все синхронизировано
Автор видео - из команды разработчиков Genie 3
Второе видео - сцена из фильма Космобольцы
#text2world #research #text2game
😁8👍3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Jules
Google релизнул показанный в мае асинхронный агент для программирования на базе Gemini 2.5 Pro
- интеграция с GitHub
- может запускать существующие тесты и создавать новые
- клонирует код в облачную виртуальную машину и проверяет работоспособность изменений
- показывает план действий, объясняет свои решения и предоставляет диффы изменений в коде
Есть базовый тариф - 15 задач в день, 3 одновременные задачи
Россиян не любят
#assistant #Agent #coding
Google релизнул показанный в мае асинхронный агент для программирования на базе Gemini 2.5 Pro
- интеграция с GitHub
- может запускать существующие тесты и создавать новые
- клонирует код в облачную виртуальную машину и проверяет работоспособность изменений
- показывает план действий, объясняет свои решения и предоставляет диффы изменений в коде
Есть базовый тариф - 15 задач в день, 3 одновременные задачи
Россиян не любят
#assistant #Agent #coding
🔥5❤3🥴2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
gpt-oss 20B в облаке бесплатно
Времена настали тяжкие. Это где это видано чтобы каждый босяк мог запустить новейшую крутую LLM бесплатно в облаке. Совсем распоясались.
Я не знаю как долго она будет скачиваться и запускаться, несколько часов в день на бесплатном Колабе - стоит того чтобы вы об этом знали.
[UPDATE] у меня не запускается, OOM на 9 ячейке. Выходит, не каждый босяк
Колаб ноутбук
#assistant
Времена настали тяжкие. Это где это видано чтобы каждый босяк мог запустить новейшую крутую LLM бесплатно в облаке. Совсем распоясались.
Я не знаю как долго она будет скачиваться и запускаться, несколько часов в день на бесплатном Колабе - стоит того чтобы вы об этом знали.
[UPDATE] у меня не запускается, OOM на 9 ячейке. Выходит, не каждый босяк
Колаб ноутбук
#assistant
👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня в 20:00 по Москве в прямом эфире ждем релиз...
GPT-й?
Я сегодня ходил к окулисту, глаза проверил. Там точно "Й"
#news
GPT-й?
Я сегодня ходил к окулисту, глаза проверил. Там точно "Й"
#news
😁16👍1🤯1