Нейронавт | Нейросети в творчестве
9.85K subscribers
3.88K photos
3.27K videos
41 files
4.27K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Songscription

Преобразует аудиозапись в ноты и midi файлы. Это избавляет от необходимости вручную разбирать композицию.

Поддерживает транскрибацию нескольких инструментов, модель для фортепиано пока самая надёжная. В будущем планируют добавить гитарные табулатуры и аранжировки для ансамблей

Piano roll тоже может сделать

Экспорт транскрипций в форматах PDF, MIDI и MusicXML

На вход принимает youtube ссылки

Фримиум

#music2midi #music2notation #notation #audio2midi
👍24😱1
Пара новостей от универсального агента Kortix Suna

1. Даже на бесплатном тарифе теперь Sonnet 4

2. Сохам Парех своим успехом обязан Suna (если не врут)

#agent #news
😱4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan-A13B

Новая LLM от Hunyuan / Tencent
Архитектура совет экспертов (#MoE)

Оптимизирована на агентские задачи
Контекст 256K

13 B активных параметров из общего числа в 80 B

Поддержка гибридного рассуждения: позволяет выбирать между быстрым и медленным режимами мышления

Попробовать где-то здесь
API
HF
Гитхаб

#assistant #agent #reasoning
7👍4
Нейронавт | Нейросети в творчестве
Объявляю сброс мемов, накопилось #humor
А вот и продолжение

Забавно что уже сегодня ИИ лучше ставит диагнозы чем в среднем человеки-врачи.
*Без негатива к врачам

#humor #news
😁10🔥2👍1
Media is too big
VIEW IN TELEGRAM
EX-4D: EXtreme Viewpoint 4D Video Synthesis via Depth Watertight Mesh

Генератор видео от ByteDance с возможностью управления камерой из одноглазого (монокулярного) входного сигнала. Модель особенно эффективна при работе с экстремальными точками зрения.

Представляет собой LoRa на 1% параметров😏

Код
Демо ждем

#cameracontrol #novelview
🔥7👍1🤔1
Calligrapher: Freestyle Text Image Customization

Генерация и редактирование надписей на изображении.

Умеет брать образец стиля и шрифта с картинки, и туда же вписывать новый текст.

В основе - FLUX.1-Fill-dev

Напомнило инструмент Textify из 2023. Порадуемся прогрессу за это время

Код
HF

#text2font #font #referencing #text2image
🔥7👍42🤷‍♂1
This media is not supported in your browser
VIEW IN TELEGRAM
Describe Anything: Detailed Localized Image and Video Captioning (DAM)

Модель от NVIDIA генерирует подробные описания для заданных областей на изображениях и видео

Код
Демо

#captioning #image2text #video2text
👍11🔥3🤔1
inference.sh

Самый простой способ запускать опенсорсные нейросети локально или на удаленной машине


Еще одна попытка сделать простой доступ пользователям к ИИ-инструментам, подобная Pinokio, Stability Matrix и иже с ними.

Есть презентационное видео
и пост на Реддите

#tools #gui
🔥11👍4