Neurogen
21.4K subscribers
479 photos
166 videos
17 files
519 links
Популяризатор нейросетей, разработчик-энтузиаст, ментор.

СEO NeuroIMG.ART

По вопросам сотрудничества и рекламы: @roman_neurogen

Портативные сборки: https://boosty.to/neurogen

Live канал: @neurogen_blog
Реестр РКН: №4777528086
Download Telegram
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Основная информация по Grok-3

🟡 Grok-3 — новая версия чат-бота от xAI, представленная Илоном Маском, значительно умнее предыдущей модели Grok-2 (в 10 раз).

🟡 Тесты: Grok-3 обходит такие модели, как GPT-4o, Claude 3.5, Sonnet, Gemini-2 Pro и DeepSeek-V3 в областях математики, кодирования и научной работы.

🟡 Способности рассуждения: Grok-3 демонстрирует высокие возможности для рассуждения, с признаками креативности, и способен рассчитывать сложные задачи, такие как полёт на Марс.

🟡 Технологическая база: Grok-3 обучали на суперкомпьютере Colossus с 200,000 чипами Nvidia H100.

🟡 Функция DeepSearch: ИИ анализирует весь интернет для точных ответов на запросы, а если ответ не найден, даёт обоснованные предположения по любому вопросу.

🟡 Генерация игр: Grok-3 может создавать игры на ходу, как показано на примере Тетриса и Три-в-ряд.

🟡 Статус: Grok-3 находится на стадии бета-тестирования, есть мини-версия модели. Также запланирован голосовой режим, который будет выпущен через неделю.

🟡 Отзывы: Андрей Карпаты (бывший сотрудник OpenAI и Tesla) отметил, что Grok-3 демонстрирует отличные результаты на уровне сильнейших моделей и впечатляет быстротой разработки.

Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
FastHynyuanVideo Portable by Neurogen

Сборка для генерации видео txt2video.
Сборка заточена для работы на видеокартах RTX 4090 и, теоретически, и 3090. Еще более ужатая версия для карт на 8-12 Гигабайт видеопамяти выйдет позже.

Качаете архив, распаковываете, затем запускаете файл run_nvidia_gpu.bat

Затем у вас откроется браузер и в этой вкладке нажмите W. Затем в появившемся окне выберите наш рабочий процесс (он всего один)

Для вас я специально выделил и подписал основные настройки в рамках одной группы, а также добавил подсказку по оптимальным параметрам.

Под капотом - полностью готовый к работе и настроенный ComfyUI, с кучей оптимизаций.

По производительности: генерация одного видео в несколько секунд хронометража генерируется на RTX 4090 примерно 80-90 секунд (что, как по мне, ну очень быстро).

Сборка поддерживает возможность выбора LoRA, специально для вас я закинул несколько, в том числе и для генерации NSFW контента 😁.

Дополнительные вы можете скачать на civit.ai, их там по моему целая сотня.

Рекомендуемые разрешения это 848x480, 960x544 и 1280x720, но на 24 GB VRAM наиболее адекватно работает 848x480, 960x544. Количество кадров от 25 до 129. В среднем, генерация ролика в таком случае занимает до двух минут.

Скачать сборку бесплатно можно с:

C моего сервера | С зеркала (Яндекс Диск)

P.S. Для тех, кто не работал с ComfyUI, видеообзор будет на днях.

Сборка для меня пробная, при наличии ошибок просьба писать сколько у вас оперативной памяти и какая модель видеокарты.
Please open Telegram to view this post
VIEW IN TELEGRAM
🎙Бета-версия Zonos-v0.1
text-to-spench модель от Zyphra

Команда Zyphra анонсировала выпуск бета-версии Zonos v0.1, включающей две модели для преобразования текста в речь (TTS) с клонированием голоса в реальном времени. Модели 1.6B Transformer и 1.6B Hybrid доступны под лицензией Apache 2.0.

👀Что может:
- Клонирование голоса
- Поддерживает английский, японский, китайский, французский и немецкий языки, русского нет
- Контроль скорости речи, высоты тона, максимальной частоты, качества звука
- Возможность контроля эмоция
- Открытый Playground и API

⚙️Производительность и архитектура:
- 200,000 часов речевых данных для обучения: английский, китайский, японский и другие языки.
- Поддержка быстрой генерации речи с низкими задержками (200-300 мс) на RTX 4090.
- Модели обучаются с использованием автокодера DAC и параметров (скорость речи, высота тона, эмоции).

🐱Код - открытый код
🆓Демо - потестить, можно зайти через гугл
🖥Блог - почитайте, там интересно, если вниз листнете можно найти сравнение с конкурентами
Please open Telegram to view this post
VIEW IN TELEGRAM
Последнее время я замечаю, что большинство проектов лучше всего и легче развернуть внутри ComfyUI, чем в отдельной оболочке.

И тут у меня появилась дилемма. Делать под каждый проект отдельную сборку ComfyUI мне кажется странным. А если просто выкладывать воркфлоу, то людям, кто не работали с комфи будет непонятно что и куда тыкать. Все таки, мне кажется, что большинство моей аудитории обходит нодовый интерфейс ComfyUI стороной

Делать "мега сборку" тоже не вариант - она будет весить под 100 гигабайт.

Поэтому вопрос к вам: Какой из этих вариантов вам кажется оптимальным? Или может у вас есть какое-то свое предложение?
NotebookLM - очень недооцененный ИИ-помощник от Google

По тестам пользователей, notebooklm это ребенок ChatGPT + Perplexity + Notion AI еще и с реальными ссылками на источники. Создан на основе Gemini 2.0. К сожалению код как и API закрыты. Но в конце поста я оставил альтернативу гугловскому помощьнику с открытым кодом "📌".

Отличия от других:
🟡Читает и резюмирует PDF-файлы, документы и заметки
🟡Автоматически ссылается на источники (прощайте галлюцинации)
🟡Запоминает загруженные файлы и контекст лучше, чем ChatGPT
🟡Делает структурированное исследование безболезненным

Он идеально подойдет любой категории пользователей которые работают с большим количеством данных. Когда нужны точные свединия из документов notebook просто незаменимая вещь.

🆓Протестировать

📌Альтернативный помощник с открытым кодом и API
Please open Telegram to view this post
VIEW IN TELEGRAM
Expanding your horizons! 🌐

Due to the expansion of the team, we continue to maintain our English-language Telegram channel. Basically, all the same posts will be duplicated there, but in English and with minor edits. If anyone is interested, we are looking forward to seeing you!

В связи с расширением команды мы продолжаем вести наш англоязычный телеграм канал. В основном туда будут дублироваться все те же посты но на английском языке и с небольшими правками. Если кому интересно, с радостью ждем вас!

🖥Neurogen [EN]
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Онлайн-интервью с нулевым знанием с использованием AI Interview Hammer

Interview Hammer нейронка с помощью которой можно пройти собеседование или придти с ним на какую то конференцию, попробовать ради интереса можно, в серьез воспринимать бы не стал...

Есть бесплатная пробная версия и можно скачать на телефон

🆓Пробная версия - нужно зарегистрироваться
⬇️Скачать приложение
Please open Telegram to view this post
VIEW IN TELEGRAM
‼️Grok 3 стал бесплатным

Компания xAI объявила о запуске Grok 3 — самой продвинутой версии своего искусственного интеллекта, которую теперь можно попробовать абсолютно бесплатно. Однако разработчики предупреждают: доступ открыт «до тех пор, пока наши серверы не расплавятся от нагрузки»

Grok 3 уже доступен для тестирования через платформу X по ссылке. Пользователи с подпиской X Premium+ и SuperGrok получат расширенный доступ к новейшему ИИ, а также эксклюзивную возможность опробовать передовые функции, такие как голосовой режим (Voice Mode), раньше остальных.

Кроме того, для удобства пользователей xAI выпустила отдельное приложение Grok, которое уже доступно для скачивания в США через App Store для iOS. скачать его можно по ссылке. В ближайшее время ожидается выход приложения в Google Play для Android, однако пока точные сроки и список других стран, где оно станет доступно, не уточняются.

Спешите испытать Grok 3 — пока серверы не расплавились!

🆓Попробовать Grok 3
🍏Приложение для IOS
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Новый прорыв от Microsoft 🏳️‍🌈

Компания Microsoft представила свою инновационную модель Muse - это ИИ для генерации игрового процесса. Модель была создана исследовательским подразделением Microsoft Research в сотрудничестве со студией Ninja Theory, известной по игре Bleeding Edge. Muse способна генерировать игровые окружения, понимая физику и динамику 3D-мира, а также реакции на действия игроков. Ее обучали на семилетнем объеме данных реального геймплея Bleeding Edge.

Разрабы негодуют, так как боятся что такими "инновациями" многолетний труд художников и разработчиков находится под угрозой и возможно сокращение рабочих мест в индустрии. Microsoft признает опасения и заявляет, что Muse предназначена для дополнения, а не замены человека.

⚙️Технические данные:
🟡 Качество генерации: На текущем этапе Muse генерирует визуальные данные с разрешением 300×180 пикселей при 10 кадрах в секунду, что соответствует 1 секунде реального игрового процесса.
🟡 Обучение: Изначально обучение проводилось на кластере V100, что позволило масштабировать процесс до 100 GPU. Позднее обучение было перенесено на H100, что обеспечило более высокую производительность и эффективность.
🟡 Архитектура: Muse использует трансформерную архитектуру, адаптированную для обработки визуальных данных и действий контроллера. Для эффективного представления изображений и действий контроллера были приняты ключевые проектные решения, заимствованные из сообщества больших языковых моделей (LLM).

Статьи: xbox wire, wired, microsoft
Please open Telegram to view this post
VIEW IN TELEGRAM
Neurogen
VisoMaster Portable by Neurogen v 0.1.3 | DeepFake | Nvidia VisoMaster — мощная и простая в использовании программа для замены лиц (DeepFake) и редактирования видео, которая объединяет современные нейросетевые технологии для создания реалистичных эффектов.…
VisoMaster Portable by Neurogen v 0.1.4 | DeepFake | Nvidia

Начиная с данной версии, сборка поддерживает видеокарты серии RTX 50XX (RTX 5080, RTX 5090 и другие).

Для этого Cuda была обновлена до версии 12.8, TensorRT до версии 10.8 и CuDNN до версии 9.7.1

Обновление v0.1.4. Что нового:
Горячие клавиши:

F11: Переключение полноэкранного режима
V: Перемотка видео на 1 кадр вперед
C: Перемотка видео на 1 кадр назад
D: Перемотка видео на 30 кадров вперед
A: Перемотка видео на 30 кадров назад
Z: Переход к началу видео
Пробел: Воспроизведение/Пауза видео
R: Начало/Остановка записи
F: Добавление/удаление маркера (Alt+F для удаления)
W: Переход к следующему маркеру
Q: Переход к предыдущему маркеру
S: Переключение замены лиц

Дополнительно:

Добавлено контекстное меню для удаления элементов из разделов "Целевые медиа" и "Входные лица"
Добавлена опция вставки артефактов JPEG-сжатия в вывод для повышения реалистичности при работе с низкокачественными целевыми медиа
Обновлено управление параметрами с поддержкой резервного варианта
Автоматическая генерация эскизов для всех ранее загруженных целевых файлов
Горизонтальная прокрутка для списка эмбеддингов
Применение восстановителя выражений до восстановителя лиц в конвейере замены

Сборка доступна при поддержке проекта. Проект можно поддержать:

Boosty (Картой)

Telegram (USDT, ЮMoney, Telegram Stars)

#deepfake #portable #visomaster
This media is not supported in your browser
VIEW IN TELEGRAM
[Open Beta] FastHynyuanVideo LowVRAM Portable by Neurogen

Сделал версию для видеокарт на 8-12Gb видеопамяти и более.
Для работы нужно минимум 32 Gb оперативной памяти, так как модели будут активно выгружаться в нее. Работа была проверена на RTX 3060 Ti 8Gb, генерация видео в 3-4 секунды заняло 600 секунд.
Данная сборка может показаться интересной и для владельцев видеокарт на 24Gb видеопамяти, так как позволяет генерировать ролики с большим разрешением / c большей длинной.

В основе лежат GGUF версии моделей, квантованные до 4 бит (Q4_0)

Для тех, кто уже активно пользуется ComfyUI, прикладываю файл workflow.

Запуск:
- Качаете архив, распаковываете, затем запускаете файл run_nvidia_gpu.bat
Затем у вас откроется браузер и в этой вкладке нажмите W. Затем в появившемся окне выберите наш рабочий процесс (он будет сверху, в избранном)

Для вас я специально выделил и подписал основные настройки в рамках одной группы, а также добавил подсказку по оптимальным параметрам.

Под капотом - полностью готовый к работе и настроенный ComfyUI, с кучей оптимизаций.

По производительности: генерация одного видео в несколько секунд хронометража генерируется на RTX 4090 примерно 60-80 секунд (что, как по мне, ну очень быстро). На RTX 3060 Ti время генерации составило уже 600 секунд.

Сборка поддерживает возможность выбора LoRA, специально для вас я закинул несколько, в том числе и для генерации NSFW контента 😁.

Дополнительные вы можете скачать на civit.ai, их там по моему целая сотня.

Рекомендуемые разрешения это 848x480, 960x544 и 1280x720, но на 24 GB VRAM наиболее адекватно работает 848x480, 960x544. Количество кадров от 25 до 129. В среднем, генерация ролика в таком случае занимает до двух минут.

Касаемо генерации image2video
- пока что ее нет, разработчики HynyuanVideo не выпускали такой версии модели. Но есть уже дообученные модели, вроде SkyReels, и как только их квантуют - выпущу обновление.

Скачать сборку бесплатно можно с:

С Моего сервера | С Зеркала (Yandex Disk).

Просьба при наличии ошибок и проблем, присылайте сразу скрины консоли или скрины ошибок в комментарии. Я только начал собирать ядро своей универсальной сборки Комфи, поэтому могут быть различные проблемы.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥DeepSeek планирует опубликовать исходный код

В прошлом месяце DeepSeek перевернул мир ИИ с ног на голову, выпустив новую, конкурентоспособную модель имитируемого рассуждения, которую можно было бесплатно загрузить и использовать по лицензии MIT . Теперь компания готовится сделать базовый код этой модели более доступным, обещая выпустить пять репозиториев с открытым исходным кодом, начиная со следующей недели.

В сообщении в социальных сетях в четверг вечером DeepSeek сообщила, что ежедневные релизы, которые она планирует в рамках своей «Недели открытого исходного кода», позволят увидеть «эти скромные строительные блоки нашего онлайн-сервиса, которые были задокументированы, развернуты и проверены в реальных условиях. Как часть сообщества открытого исходного кода, мы считаем, что каждая строка, которой мы делимся, становится коллективным импульсом, который ускоряет процесс».

Хотя DeepSeek не конкретизировал, каким именно кодом он будет делиться, сопроводительная страница GitHub для «DeepSeek Open Infra» обещает, что в будущих релизах будет представлен «код, который продвинул наш крошечный полет на Луну» и будет рассказано о «нашем небольшом, но искреннем прогрессе с полной прозрачностью». На странице также есть ссылка на статью 2024 года, в которой подробно описывается архитектура обучения DeepSeek и программный стек.

Этот шаг грозит усилить контраст между DeepSeek и OpenAI, чьи лидирующие на рынке модели ChatGPT остаются полностью проприетарными, что делает их внутреннюю работу непрозрачной для внешних пользователей и исследователей. Выпуск с открытым исходным кодом также может помочь обеспечить более широкий и простой доступ к DeepSeek, даже несмотря на то, что его мобильное приложение сталкивается с международными ограничениями из-за проблем с конфиденциальностью .

🐱Насколько открыт код?
Первоначальный выпуск модели DeepSeek уже включал так называемый "открытый вес" доступ к базовым данным, представляющим силу связей между миллиардами смоделированных нейронов модели. Такой выпуск позволяет конечным пользователям легко настраивать эти параметры модели с помощью дополнительных данных обучения для более точных целей.

В настоящее время неясно, будет ли запланированный релиз DeepSeek с открытым исходным кодом также включать код, который команда использовала при обучении модели. Такой учебный код необходим для соответствия формальному определению Open Source Institute "ИИ с открытым исходным кодом" , которое было окончательно сформулировано в прошлом году после многих лет исследований. По-настоящему открытый ИИ также должен включать "достаточно подробную информацию о данных, используемых для обучения системы, чтобы опытный специалист мог построить по существу эквивалентную систему", согласно OSI.

©Кайл Орланд
Please open Telegram to view this post
VIEW IN TELEGRAM
RopeMod Portable by Neurogen v 2.7.3 Cuda 12.8 | Добавлена поддержка RTX 5070 Ti, RTX 5080, RTX 5090

Техническое обновление, добавляющее поддержку RTX 50XX. Cuda обновлена до 12.8, TensorRT 10.8, CuDNN 9.7.1

Сборка доступна для поддержавших канал по подписке, оформить подписку можно:

Оформить через банковскую карту (Boosty)
Оформить через USDT / ЮMoney / Telegram Stars (Telegram)

#rope #deepfake #portable
Please open Telegram to view this post
VIEW IN TELEGRAM