#unrealneural
200-страничная работа по LLM: ключевые выводы.
Предобучение: ИИ изучает данные через неконтролируемое и самоконтролируемое обучение. Архитектуры: кодировщики, декодеры, BERT, Трансформеры.
Генеративные модели: GPT-подобные модели для творчества. Тонкая настройка и RLHF обеспечивают специализацию и безопасность.
Промпт-инжиниринг: Контекстное обучение, цепочка мыслей и RAG для точных ответов.
Выравнивание ИИ: Тонкая настройка и RLHF для соответствия человеческим намерениям.
https://arxiv.org/pdf/2501.09223
200-страничная работа по LLM: ключевые выводы.
Предобучение: ИИ изучает данные через неконтролируемое и самоконтролируемое обучение. Архитектуры: кодировщики, декодеры, BERT, Трансформеры.
Генеративные модели: GPT-подобные модели для творчества. Тонкая настройка и RLHF обеспечивают специализацию и безопасность.
Промпт-инжиниринг: Контекстное обучение, цепочка мыслей и RAG для точных ответов.
Выравнивание ИИ: Тонкая настройка и RLHF для соответствия человеческим намерениям.
https://arxiv.org/pdf/2501.09223
⚡3👍2
#unrealneural
Исследователи Apple представляют AToken
Первый унифицированный визуальный токенизатор для высокоточной реконструкции и семантического понимания изображений, видео и 3D-ресурсов.
https://huggingface.co/papers/2509.14476
AToken, как универсальный токенизатор, который объединяет обработку изображений, видео и 3D-объектов в одном 4D-пространстве, обеспечивает точную реконструкцию и понимание. Он использует трансформерную архитектуру и устойчивое обучение без состязательности, поддерживая создание контента и анализ данных.
AToken может продвинуть индустрию ИИ, упрощая разработку мультимодальных систем и снижая затраты на создание универсальных моделей.
Исследователи Apple представляют AToken
Первый унифицированный визуальный токенизатор для высокоточной реконструкции и семантического понимания изображений, видео и 3D-ресурсов.
https://huggingface.co/papers/2509.14476
AToken, как универсальный токенизатор, который объединяет обработку изображений, видео и 3D-объектов в одном 4D-пространстве, обеспечивает точную реконструкцию и понимание. Он использует трансформерную архитектуру и устойчивое обучение без состязательности, поддерживая создание контента и анализ данных.
AToken может продвинуть индустрию ИИ, упрощая разработку мультимодальных систем и снижая затраты на создание универсальных моделей.
🤯5👍3💩1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
DeepSeek-V3.1-Terminus доступен на Hugging Face
Что нового?
Прощай, путаница в тексте🙃 Больше никаких раздражающих миксов из китайского, русского и английского, и странных символов, которые выглядят как сбой матрицы.
Режим агента 🔥 Кодовый агент и поисковик прокачали до уровня, где они не просто работают, а реально выручают. Пишешь код или ищешь инфу, модель теперь справляется как профи, быстро и по делу 🤝
Сразу затестил на Anycoder. Все ссылки и промпт в комментах.
DeepSeek-V3.1-Terminus доступен на Hugging Face
Что нового?
Прощай, путаница в тексте🙃 Больше никаких раздражающих миксов из китайского, русского и английского, и странных символов, которые выглядят как сбой матрицы.
Режим агента 🔥 Кодовый агент и поисковик прокачали до уровня, где они не просто работают, а реально выручают. Пишешь код или ищешь инфу, модель теперь справляется как профи, быстро и по делу 🤝
Сразу затестил на Anycoder. Все ссылки и промпт в комментах.
🔥5❤2⚡1👍1
#unrealneural #нейроразбор
Microsoft представляет нейронку латентного зонирования 🤗
Вышла статья про Latent Zoning Network (LZN), попробуем разобраться.
Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию через общее скрытое пространство, где энкодеры и декодеры решают разные задачи. Но при этом результаты пока показаны на простых датасетах (CIFAR10, ImageNet), и неясно, как она справится с более сложными данными. 🤷🏻♂️
Это не проходная статья, так как LZN упрощает архитектуру, улучшает генерацию (FID 2.76 -> 2.59 на CIFAR10), превосходит MoCo и SimCLR в представлении данных и предлагает универсальный подход с открытым кодом.
https://huggingface.co/microsoft/latent-zoning-networks
Microsoft представляет нейронку латентного зонирования 🤗
Вышла статья про Latent Zoning Network (LZN), попробуем разобраться.
Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию через общее скрытое пространство, где энкодеры и декодеры решают разные задачи. Но при этом результаты пока показаны на простых датасетах (CIFAR10, ImageNet), и неясно, как она справится с более сложными данными. 🤷🏻♂️
Это не проходная статья, так как LZN упрощает архитектуру, улучшает генерацию (FID 2.76 -> 2.59 на CIFAR10), превосходит MoCo и SimCLR в представлении данных и предлагает универсальный подход с открытым кодом.
https://huggingface.co/microsoft/latent-zoning-networks
⚡3👍1🤗1
AI LAB
#unrealneural #нейроразбор Microsoft представляет нейронку латентного зонирования 🤗 Вышла статья про Latent Zoning Network (LZN), попробуем разобраться. Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию…
Если ничего непонятно 😃😃😃, то LZN - это нейронка, которая сразу умеет рисовать картинки, понимать, что на них, и говорить, что это за картинка. Обычно для этого нужны разные нейросети, а тут всё в одной! Она превращает картинки, слова и метки в точки в "волшебной комнате" (латентное пространство) и обратно. Круто, что работает лучше некоторых старых методов, и код открыт.
👍4❤2😱2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #анализдокументов
ByteDance выпустила Dolphin
Это фреймворк для анализа документов, который преобразует PDF-файлы в структурированные форматы, такие как Markdown, HTML, LaTeX и JSON.
И что? 🤷🏻🤷🏻🤷🏻
Отсутствие прозрачных метрик производительности вызывает вопросы. Без тестов на реальных данных сложно доверять заявлениям о "высокой точности".
Для новичков Dolphin может быть сложным в настройке.
Если твои PDF на русском или содержат нестандартные шрифты/макеты, результат может быть непредсказуемым без предварительного тестирования.
Надо пробовать 😔
https://github.com/bytedance/Dolphin
ByteDance выпустила Dolphin
Это фреймворк для анализа документов, который преобразует PDF-файлы в структурированные форматы, такие как Markdown, HTML, LaTeX и JSON.
И что? 🤷🏻🤷🏻🤷🏻
Отсутствие прозрачных метрик производительности вызывает вопросы. Без тестов на реальных данных сложно доверять заявлениям о "высокой точности".
Для новичков Dolphin может быть сложным в настройке.
Если твои PDF на русском или содержат нестандартные шрифты/макеты, результат может быть непредсказуемым без предварительного тестирования.
Надо пробовать 😔
https://github.com/bytedance/Dolphin
👍3⚡1
#unrealneural
Qwen3-LiveTranslate-Flash: большой шаг в мультимодальном переводе
Что это и в чем фишка?
Qwen3-LiveTranslate-Flash — это мультимодальный инструмент для перевода в реальном времени. Он поддерживает 18 языков и 6 диалектов, понимает жесты, читает по губам, экранный текст и объекты, работает с минимальной задержкой в 3 секунды⚡️⚡️⚡️, обеспечивает точность офлайн-перевода и использует выразительные голоса.
Демо
https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo
Qwen3-LiveTranslate-Flash: большой шаг в мультимодальном переводе
Что это и в чем фишка?
Qwen3-LiveTranslate-Flash — это мультимодальный инструмент для перевода в реальном времени. Он поддерживает 18 языков и 6 диалектов, понимает жесты, читает по губам, экранный текст и объекты, работает с минимальной задержкой в 3 секунды⚡️⚡️⚡️, обеспечивает точность офлайн-перевода и использует выразительные голоса.
Демо
https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo
⚡4❤2👌2
#unrealneural
Встречайте Flush
ИИ, который по фото вашего 💩 выдаёт 20 параметров здоровья: от кишечника до стресса!
Трекер прогресса сделает каждый поход в туалет настоящим квестом с оценкой твоего "шедевра".
Первые 3 дня бесплатно 🤷🏻
Это важный шаг к использованию ИИ для здоровья
https://apps.apple.com/ru/app/flush-poop-gut-health-scan/id6748068252
Встречайте Flush
ИИ, который по фото вашего 💩 выдаёт 20 параметров здоровья: от кишечника до стресса!
Трекер прогресса сделает каждый поход в туалет настоящим квестом с оценкой твоего "шедевра".
Первые 3 дня бесплатно 🤷🏻
Это важный шаг к использованию ИИ для здоровья
https://apps.apple.com/ru/app/flush-poop-gut-health-scan/id6748068252
💩13😁2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #нейроразбор
ИИ, который эволюционирует как природа 🌚
ShinkaEvolve от Sakana AI бьёт рекорды: упаковал 26 кругов лучше всех за 150 попыток (смотрите видео)
Это open-source магия для математики и ИИ.
Это и улучшение решения сложных задачи и про эффективную работ LLM.
Эта open-source технология поможет в геймдеве, математике, программировании и даже улучшить сами нейросети⚡️⚡️⚡️
https://sakana.ai/shinka-evolve/
ИИ, который эволюционирует как природа 🌚
ShinkaEvolve от Sakana AI бьёт рекорды: упаковал 26 кругов лучше всех за 150 попыток (смотрите видео)
Это open-source магия для математики и ИИ.
Это и улучшение решения сложных задачи и про эффективную работ LLM.
Эта open-source технология поможет в геймдеве, математике, программировании и даже улучшить сами нейросети⚡️⚡️⚡️
https://sakana.ai/shinka-evolve/
❤5🤯2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
FLUX.1 Kontext [Pro] теперь в Photoshop
Использование FLUX в Generative Fill позволяет легко редактировать изображения: создавать новые фоны, добавлять реалистичные элементы к существующим фотографиям или улучшать материалы.
FLUX.1 Kontext [Pro] теперь в Photoshop
Использование FLUX в Generative Fill позволяет легко редактировать изображения: создавать новые фоны, добавлять реалистичные элементы к существующим фотографиям или улучшать материалы.
⚡3❤3
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #AILAB #ЛабораторияИИ
Тестируем новые модели видеогенерации ⚡️
Использую только промпт, без первого кадра. Нашел подобные эксперименты в X и решил их немного адаптировать под другие темы.
Советую брать промпт и просить ЛЛМ просто адаптировать под нужную вам тематику.
Промпт и другие результаты смотрите в комментариях 👍🏻
Тестируем новые модели видеогенерации ⚡️
Использую только промпт, без первого кадра. Нашел подобные эксперименты в X и решил их немного адаптировать под другие темы.
Советую брать промпт и просить ЛЛМ просто адаптировать под нужную вам тематику.
Промпт и другие результаты смотрите в комментариях 👍🏻
⚡6❤4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Инструменты параметрической генерации продолжают удивлять красотой своей математики 🤗
Не смотря на то, что сейчас активно создаются нейрогенераторы, инструменты на подобие Icity все равно выглядят очень круто 👍🏻
Не смотря на то, что сейчас активно создаются нейрогенераторы, инструменты на подобие Icity все равно выглядят очень круто 👍🏻
👍7⚡3❤2🔥1