Forwarded from Data Secrets
Media is too big
VIEW IN TELEGRAM
«Я хочу себе частную LLM»: в сообществе внезапно завирусился момент из интервью Мэттью Макконахи
Пост в X с цитатой залетел на миллионы просмотров, и мнения разделились максимально (кто бы подумал, что такое количество споров вызовет голивудский актер):
– Одни говорят, что такое уже давно есть и называется Notebook LM.
– Кто-то утверждает, что NotebookLM – совсем не то, а Мэттью озвучил идею, о которой они думали и мечтали годами.
– Третьи взывают к здравому смыслу и утверждают, что создать такую LLM технически невозможно, и Макконахи абсолютно не понимает, о чем говорит (откровенно говоря, он и не обязан).
Ближе всего к правде – последнее. Конечно, мы не знаем, что имел в виду актер. Может быть, NotebookLM и правда есть то, что он описывает.
Но если нет, то пока что такая сеть может существовать только в виде вашего собственного мозга. L в аббревиатуре LLM – это Large. Чтобы трансформер заговорил, ему нужны громадные объемы текста. Вряд ли у кого-либо найдется столько любимых книг, заметок и статей. Так что прости, Мэттью, такого еще не изобрели.
Чтобы быть царем зверей, мало вести себя по царски. Надо иметь собственную LLM🚬
«Мне нужна частная LLM, содержащая только мои любимые книги, мои заметки и статьи. Чтобы я мог спросить у нее что-нибудь, и она отвечала, исходя исключительно из этой информации, без влияния внешнего мира. И по мере разговоров она бы узнавала обо мне еще больше»
Пост в X с цитатой залетел на миллионы просмотров, и мнения разделились максимально (кто бы подумал, что такое количество споров вызовет голивудский актер):
– Одни говорят, что такое уже давно есть и называется Notebook LM.
– Кто-то утверждает, что NotebookLM – совсем не то, а Мэттью озвучил идею, о которой они думали и мечтали годами.
– Третьи взывают к здравому смыслу и утверждают, что создать такую LLM технически невозможно, и Макконахи абсолютно не понимает, о чем говорит (откровенно говоря, он и не обязан).
Ближе всего к правде – последнее. Конечно, мы не знаем, что имел в виду актер. Может быть, NotebookLM и правда есть то, что он описывает.
Но если нет, то пока что такая сеть может существовать только в виде вашего собственного мозга. L в аббревиатуре LLM – это Large. Чтобы трансформер заговорил, ему нужны громадные объемы текста. Вряд ли у кого-либо найдется столько любимых книг, заметок и статей. Так что прости, Мэттью, такого еще не изобрели.
Чтобы быть царем зверей, мало вести себя по царски. Надо иметь собственную LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🤔5👍3🤓1
#unrealneural
200-страничная работа по LLM: ключевые выводы.
Предобучение: ИИ изучает данные через неконтролируемое и самоконтролируемое обучение. Архитектуры: кодировщики, декодеры, BERT, Трансформеры.
Генеративные модели: GPT-подобные модели для творчества. Тонкая настройка и RLHF обеспечивают специализацию и безопасность.
Промпт-инжиниринг: Контекстное обучение, цепочка мыслей и RAG для точных ответов.
Выравнивание ИИ: Тонкая настройка и RLHF для соответствия человеческим намерениям.
https://arxiv.org/pdf/2501.09223
200-страничная работа по LLM: ключевые выводы.
Предобучение: ИИ изучает данные через неконтролируемое и самоконтролируемое обучение. Архитектуры: кодировщики, декодеры, BERT, Трансформеры.
Генеративные модели: GPT-подобные модели для творчества. Тонкая настройка и RLHF обеспечивают специализацию и безопасность.
Промпт-инжиниринг: Контекстное обучение, цепочка мыслей и RAG для точных ответов.
Выравнивание ИИ: Тонкая настройка и RLHF для соответствия человеческим намерениям.
https://arxiv.org/pdf/2501.09223
⚡3👍2
#unrealneural
Исследователи Apple представляют AToken
Первый унифицированный визуальный токенизатор для высокоточной реконструкции и семантического понимания изображений, видео и 3D-ресурсов.
https://huggingface.co/papers/2509.14476
AToken, как универсальный токенизатор, который объединяет обработку изображений, видео и 3D-объектов в одном 4D-пространстве, обеспечивает точную реконструкцию и понимание. Он использует трансформерную архитектуру и устойчивое обучение без состязательности, поддерживая создание контента и анализ данных.
AToken может продвинуть индустрию ИИ, упрощая разработку мультимодальных систем и снижая затраты на создание универсальных моделей.
Исследователи Apple представляют AToken
Первый унифицированный визуальный токенизатор для высокоточной реконструкции и семантического понимания изображений, видео и 3D-ресурсов.
https://huggingface.co/papers/2509.14476
AToken, как универсальный токенизатор, который объединяет обработку изображений, видео и 3D-объектов в одном 4D-пространстве, обеспечивает точную реконструкцию и понимание. Он использует трансформерную архитектуру и устойчивое обучение без состязательности, поддерживая создание контента и анализ данных.
AToken может продвинуть индустрию ИИ, упрощая разработку мультимодальных систем и снижая затраты на создание универсальных моделей.
🤯5👍3💩1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
DeepSeek-V3.1-Terminus доступен на Hugging Face
Что нового?
Прощай, путаница в тексте🙃 Больше никаких раздражающих миксов из китайского, русского и английского, и странных символов, которые выглядят как сбой матрицы.
Режим агента 🔥 Кодовый агент и поисковик прокачали до уровня, где они не просто работают, а реально выручают. Пишешь код или ищешь инфу, модель теперь справляется как профи, быстро и по делу 🤝
Сразу затестил на Anycoder. Все ссылки и промпт в комментах.
DeepSeek-V3.1-Terminus доступен на Hugging Face
Что нового?
Прощай, путаница в тексте🙃 Больше никаких раздражающих миксов из китайского, русского и английского, и странных символов, которые выглядят как сбой матрицы.
Режим агента 🔥 Кодовый агент и поисковик прокачали до уровня, где они не просто работают, а реально выручают. Пишешь код или ищешь инфу, модель теперь справляется как профи, быстро и по делу 🤝
Сразу затестил на Anycoder. Все ссылки и промпт в комментах.
🔥5❤1⚡1👍1
#unrealneural #нейроразбор
Microsoft представляет нейронку латентного зонирования 🤗
Вышла статья про Latent Zoning Network (LZN), попробуем разобраться.
Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию через общее скрытое пространство, где энкодеры и декодеры решают разные задачи. Но при этом результаты пока показаны на простых датасетах (CIFAR10, ImageNet), и неясно, как она справится с более сложными данными. 🤷🏻♂️
Это не проходная статья, так как LZN упрощает архитектуру, улучшает генерацию (FID 2.76 -> 2.59 на CIFAR10), превосходит MoCo и SimCLR в представлении данных и предлагает универсальный подход с открытым кодом.
https://huggingface.co/microsoft/latent-zoning-networks
Microsoft представляет нейронку латентного зонирования 🤗
Вышла статья про Latent Zoning Network (LZN), попробуем разобраться.
Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию через общее скрытое пространство, где энкодеры и декодеры решают разные задачи. Но при этом результаты пока показаны на простых датасетах (CIFAR10, ImageNet), и неясно, как она справится с более сложными данными. 🤷🏻♂️
Это не проходная статья, так как LZN упрощает архитектуру, улучшает генерацию (FID 2.76 -> 2.59 на CIFAR10), превосходит MoCo и SimCLR в представлении данных и предлагает универсальный подход с открытым кодом.
https://huggingface.co/microsoft/latent-zoning-networks
⚡3👍1🤗1
AI LAB
#unrealneural #нейроразбор Microsoft представляет нейронку латентного зонирования 🤗 Вышла статья про Latent Zoning Network (LZN), попробуем разобраться. Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию…
Если ничего непонятно 😃😃😃, то LZN - это нейронка, которая сразу умеет рисовать картинки, понимать, что на них, и говорить, что это за картинка. Обычно для этого нужны разные нейросети, а тут всё в одной! Она превращает картинки, слова и метки в точки в "волшебной комнате" (латентное пространство) и обратно. Круто, что работает лучше некоторых старых методов, и код открыт.
👍4❤2😱2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #анализдокументов
ByteDance выпустила Dolphin
Это фреймворк для анализа документов, который преобразует PDF-файлы в структурированные форматы, такие как Markdown, HTML, LaTeX и JSON.
И что? 🤷🏻🤷🏻🤷🏻
Отсутствие прозрачных метрик производительности вызывает вопросы. Без тестов на реальных данных сложно доверять заявлениям о "высокой точности".
Для новичков Dolphin может быть сложным в настройке.
Если твои PDF на русском или содержат нестандартные шрифты/макеты, результат может быть непредсказуемым без предварительного тестирования.
Надо пробовать 😔
https://github.com/bytedance/Dolphin
ByteDance выпустила Dolphin
Это фреймворк для анализа документов, который преобразует PDF-файлы в структурированные форматы, такие как Markdown, HTML, LaTeX и JSON.
И что? 🤷🏻🤷🏻🤷🏻
Отсутствие прозрачных метрик производительности вызывает вопросы. Без тестов на реальных данных сложно доверять заявлениям о "высокой точности".
Для новичков Dolphin может быть сложным в настройке.
Если твои PDF на русском или содержат нестандартные шрифты/макеты, результат может быть непредсказуемым без предварительного тестирования.
Надо пробовать 😔
https://github.com/bytedance/Dolphin
👍3⚡1
#unrealneural
Qwen3-LiveTranslate-Flash: большой шаг в мультимодальном переводе
Что это и в чем фишка?
Qwen3-LiveTranslate-Flash — это мультимодальный инструмент для перевода в реальном времени. Он поддерживает 18 языков и 6 диалектов, понимает жесты, читает по губам, экранный текст и объекты, работает с минимальной задержкой в 3 секунды⚡️⚡️⚡️, обеспечивает точность офлайн-перевода и использует выразительные голоса.
Демо
https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo
Qwen3-LiveTranslate-Flash: большой шаг в мультимодальном переводе
Что это и в чем фишка?
Qwen3-LiveTranslate-Flash — это мультимодальный инструмент для перевода в реальном времени. Он поддерживает 18 языков и 6 диалектов, понимает жесты, читает по губам, экранный текст и объекты, работает с минимальной задержкой в 3 секунды⚡️⚡️⚡️, обеспечивает точность офлайн-перевода и использует выразительные голоса.
Демо
https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo
⚡4❤2👌2
#unrealneural
Встречайте Flush
ИИ, который по фото вашего 💩 выдаёт 20 параметров здоровья: от кишечника до стресса!
Трекер прогресса сделает каждый поход в туалет настоящим квестом с оценкой твоего "шедевра".
Первые 3 дня бесплатно 🤷🏻
Это важный шаг к использованию ИИ для здоровья
https://apps.apple.com/ru/app/flush-poop-gut-health-scan/id6748068252
Встречайте Flush
ИИ, который по фото вашего 💩 выдаёт 20 параметров здоровья: от кишечника до стресса!
Трекер прогресса сделает каждый поход в туалет настоящим квестом с оценкой твоего "шедевра".
Первые 3 дня бесплатно 🤷🏻
Это важный шаг к использованию ИИ для здоровья
https://apps.apple.com/ru/app/flush-poop-gut-health-scan/id6748068252
💩13😁2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #нейроразбор
ИИ, который эволюционирует как природа 🌚
ShinkaEvolve от Sakana AI бьёт рекорды: упаковал 26 кругов лучше всех за 150 попыток (смотрите видео)
Это open-source магия для математики и ИИ.
Это и улучшение решения сложных задачи и про эффективную работ LLM.
Эта open-source технология поможет в геймдеве, математике, программировании и даже улучшить сами нейросети⚡️⚡️⚡️
https://sakana.ai/shinka-evolve/
ИИ, который эволюционирует как природа 🌚
ShinkaEvolve от Sakana AI бьёт рекорды: упаковал 26 кругов лучше всех за 150 попыток (смотрите видео)
Это open-source магия для математики и ИИ.
Это и улучшение решения сложных задачи и про эффективную работ LLM.
Эта open-source технология поможет в геймдеве, математике, программировании и даже улучшить сами нейросети⚡️⚡️⚡️
https://sakana.ai/shinka-evolve/
❤4🤯2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
FLUX.1 Kontext [Pro] теперь в Photoshop
Использование FLUX в Generative Fill позволяет легко редактировать изображения: создавать новые фоны, добавлять реалистичные элементы к существующим фотографиям или улучшать материалы.
FLUX.1 Kontext [Pro] теперь в Photoshop
Использование FLUX в Generative Fill позволяет легко редактировать изображения: создавать новые фоны, добавлять реалистичные элементы к существующим фотографиям или улучшать материалы.
⚡3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #AILAB #ЛабораторияИИ
Тестируем новые модели видеогенерации ⚡️
Использую только промпт, без первого кадра. Нашел подобные эксперименты в X и решил их немного адаптировать под другие темы.
Советую брать промпт и просить ЛЛМ просто адаптировать под нужную вам тематику.
Промпт и другие результаты смотрите в комментариях 👍🏻
Тестируем новые модели видеогенерации ⚡️
Использую только промпт, без первого кадра. Нашел подобные эксперименты в X и решил их немного адаптировать под другие темы.
Советую брать промпт и просить ЛЛМ просто адаптировать под нужную вам тематику.
Промпт и другие результаты смотрите в комментариях 👍🏻
⚡5❤3👍2