Лаборатория ИИ

Grok 4 Fast: уровень Gemini 2.5 Pro в 20 раз дешевле

xAI выпустили Grok 4 Fast. Моделька просто поражает соотношением цены, скорости и качества. Смотрите сами:

– Уровень Gemini 2.5 Pro и Claude 4.1 Opus на тестах, контекст 2М токенов, гибридный ризонинг

– Более 340 токенов в секунду на инференсе

– Цены: $0.20/M input, $0.50/M output. У той же Gemini 2.5 Pro, для сравнения: in $1.25 / out $10.

При этом, помимо понижения цены, модель еще и более эффективна по использованию токенов. Например, аналитики из Artificial Analysis пишут, что для решения их теста Grok’у понадобилось всего 61М токенов, в то время как Gemini 2.5 Pro сожгла 93М. Принимая это во внимание, получается, что Grok 4 Fast примерно в 25 раз дешевле.

Выглядит как то, что точно надо пробовать. Уже доступно в API, у провайдеров и бесплатно в чате

Блогпост

🔥2❤1👍1

544 viewsАртур Ишмаев, 16:21

Лаборатория ИИ

#unrealneural
Grok 4 Fast

Мультимодальная модель с контекстным окном 2М, которая устанавливает новый стандарт для экономически эффективного ИИ

⚡3👍3👌2

593 viewsАртур Ишмаев, edited 17:23

Лаборатория ИИ

Forwarded from Data Secrets

1:19

Media is too big

VIEW IN TELEGRAM

«Я хочу себе частную LLM»: в сообществе внезапно завирусился момент из интервью Мэттью Макконахи

«Мне нужна частная LLM, содержащая только мои любимые книги, мои заметки и статьи. Чтобы я мог спросить у нее что-нибудь, и она отвечала, исходя исключительно из этой информации, без влияния внешнего мира. И по мере разговоров она бы узнавала обо мне еще больше»

Пост в X с цитатой залетел на миллионы просмотров, и мнения разделились максимально (кто бы подумал, что такое количество споров вызовет голивудский актер):

– Одни говорят, что такое уже давно есть и называется Notebook LM.

– Кто-то утверждает, что NotebookLM – совсем не то, а Мэттью озвучил идею, о которой они думали и мечтали годами.

– Третьи взывают к здравому смыслу и утверждают, что создать такую LLM технически невозможно, и Макконахи абсолютно не понимает, о чем говорит (откровенно говоря, он и не обязан).

Ближе всего к правде – последнее. Конечно, мы не знаем, что имел в виду актер. Может быть, NotebookLM и правда есть то, что он описывает.

Но если нет, то пока что такая сеть может существовать только в виде вашего собственного мозга. L в аббревиатуре LLM – это Large. Чтобы трансформер заговорил, ему нужны громадные объемы текста. Вряд ли у кого-либо найдется столько любимых книг, заметок и статей. Так что прости, Мэттью, такого еще не изобрели.

Чтобы быть царем зверей, мало вести себя по царски. Надо иметь собственную LLM 🚬

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6🤔5👍4🤓1

575 viewsАртур Ишмаев, 07:10

Лаборатория ИИ

#unrealneural
200-страничная работа по LLM: ключевые выводы.

Предобучение: ИИ изучает данные через неконтролируемое и самоконтролируемое обучение. Архитектуры: кодировщики, декодеры, BERT, Трансформеры.

Генеративные модели: GPT-подобные модели для творчества. Тонкая настройка и RLHF обеспечивают специализацию и безопасность.

Промпт-инжиниринг: Контекстное обучение, цепочка мыслей и RAG для точных ответов.

Выравнивание ИИ: Тонкая настройка и RLHF для соответствия человеческим намерениям.

https://arxiv.org/pdf/2501.09223

⚡3👍2

625 viewsАртур Ишмаев, 08:15

Лаборатория ИИ

#unrealneural #пытаюсьпонять

❤3👍3

752 viewsАртур Ишмаев, 15:08

Лаборатория ИИ

#unrealneural
Исследователи Apple представляют AToken

Первый унифицированный визуальный токенизатор для высокоточной реконструкции и семантического понимания изображений, видео и 3D-ресурсов.
https://huggingface.co/papers/2509.14476

AToken, как универсальный токенизатор, который объединяет обработку изображений, видео и 3D-объектов в одном 4D-пространстве, обеспечивает точную реконструкцию и понимание. Он использует трансформерную архитектуру и устойчивое обучение без состязательности, поддерживая создание контента и анализ данных.

AToken может продвинуть индустрию ИИ, упрощая разработку мультимодальных систем и снижая затраты на создание универсальных моделей.

🤯5👍3💩1

697 viewsАртур Ишмаев, edited 21:16

Лаборатория ИИ

0:52

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural
DeepSeek-V3.1-Terminus доступен на Hugging Face

Что нового?
Прощай, путаница в тексте🙃 Больше никаких раздражающих миксов из китайского, русского и английского, и странных символов, которые выглядят как сбой матрицы.

Режим агента 🔥 Кодовый агент и поисковик прокачали до уровня, где они не просто работают, а реально выручают. Пишешь код или ищешь инфу, модель теперь справляется как профи, быстро и по делу 🤝

Сразу затестил на Anycoder. Все ссылки и промпт в комментах.

🔥5❤2⚡1👍1

889 viewsАртур Ишмаев, 19:38

Лаборатория ИИ

#unrealneural #нейроразбор
Microsoft представляет нейронку латентного зонирования 🤗

Вышла статья про Latent Zoning Network (LZN), попробуем разобраться.

Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию через общее скрытое пространство, где энкодеры и декодеры решают разные задачи. Но при этом результаты пока показаны на простых датасетах (CIFAR10, ImageNet), и неясно, как она справится с более сложными данными. 🤷🏻‍♂️

Это не проходная статья, так как LZN упрощает архитектуру, улучшает генерацию (FID 2.76 -> 2.59 на CIFAR10), превосходит MoCo и SimCLR в представлении данных и предлагает универсальный подход с открытым кодом.

https://huggingface.co/microsoft/latent-zoning-networks

⚡3🤗2👍1

670 viewsАртур Ишмаев, edited 06:06

Лаборатория ИИ

Если ничего непонятно 😃😃😃, то LZN - это нейронка, которая сразу умеет рисовать картинки, понимать, что на них, и говорить, что это за картинка. Обычно для этого нужны разные нейросети, а тут всё в одной! Она превращает картинки, слова и метки в точки в "волшебной комнате" (латентное пространство) и обратно. Круто, что работает лучше некоторых старых методов, и код открыт.

👍6❤2😱2

676 viewsАртур Ишмаев, 06:19

Лаборатория ИИ

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural #анализдокументов
ByteDance выпустила Dolphin
Это фреймворк для анализа документов, который преобразует PDF-файлы в структурированные форматы, такие как Markdown, HTML, LaTeX и JSON.

И что? 🤷🏻🤷🏻🤷🏻

Отсутствие прозрачных метрик производительности вызывает вопросы. Без тестов на реальных данных сложно доверять заявлениям о "высокой точности".

Для новичков Dolphin может быть сложным в настройке.

Если твои PDF на русском или содержат нестандартные шрифты/макеты, результат может быть непредсказуемым без предварительного тестирования.

Надо пробовать 😔
https://github.com/bytedance/Dolphin

👍3⚡1

803 viewsАртур Ишмаев, 16:52

Лаборатория ИИ

#unrealneural
Qwen3-LiveTranslate-Flash: большой шаг в мультимодальном переводе

Что это и в чем фишка?
Qwen3-LiveTranslate-Flash — это мультимодальный инструмент для перевода в реальном времени. Он поддерживает 18 языков и 6 диалектов, понимает жесты, читает по губам, экранный текст и объекты, работает с минимальной задержкой в 3 секунды⚡️⚡️⚡️, обеспечивает точность офлайн-перевода и использует выразительные голоса.

Демо
https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo

⚡4❤2👌2

753 viewsАртур Ишмаев, edited 05:20

Лаборатория ИИ

#unrealneural
Встречайте Flush

ИИ, который по фото вашего 💩 выдаёт 20 параметров здоровья: от кишечника до стресса!
Трекер прогресса сделает каждый поход в туалет настоящим квестом с оценкой твоего "шедевра".

Первые 3 дня бесплатно 🤷🏻

Это важный шаг к использованию ИИ для здоровья
https://apps.apple.com/ru/app/flush-poop-gut-health-scan/id6748068252

💩15😁3👍1

756 viewsАртур Ишмаев, edited 10:47

Лаборатория ИИ

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural #нейроразбор
ИИ, который эволюционирует как природа 🌚

ShinkaEvolve от Sakana AI бьёт рекорды: упаковал 26 кругов лучше всех за 150 попыток (смотрите видео)
Это open-source магия для математики и ИИ.

Это и улучшение решения сложных задачи и про эффективную работ LLM.
Эта open-source технология поможет в геймдеве, математике, программировании и даже улучшить сами нейросети⚡️⚡️⚡️

https://sakana.ai/shinka-evolve/

❤7🤯2⚡1

796 viewsАртур Ишмаев, edited 11:46

Лаборатория ИИ

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural
FLUX.1 Kontext [Pro] теперь в Photoshop

Использование FLUX в Generative Fill позволяет легко редактировать изображения: создавать новые фоны, добавлять реалистичные элементы к существующим фотографиям или улучшать материалы.

⚡4❤3

779 viewsАртур Ишмаев, edited 05:13

Лаборатория ИИ

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural #AILAB #ЛабораторияИИ
Тестируем новые модели видеогенерации ⚡️

Использую только промпт, без первого кадра. Нашел подобные эксперименты в X и решил их немного адаптировать под другие темы.

Советую брать промпт и просить ЛЛМ просто адаптировать под нужную вам тематику.

Промпт и другие результаты смотрите в комментариях 👍🏻

⚡6❤4👍4

1.04K viewsАртур Ишмаев, edited 13:25

Лаборатория ИИ

Channel name was changed to «AI LAB»

19:11

Лаборатория ИИ

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

Инструменты параметрической генерации продолжают удивлять красотой своей математики 🤗

Не смотря на то, что сейчас активно создаются нейрогенераторы, инструменты на подобие Icity все равно выглядят очень круто 👍🏻

👍10⚡3❤2🔥2

939 viewsАртур Ишмаев, edited 13:02

Лаборатория ИИ

В сентябре вышли три исследования, которые продвигают генерацию векторной графики с помощью ИИ.

Вот краткий небольшой обзор:
1. NeuralSVG - это модель для создания SVG из текстовых описаний. Использует метод Score Distillation Sampling и dropout-регуляризацию для улучшения структуры векторных слоев.
2. UniSVG - датасет для обучения мультимодальных языковых моделей задачам понимания и генерации SVG. Подходит для тестирования и разработки новых алгоритмов.
3. LayerTracer - это фреймворк на базе диффузионных трансформеров, генерирующий многослойные SVG, имитирующие последовательность действий дизайнера.

Эти работы улучшают точность и сложность генерации SVG, делая процесс ближе к человеческому подходу к дизайну. NeuralSVG упрощает создание графики из текста, UniSVG стандартизирует обучение моделей, а LayerTracer повышает качество многослойных изображений.

⚡3👍3

817 viewsАртур Ишмаев, 08:18

About

Blog

Apps

Platform