AI LAB | Лаборатория ИИ
1.93K subscribers
681 photos
456 videos
24 files
945 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca

Вопросы сотрудничества и соучастия
@j_fede
Download Telegram
Forwarded from Data Secrets
Grok 4 Fast: уровень Gemini 2.5 Pro в 20 раз дешевле

xAI выпустили Grok 4 Fast. Моделька просто поражает соотношением цены, скорости и качества. Смотрите сами:

– Уровень Gemini 2.5 Pro и Claude 4.1 Opus на тестах, контекст 2М токенов, гибридный ризонинг

Более 340 токенов в секунду на инференсе

– Цены: $0.20/M input, $0.50/M output. У той же Gemini 2.5 Pro, для сравнения: in $1.25 / out $10.

При этом, помимо понижения цены, модель еще и более эффективна по использованию токенов. Например, аналитики из Artificial Analysis пишут, что для решения их теста Grok’у понадобилось всего 61М токенов, в то время как Gemini 2.5 Pro сожгла 93М. Принимая это во внимание, получается, что Grok 4 Fast примерно в 25 раз дешевле.

Выглядит как то, что точно надо пробовать. Уже доступно в API, у провайдеров и бесплатно в чате

Блогпост
🔥21👍1
#unrealneural
Grok 4 Fast

Мультимодальная модель с контекстным окном 2М, которая устанавливает новый стандарт для экономически эффективного ИИ
3👍3👌2
Forwarded from Data Secrets
Media is too big
VIEW IN TELEGRAM
«Я хочу себе частную LLM»: в сообществе внезапно завирусился момент из интервью Мэттью Макконахи

«Мне нужна частная LLM, содержащая только мои любимые книги, мои заметки и статьи. Чтобы я мог спросить у нее что-нибудь, и она отвечала, исходя исключительно из этой информации, без влияния внешнего мира. И по мере разговоров она бы узнавала обо мне еще больше»


Пост в X с цитатой залетел на миллионы просмотров, и мнения разделились максимально (кто бы подумал, что такое количество споров вызовет голивудский актер):

– Одни говорят, что такое уже давно есть и называется Notebook LM.

– Кто-то утверждает, что NotebookLM – совсем не то, а Мэттью озвучил идею, о которой они думали и мечтали годами.

– Третьи взывают к здравому смыслу и утверждают, что создать такую LLM технически невозможно, и Макконахи абсолютно не понимает, о чем говорит (откровенно говоря, он и не обязан).

Ближе всего к правде – последнее. Конечно, мы не знаем, что имел в виду актер. Может быть, NotebookLM и правда есть то, что он описывает.

Но если нет, то пока что такая сеть может существовать только в виде вашего собственного мозга. L в аббревиатуре LLM – это Large. Чтобы трансформер заговорил, ему нужны громадные объемы текста. Вряд ли у кого-либо найдется столько любимых книг, заметок и статей. Так что прости, Мэттью, такого еще не изобрели.

Чтобы быть царем зверей, мало вести себя по царски. Надо иметь собственную LLM 🚬
Please open Telegram to view this post
VIEW IN TELEGRAM
6🤔5👍3🤓1
#unrealneural
200-страничная работа по LLM: ключевые выводы.

Предобучение: ИИ изучает данные через неконтролируемое и самоконтролируемое обучение. Архитектуры: кодировщики, декодеры, BERT, Трансформеры.

Генеративные модели: GPT-подобные модели для творчества. Тонкая настройка и RLHF обеспечивают специализацию и безопасность.

Промпт-инжиниринг: Контекстное обучение, цепочка мыслей и RAG для точных ответов.

Выравнивание ИИ: Тонкая настройка и RLHF для соответствия человеческим намерениям.

https://arxiv.org/pdf/2501.09223
3👍2
#unrealneural
Исследователи Apple представляют AToken

Первый унифицированный визуальный токенизатор для высокоточной реконструкции и семантического понимания изображений, видео и 3D-ресурсов.
https://huggingface.co/papers/2509.14476

AToken, как универсальный токенизатор, который объединяет обработку изображений, видео и 3D-объектов в одном 4D-пространстве, обеспечивает точную реконструкцию и понимание. Он использует трансформерную архитектуру и устойчивое обучение без состязательности, поддерживая создание контента и анализ данных.

AToken может продвинуть индустрию ИИ, упрощая разработку мультимодальных систем и снижая затраты на создание универсальных моделей.
🤯5👍3💩1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
DeepSeek-V3.1-Terminus доступен на Hugging Face

Что нового?
Прощай, путаница в тексте🙃 Больше никаких раздражающих миксов из китайского, русского и английского, и странных символов, которые выглядят как сбой матрицы.

Режим агента 🔥 Кодовый агент и поисковик прокачали до уровня, где они не просто работают, а реально выручают. Пишешь код или ищешь инфу, модель теперь справляется как профи, быстро и по делу 🤝

Сразу затестил на Anycoder. Все ссылки и промпт в комментах.
🔥511👍1
#unrealneural #нейроразбор
Microsoft представляет нейронку латентного зонирования 🤗

Вышла статья про Latent Zoning Network (LZN), попробуем разобраться.

Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию через общее скрытое пространство, где энкодеры и декодеры решают разные задачи. Но при этом результаты пока показаны на простых датасетах (CIFAR10, ImageNet), и неясно, как она справится с более сложными данными. 🤷🏻‍♂️

Это не проходная статья, так как LZN упрощает архитектуру, улучшает генерацию (FID 2.76 -> 2.59 на CIFAR10), превосходит MoCo и SimCLR в представлении данных и предлагает универсальный подход с открытым кодом.

https://huggingface.co/microsoft/latent-zoning-networks
3👍1🤗1
AI LAB | Лаборатория ИИ
#unrealneural #нейроразбор Microsoft представляет нейронку латентного зонирования 🤗 Вышла статья про Latent Zoning Network (LZN), попробуем разобраться. Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию…
Если ничего непонятно 😃😃😃, то LZN - это нейронка, которая сразу умеет рисовать картинки, понимать, что на них, и говорить, что это за картинка. Обычно для этого нужны разные нейросети, а тут всё в одной! Она превращает картинки, слова и метки в точки в "волшебной комнате" (латентное пространство) и обратно. Круто, что работает лучше некоторых старых методов, и код открыт.
👍42😱2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #анализдокументов
ByteDance выпустила Dolphin
Это фреймворк для анализа документов, который преобразует PDF-файлы в структурированные форматы, такие как Markdown, HTML, LaTeX и JSON.

И что? 🤷🏻🤷🏻🤷🏻

Отсутствие прозрачных метрик производительности вызывает вопросы. Без тестов на реальных данных сложно доверять заявлениям о "высокой точности".

Для новичков Dolphin может быть сложным в настройке.

Если твои PDF на русском или содержат нестандартные шрифты/макеты, результат может быть непредсказуемым без предварительного тестирования.

Надо пробовать 😔
https://github.com/bytedance/Dolphin
👍31
#unrealneural
Qwen3-LiveTranslate-Flash: большой шаг в мультимодальном переводе

Что это и в чем фишка?
Qwen3-LiveTranslate-Flash — это мультимодальный инструмент для перевода в реальном времени. Он поддерживает 18 языков и 6 диалектов, понимает жесты, читает по губам, экранный текст и объекты, работает с минимальной задержкой в 3 секунды⚡️⚡️⚡️, обеспечивает точность офлайн-перевода и использует выразительные голоса.

Демо
https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo
42👌2
#unrealneural
Встречайте Flush

ИИ, который по фото вашего 💩 выдаёт 20 параметров здоровья: от кишечника до стресса!
Трекер прогресса сделает каждый поход в туалет настоящим квестом с оценкой твоего "шедевра".

Первые 3 дня бесплатно 🤷🏻

Это важный шаг к использованию ИИ для здоровья
https://apps.apple.com/ru/app/flush-poop-gut-health-scan/id6748068252
💩13😁2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #нейроразбор
ИИ, который эволюционирует как природа 🌚

ShinkaEvolve от Sakana AI бьёт рекорды: упаковал 26 кругов лучше всех за 150 попыток (смотрите видео)
Это open-source магия для математики и ИИ.

Это и улучшение решения сложных задачи и про эффективную работ LLM.
Эта open-source технология поможет в геймдеве, математике, программировании и даже улучшить сами нейросети⚡️⚡️⚡️

https://sakana.ai/shinka-evolve/
4🤯21
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
FLUX.1 Kontext [Pro] теперь в Photoshop

Использование FLUX в Generative Fill позволяет легко редактировать изображения: создавать новые фоны, добавлять реалистичные элементы к существующим фотографиям или улучшать материалы.
32
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #AILAB #ЛабораторияИИ
Тестируем новые модели видеогенерации ⚡️

Использую только промпт, без первого кадра. Нашел подобные эксперименты в X и решил их немного адаптировать под другие темы.

Советую брать промпт и просить ЛЛМ просто адаптировать под нужную вам тематику.

Промпт и другие результаты смотрите в комментариях 👍🏻
52👍1