Технозаметки Малышева
8.67K subscribers
3.85K photos
1.44K videos
40 files
4.02K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from Machinelearning
🌟 Cемейство гибридных моделей Nemotron-H от NVIDIA.

NVIDIA выпустила новое семейство языковых моделей Nemotron-H, сочетающих архитектуры Mamba и Transformer. Эти гибриды обещают до 3х ускорения инференса по сравнению с чистыми Transformer-моделями аналогичного размера (Qwen или Llama).

Семейство поддерживает английский, немецкий, испанский, французский, итальянский, корейский, португальский, русский, японский и китайский языки.

Основной фокус Nemotron-H — баланс между эффективностью и интеллектом: даже при меньшем числе параметров (47–56 млрд.) модели демонстрируют точность, близкую к DeepSeek-V3-671B.

Особенность Nemotron-H — использование FP8 для претрейна. 56B-версию обучали на 20 трлн. токенов с квантованием тензоров «на лету», а сжатую в FP4 модель c 47B можно запускать на потребительской RTX 5090 с поддержкой контекста до 1 млн. токенов. Правда, пришлось пожертвовать частью слоев самовнимания — их заменили на более легкие Mamba-блоки, чтобы ускорить генерацию.

NVIDIA не стала тренировать компактные версии модели с нуля. Вместо этого использовали дистилляцию: 47B-модель получили из 56B, удалив половину «тяжелых» слоев и дообучив на 63 млрд токенов. Результат — почти та же точность, но на 1.2x быстрее.

В бенчмарках Nemotron-H обходит конкурентов в математике и коде: на GSM8k 56B-версия дает 93.7% против 90.9% у Qwen-72B. А 8B-модель, хоть и уступает в MMLU, вырывается вперёд в HumanEval+ (56.1%) — ожидаемо, с учетом ее instruct-оптимизации.

Пока модели доступны на HF как базовые, но NVIDIA обещает добавить инструктивные и мультимодальные версии.

▶️В опенсорсный релиз были выпушены чекпоинты с контекстом 8 тыс. токенов:

🟢Nemotron-H-56B-Base-8K

🟢Nemotron-H-47B-Base-8K

🟢Nemotron-H-8B-Base-8K


📌 Лицензирование: NVIDIA Internal Scientific Research and Development Model License.


🟡Страница проекта
🟡Коллекция на HF
🟡Arxiv


@ai_machinelearning_big_data

#AI #ML #LLM #NemotronH #NVIDIA
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31
OpenAI разрабатывает конкурента Twitter — интеллектуальную социальную сеть

Компания Сэма Альтмана создаёт социальную платформу, напоминающую X (экс-Twitter).

Внутренний прототип фокусируется на генерации изображений и представляет собой ленту контента.

Руководитель проекта запрашивает отзывы о разработке у внешних экспертов.

Неясно, будет ли продукт выпущен как отдельное приложение или интегрирован в ChatGPT.

Запуск усилит соперничество между Альтманом и Маском, предлагавшим купить OpenAI за $97.4 млрд.

Обостряется конкуренция с Meta*(запрещённой в РФ), планирующей добавить социальную ленту в свой ИИ-ассистент.

Собственная платформа обеспечит организацию уникальными данными для обучения моделей.

Одна из задумок — помогать авторам публиковать качественный контент с помощью искусственного интеллекта.

Не можешь победить, - создай своё. Норм.

#OpenAI #SocialNetwork #Altman
-------
@tsingular
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Бесплатные API для ваших агентов на все случаи жизни

390 бесплатных API: путешествия, погода, апи для разработчикв, финансы, искусство, игры, музыка, публичные и научные данные, спорт и даже спиритизм.

Есть автоматическое ранжирование по доступности, платности (их исключают) и надёжности.

У каждого API описание - ДОСТАТОЧНОЕ ДЛЯ РАБОТЫ АГЕНТА.

Т.е. буквально - копируете его в инструменты и полетели.

n8n агенты благодарносте! :)

А ещё у этого каталога есть API.
Ну так, - API для API.
Поэтому вы можете к агенту его прикрутить и в принципе все эти 390 апи ( а они динамично пополняются) станут инструментами вашего агента все и сразу.
Он вообще любую задачу решить сможет :)

#API #каталог
———
@tsingular
🔥13👍5❤‍🔥2
Forwarded from Технотренды
Google выкатил 601 бизнес-идею с нейронкой внутри.

— Есть конкретные кейсы под любую сферу: торговля, логистика, медиа, кодинг, телеком, наука и т.д.
— Под все расписаны реальные примеры от топовых мировых компаний по интеграции ИИ-агентов в бизнес.
— Уникальная информация в одном месте, фактически сотни готовых бизнес-идей с ИИ.


Забираем — тут.

😇 Техно
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥104🆒3👍2
Преждевременные смерти китайских AI-учёных (2022-2025)

В SCMP (Alibaba) вышел материал про серию неожиданных смертей ученых в Китае, которые занимались исследованиями в области ИИ.

🧠 Индустриальный контекст
Интересен профессиональный профиль погибших — все работали в стратегически важных направлениях:

- Компьютерное зрение — ключевая технология для систем наблюдения и автономных транспортных средств

- Военные AI-приложения — критический компонент современных оборонных технологий

- Медицинский ИИ — высококонкурентная область с огромным коммерческим потенциалом

🔄 Факторы давления в китайской AI-индустрии

Сверхскоростной цикл разработки — идеи устаревают ещё до завершения экспериментов

Конкуренция на опережение — публикация результатов становится гонкой с нулевой суммой

Этические дилеммы — моральная ответственность за потенциальные социальные последствия

Геополитический контекст — стресс от восприятия работы как части технологической войны

Практический вывод для технологических компаний:

Необходимы программы профилактики выгорания сотрудников и регулярный мониторинг здоровья, особенно для ключевых разработчиков.

Всех в санатории у моря. Прогулки в сосновом бору между митапами.
И РЭБ.

#SCMP #Китай #стресс #выгорание
——-
@tsingular
👍8😢6🤯4
Unsloth выпустил руководство по датасетам для файнтюнинга языковых моделей

Создание качественного датасета — ключевой момент в успешном файн-тюне.
Правильно подготовленные данные определяют, насколько хорошо модель усвоит нужные навыки и специализацию.

Основные форматы данных

Четыре ключевых типа датасетов:

📝 Raw Corpus — необработанный текст для продолжения предобучения (CPT)
🎯 Instruct — инструкции и примеры ожидаемого результата для SFT
💬 Conversation — диалоги между пользователем и AI для SFT
🔄 RLHF — диалоги с ранжированием ответов для обучения с подкреплением

Подготовка перед форматированием
Определите цель датасета
- Адаптация модели к конкретной задаче (суммаризация, Q&A)
- Обучение для специфической области (медицина, финансы)
- Настройка на определенный стиль общения

Выберите стиль вывода

Формат: JSON, HTML, код, текст
Язык: испанский, английский, русский и т.д.

Найдите источники данных
- Hugging Face, Wikipedia для готовых наборов
- Специализированные CSV, PDF или веб-ресурсы
- Синтетически сгенерированные данные

Форматы данных под разные задачи
Для предобучения (CPT):

{
"text": "Pasta carbonara is a traditional Roman pasta dish. The sauce is made by mixing raw eggs with grated Pecorino Romano cheese and black pepper..."
}


Для инструкций (Alpaca style):
{
"Instruction": "Task we want the model to perform.",
"Input": "Optional user query.",
"Output": "The expected result."
}


Для диалогов (ChatML):
{
"conversations": [
{
"from": "human",
"value": "Can you help me make pasta carbonara?"
},
{
"from": "gpt",
"value": "Would you like the traditional Roman recipe..."
}
]
}


Hugging Face формат:
{
"messages": [
{
"role": "user",
"constant": "What is 1+1?"
},
{
"role": "assistant",
"value": "It's 2!"
}
]
}

Генерация синтетических данных
Используйте мощные LLM (Llama 3.3 70B, GPT-4.5) для создания дополнительных примеров. Это помогает:

- Расширить существующий датасет
- Диверсифицировать данные, предотвращая переобучение
- Автоматически структурировать данные в нужном формате

Особенности мультимодальных моделей
Для моделей с возможностью обработки изображений (например, Llama 3.2 Vision):
[
{
"role": "user",
"content": [
{"type": "text", "text": "You are an expert radiographer..."},
{"type": "image", "image": image_data}
]
},
{
"role": "assistant",
"content": [
{"type": "text", "text": "This radiograph shows..."}
]
}
]

Практические советы

📊 Минимальный размер датасета: 100+ записей, оптимально 1000+
🧠 Для моделей с рассуждением: включайте в ответы пошаговое объяснение
🔄 Многократный файн-тюнинг: лучше объединить все датасеты и обучить за один раз

Качественная подготовка данных — это 80% успеха файн-тюнинга.
Иначе количество попыток может уйти в бесконечность.

#Unsloth #finetuning #datasets
———
@tsingular
🔥311👍1😐1
Дорогой Дедушка Мороз!
Пишет тебе мальчик 45ти годиков...

:)

(Apple Mac Studio M3 Ultra 512GB/8TB (MU973FN/A-CPU32-GPU80-512GB-8TB))

#железо #юмор
———
@tsingular
👍11😁8🦄1
Media is too big
VIEW IN TELEGRAM
n8n выпустили в релиз 1.88

В релизе помимо MCP клиент-серверных нод и поддержки Milvus, добавили Think tool, который позволяет запустить гарантированные рассуждения в моделях.

Обновляемся.

#n8n #think #переводы
———
@tsingular
🔥5❤‍🔥31
Media is too big
VIEW IN TELEGRAM
Виртуальное сообщество: 1000 ИИ-агентов в экосистеме Minecraft

Исследователи поместили тысячу искусственных интеллектов в мир Minecraft для наблюдения за формированием цифрового сообщества.

Виртуальные агенты демонстрировали самоорганизацию, создавая структурированные поселения и развивая примитивную экономику обмена.

Наблюдалось спонтанное возникновение иерархий и специализаций среди ИИ-существ без прямого программирования такого поведения.

Некоторые агенты занимались добычей ресурсов, другие строительством, а третьи выполняли защитные функции.

Данное исследование открывает новые перспективы для понимания эволюции сложных социальных систем и моделирования человеческих сообществ.

Следующий шаг — создать цифровой двойник каждого государства и моделировать поведение общества для тестирования социальных и политических гипотез.

#Minecraft #social
———
@tsingular
👀7🔥6👍41👾1
Forwarded from Не баг, а фича
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 В Grok появился свой Canvas — нейронка теперь может запускать код прямо в браузере и кроме того коннектиться с Google Drive. Из фишек:

🔅Запускает ЛЮБОЙ код на Python, C++, JS, TS, Bash и HTML;
🔅Через Google Drive можно включить свои документы, таблицы и презентации;
🔅Функционал абсолютно БЕСПЛАТНЫЙ.

Пробуем тут.

🙂 Не баг, а фича
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒7
Forwarded from Denis Sexy IT 🤖
У гугла начали появляться странные вакансии – ищут ресечера на «Пост-АИ» фазу мира

То есть, ученого, который начнет изучать влияние АИ на общество, машинное сознание и траектории к достижению «Сверх Искусственного Интеллекта»

Кажется уже все верят, что АИ скоро

Feel the AGI moment
🔥5💯4👍1🤔1
🤖 OpenAI представляет свежие гайды по внедрению ИИ в бизнес

Что такое ИИ-агенты и когда их создавать
OpenAI определяет агентов как системы, которые могут самостоятельно выполнять многоэтапные задачи. По сути — это LLM с "руками" (API и функциями) и четкими инструкциями.

Самое важное здесь — агенты нужны там, где традиционная автоматизация не справляется:
• Сложные рабочие процессы с определёнными мелкими шагами
• Запутанные правила, которые сложно поддерживать
• Работа с неструктурированными данными
Технически это симбиоз трёх компонентов:
• Базовая модель (предлагают начинать с мощной, оптимизировать потом! Обычно все делают наоборот)
• Инструменты (API для получения данных и действий)
• Чёткие инструкции (пошаговые, без двусмысленностей)

Архитектура агентов
Разделяют два основных подхода:
• Single-agent: начинаем с одного агента, постепенно добавляем инструменты
• Multi-agent: когда становится сложно, подключаем либо центрального "Менеджера", либо децентрализованную систему передачи задач

Не забыли про защиту: OpenAI рекомендует многоуровневую оборону с классификаторами, фильтрами PII и триггерами для передачи задачи на контроль человеку.

Как найти применимость ИИ в бизнесе
OpenAI выделяет три главных направления:
• Автоматизация рутины (очевидно)
• Преодоление дефицита навыков (усиление возможностей существующих команд)
• Навигация в условиях неопределенности (катализатор идей и анализа)

И шесть базовых примитивов использования:
• Создание контента
• Исследования
• Стратегия/генерация идей
• Анализ данных
• Программирование
• Автоматизация

Приоритезация по матрице "Влияние/Усилия" — ничего нового, но работает.

Реальные уроки от компаний, уже внедривших ИИ
Собраны кейсы из опыта Morgan Stanley, Indeed, Klarna и других

Самое интересное: OpenAI сами поставили себе цели по автоматизации с ИИ во внутренних процессах.

В целом, с чего стоит начать:
1. Начинать с простых агентов для конкретных задач
2. Обязательно строить систему оценки и безопасности с самого начала
3. Отдавать инструменты в руки специалистам, а не изолировать в ИТ
4. Кастомизировать под свои данные

И самое главное — не бояться экспериментировать.

#Agents #Enterprise #OpenAI #кейсы
———
@tsingular
🔥7👍52
Forwarded from Machinelearning
🖥 OpenAi представлют новые модели o-серии (o3 и o4-mini)

OpenAI утверждает, что эти модели способны генерировать новые и полезные идеи.

Обе будут добавлены с сегодняшнего дня в ChatGPT и API.

Эти ризонинг модели стали лучше использовать внутренние инструменты для решения сложных задач.

Модель o3 установила новый рекорд на AIME 2025 с точностью 98.4%.

А вот o4-mini, набрала 99.5% — лучший результат среди всех моделей.

На Codeforces модели набирают более 2700 баллов, что помещает их в число 200 лучших программистов в мире!

На Humanity Last Exam её показатели находятся на уровне флагманской модели Deep Research.

API — о3 сильно дешевле о1: 10/40$ вместо 15/60$, а o4-mini будет доступна для БЕСПЛАТНЫХ пользователей

С помощью внутренних инструментов модель также умеет рассуждать и работать с изображениями (например, использовать Python для их преобразования).

Эти способности к рассуждению достигнуты благодаря масштабированию как во время обучения, так и во время инференса.

Трансляция: https://www.youtube.com/watch?v=sq8GBPUb3rk

@ai_machinelearning_big_data

#openai
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍2
о4-мини всё ещё хуже, чем Sonnet 3.7 в написании сонетов.

полный венок, - это epic fail.
оставлю в комментарии

#OpenAI #o4mini
———
@tsingular
❤‍🔥32🤔2😢1
Media is too big
VIEW IN TELEGRAM
Давайте сделаем наоборот.
я вот прямо сейчас по такому промпту

write a html with simulation of ultranova
must be physically as realistic as possible and visually stunning
use any necessary libraries, which would fit the best


генерю сверхновую в Gemini2.5-exp0325.

Кто сделает лучше с OpenAI новым или чем-то ещё - велкам с примерами в комменты.

мне о4-мини так ничего сносного не создала

#Gemini2-5-ep0325 #dev
———
@tsingular
🔥92
Media is too big
VIEW IN TELEGRAM
Sonnet 3.7 thinking

Достоин отдельного поста :)

#Sonnet #dev
———
@tsingular
🔥9😁61👍1
Forwarded from Tensor Banana
wan vace 1.3b video2video + depth + ghibli lora

- используется карта глубины для направления движения
- попросил chatgpt гиблифицировать несколько кадров для референса
- чтобы картинки-референсы лучше воспринимались, их композиция должна полностью совпадать композиции видео
- первый и последний кадр я тут не использовал, по причине того, что chatgpt меняет композицию картинки. Из-за этого движение будет не там где надо. Но можно заморочиться, сделать нужную композицию совпадающую с движением карты глубины. Будет лучше, особенно если еще и конечный кадр добавить.
- вместо depth anything можно попробовать другой контролнет, например openpose, но я не тестил
- чтобы карта глубины не слишком сильно влияла на конечное анимешное видео, я ее инвертирую и делаю меньшую контрастность (делаю белой). Если так не делать, в итоге будут люди из фильма, а не анимешные персонажи

vace также поддерживает маски.
- черный цвет - оставляет без изменений
- белый цвет - переделывает
- маски можно использовать, например, для сохранения исходного лица.
- для создания масок можно использовать segment anything (SAM2, не используется в этом воркфлоу, nsfw примеры есть тут: https://t.iss.one/tensor_art/410 )

Скорость на 3090:
81 кадр (5s) 640x480 20 шагов - 3 минуты
vram - 16 GB

1.3b поддерживает длину ролика до 81 кадров. Если длиннее, то будут визуальные артефакты (видно в первой сцене)

wan + vace ноды: https://github.com/kijai/ComfyUI-WanVideoWrapper
Depth-Anything ноды: https://github.com/DepthAnything/Depth-Anything-V2
ghibli lora 1.3b: https://civitai.com/models/1474964
workflow: https://github.com/Mozer/comfy_stuff/blob/main/workflows/wan_1_3B_VACE_v2v_with_depth_and_lora.json
👍1411
Добавляем в штатное расписание:

Chief postAGI Officer

Раньше футурологи смотрели на 100 лет вперёд и рассказывали фантастику.

Теперь для того же эффекта достаточно смотреть вперёд на 3-5 лет.
А это уже не футурология, а бизнес-планирование.

#futurology #мысли
------
@tsingular
👍12722🔥2
Forwarded from эйай ньюз
А вот и первые независимые бенчи o4-mini

Artificial Analysis уже протестили o4-mini и прямо сейчас тестят o3. Модель очень хорошо себя показывает на всех бенчах, но есть и отличия — по сравнению с данными OpenAI HLE заметно выше, а GPQA немного ниже. Но это нормально — результаты на бенчмарках всегда немного отличаются между разными прогонами, особенно когда сетап немного отличается.

В целом вышла очень хорошая модель — даже лучше чем o3 на визуальных тасках, судя по заявлениям сотрудников OpenAI. А теперь представьте что сможет полноценная o4.

@ai_newz
🔥6👍3