Очень сложно оторваться от Pika2.
Практически невозможно.
Нейрорендер это тяжёлый наркотик.
Когда миры создаются из картинок, которые ты кидаешь как в миксер, это непередаваемое ощущение.
Когда это будет чуть более качественно и быстро доступно на локальных машинах, - нас ждёт переосмысление реальности.
Можно будет переснимать любые фильмы с любыми героями.
Создавать фильмы по книгам, как по промптам.
#pika2 #нейрорендер
———
@tsingular
Практически невозможно.
Нейрорендер это тяжёлый наркотик.
Когда миры создаются из картинок, которые ты кидаешь как в миксер, это непередаваемое ощущение.
Когда это будет чуть более качественно и быстро доступно на локальных машинах, - нас ждёт переосмысление реальности.
Можно будет переснимать любые фильмы с любыми героями.
Создавать фильмы по книгам, как по промптам.
#pika2 #нейрорендер
———
@tsingular
1👍18🔥4💯1
Forwarded from Сиолошная
Ещё из этого поста узнал про ProcessBench от Qwen Team, вышедший неделю назад. Как вы могли понять из объяснения выше, очень важно, чтобы у вас был качественный оценщик — если он умеет обнаруживать ошибки почти идеально, и имеет интуицию о том, какие решения более перспективны, то это существенно улучшает оптимальность генерации десятков-сотен решений.
Вот ProcessBench и оценивает это: исследователи собрали 3400 примеров и разметили их вручную по шагам, а затем смотрели, насколько хорошо разные LLM умеют обнаруживать самый первый шаг, содержащий ошибку (или наоборот отсутствие проблем во всём решении).
Лучше всех из открытых моделей показала себя... их QwQ-32B-Preview, что не удивительно (не потому, что модель выпущена ими, а потому что она умеет рассуждать и сама по себе сильна в математике). Она правильно оценила 71.5% примеров, что больше, чем GPT-4o (61.9%), но меньше, чем o1-mini (87.9, существенно выше).
Почему это важно: с очень качественными оценщиками (верификаторами) можно запускать автоматический цикл генерации сотне решений и дообучения на самых высоко оценённых (и правильных). Предположительно, именно так и учили o1, и отсюда видно, насколько большим остаётся гэп в обучении оценщика.
Вот ProcessBench и оценивает это: исследователи собрали 3400 примеров и разметили их вручную по шагам, а затем смотрели, насколько хорошо разные LLM умеют обнаруживать самый первый шаг, содержащий ошибку (или наоборот отсутствие проблем во всём решении).
Лучше всех из открытых моделей показала себя... их QwQ-32B-Preview, что не удивительно (не потому, что модель выпущена ими, а потому что она умеет рассуждать и сама по себе сильна в математике). Она правильно оценила 71.5% примеров, что больше, чем GPT-4o (61.9%), но меньше, чем o1-mini (87.9, существенно выше).
Почему это важно: с очень качественными оценщиками (верификаторами) можно запускать автоматический цикл генерации сотне решений и дообучения на самых высоко оценённых (и правильных). Предположительно, именно так и учили o1, и отсюда видно, насколько большим остаётся гэп в обучении оценщика.
Интересный доклад по работе Gigachain в деталях.
По QR кодом ссылки на исходники.
https://github.com/ai-forever/gigachain
#gigachain #сбербанк
------
@tsingular
По QR кодом ссылки на исходники.
https://github.com/ai-forever/gigachain
#gigachain #сбербанк
------
@tsingular
👍5✍2👏1🆒1
Forwarded from Machinelearning
Институт технологических инноваций Абу-Даби представил семейство моделей Falcon 3 с расширенными возможностями в областях науки, математики и программирования.
Модели Falcon 3 основаны на трансформерах, совместимы с архитектурой Llama поддерживает до 32К токенов контекста (кроме 1B с контекстом 8К). Все модели используют функцию активации SwiGLU с размером словаря 131K токенов (65K для Mamba-7B версии).
Falcon3-7B-Base была масштабирована до 10 млрд. параметров путем дублирования избыточных слоев и последующего обучения на 2 трлн. токенов. Это позволило модели Falcon3-10B-Base достичь высоких результатов в задачах zero-shot и few-shot среди моделей с менее чем 13В параметров.
Для создания компактных моделей Falcon3-1B Base и Falcon3-3B Base использовались методы обрезки и дистилляции знаний на основе около 100 ГБ высококачественных данных.
Модель Falcon3-Mamba-7B-Base была усовершенствована путем обучения на дополнительных 1,5 трлн. токенов, что привело к созданию Falcon3-Mamba-7B-Base с улучшенными способностями к рассуждению и в математических задачах.
В бенчмарках задач математики Falcon3-10B-Base достигает 22,9 на MATH-Lvl5 и 83,0 на GSM8K, а в задачах программирования набирает 73,8 на MBPP.
Инструктивные версии моделей также показывают высокие результаты, при этом Falcon3-7B-Instruct и Falcon3-10B-Instruct превосходят аналогичные модели до 13 млрд. параметров.
⚠️ В январе 2025 года планируется выпуск моделей семейства Falcon3 с расширенными мультимодальными возможностями: поддержка изображений, видео и аудио, а также полный технический отчет с описанием методик.
@ai_machinelearning_big_data
#AI #ML #LLM #Falcon3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2🤔2❤1🍾1
Было интересно.
Сберу респект и спасибо.
Много интересных докладов.
- GigaChain
- Embedding
- Alignment
- претрейн
- тренировка Макса
- посттрейн
- распознавание звука
- тренировки звуковых моделей
- генерация звука
и многое другое.
Записи докладов ждём на сайте мероприятия.
https://sberdevices-events.jugru.org/gigachat_17/12/2024
#сбербанк
------
@tsingular
Сберу респект и спасибо.
Много интересных докладов.
- GigaChain
- Embedding
- Alignment
- претрейн
- тренировка Макса
- посттрейн
- распознавание звука
- тренировки звуковых моделей
- генерация звука
и многое другое.
Записи докладов ждём на сайте мероприятия.
https://sberdevices-events.jugru.org/gigachat_17/12/2024
#сбербанк
------
@tsingular
🔥6⚡1👍1
9й день адвента OpeanAi
Технический обзор OpenAI o1 (Декабрь 2024)
Основные обновления
Модель O1
- Релиз
- Ключевые возможности:
- Вызов функций с интеграцией внешних API
- Структурированный вывод по JSON Schema
- Управление поведением через developer messages
- Обработка изображений
- Снижение токенов на 60% по сравнению с preview
- Новый параметр
Улучшения в бенчмарках
Значительный прогресс по сравнению с o1-preview:
- GPQA diamond: 75.7% (+2.4%)
- MMLU: 91.8% (+1%)
- SWE-bench Verified: 48.9% (+7.6%)
- LiveCodeBench: 76.6% (+24.3%)
- MATH: 96.4% (+10.9%)
- AIME 2024: 79.2% (+37.2%)
Улучшения Realtime API
- Интеграция WebRTC
- Снижение стоимости:
- GPT-4o аудио: -60% (40$/1M входящих, 80$/1M исходящих токенов)
- Кэшированное аудио: -87.5% (2.50$/1M токенов)
- GPT-4o mini: 10$/1M входящих, 20$/1M исходящих токенов
- Улучшения сессий:
- Параллельные фоновые ответы
- Настраиваемый контекст ввода
- Контроль времени ответа
- Увеличение максимальной длительности до 30 минут (было 15)
Инструменты разработчика
Preference Fine-Tuning (PFT)
- На основе Direct Preference Optimization
- Доступно для:
- gpt-4o-2024-08-06 (сейчас)
- gpt-4o-mini-2024-07-18 (скоро)
- Отличие от SFT: использует пары предпочтительных/непредпочтительных ответов вместо точных совпадений
- Практическое подтверждение: Rogo AI достигли >80% точности (против 75% базовой)
Новые SDK (Бета)
- Go SDK: оптимизирован для конкурентных систем
- Java SDK: корпоративного уровня с типизированными запросами/ответами
- Дополняет существующие библиотеки Python, Node.js, .NET
Архитектурные изменения
- Повышение эффективности модели (снижение токенов на 60%)
- Интеграция WebRTC с встроенной поддержкой:
- Кодирования аудио
- Обработки потоков
- Подавления шума
- Контроля сетевой нагрузки
- Поддержка браузерных и серверных реализаций
Доступ и развертывание
- Постепенный релиз для usage tier 5
- Расширение на дополнительные уровни
- Корректировка лимитов запросов
- Цены на Preference Fine-Tuning аналогичны SFT
Сегодня прям очень много крутых штук.
Впечатляет
#OpenAI #advent
------
@tsingular
Технический обзор OpenAI o1 (Декабрь 2024)
Основные обновления
Модель O1
- Релиз
o1-2024-12-17 (преемник o1-preview)- Ключевые возможности:
- Вызов функций с интеграцией внешних API
- Структурированный вывод по JSON Schema
- Управление поведением через developer messages
- Обработка изображений
- Снижение токенов на 60% по сравнению с preview
- Новый параметр
reasoning_effortУлучшения в бенчмарках
Значительный прогресс по сравнению с o1-preview:
- GPQA diamond: 75.7% (+2.4%)
- MMLU: 91.8% (+1%)
- SWE-bench Verified: 48.9% (+7.6%)
- LiveCodeBench: 76.6% (+24.3%)
- MATH: 96.4% (+10.9%)
- AIME 2024: 79.2% (+37.2%)
Улучшения Realtime API
- Интеграция WebRTC
async function createRealtimeSession(localStream, remoteAudioEl, token) {
const pc = new RTCPeerConnection();
pc.ontrack = e => remoteAudioEl.srcObject = e.streams[0];
pc.addTrack(localStream.getTracks()[0]);
const offer = await pc.createOffer();
await pc.setLocalDescription(offer);
const headers = { Authorization: `Bearer ${token}`, 'Content-Type': 'application/sdp' };
const opts = { method: 'POST', body: offer.sdp, headers };
const resp = await fetch('https://api.openai.com/v1/realtime', opts);
await pc.setRemoteDescription({ type: 'answer', sdp: await resp.text() });
return pc;
}- Снижение стоимости:
- GPT-4o аудио: -60% (40$/1M входящих, 80$/1M исходящих токенов)
- Кэшированное аудио: -87.5% (2.50$/1M токенов)
- GPT-4o mini: 10$/1M входящих, 20$/1M исходящих токенов
- Улучшения сессий:
- Параллельные фоновые ответы
- Настраиваемый контекст ввода
- Контроль времени ответа
- Увеличение максимальной длительности до 30 минут (было 15)
Инструменты разработчика
Preference Fine-Tuning (PFT)
- На основе Direct Preference Optimization
- Доступно для:
- gpt-4o-2024-08-06 (сейчас)
- gpt-4o-mini-2024-07-18 (скоро)
- Отличие от SFT: использует пары предпочтительных/непредпочтительных ответов вместо точных совпадений
- Практическое подтверждение: Rogo AI достигли >80% точности (против 75% базовой)
Новые SDK (Бета)
- Go SDK: оптимизирован для конкурентных систем
- Java SDK: корпоративного уровня с типизированными запросами/ответами
- Дополняет существующие библиотеки Python, Node.js, .NET
Архитектурные изменения
- Повышение эффективности модели (снижение токенов на 60%)
- Интеграция WebRTC с встроенной поддержкой:
- Кодирования аудио
- Обработки потоков
- Подавления шума
- Контроля сетевой нагрузки
- Поддержка браузерных и серверных реализаций
Доступ и развертывание
- Постепенный релиз для usage tier 5
- Расширение на дополнительные уровни
- Корректировка лимитов запросов
- Цены на Preference Fine-Tuning аналогичны SFT
Сегодня прям очень много крутых штук.
Впечатляет
#OpenAI #advent
------
@tsingular
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Ruyi-Models - новый локальный видео генератор
Ruyi — это модель преобразования изображений в видео, способная генерировать видео кинематографического качества с разрешением 768 пикселей и частотой кадров 24 кадра в секунду, всего 5 секунд и 120 кадров. Она поддерживает управление линзой и амплитудой движения.
На RTX 3090 или RTX 4090, можно генерить видео с разрешением 512 пикселей (120 кадров) или с разрешением 768 пикселей (~72 кадра), не теряя качества.
https://github.com/IamCreateAI/Ruyi-Models
Интеграция с ComfyUI из коробки.
#нейрорендер #ComfyUI #видео
------
@tsingular
Ruyi — это модель преобразования изображений в видео, способная генерировать видео кинематографического качества с разрешением 768 пикселей и частотой кадров 24 кадра в секунду, всего 5 секунд и 120 кадров. Она поддерживает управление линзой и амплитудой движения.
На RTX 3090 или RTX 4090, можно генерить видео с разрешением 512 пикселей (120 кадров) или с разрешением 768 пикселей (~72 кадра), не теряя качества.
https://github.com/IamCreateAI/Ruyi-Models
Интеграция с ComfyUI из коробки.
#нейрорендер #ComfyUI #видео
------
@tsingular
👍8⚡1✍1
Media is too big
VIEW IN TELEGRAM
Unitree дороботали ExBody2 - роботы начали детально копировать движения людей
Исследователи представили передовую систему управления для гуманоидных роботов ExBody2.
Платформа сочетает отслеживание ключевых точек тела с контролем скорости движения через обучение с подкреплением.
Технология использует двухэтапную архитектуру (учитель-ученик) и условные вариационные автоэнкодеры для генерации естественных движений.
Тестирование на роботах Unitree G1 и H1 демонстрирует превосходную точность в воспроизведении бега, танцев и сложных акробатических элементов.
Система успешно переносит навыки из симуляции в реальный мир благодаря локальному отслеживанию и периодической коррекции движений.
Новые электронные граждане подрастают. 🤖
#ExBody2 #Unitree #Китай
———
@tsingular
Исследователи представили передовую систему управления для гуманоидных роботов ExBody2.
Платформа сочетает отслеживание ключевых точек тела с контролем скорости движения через обучение с подкреплением.
Технология использует двухэтапную архитектуру (учитель-ученик) и условные вариационные автоэнкодеры для генерации естественных движений.
Тестирование на роботах Unitree G1 и H1 демонстрирует превосходную точность в воспроизведении бега, танцев и сложных акробатических элементов.
Система успешно переносит навыки из симуляции в реальный мир благодаря локальному отслеживанию и периодической коррекции движений.
Новые электронные граждане подрастают. 🤖
#ExBody2 #Unitree #Китай
———
@tsingular
1🔥13🆒4👾1
Google зарелизила Experimental 1206
Оказывается это Gemini 2.0 Experimental Advanced
Есть в API
Это вот та модель, от которой я уже неделю не могу оторваться.
#Google #Gemini
———
@tsingular
Оказывается это Gemini 2.0 Experimental Advanced
Есть в API
Это вот та модель, от которой я уже неделю не могу оторваться.
#Google #Gemini
———
@tsingular
🔥10
Лаборатория Касперского выпустила гайдлайн по безопасному внедрению ИИ
Масштабы внедрения искусственных интеллектов впечатляют - каждая вторая организация применяет нейросети, треть планирует запуск.
Киберпреступники нанесли ущерб в $8 трлн за 2023 год, что стимулирует развитие защитных механизмов.
Регуляторы активизировались: Китай создал AI Safety Framework, ЕС принял AI Act, США выпустили Executive Order.
Эксперты выделили 8 ключевых направлений защиты: от организационных мер до мониторинга систем.
Основные риски: финансовые потери, репутационный ущерб, проблемы с клиентами, угрозы здоровью пациентов.
Документ содержит практические рекомендации по безопасному развертыванию ИИ-систем с учетом отраслевой специфики.
Теперь у безопасников есть чёткий план действий. 🤖🛡
Документ в комментарии. Ссылка открывается не у всех.
#Kaspersky #cybersecurity #guidelines
-------
@tsingular
Масштабы внедрения искусственных интеллектов впечатляют - каждая вторая организация применяет нейросети, треть планирует запуск.
Киберпреступники нанесли ущерб в $8 трлн за 2023 год, что стимулирует развитие защитных механизмов.
Регуляторы активизировались: Китай создал AI Safety Framework, ЕС принял AI Act, США выпустили Executive Order.
Эксперты выделили 8 ключевых направлений защиты: от организационных мер до мониторинга систем.
Основные риски: финансовые потери, репутационный ущерб, проблемы с клиентами, угрозы здоровью пациентов.
Документ содержит практические рекомендации по безопасному развертыванию ИИ-систем с учетом отраслевой специфики.
Теперь у безопасников есть чёткий план действий. 🤖🛡
Документ в комментарии. Ссылка открывается не у всех.
#Kaspersky #cybersecurity #guidelines
-------
@tsingular
✍1
Salesforce выпускает Agentforce 2.0 - обновлеённую армию цифровых работников
Всего спустя 3 месяца после запуска Agentforce, Salesforce представила обновленную платформу для создания автономных ИИ-агентов.
Ключевые улучшения включают:
- расширенную библиотеку навыков,
- интеграцию со Slack
- улучшенный механизм рассуждений Atlas.
Система демонстрирует впечатляющие результаты: 83% запросов решаются без участия человека, количество обращений к специалистам снизилось вдвое.
Платформа интегрируется с CRM, Tableau и другими системами через MuleSoft и обеспечивает круглосуточную автономную работу.
Крупные компании (Accenture, Indeed, Finnair) уже внедряют решение для автоматизации рекрутинга, продаж и поддержки клиентов.
У них код обновлений тоже уже агенты пилят, похоже. 🤖
#Salesforce #Agentforce #Atlas
-------
@tsingular
Всего спустя 3 месяца после запуска Agentforce, Salesforce представила обновленную платформу для создания автономных ИИ-агентов.
Ключевые улучшения включают:
- расширенную библиотеку навыков,
- интеграцию со Slack
- улучшенный механизм рассуждений Atlas.
Система демонстрирует впечатляющие результаты: 83% запросов решаются без участия человека, количество обращений к специалистам снизилось вдвое.
Платформа интегрируется с CRM, Tableau и другими системами через MuleSoft и обеспечивает круглосуточную автономную работу.
Крупные компании (Accenture, Indeed, Finnair) уже внедряют решение для автоматизации рекрутинга, продаж и поддержки клиентов.
У них код обновлений тоже уже агенты пилят, похоже. 🤖
#Salesforce #Agentforce #Atlas
-------
@tsingular
🔥8🆒1