Анализ данных (Data analysis)

✅Генерация бесконечных 4D городов

CityDreamer4D - это новая генеративная модель создания городов в 4D, которая объединяет статические и динамические сцены.

Заявлена высокая управляемость и реалистичность генераций.

- Проект: https://infinitescript.com/project/city-dreamer-4d/
- Код (обещают залить в ближайшее время ): https://github.com/hzxie/CityDreamer4D
- Датасет CityTopia: https://gateway.infinitescript.com/s/CityTopia

@data_analysis_ml

🔥12❤4👍4😐3

5.65K viewsedited 14:20

Анализ данных (Data analysis)

🔥Google представили стратегию эволюционного поиска для масштабирования времени инференса в больших языковых моделях.

Предлагаемый подход, Mind Evolution, использует языковую модель для генерации, рекомбинации и уточнения ответов-модели.

Контролируя инференс модели, разработчики обнаружили, что Mind Evolution значительно превосходит другие стратегии инференса, такие как Best-of-N и Sequential Revision, в задачах планирования на естественном языке.

В бенчмарках TravelPlanner и Natural Plan Mind Evolution, модель решает успешно более 98 %.

https://huggingface.co/papers/2501.09891

👍7❤3🔥2

5.53K viewsedited 06:48

Анализ данных (Data analysis)

🔥

NautilusTrader — это высокопроизводительная, открытая платформа для алгоритмической торговли и тестирования стратегий, разработанная для количественных трейдеров!

🌟 Она позволяет создавать, тестировать и внедрять автоматизированные торговые стратегии, обеспечивая их прямой переход от бэктестинга к реальной торговле без необходимости изменения кода.

🌟 Платформа поддерживает различные классы активов и может интегрироваться с любыми API (REST, WebSocket или FIX) через модульные адаптеры. NautilusTrader разработана с акцентом на производительность и надежность, предоставляя Python-ориентированную среду для разработки и развертывания стратегий. Она также поддерживает современные языковые модели, такие как GPT-4 и Claude 3.5, для предоставления рекомендаций и анализа.

🔐 Лицензия: LGPL-3.0

🖥

Github

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍5🔥5😐1

6.05K views09:21

Анализ данных (Data analysis)

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Все датасаентисты и ИИ-инженеры сегодня.

P.S. Вышли новые модели DeepSeek если вы вдруг пропустили.

#DeepSeek #deepseekv3 #reasoning #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥19👍7❤3

5.36K viewsedited 13:39

Анализ данных (Data analysis)

🔥

openai-realtime-agents от OpenAI — пример, демонстрирующий использование более сложных агентов, построенных на основе Realtime API!

💡 В нём представлены паттерны взаимодействия агентов, такие как последовательная передача задач между агентами, эскалация к более интеллектуальным моделям и подход с использованием машины состояний для пошагового взаимодействия с пользователем (например, для проверки данных). Это прототип для создания голосовых приложений в реальном времени, в которых несколько агентов могут взаимодействовать с пользователями.

🔐 Лицензия: MIT

🖥

Github

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍7🔥4

5.92K views16:02

Анализ данных (Data analysis)

🧠 Supermemory

Мощное поисковое ИИ-приложение с гибким и простым в работе API.

Вы можете создать свой собственный второй мозг с помощью supermemory.

По сути это ChatGPT для поиска в интернете .

▪Github: https://github.com/supermemoryai/supermemory
▪ Документация: https://docs.supermemory.ai/
▪Расширение для хрома: https://api.supermemory.ai/

@data_analysis_ml

👍8🔥5❤4

5.48K viewsedited 07:38

Анализ данных (Data analysis)

🔥Tencent выпустили новую генеративную модель для 3D - Hunyuan3D 2.0

Hunyuan3D 2.0, усовершенствованная система 3D-синтеза и генерации текстурированных 3D-объектов
высокого разрешения.

Эта система включает в себя два основных компонента: модель генерации формы - Hunyuan3D-DiT и модель синтеза текстуры - Hunyuan3D-Paint.

Генеративная модель формы, построена на масштабируемом диффузионном трансформере, и необходима для создания геометрии объекта и отвечает за согласование генерации.

Модель синтеза текстур генерирует карты текстур высокого разрешения для сгенерированных или созданных вручную сеток.

Hunyuan3D 2.0 превосходит предыдущие модели, как с открытым кодом, так и закрытые модели, по детализации геометрии, выравниванию генерации, качеству текстур и т. д.

GitHub: https://github.com/tencent/Hunyuan3D-2

❤9👍4🔥3🥰1

5.81K views10:30

Анализ данных (Data analysis)

✅ Ускорение обработки запросов через миграцию парсера

Выпускник Школы анализа данных Яндекса выкатил годноту — руководство по переносу парсера YQL (SQL-диалект для YDB и YTsaurus) с ANTLR3 на ANTLR4.

Основные моменты:

→ ANTLR — генератор парсеров, который переводит грамматики в исполняемые парсеры для разбора и анализа текстовых данных.
→ Для нового парсера использовалась генерация Protobuf-схем, что позволило сохранить структуру AST и упростить интеграцию с парсером.
→ Были разработаны специализированные шаблоны (stg-файлы) для генерации кода, что позволило адаптировать логику парсинга под изменяющиеся требования.

Ссылка на статью

❤7

5.42K views11:12

Анализ данных (Data analysis)

This media is not supported in your browser

VIEW IN TELEGRAM

🔥

Tabby — AI-ассистент для программирования, являющийся открытой альтернативой GitHub Copilot!

💡 Он разработан для локальной работы, исключая необходимость в облачных сервисах, что делает его подходящим для конфиденциальных или корпоративных сред. Tabby поддерживает пользовательские интерфейсы, такие как OpenAPI, и может интегрироваться с существующими инструментами, включая облачные IDE.

🔐 Лицензия: Apache-2.0

🖥

Github

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥10❤5👍4

6.04K views13:48

Анализ данных (Data analysis)

Forwarded from Machinelearning

🌟 Google только что выпустили новую модель Gemini 2.0 Flash Thinking

✅ Контекст с 1 миллионом токенов (5-х больше, чем o1 Pro)

#1 на арене чат-ботов

👑

Модель показала наивысший результат, обогнав Gemini-Exp-1206

+ 17 очков прироста по сравнению с предыдущей контрольной точкой 1219

- №1 по всем направлениям (генерации кода), за исключением управления стилем.

• AIME: 73.3%
• GPQA: 74.2%
• MMMU: 75.4%

Модель доступна в ai-gradio

pip install --upgrade "ai-gradio[gemini]"

Они так же выпустили Gemini2.0 Pro.

https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-thinking-exp-01-21

#google #gemini

Please open Telegram to view this post

VIEW IN TELEGRAM

❤12👍2

4.76K views06:05

Анализ данных (Data analysis)

🔥

Agent Recipes — мастерская с огромным количеством примеров кода, который вы можете скопировать и использовать в своих собственных проектах ИИ!

🔗 Ссылка: *клик*

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤13👍4🔥2

5.83K views09:02

Анализ данных (Data analysis)

1:14

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Creating new games with interactive generative videos that learns from a small-scale dataset of Minecraft data.

▪Project page: https://vvictoryuki.github.io/gamefactory/
▪Paper: https://arxiv.org/abs/2501.08325
▪ Dataset: https://huggingface.co/datasets/KwaiVGI/GameFactory-Dataset

@data_analysis_ml

❤7👍4🔥3

5.51K views16:19

Анализ данных (Data analysis)

14:17

Media is too big

VIEW IN TELEGRAM

🔥 Обобщение и переобучение в машинном обучении.

- Видео
- Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 /
- Урок6/ Урок7/ Урок 8
- Colab
-Полный курс

#ml #math #mlmath #probability #машинноеобучение

@data_analysis_ml

❤11👍3🔥1

5.48K viewsedited 06:27

Анализ данных (Data analysis)

⚡️ Bespoke-Stratos-32B, новая ризонинг модель, разработанную на основе DeepSeek-R1 с использованием Sky-T1 от Berkeley NovaSky.

Модель превосходит Sky-T1 и o1-preview в тестах reasoning (математика и написаний кода) и почти достигает производительности DeepSeek-R1-Distill-Qwen-32B при обучении, котором было использовано 47 раз меньшее количество примеров!

Важно отметить то, что разработчики используют набор данных с открытым исходным кодом.

▪Data: https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-17k
▪Curator: https://github.com/bespokelabsai/curator/
▪32B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-32B
▪7B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-7B
▪Сode: https://github.com/bespokelabsai/curator/tree/main/examples/bespoke-stratos-data-generation

@data_analysis_ml

❤9🔥2👍1🥰1

7.49K views06:31

Анализ данных (Data analysis)

📖

Эта статья исследует методы оценки неопределенности больших языковых моделей в "черном ящике"!

💡 Авторы предлагают подход под названием DiverseAgentEntropy, который измеряет надежность модели, анализируя ее ответы на различные переформулированные версии одного и того же запроса. Если модель уверена в своих знаниях, она должна отвечать одинаково независимо от формулировки вопроса. Этот метод позволяет также обнаруживать случаи галлюцинаций, когда модель предоставляет недостоверные ответы.

🌟 В основе подхода лежит идея многократного взаимодействия "агентов" (вариаций одной и той же модели), которые обрабатывают один и тот же запрос с разным контекстом. Итоговая оценка основана на согласованности их ответов. В результате метод показывает более точные оценки неопределенности по сравнению с традиционными методами, такими как самосогласованность. Исследование также подчеркивает проблему неспособности моделей систематически извлекать правильные ответы, даже если они уже заложены в параметрические знания модели.

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤4

5.06K views14:46

Анализ данных (Data analysis)

Forwarded from Machinelearning

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

🌟 SmolVLM: набор компактных VLM от HuggingFace - Base, Synthetic и Instruct.

SmolVLM - серия компактных VLM отличающихся высокой эффективностью использования памяти и могут быть развернуты на локальных устройствах с ограниченными ресурсами.

Только что были выпущены SmolVLM (256M и 500M), которым требуются GPU <1GB для запуска.

🤗

SmolVLM-256M – это cамая маленькая VLM в мире!

Модели настолько маленькт, что могут работать 100% локально в вашем браузере на WebGPU!

📌Лицензирование: Apache 2.0

⭐️

Smolervlm: https://huggingface.co/blog/smolervlm
🤗 Модели: https://huggingface.co/collections/HuggingFaceTB/smolvlm-256m-and-500m-6791fafc5bb0ab8acc960fb0

@ai_machinelearning_big_data

#AI #ML #SmallVLM #Huggingface

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12❤5🔥1

4.98K views16:40

About

Blog

Apps

Platform