Анализ данных (Data analysis)

🎓 Как обучить LLM с логическим мышлением — за один уикенд и на одном GPU

NVIDIA выпустили новый туториал, где показывают, как за 48 часов обучить свою модель рассуждений — без суперкомпьютеров.

Что внутри:

⚙️ Используется NVIDIA NeMo — фреймворк для обучения LLM
📦 Обучение на специализированных задачах reasoning (аналог GSM8K)
💻 Достаточно одного GPU, чтобы получить маленькую, но умную LLM

Это отличный способ понять, как LLM "думают", и собрать свою reasoning‑модель для внутренних задач или исследований.

📹 Видео: https://youtu.be/hMGikmMFLAU
🧠 Блог: https://developer.nvidia.com/blog/train-a-reasoning-capable-llm-in-one-weekend-with-nvidia-nemo

👍6❤5🔥5

5.41K views13:00

Анализ данных (Data analysis)

🚀

ADeus — ваш open-source AI-ассистент на носимом устройстве!

🎯 Записывает и транскрибирует всё, что вы слышите и говорите, сохраняет это на ваш сервер. Через мобильное/веб‑приложение вы общаетесь с ADeus уже в контексте — никаких сторонних облаков.

🔧 Состав:
• ACM‑металлическое устройство
• Мобильное/веб UI
• Supabase backend + LLM интеграция

💰 Стоимость ≈ 100 USD (DIY) за устройство и открытый код

⭐ Более 3 200 звёзд на GitHub, 19 контрибьюторов, активные фичи: Bluetooth, diarization, voice‑activity detection и UI‑улучшения.

📚 Подробнее:

• GitHub: https://github.com/adamcohenhillel/ADeus
• Документация: https://docs.adeus.ai/

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15❤5🔥2🤣1

4.9K views20:29

Анализ данных (Data analysis)

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

🌍

Новая AI‑модель от Google кардинально меняет способ мониторинга планеты

Каждый день спутники собирают терабайты снимков Земли — но как объединить все эти разрозненные данные в единую картину?

🤖 Знакомьтесь: AlphaEarth Foundations
Это ИИ, который работает как виртуальный спутник — он объединяет оптические снимки, радар, лазерное сканирование и климатические симуляции в одно компактное цифровое представление Земли. Такой "эмбеддинг" легко обрабатывается компьютерами и помогает:

🟢 Детально отслеживать изменения на суше и в прибрежных зонах
🟢 Обходить облачность и редкие снимки (например, в Антарктиде)
🟢 Создавать точные карты с разрешением 10×10 метров
🟢 Сокращать объём хранимых данных в 16 раз

🟠

Модель уже используется:
• ООН для мониторинга экосистем
• MapBiomas (Бразилия) для слежения за вырубкой и развитием сельского хозяйства
• Harvard Forest, Stanford и другие институты

🛰 В Google Earth Engine теперь доступен уникальный датасет — Satellite Embedding, включающий более 1,4 трлн эмбеддингов в год, с которым можно создавать собственные карты и отслеживать изменения в реальном времени.

🟠 *“Это меняет всё: теперь мы можем точно картировать ранее неотмеченные экосистемы”*, — Nick Murray, Global Ecosystems Atlas

📌 Подробнее — в блоге Google Earth Engine

🟠

Blog post: https://deepmind.google/discover/blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail
Dataset: https://developers.google.com/earth-engine/datasets/catalog/GOOGLE_SATELLITE_EMBEDDING_V1_ANNUAL#description

🟠

Paper: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/alphaearth-foundations.pdf

@data_analysis_ml

#AI #geospatial #remotesensing #geoai

Please open Telegram to view this post

VIEW IN TELEGRAM

❤13👍5🔥3

4.45K views07:57

Анализ данных (Data analysis)

1:03

This media is not supported in your browser

VIEW IN TELEGRAM

🧠 Mo Gawdat: AI сделает кого-то триллионером до 2030 года

Бывший топ‑менеджер Google Mo Gawdat дал любопытное интервью на канале *The Diary Of A CEO* — и предсказал бурное будущее:

🚀 AGI появится до конца 2026 года

💰 "Кто‑то станет триллионером до 2030. Это будет новый Илон Маск или Ларри Эллисон, инвестировавший в ИИ. У него будет столько денег, что он сможет купить всё. Роботы и ИИ будут делать всю работу. Люди останутся без профессий."

⚖️ Сначала ИИ усилит производительность, а потом массово заменит людей

🧨 12–15 лет хаоса, когда глупые лидеры будут использовать умные системы

🌍 Потом — *этика‑ориентированные ИИ могут взять контроль* и принести глобальное изобилие

🪙 Базовый доход возможен, но при неправильной архитектуре элиты могут захватить власть и урезать выплаты

🤖 Уже сегодня AI‑агенты умеют кодить, торговать, планировать, а self-evolving модели запустят взрыв интеллекта

📺 Очень сильное интервью — смотреть стоит каждому, кто думает о будущем AI

❤18👍7🥴6🔥5😁4

4.93K views15:32

Анализ данных (Data analysis)

Livestream OpenAI, ждём анонса ChatGPT-5

https://www.youtube.com/watch?v=0Uu_VJeVVfo

#Chatgpt5 #openai

YouTube

Introducing GPT-5

Sam Altman, Greg Brockman, Sebastien Bubeck, Mark Chen, Yann Dubois, Brian Fioca, Adi Ganesh, Oliver Godement, Saachi Jain, Christina Kaplan, Christina Kim, Elaine Ya Le, Felipe Millon, Michelle Pokrass, Jakub Pachocki, Max Schwarzer, Rennie Song, Ruochen…

❤3👍3🔥2🤣1

4.84K views17:02

Анализ данных (Data analysis)

🤦‍♂️ После того как OpenAi уверенно сообщили о сниженияи галлюцинаций у GPT‑5, первый же тест оказался... галлюцинацией.

🔍 Модель повторила старый фейк о том, как крыло самолёта создаёт подъёмную силу — "equal transit theory", которую давно опровергли в аэродинамике.

🧠 Проблема не в том, что Chatgpt ошибается. Проблема в том, что он делает это *уверенно* — даже в примере, призванном показать прогресс.

🤣42❤4🔥4👍2😢2

11.9K views18:29

Анализ данных (Data analysis)

💫 И еще забавная штука Sam Altman тизерил стрим с изображением… Звезды Смерти.

Отличная идея, не так ли)

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥14❤6👍3🥱1

5.28K views18:37

Анализ данных (Data analysis)

0:39

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ ИИ теперь сам чинит свои баги

Anthropic встроила в Claude Code автоматический аудит безопасности: теперь ИИ не только пишет код, но и проверяет его перед отправкой. Достаточно команды /security-review и модель анализирует изменения, ищет уязвимости и сразу предлагает патчи. Те же проверки работают в GitHub Actions, оставляя комментарии прямо в пул-реквестах.

Тестирование на внутренних проектах уже выявило критические уязвимости до выхода в прод. Теперь траектория развития очевидна: поскольку ИИ-модели становятся все мощнее, компаниям придется встраивать все более сильные встроенные механизмы контроля. Иначе экосистема просто захлебнётся в собственных багах.

🔗 Ссылка - *клик*

@data_analysis_ml

❤8👍5🔥2

5.41K views10:33

Анализ данных (Data analysis)

Сатья Наделла — лучший CEO Microsoft

👍

Илон Маск написал в своем Твиттере:

"OpenAI «сожрёт» Microsoft живьём"

Сатья Наделла ответил:

- "Люди пытались сделать это последние 50 лет — и в это-то и забавно! Каждый день ты учишься чему-то новому, создаёшь инновации, заключаешь партнёрства и конкурируешь. С нетерпением жду Grok 4 на Azure и Grok 5!"

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥19👍10🥱5❤4

4.78K views11:00

Анализ данных (Data analysis)

Forwarded from Machinelearning

4:00

Media is too big

VIEW IN TELEGRAM

✔️

Microsoft запустила Copilot 3D.

Microsoft открыла доступ к экспериментальному веб-инструменту Copilot 3D, который позволяет конвертировать статичные изображения в трехмерные модели. Сервис доступен бесплатно через портал Copilot Labs.

Инструмент поддерживает на входе PNG и JPG размером до 10 МБ. Созданные модели сохраняются на странице пользователя в течение 28 дней и могут быть скачаны в формате GLB. Copilot 3D является новой попыткой Microsoft популяризировать 3D-творчество после закрытия проектов Paint 3D и Remix3D.
copilot.microsoft.com

✔️

Tesla сворачивает проект суперкомпьютера Dojo.

Команда, занимавшаяся разработкой суперкомпьютера Dojo расформирована, а ее руководитель Питер Бэннон покидает компанию.

Этот шаг завершает многолетнюю попытку Tesla создать кастомные чипы и процессоры "размером с кремниевую пластину" для обучения моделей автономного вождения и робототехники. Вместо этого компания перейдет на решения Nvidia и AMD, а производством чипов нового поколения займется Samsung.

Около 20 инженеров из команды Dojo уже основали собственный стартап DensityAI, а остальные сотрудники будут переведены на другие проекты внутри Tesla.
bloomberg.com

✔️

Apple интегрирует GPT-5 в Apple Intelligence с сентябрьским обновлением ОС.

Apple подтвердила, что осенние обновления: iOS, iPadOS и macOS получат поддержку GPT-5. Она заменит текущую GPT-4o в тех случаях, когда собственным моделям Apple потребуется помощь в обработке сложных запросов. Это коснется ответов Siri, инструментов для письма и визуального поиска.

Использование GPT-5 останется опциональным: пользователи должны будут явно дать согласие на передачу запросов в ChatGPT. Apple продолжит скрывать IP-адреса и запрещать OpenAI хранить данные, однако оставит возможность привязать платную подписку OpenAI для доступа к дополнительным функциям.

Кроме того, обновления ОС принесут функцию Live Translation для перевода разговоров в реальном времени и расширят возможности сквозного поиска по контенту.
9to5mac.com

✔️

Компания Марка Цукерберга купила стартап WaveForms AI.

Техногигант приобрел WaveForms AI - молодой стартап, чье программное обеспечение способно идентифицировать и воспроизводить эмоциональные оттенки в человеческой речи. Команда WaveForms присоединится к подразделению Superintelligence Labs.

Стартап был основан в декабре 2024 года, но уже успел привлечь 40 миллионов долларов инвестиций при оценке в 160 миллионов. Компания работала над "Тестом Тьюринга для речи" и так называемым "эмоциональным AGI", чтобы сделать голоса, сгенерированные ИИ, неотличимыми от человеческих.

Для Цукерберга это уже вторая сделка в области ИИ-аудио за последние месяцы после июльского поглощения PlayAI. Финансовые условия покупки не разглашаются.
theinformation.com

✔️

Google тестирует Google Finance с генеративным ИИ.

Google приступил к тестированию редизайна сервиса Google Finance, в центре которого теперь находится ИИ. В ближайшие недели пользователи из США получат доступ к новой версии со встроенным чат-ботом. Он сможет отвечать на сложные вопросы о рынках, предоставляя обобщенные ответы со ссылками на внешние источники.

Помимо ИИ-помощника, обновление включает расширенные инструменты для построения графиков и добавляет рыночные данные в реальном времени для сырьевых товаров и криптовалют.

Появится и постоянно обновляемая новостная лента, которая позволит отслеживать важные заголовки, не покидая платформу. Во время тестового периода пользователи смогут переключаться между новым и классическим интерфейсами.
blog.google

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍5🔥5

3.41K views08:01

Анализ данных (Data analysis)

💰 McKinsey: к 2030 году на AI-инфраструктуру потратят $6,7 трлн

К 2030-му мировая мощность дата-центров почти утроится, и ~70% этого роста придётся на AI.
Под AI потребуется $5,2 трлн инвестиций и 156 ГВт мощности.

📊 Куда уйдут деньги:
- 60% (~$3,1 трлн) — чипы и серверы
- 25% (~$1,3 трлн) — энергия и охлаждение
- 15% (~$0,8 трлн) — площадки и строительство

📉 Сценарии развития
- 🚀 Ускоренный: +205 ГВт, ~$7,9 трлн
- 📈 Базовый: +125 ГВт, ~$5,2 трлн
- 🐢 Ограниченный: +78 ГВт, ~$3,7 трлн

⚡ Энергетика и охлаждение
- Главные ограничения: электросети и теплоотвод
- 45–50% энергии — из возобновляемых источников
- Рост инвестиций в атом, геотермальную энергетику, улавливание CO₂ и длительное хранение энергии
- Переход на direct-to-chip и иммерсионное охлаждение

🧮 Что ускоряет рост
- К 2030 году inference станет основной нагрузкой
- Корпоративные приложения с отраслевыми моделями создадут стабильный поток запросов
- Hyperscalers масштабируются, чтобы снижать стоимость вычислений
- Государства инвестируют в AI-инфраструктуру как в стратегический актив

💡 Как не перепостроить
- Планировать мощность с возможностью масштабирования или паузы
- Инвестировать в энергоэффективность чипов, сетей и охлаждения
- Обеспечить стабильный доступ к энергии, чипам и площадкам

📌 Пример эффективности:
DeepSeek V3 — обучение в ~18× дешевле GPT-4o, инференс в ~36× дешевле.
Но парадокс Джевонса означает, что экономия стимулирует больше экспериментов, а значит, общий спрос на вычисления всё равно растёт.

📌 Подробнее

@data_analysis_ml

❤12🔥6👍3

6.14K views09:39

Анализ данных (Data analysis)

🖼️ Qwen-Image — мультиязычная генеративная модель от Alibaba. Проект предлагает 20-миллиардную модель для создания изображений с точным рендерингом текста. Модель поддерживает английский и китайский языки, включая сложные шрифтовые композиции и смешанные текстовые блоки. Архитектура сочетает Qwen2.5-VL для анализа текста, VAE для детализации и диффузионное ядро MMDiT.

Модель обучалась на миллиардах изображений: от природных сцен до дизайн-макетов. В тестах она превзошла многие закрытые аналоги, особенно в генерации инфографики и материалов с встроенным текстом. Лицензия Apache 2.0 позволяет свободное использование.

🤖 GitHub

@data_analysis_ml

🔥14❤4👍3

5.13K views13:00

Анализ данных (Data analysis)

🤨 OpenAI заявила о 74.9% на SWE-Bench, чтобы обойти Opus 4.1 с его 74.5%…
Но тест они прогнали не на всех 500 задачах, а только на 477.

Ирония в том, что в официальной system card у них стоит просто 74%.

Источник: https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf

😁39👍8❤4🔥3🌚1💔1

10.8K views08:45

Анализ данных (Data analysis)

🚀 Релиз MiMo-VL 2508: тот же размер — больше мощность

Улучшена:
- Производительность
- Управление рассуждениями
- Общий пользовательский опыт

📈 Улучшены показатели почти всех бенчмарков (изображения + видео)
- MMMU: 70.6
- VideoMME: 70.8
Стабильные улучшения по всем направлениям.

🤖 Thinking Control
- Вкл. (по умолчанию): полный ход рассуждений в ответах.
- Выкл.: прямые ответы без показа рассуждений ⚡

❤️ Реальный опыт пользователей
Рейтинг в VLM Arena вырос с 1093.9 → 1131.2 (+37.3).

Модель стала более способной, гибкой и надёжной в повседневных задачах.

🤗 Ссылки на модели
- RL: https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-RL-2508
- SFT: https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-SFT-2508

#XiaomiMiMo #MiMoVL

❤7👍3🔥3

4.75K viewsedited 13:01

Анализ данных (Data analysis)

📈 Сэм Альтман ответил на критику запуска GPT-5: OpenAI удваивает лимиты для подписчиков Plus

Всего через несколько дней после запуска GPT-5 OpenAI уже анонсирует изменения для пользователей. Сэм Альтман в AMA-сессии на Reddit подтвердил, что лимиты запросов к GPT-5 Thinking на подписке Plus будут увеличены в два раза — с текущих 200 до 400. Это ответ на критику пользователей, которые отмечали, что квоты для новой модели оказались заметно ниже, чем для предыдущих версий.

При этом OpenAI также рассматривает возможность вернуть доступ к GPT-4o для подписчиков Plus — видимо, чтобы дать пользователям больше гибкости в выборе модели. Параллельно команда дорабатывает автоматический режим GPT-5, где ИИ сам решает, использовать глубокие рассуждения или давать быстрый ответ.

🔗 Ссылка - *клик*

@data_analysis_ml

👍9❤4🔥1🌚1

4.46K views06:04

Анализ данных (Data analysis)

🚀 Выпущен техрепорт GLM-4.5 — мощный Mixture-of-Experts (MoE) LLM с 355 млрд параметров (и 32 млрд активных), оснащённый гибридной логикой: умеет «думать» для сложных задач и сразу отвечать, когда нужно.

Ключевые особенности:
- Обучен на 23 трлн токенов с поисковой дообучкой и RL через экспертные итерации.
- Выдаёт отличные результаты в задачах agentic (агентные задачи), reasoning (логика) и coding (кодинг):
— TAU-Bench: 70,1%
— AIME 24: 91,0%
— SWE-bench Verified: 64,2%
- Несмотря на менее мощные размеры, занимает 3-е место по общим метрикам и 2-е место по agentic-бенчам среди всех моделей.
- Выпущены две версии: полноразмерная GLM-4.5 (355B) и компактная GLM-4.5-Air (106B) — обе открыты для сообщества.

Это значимый шаг для открытых LLM — мощный, гибридный, способный рассуждать, действовать и кодить в рамках одного фундамента.

🟡

🟡

🟡

🟡

🟡

🖥