192K subscribers
3.54K photos
529 videos
17 files
4.28K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🍏Иллюзия мышления: понимание сильных и слабых сторон моделей рассуждения через призму сложности задач

Apple внезапно опубликовала исследование, которое разоблачает популярные LLM с "цепочкой размышлений" (Chain-of-Thought) — такие как Gemini 2.5 Pro, OpenAI o3 и DeepSeek R1.

📌 Что тестировали?
Логические задачи:
• башни Ханоя (100+ шагов!)
• загадка про волка, козу и капусту
• головоломки с правилами и условиями

И всё это — с усложнением.

💥 Результаты:

🔁 Модели не думают, а вспоминают
Они не решают задачу шаг за шагом, а ищут похожие примеры в своей базе знаний. Это имитация мышления, а не само мышление.

🤯 "Переосмысление" вредит
Если задача простая, модель находит верный ответ — и… продолжает «думать» дальше, усложняя всё и случайно портя решение.

🧠 Больше размышлений ≠ лучше результат
Дать больше токенов и времени на размышления не помогает. На сложных задачах модели просто сдаются быстрее. Даже "бесконечный" бюджет не спасает.

🧪 Few-shot примеры не работают
Даже если расписать пошаговое решение и дать примеры — модель всё равно ломается, если задача ей незнакома.

🏗 Модели обожают Ханой, но ненавидят загадки
Башни Ханоя решаются идеально даже на 100+ шагов.
А вот в простой задаче с козой и капустой — модели сдаются на 4-м шаге. Почему? Ханой — в датасетах, загадки про реку — нет.

🍏 Интересно, что Apple выпустила это исследование за день до WWDC 2025.
Подколка конкурентам? А завтра, может, и своё покажут. 🤔

📎 Исследование: https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdf

@data_analysis_ml

#AI #LLM #AGI #Apple #WWDC2025 #PromptEngineering #NeuralNetworks
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🤍🤍🤍🤍🤍
Когда мир говорит: «Ты слишком» — Сбер отвечает: «Нам подходит»

Слишком амбициозный?
Слишком нестандартный?
Слишком умный, громкий, яркий?


Для Сбера — это преимущество!
Веди за собой команду, создавай новые продукты, помогай людям.

Будь собой — в команде, где возможно всё 💚
Please open Telegram to view this post
VIEW IN TELEGRAM
📈 Количество пользователей растет у всех , но ChatGPT — вне конкуренции

Но ChatGPT растет быстрее всех.

Почти все крупные сайты растут, но ChatGPT показывает непрерывный и аномальный взлёт. В мае 2025 года его посещаемость выросла на +6,82% по сравнению с апрелем.

И это говорит о двух вещах:

1️⃣ ИИ стал по-настоящему массовым
Все меньше людей , которые не использует ИИ — в работе, учёбе или просто в быту. Это уже не будущее — это часть повседневности.

2️⃣ OpenAI наращивает отрыв
Именно поэтому GPT‑5 — будет не просто новой моделью, это стратегическая ставка на доминирование на ИИ рынке.

У модели есть шанс пробить магическую планку в 1 миллиард пользователей и окончательно закрепить лидерство OpenAI.

@ai_machinelearning_big_data

#chatgpt #openai #news #ml #ai
🌟 True Tech Day 2025: крупнейшая ИТ-конференция от MTS Web Services

MTS Web Services (MWS) провела масштабное мероприятие True Tech Day — свыше 800 000 участников онлайн и 5 000 офлайн. Ключевой фокус — искусственный интеллект и ML.

Формат: 4 трека, 50+ спикеров, интерактив с флагманскими продуктами MWS.

Технологии: генеративный ИИ, цифровые двойники, робототехника, AutoML, системная инженерия будущего.

На главной сцене:
🟡 Пабло дель Веккио (NTT DATA) — цифровые двойники и предиктивные модели
🟡 Дмитрий Ливанов (МФТИ) — open talk об ИИ против разума
🟡 Радослав Нейчев (Яндекс) — синтетические данные и обучение моделей
🟡 Кэсси Козырков (экс-Google) — human-in-the-loop в эпоху AI
🟡 Денис Филиппов (MWS AI) — реальные кейсы генеративного ИИ
🟡 Антон Скогорев (Т-Банк) — архитектура AI-ориентированных систем

Треки конференции:
🟡 MAIN — LLM-агенты, робототехника, цифровые двойники
🟡 SCIENCE — нейрофизиология, нейроимпланты, генная инженерия, частный космос
🟡 ENGINEERING — backend-архитектура, AI-ассистенты, облачные стеки
🟡 AI/ML — RAG, AutoML, временные ряды, оптимизация inference

True Tech Day 2025 стал не просто конференцией, а местом встречи ИТ-сообщества, где ИИ не только обсуждали — с ним взаимодействовали на практике.

@ai_machinelearning_big_data

#AI #ML #TrueTech #MWS
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
📌Небенчмарковый анализ математических рассуждений o3-mini.

Epoch AI провели исследование, чтобы копнуть способность o3-mini в математическом ризонинге глубже, чем это происходит в популярных тестах и бенчмарках.

Они дали 14 математикам разобрать, как именно o3-mini-high решает сложные задачи из FrontierMath. Цель - понять ее сильные и слабые стороны в реальном математическом мышлении, а не просто фиксировать правильные ответы.

Так как внутренняя структура самой модели OpenAI не раскрывает, авторы сосредоточились на анализе ее рассуждений.

По 29-и "траекториям рассуждений" стало видно: модель не просто перебирает формулы, она действует как "индуктивный решатель на ощущениях" (по выражению одного математика).

Модель проявляет любопытство: пробует разные подходы, ставит "бюджетные эксперименты", чтобы прощупать задачу. Иногда даже пишет код для расчетов, избегая излишней абстракции.

Но стиль ее рассуждений часто неформальный, "черновой". Рассуждения излагаются приблизительно, без строгой формулировки, с пропусками сложных моментов – совсем не как это принято в математической среде.

Почему так? Возможно, строгие доказательства просто реже встречались в ее обучающих данных.

Главные проблемы модели – это обратная сторона ее же достоинств. Да, она эрудирована как никто (знает кучу теорем из разных областей – в 66% случаев она адресно применяла нужные знания, даже если подход был замаскирован).

Но ей не хватает строгости и глубины. Она часто "читерит": делает верную догадку интуитивно и тут же применяет ее для решения, даже не пытаясь ее подтвердить доказательствами.

Порой ей не хватает буквально одного шага до верного ответа. Но главное – математики критикуют ее за слабую креативность. Как заметил один эксперт, модель похожа на аспиранта, который может блеснуть начитанностью, назвать кучу теорем и авторов, но не способен глубоко переосмыслить материал или придумать что-то новое.

Набор идей модели ограничен, и если они не срабатывают – прогресса нет. Плюс ко всему, в 75% рассуждений нашли галлюцинации: модель путает термины, формулы, и зачастую выдумывает несуществующие URL для поиска недостающей информации.

Модель, по заверением OpenAI, обучали на огромном массиве данных математической литературы. Это объясняет ее феноменальную эрудицию. Но смогут ли такие модели, как o3-mini-high, преодолеть свои слабости в будущем?

Или же системы, обученные на синтетических данных (AlphaProof), пойдут другим путем, предлагая в инфернесе рассуждения, мало похожие на человеческое математическое мышление?

А пока что вывод: o3-mini-high – это мощный, но своеобразный инструмент. Знаток с интуицией, но без дисциплины профессора.

🔜 Читать статью полностью

@ai_machinelearning_big_data

#AI #ML #EpochAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
✔️ В приложение Gemini добавили «запланированные действия».

Новая функция позволяет автоматизировать повторяющиеся задачи и получать персонализированные уведомления. Пользователи могут задавать команды, например, ежедневно присылать сводку календаря или идеи для блога, а также создавать разовые напоминания.

«Запланированные действия» активируется через настройки приложения. Система работает просто: достаточно описать задачу и указать время выполнения. Доступ к инструменту открыт для подписчиков Google AI Pro/Ultra и корпоративных пользователей Google Workspace (образовательные и бизнес-планы).
blog.google

✔️ Google меняет план доступа к AI Studio.

Все началось из за волны возмущения платных подписчиков поводу того, что в Gemini app платный Pro-тариф ($19.99) оказался строже, чем бесплатный AI Studio.

Google отреагировал увеличением лимитов для Gemini app, но параллельно объявил, что AI Studio полностью перейдет на авторизацию по API-ключам. Это напугало разработчиков, многие используют AI Studio в своих проектах. Они опасаются, что теперь придется платить за сервис.

Руководитель направления, Логан Килпатрик, успокоил сообщество: "Бесплатный уровень AI Studio никуда не денется в ближайшее время". Поменяется система учета. Пока большинство укладывалось в свободные квоты, но теперь, при их превышении, точно потребуется свой ключ и, возможно, оплата. Для тех, кому критичны большие квоты Gemini app, теперь нужен уже AI Ultra за $250/мес. Будущее бесплатного доступа в AI Studio прорабатывается, компания обещает минимизировать неудобства.
9to5google.com

✔️ Microsoft Photos получило новые ИИ-инструменты.

Microsoft выпустила обновление для Photos на Windows 11 с новыми фичами. Relight: позволяет управлять тремя источниками света, менять их цвет и фокус, есть готовые пресеты. Пока это работает только на Snapdragon-устройствах Copilot+, но вскоре поддержка дойдет до AMD и Intel.

Поиск по текстовому запросу: вводите «закат на пляже» или «семейный пикник», и приложение найдет подходящие фото без лишних кликов.

Коммерческие пользователи с Entra ID получили доступ к Restyle Image и Image Creator, ранее доступным только через личные аккаунты Microsoft. Обновление доступно в версии 2025.11060.5006.0 и выше.
blogs.windows.com

✔️ Apple на WWDC 2025 анонсировала улучшенные инструменты для разработчиков.

Foundation Models — фреймворк для создания интеллектуальных приложений с поддержкой офлайн-работы и приватностью данных. С ним можно добавлять ИИ-функции в приложения всего за три строки кода на Swift.

Xcode 26 получил интеграцию с ChatGPT и другими LLM, позволяя писать код, тесты и документацию через API-ключи или локальные модели на Mac с чипами Apple. Удобство повысилось за счет голосового управления, обновлённой навигации и локализации.

Swift 6.2 улучшил производительность и взаимодействие с C++ и JavaScript, а также получил поддержку WebAssembly. Контейнеризация для Mac теперь работает с Linux-образами благодаря изолированному опенсорсному фреймворку.
apple.com

✔️ Anthropic закрыла пилотный блог, который вел Claude.

Всего месяц просуществовал экспериментальный блог "Claude Explains", где Claude писал технические статьи. Инициатива, по задумке, должна была объединить обучающий контент с маркетинговыми целями, при участии редакторов и экспертов, дорабатывавших черновики Claude.

Блог освещал темы от анализа данных до оптимизации кода. Однако уже через месяц пилот остановили, хотя планы были грандиозные. Пользователи соцсетей критиковали неясность: часть постов выглядела как автоматизированный маркетинг, а отсутствие меток об ИИ-генерации вызывало недоверие.

Согласно сервису Backlink Checker, за месяц существования блога, на его статьи сослались 24 сайта. Вероятно, Anthropic решили дистанцироваться из-за рисков, связанных с ошибками ИИ. Сейчас с адреса блога установлено перенаправление на главную страницу Anthropic.
techcrunch.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 Золотая коллекция авторских каналов про нейросети, сохраняйте!

Собрал для вас редкие и полезные каналы про нейронки:

Tips AI | IT & AI — про сервисы и технологии IT и AI, которые могут упростить (или не совсем) жизнь. Пишет только то, что сам считает интересным.

НейроProfit — авторский канал с проверенными инструментами для бизнеса, учебы и работы. Конкретика и пошаговые инструкции – все, чтобы использовать ИИ уже сегодня.

Бурый — коллекционер нейросетей, тестит всё на себе и делится лучшими бесплатными нейронками.

Сергей Булаев AI 🤖 — создание полезного контента и продуктов с помощью ИИ. Открываем эру миллиардных компаний из трёх человек.

Max Votek — о технологиях, AI и предпринимательстве простыми словами. Много лет строит бизнесы и инвестирует в идеи. Co-founder Customertimes.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Вот как изменилась доля трафика на рынке ИИ за последние полгода:

🗓️ 6 месяцев назад:
🥇 ChatGPT: 87,5%
🥈 Google: 5,4%
🥉 Perplexity: 2,0%
Claude: 1,6%

🗓️ 3 месяца назад:
🥇 ChatGPT: 77,6% (−9,9%)
🥈 DeepSeek: 8,1% (новый игрок!)
🥉 Google: 4,9%
🤖 Grok: 2,7% (входит в игру от X)
🚀 Perplexity: 2,0%

🗓️ 1 месяц назад:
🥇 ChatGPT: 80,2% (+2,6%)
🥈 Google: 6,1% (+1,2%)
🥉DeepSeek: 5,9% (−2,2%)
🤖 Grok: 2,4%
🚀 Perplexity: 1,6%
Claude: 1,2%

🗓️ Сейчас:
🥇 ChatGPT: 78,9% (−1,3%)
🥈 Google: 8,0% (+1,9% 📈)
🥉 DeepSeek: 5,3% (−0,6%)
🤖 Grok: 2,1% (−0,3%)
🚀Perplexity: 1,7% (+0,1%)
Claude: 1,4% (+0,2%)

Главные выводы:
- ChatGPT по-прежнему лидирует, но понемногу теряет долю рынка (−8,6% за полгода).
- Google стабильно растёт (+2,6% с прошлого года).
- DeepSeek мощно стартовал, но в последнее время сдал позиции.
- Grok и Perplexity держатся, а Claude показывает небольшой рост.

@ai_machinelearning_big_data


#GenAI #ТрендыРынка