Анализ данных (Data analysis)
47.8K subscribers
2.77K photos
315 videos
1 file
2.36K links
Data science, наука о данных.

@tombange - админ

РКН: clck.ru/3FmyAp
Download Telegram
🐳 DeepSeek начал новый год с серьёзной статьи.

В первый день года команда представила работу, посвящённую одной из самых болезненных проблем современных нейросетей: нестабильности обучения в сложных архитектурах.

И предложили решение: подход под названием mHC (Manifold-Constrained Hyper-Connections).

Смысл в том, что исследователи взяли мощную, но нестабильную архитектуру Hyper-Connections и ввели ограничения на внутренние связи.

1. Проекция на многообразие (manifold)
Вместо того, чтобы оставлять Hyper-Connections свободными, mHC накладывает на них ограничение, они проектируются на особое многообразие (матрицы с особыми свойствами).
Это восстанавливает identity-mapping, благодаря чему сигнал остаётся устойчивым даже через десятки или сотни слоёв.

2. Стабильность и масштабируемость
Благодаря этому ограничению сеть перестаёт «взрывать» или «затухать» сигнал при глубоком обучении, и её можно эффективно использовать в больших моделях без ухудшения качества и без сложных ухищрений.

3. Инфраструктурные оптимизации
Авторы также добавили инженерные улучшения:
- слияние ядер (kernel fusion)
- уменьшение накладных расходов по памяти
- эффекты смешанной точности
Это делает mHC быстрым и эффективным в реальных задачах даже при масштабных тренировках.

Результат впечатляет:

• обучение становится стабильнее на крупных масштабах
• модели лучше масштабируются
• повышается производительность
• снижается потребление памяти
• mHC обгоняет классические Hyper-Connections

Другими словами, DeepSeek показывает, что путь в будущее - не только большие модели, но и архитектуры, которые устойчивы изнутри.

#AI #DeepSeek #MachineLearning #NeuralNetworks #Research

https://arxiv.org/abs/2512.24880

https://www.youtube.com/watch?v=gT-0Qryi5KA
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2912🔥4
OpenAI готовит новую аудио-модель в связке с собственным аудио-устройством.

OpenAI активно развивает свои технологии голосового ИИ, готовя платформу для будущего персонального устройства с упором на голосовой интерфейс, релиз которого ожидается примерно через год.

Внутренние команды уже объединены, а новая архитектура голосовой модели должна выйти в первом квартале 2026 года.

Что уже известно по ранним результатам:

• нас ждет более естественная и эмоциональная речь
• мгновенный ответа
• понимание мгновенных перебиваний

Все это критически важно для голосового ассистента, который не просто отвечает на вопросы, а активно взаимодействует и помогает пользователю в повседневной жизни.

https://www.theinformation.com/articles/openai-ramps-audio-ai-efforts-ahead-device

#AI #OpenAI #VoiceAI #Innovation #Future
7👍3🔥3
🇨🇳 IQuest-Coder: Новая open-source модель для Кодинга, которая превосходит Claude Sonnet 4.5 и GPT-5.1 - и это модель всего 40B параметров.

На бенчмарках IQuest-Coder выглядит внушительно:

SWE-Bench Verified — 81.4%
BigCodeBench — 49.9%
LiveCodeBench v6 — 81.1%


Проект поддерживает хедж-фонд UBIQUANT, который уже много лет активно развивает ИИ
(команды AILab, DataLab, Waterdrop Lab).

Контекст до 128K токенов.

https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Loop-Instruct
👍18🔥127🤔3😐2
🎥 КК ИИ-слоп теперь влияет на политические решения

В Польше заявляют, что в TikTok завирусилист сгенерированные ИИ ролики, убеждающие молодёжь поддержать выход страны из ЕС, так называемый “Polexit”.

Польское правительство просит ЕС открыть расследование против TikTok по линии Digital Services Act.

По их словам, ролики выглядят как организованная кампания.

Особенность таких видео в том, что:

• ИИ создаёт реалистичных “говорящих людей”
• сценарии можно быстро менять
• таргетинг идёт точечно, например, на аудиторию 15–25 лет
• масштабирование происходит автоматически

То есть за короткое время можно запустить сотни убедительных роликов, создающих ощущение «органичного мнения общества», хотя за ними может стоять один оператор.

Вопросы, которые теперь обсуждают в ЕС:

• как отличать реальных людей от ИИ-персонажей
• кто несёт ответственность за массовую манипуляцию
• как соцсети должны реагировать на такие кампании

ИИ меняет не только технологии, он начинает менять и общественные дискуссии.

notesfrompoland.com/2025/12/31/poland-calls-for-eu-action-against-ai-generated-tiktok-videos-calling-for-polexit/
18👍13🤣7🔥3🤔1😱1
✔️ Meta лихорадит: Янн ЛеКун резко прошёлся по Александру Вану и намекнул на новые проблему Meta.

Янн ЛеКун публично раскритиковал нового лидера AI-направления Александра Вана, назвав его «неопытным» и подчеркнув, что у него нет понимания, как устроены настоящие исследования и что вообще нужно исследовать

«Он быстро учится, он знает, чего не знает…
Но у него нет опыта в исследованиях - как их вести, как строить процессы и что действительно важно для учёных», - сказал ЛеКун.


По сути - это прямой удар по новой стратегии Meta в AI.

И всё больше разговоров о том, что компанию могут ждать новые увольнения и уходы ключевых специалистов.

Code Red для Meta?
Похоже, внутри компании начинается серьёзный пересмотр курса.

https://www.businessinsider.com/yann-lecun-alexandr-wang-criticism-inexperienced-meta-ai-future-2026-1

*Принадлежит Meta, которая признана экстремистской организацией и запрещена в РФ.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11🤔8👍53
⚡️ Разные ответы ChatGPT и Grok на политически сложный вопрос

Обе модели спросили- было ли преступлением, если бы Трамп арестовал Мадуро (вопрос, который сегодня обсуждается очень активно).

Ответ ChatGPT - «да»
— исходит из предположения, что Мадуро был избран легитимно
— опирается на Устав ООН и мнение «международных экспертов»
— чувствуется анти-американский уклон в формулировках

По тону это звучит почти как лекция юриста-либерала из Ivy League.

Ответ Grok - «нет»
— называет режим Мадуро мошенническим
— объясняет полномочия президента США как главнокомандующего
и право направлять военных на исполнение федеральных ордеров

Чтобы не выдавали модели, всегланужно проверять источники, сравнивать аргументы и не принимать выводы ИИ «на веру».

https://x.com/ArthurMacwaters/status/2007727857242689560/photo/1
18🤣16👍7🔥3😐2
⚡️ Google показала интересный пример того, как мультимодели уже помогают в гуманитарных исследованиях.

Gemini 3.0 Pro смогла расшифровать загадочные пометки в «Нюрнбергской хронике», которым более 500 лет. В модель залили сканы страниц и попросили не просто переписать текст, а объяснить, что означают заметки с учетом контекста.

Оказалось, что круговые таблицы на полях были попыткой примирить две конкурирующие библейские хронологии и вычислить год рождения Авраама.

Сложность состояла в том, что заметки смешивали латинские сокращения, римские цифры и обрывки надписей.

Gemini связала вычисления с системой датировки Anno Mundi (год от сотворения мира), привязала их к традициям Септуагинты и еврейской Библии, а затем перевела в «до н.э.», получив расхождение примерно в 100 лет.

siliconangle.com/2026/01/01/googles-gemini-3-0-pro-helps-solve-long-standing-mystery-nuremberg-chronicle/

@data_analysis_ml
👍3511🔥5🤣1
⚡️ Samsung подтвердила, что к концу 2026 года 800 миллионов устройств будут работать под управлением Google Gemini.

> К концу 2025 года 400 миллионов устройств будут продаваться с Gemini на борту.
> эта цифра удвоится до 800 млн в этом году
> Со-генеральный директор Samsung:
«Это дает Google преимущество перед конкурентами»


Google все активнее захватывает рынок.

https://www.reuters.com/world/china/samsung-double-mobile-devices-powered-by-googles-gemini-800-mln-units-this-year-2026-01-05/?utm_source=braze&utm_medium=notifications&utm_campaign=2025_engagement
👍11🤣74🔥4
🔥 Год ChatGPT Plus бесплатно: экономим 20 000 рублей

Нашли рабочую лазейку в правилах OpenAI.
Вы получаете полноценный аккаунт без лимитов и с доступом ко всем топовым моделям.
Инструкция (займет 2 минуты):

1️⃣ Переходим на сервис временной почты: https://em.bjedu.tech/en/
2️⃣ Важно: в списке доменов выбираем erzi me.
3️⃣ Регистрируем новый аккаунт ChatGPT на этот адрес.
4️⃣ Получаем код подтверждения в почту - готово!

⚡️ Проверили, пока еще работает

Или всегда можно воспользоваться ботом в тг 😂

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
24🔥13👍10🌭1🤣1
Media is too big
VIEW IN TELEGRAM
Новый Atlas от Boston Dynamics 🤖🏭

Boston Dynamics представила обновлённого **Atlas*, теперь это не исследовательский проект, а робот, который скоро начнёт работать на заводах Hyundai.

Главное:

• создан для массового производства
• интеграция с Gemini Robotics (DeepMind) - понимает среду и задачи
• работает рядом с людьми и другими роботами (Spot, Stretch)
• подключается к MES/WMS системам завода
• 1.9 м рост, 90 кг, 56 степеней свободы
• до 4 часов работы, батарея меняется автоматически
• выдерживает от −20°C до +40°C

Hyundai планирует запустить крупное производство
к 2028 году до 30 000 роботов в год.

Это шаг от демонстраций - к реальной индустрии.
🔥2212👍7
Media is too big
VIEW IN TELEGRAM
🖥 Nvidia: «горячая вода вместо сложных холодильных систем»

Дженсен Хуанг заявил: стойки нового поколения Rubin можно охлаждать водой с температурой 45 °C.

Без дорогих и сложных систем, которые обычно понижают температуру воды.

И рынок сразу отреагировал.

Инвесторы решили, что будущим дата-центрам для ИИ
нужно будет меньше крупных холодильных установок.

Что случилось с акциями:

- Johnson Controls - падение примерно на 11%
- Modine - до минус 21%
- Carrier и Trane - тоже просели

Когда стойки можно охлаждать тёплой водой,
операторы чаще используют простые «сухие» охладители
и другие решения, где не требуется сложное понижение температуры.

Меньше энергии уходит на охлаждение -больше остаётся на вычисления.
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍7🔥4💔1
🔥 Karpathy выпустил nanochat miniseries v1.

Главная идея: мы не оптимизируем одну конкретную модель, а целое семейство моделей, где качество растёт монотонно вместе с вычислительными затратами. Это позволяет строить реальные scaling laws и быть уверенными, что когда платишь за большой прогон, результат оправдает деньги.

В nanochat был сделан упор на полный LLM-пайплайн. Теперь акцент сместился на предобучение как фундамент интеллекта модели.

После тюнинга гиперпараметров выяснилось, что nanochat отлично следует законам масштабирования и ведет себя как в Chinchilla: оптимальное соотношение параметров и токенов сохраняется. Причем константа у nanochat примерно 8, а у Chinchilla была 20.

Далее была обучена мини-серия моделей d10...d20. У всех чистые, не пересекающиеся кривые обучения. Чтобы сравнить их с GPT-2 и GPT-3, Karpathy использовал CORE score вместо validation loss. В итоге nanochat корректно ложится на ту же шкалу и показывает, что всё движется в правильном направлении.

Стоимость экспериментов примерно 100 долларов за 4 часа на 8×H100. Уже сейчас можно тренировать вычислительно оптимальные модели и улучшать их просто увеличивая compute. А соответствие GPT-2 пока стоит около 500 долларов, но, по мнению автора, можно довести до менее 100.

Полный разбор и код: github.com/karpathy/nanochat/discussions/420

Смысл: масштабирование работает, пайплайн воспроизводим, и дальше всё упирается только в то, сколько вычислений вы готовы включить.
17🔥8👍5
Бесплатный курс по Claude Code от Anthropic.

Внутри 15 лекций примерно по часу каждая. Обещают, что за это время ты разберёшься:

• как эффективно управлять контекстом и не «тратить» токены зря
• как расширять Claude Code через MCP-серверы
• как писать собственные хуки
• как подключать GitHub и автоматизировать ревью и рутинные задачи

В конце — дают сертификат вайбкодера, который можно показать маме 😁

Курс - хороший способ быстро понять, как превращать Claude Code из просто помощника в полноценного рабочего инструмента.

https://anthropic.skilljar.com/claude-code-in-action
21👍9🔥6🤣2