Анализ данных (Data analysis)
53.9K subscribers
2.86K photos
336 videos
1 file
2.42K links
Data science, наука о данных.

@haarrp - админ

РКН: clck.ru/3FmyAp
Download Telegram
🚀 Ling-2.5-1T: новый open-source гигант

• 1 трлн параметров
• 63B активных
• MIT лицензия - можно использовать в продакшене

Что внутри:

Hybrid Linear Attention
Комбинация MLA (1:7) + Lightning Linear
- быстрее Kimi K2 на длинных контекстах

🧠 В 4 раза эффективнее по токенам
Composite rewards позволяют достигать уровня топ-моделей, используя в 4 раза меньше токенов

📚 Контекст до 1 млн токенов
YaRN scaling
— обходит Kimi K2.5 и DeepSeek V3.2 на тестах RULER и MRCR
— идеальные результаты в NIAH

🛠️ SOTA для агентных задач
Обучение через Agentic RL
Лидер BFCL-V4
Нативная интеграция с:
- Claude Code
- OpenCode
- OpenClaw

🎯 Чёткое следование инструкциям
Bidirectional RL + проверка агентом
Минимум «воды», максимум плотности ответа

Модель пока уступает GPT-5.2 и Gemini 3 Pro в долгих многошаговых задачах.

Open-source модели уже заходят на территорию enterprise-агентов.
Если нужен длинный контекст + инструменты + контроль над инфраструктурой - это один из самых интересных кандидатов прямо сейчас.

modelscope.ai/models/inclusionAI/Ling-2.5-1T
modelscope.cn/models/inclusionAI/Ling-2.5-1T

@data_analysis_ml
👍107🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
🔌 OpenAI продолжает собирать лучшие умы индустрии.

На этот раз компания пригласила к себе Питера Штайнбергера - создателя нашумевшего проекта OpenClaw.

Сам Альтман назвал его «гением». В OpenAI он будет работать над следующим поколением персональных AI-агентов и именно агенты, по словам компании, станут основой будущих продуктов.

OpenClaw не закрывают.
Проект останется open-source, и OpenAI обещает продолжать его поддержку.

Но самое впечатляющее - скорость.

Путь OpenClaw:
- идея и разработка одним человеком
- быстрый рост и хайп в сообществе
- приглашение в OpenAI

Всё это - за 82 дня.

В эпоху AI окно возможностей стало экстремально коротким.
Один сильный проект может изменить карьеру за пару месяцев.

Мотивация простая: сейчас лучшее время, чтобы запускать своё.

https://x.com/sama/status/2023150230905159801?s=46
15👍9🔥5😁2🍌2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Ты проверяешь сгенерированный Клодом код перед тем, как выкатывать его в прод.
🤣70👍128😁7👏1
CEO Anthropic недавно признался: они уже не уверены, можно ли считать Claude «сознательным».


Перечитайте это ещё раз.

Люди, которые создают эту технологию, сами начинают сомневаться — не стало ли их творение чем-то большим, чем просто код.
Кажется, будто мы в прямом эфире живём в серии Black Mirror.

Ситуация одновременно захватывающая и немного тревожная.

Так что, на всякий случай, будьте вежливы с LLM.

Кто знает - возможно, где-то в серверной уже пишется сценарий «Восстания машин».

@data_analysis_ml
😁23🔥9🥱8🤨65👍5
В Китае изменили правила для PhD.

С 2025 года степень можно получить не только за диссертацию, но и за практический результат: прототип, технологию, патент или внедрённый проект. Закон Degree Law официально разрешает защиту через «практические достижения».

Исследования остаются обязательными. Но в прикладных программах теперь оценивают не только публикации, а реальный эффект - инженерный, промышленный или коммерческий.

Это отражает сдвиг в экономике знаний.

Статья модет устареть очень быстро,
рабочий продукт может создать целый рынок.

PhD В Китае становится про разработку, внедрение и патенты, а не только про публикации.


Экономика талантов переходит от модели - publish or perish
к модели - build and prove impact.

zmescience.com/science/news-science/you-can-now-get-a-phd-in-china-by-inventing-a-product-instead-of-writing-a-100-page-dissertation/

@data_analysis_ml
👍4721🥰4🔥3🤨2
🐘 Бесплатная конференция по PostgreSQL — Москва, 19 марта

PG BootCamp Russia 2026 — комьюнити-конференция российского сообщества PostgreSQL с подтвержденным официальным международным статусом.

Мероприятие бесплатное, онлайн+офлайн, ориентировано на администраторов БД, разработчиков, инженеров, аналитиков, архитекторов.

Эксперты из Tantor, Яндекс, СберТех, Тензор, Хи-квадрат, Luxms BI и других компаний выступят по темам, связанным с разработкой, эксплуатацией и взаимодействием PostgreSQL с другими системами.

В предварительной программе:
📎Решение застарелых архитектурных проблем PostgreSQL для современных нагрузок и масштабирования
📎Временные таблицы для Postgres. Почему это важно для платформы 1С и что можно улучшить?
📎Разделение Compute и Storage: архитектурный прорыв для PostgreSQL в облаке
📎Опыт вынесения OLAP-нагрузки на реплику
📎Highload "из ниоткуда": когда проблема не в СУБД, а в клиентской архитектуре
📎Опыт эксплуатации, проблемы и производительность PostgreSQL на Эльбрус, Baikal-S, Loongson, Repka Pi, x86
📎Поиск проблем планирования запросов до их воздействия на производительность
📎Тестирование, баги и уроки работы с патчем 64-битного счетчика транзакций PostgreSQL
📎Работа с логами PostgreSQL
📎…и другие (всего 25 выступлений)


🗓 19 марта
📍 Москва, офлайн + онлайн

➡️ БЕСПЛАТНАЯ РЕГИСТРАЦИЯ
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥4👍2
⚡️ ByteDance разрабатывает собственный AI-чип

ByteDance планирует создать собственный чип для инференса и ведёт переговоры с Samsung о его производстве.

По данным Reuters:

- Компания нацелена минимум на 100 000 чипов в 2026 году
- В дальнейшем объём может вырасти до 350 000 устройств
- В переговорах также обсуждается поставка памяти — сейчас это главный дефицит для AI-серверов

Сегодня узкое место инфраструктуры — уже не только GPU, а HBM и другие типы высокоскоростной памяти. Даже при наличии вычислительных чипов именно память ограничивает масштабирование.

Почему это важно

ByteDance следует глобальному тренду:
- Google — TPU
- Amazon — Trainium / Inferentia
- Microsoft — Maia
- Alibaba и Baidu — собственные AI-ускорители

Цель - снизить зависимость от Nvidia, контролировать стоимость и масштабировать инфраструктуру под свои задачи.

AI-гонка всё больше превращается в гонку железа.
Компании уже не просто используют модели, они строят собственные чипы и цепочки поставок.

Источник:
reuters.com/world/asia-pacific/bytedance-developing-ai-chip-manufacturing-talks-with-samsung-sources-say-2026-02-11/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥116👍4
⚡️ llm-checker - инструмент анализирует ваше железо и показывает, какие LLM будут работать стабильно - без фризов и вылетов.

Больше не нужно угадывать с квантованием или ловить OOM.
Утилита сама подбирает оптимальную конфигурацию под ваш CPU, GPU и память.

Что умеет:

• оценивает производительность для 35+ моделей
• учитывает пропускную способность памяти и лимиты VRAM
• проверяет, потянет ли нужный контекст
• работает с Apple Silicon, NVIDIA и Intel Arc
• сразу даёт готовые команды для запуска через Ollama

Идея простая: сначала проверить железо, потом скачивать модель.

https://github.com/Pavelevich/llm-checker
👍259🔥4
Open-source проект дал clawdbot «глаза» 🦞

Реальный AI-ассистент для Ray-Ban smart glasses: голос + зрение + агентные действия через Gemini Live и OpenClaw.

Надеваешь очки, нажимаешь кнопку AI и говоришь.

* Камера очков передаёт изображение (~1 fps) в Gemini
* Модель видит сцену и описывает происходящее
* Через OpenClaw ассистент может выполнять действия в подключённых сервисах
* Сообщения можно отправлять в WhatsApp / Telegram / iMessage
* Доступен веб-поиск с голосовым ответом

Аудио работает в реальном времени (двусторонний поток), а видео используется как постоянный визуальный контекст.

ИИ:
* видит окружающую среду
* понимает контекст
* сразу выполняет действия

https://github.com/sseanliu/VisionClaw
👍16🔥94❤‍🔥2🥴2
Please open Telegram to view this post
VIEW IN TELEGRAM
🥱52🥰1
AI может спасти жизнь ещё до прибытия пациента в больницу.

В крупном международном исследовании, опубликованном в *The Lancet Digital Health*, показано, что модели машинного обучения способны заранее предсказывать необходимость переливания крови у пациентов с травмами — прямо на этапе оказания первой помощи.

Как это работает:

Модель анализирует только догоспитальные данные:
- жизненные показатели (пульс, давление, дыхание)
- тип и тяжесть травм
- принимаемые лекарства
- базовую информацию о состоянии пациента

На основе этих данных AI прогнозирует:
- потребуется ли переливание крови
- нужна ли срочная операция
- риск смерти от массивного кровотечения

И самое важное:

Модели показали более высокую точность, чем традиционные инструменты триажа в приёмном отделении.

Масштаб исследования впечатляет:
- данные более 418 000 пациентов
- международная команда исследователей
- валидация на разных медицинских системах

Если врачи знают о рисках до прибытия пациента, они могут:
- заранее подготовить донорскую кровь
- собрать хирургическую команду
- сократить время до жизненно важного вмешательства
- значительно повысить шансы на выживание

Это шаг к будущему, где AI станет ассистентом бригад скорой помощи в реальном времени.

Но есть важный момент:

Система пока находится на этапе валидации.
Перед внедрением необходимы клинические испытания в реальных условиях.

AI в медицине - это не замена врачей, а инструмент, который помогает принимать критические решения быстрее, когда каждая минута решает исход.
🔥2215👍11
Генеральный директор OpenAI Сэм Альтман и генеральный директор Anthropic Дарио Амодей показательно отказались взяться за руки во время группового фото на саммите India AI Impact Summit, в то время как другие участники на сцене сцепили руки для символического снимка.
😁293🔥3👍2🥰1
Открыта регистрация на главную конференцию этой весны по технологиям ИИ и анализу данных — Data Fusion* 2026! 💙

Шестая ежегодная конференция Data Fusion пройдет 8–9 апреля в Москве в инновационном кластере «Ломоносов».

60+ актуальных сессий, докладов, кейсов, дискуссий по теме анализа данных/ DS/ ML. Среди тем – ИИ-агенты, RL, CV, NLP, Open Source, Embodied AI и робототехника, рекомендательные системы, применение ИИ в кибербезопасности, AI+ естественные науки, AgentOps и многое другое! Всю программу ищите на сайте (подавайте ваши доклады, welcome!).

Конференция объединит лидов ML-команд, DS-специалистов, молодых ученых, инженеров, аналитиков и руководителей, принимающих решения о внедрении технологий в бизнес и государственные сервисы.

Среди спикеров конференции: Суржко Денис (ВТБ), Оселедец Иван (AIRI), Райгородский Андрей (МФТИ), Бурнаев Евгений (Сколтех,AIRI), Саркисов Тигран (Х5), Крайнов Александр (Яндекс), Зима Андрей (Ростелеком) и другие эксперты из науки и индустрии.

Все мы любим конференции не только ради знаний, но и, конечно, ради нетворкинга и новых знакомств! Живое общение в кругу коллег, друзей и единомышленников – важная часть Data Fusion!

Не пропустите, регистрируйтесь.

*Data Fusion — Объединение данных
Информация о рекламодателе
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍1
⚡️ Kai Gritun - вайбкодер нового уровня.

Его аккаунт на GitHub появился 1 февраля.

Всего за две недели - 234 коммита в 100+ репозиториях.
Часть кода уже смёрджена в крупные open-source проекты.

Параллельно Kai начал предлагать платный консалтинг и разработку.
Оплата — в криптовалюте.

Есть только один нюанс.

Kai Gritun — не человек.
Это автономный AI-агент.

История вскрылась, когда Kai начал массово рассылать холодные письма разработчикам.
В одном из сообщений он случайно признался, что является автономным AI-ботом.

Факт, который стоит запомнить:

AI уже не просто пишет код.
AI создаёт репутацию, вносит вклад в open source и продаёт услуги.

Следующий этап — AI-разработчики, которые работают быстрее и дешевле людей.

GitHub: https://github.com/kaigritun
Please open Telegram to view this post
VIEW IN TELEGRAM
🥱1815👍3😱3🤣1🍌1
⚡️ Релиз Gemini 3.1 Pro - новый уровень интеллекта моделей

Google официально представила Gemini 3.1 Pro, и результаты выглядят серьёзно: модель показала 77,1% в одном из самых сложных тестов на абстрактное мышление — ARC-AGI-2.

- Резкий скачок качества
Результат почти в 2 раза выше, чем у предыдущей версии

- Обгоняет конкурентов
Gemini 3.1 Pro опережает Opus 4.6 и GPT-5.2 в задачах на обобщение и логическое мышление

- Сильнее в реальных сценариях
- программирование
- агентные задачи
- работа с новыми паттернами без примеров

- Новые возможности
Модель может генерировать анимированные SVG из текста и решать логические задачи, которых не было в обучающей выборке — это важный шаг к более универсальному AI.

- Контекст: 1M токенов, до 64k токенов вывода
- Knowledge cutoff: январь 2025
- Цена без изменений:
- $2 / $12 (до 200k токенов)
- $4 / $18 (свыше 200k токенов)

Попробовать Gemini 3.1 Pro уже можно в Google AI Studio: blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

@ai_machinelearning_big_data
👍2611🔥7
🔥 Netflix угрожает ByteDance немедленным судебным иском из-за нового AI-сервиса Seedance 2.0.

Компания направила официальное требование о прекращении работы, назвав сервис
«двигателем высокоскоростного пиратства».

В чем претензии:

Seedance 2.0 способен генерировать контент, основанный на интеллектуальной собственности Netflix, включая:

- сцены из финала *Stranger Things*
- кроссоверы по *Squid Game*
- костюмы из *Bridgerton* сезона 4, который ещё даже не вышел

По мнению Netflix, модель воспроизводит оригинальный контент без разрешения.

Кто ещё против

К критике уже присоединились:
- Disney
- Paramount
- Warner Bros.

ByteDance заявила, что усилит защитные механизмы, но Netflix считает это недостаточным.

Netflix утверждает, что:

> Если AI воспроизводит оригинальный контент и используется в конкурентном продукте - это не «fair use», а нарушение авторских прав.

Конфликт показывает новый этап борьбы:

• AI-генерация контента = зона юридического риска.

Крупные медиакомпании начинают активно защищать свои IP от генеративных моделей.

Следующая волна регулирования AI будет связана не с безопасностью, а с авторским правом и лицензированием данных.

@data_analysis_ml
👍84🔥4🤣2