Анализ данных (Data analysis)
46.1K subscribers
2.27K photos
263 videos
1 file
2.03K links
Data science, наука о данных.

@haarrp - админ

@itchannels_telegram - 🔥 главное в ит

@ai_machinelearning_big_data - ML

@machinelearning_interview - вопросы с собесдований по Ml

РКН: clck.ru/3FmyAp
Download Telegram
🚀 Новая модель рассуждений — Hierarchical Reasoning Model (HRM) 🧠🤖

HRM — это ИИ, вдохновлённый тем, как устроен человеческий мозг: информация обрабатывается иерархически, от простого к сложному. И результат — впечатляет.

💡 Модель решает сложные задачи, такие как:
- ARC-AGI (бенчмарк на гибкое мышление)
- Судоку экспертного уровня

И всё это:
Без предобучения
Без Chain-of-Thought
Всего на 1,000 обучающих примерах!

🔬 Это не просто новая модель — это подход, построенный на принципах нейронауки, и он уже показывает мощные результаты.

📄 Исследование: https://arxiv.org/abs/2506.21734
💻 Код на GitHub: https://github.com/sapientinc/HRM

@data_analysis_ml
17🔥9😁3👍1🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
Присоединяйся к сообществу современной ИТ-компании. Проходи бесплатные стажировки, знакомься с экспертами, участвуй в активностях и найди работу мечты!

Лига — это:
— Более 6 000 сотрудников по всей России
— Удобный график: удаленка, гибрид или офис
— Полный соцпакет, ДМС, корпоративная связь
— Компенсация фитнеса
— И многое другое

Хочешь расти как профессионал, работать в дружной команде, отдыхать в компании единомышленников, участвовать в масштабных корпоративах? Тогда тебе к нам!

https://t.iss.one/digitalleague?erid=2W5zFJaD2nU

Реклама. ООО "ЭЙТИ КОНСАЛТИНГ". ИНН 7715744096.
1
This media is not supported in your browser
VIEW IN TELEGRAM
🧱 Pi³ (Pi-Cubed) — новая SOTA‑модель, которая строит 3D‑модель объекта по фотографиям 📸

💡 Главное:
— На вход подается несколько фото с разных ракурсов — и она восстанавливает объёмную 3D‑форму
— Не важно, в каком порядке поданы изображения
— Модель сама определяет, где стояла камера, как выглядел объект в объёме, и выдаёт готовое 3D

⚙️ Под капотом:
— Работает без supervision
— Не требует фиксированной позиции камеры
— Отлично подходит для 3D‑сканирования, реконструкции, AR/VR и генеративных задач

📄 Paper: https://yyfz.github.io/pi3/
👨‍💻 Code: https://github.com/yyfz/Pi3
🤗 Demo: https://huggingface.co/spaces/yyfz233/Pi3

#3d #ml #reconstruction
6👍4🔥4
🚨 BREAKING: Руководитель DeepMind резко раскритиковал заявление OpenAI о "золоте" на Международной математической олимпиаде (IMO)

IMO — это International Mathematical Olympiad (Международная математическая олимпиада).

📌 Это крупнейшее и престижнейшее соревнование по математике для школьников со всего мира. Впервые проведено в 1959 году, сегодня в нём участвуют более 100 стран.

>Прессслужба OpenAI сообщили, что их модель впервые в истории выиграла на IMO золото
> “У IMO есть внутренний протокол оценки, который никто извне не видит.
> Без него нельзя утверждать, что у вас 1 место.
> С потерей баллов на задаче P6 — это серебро, а не золото.”

📌 Что произошло:

— OpenAI не уведомлял IMO, но объявила о "первом месте" своей модели
— Объявление сделали до окончания церемонии IMO, нарушив просьбу не затмевать победу реальных студентов
— DeepMind, наоборот, работала с IMO официально и соблюдала все условия
— Научное сообщество обвиняет OpenAI в непрозрачности и неуважении к сообществу
— Пост был сделан без публикации всей методики и без согласования с организаторами

💬 Цитата из сообщества:
“OpenAI повела себя неуважительно и эгоистично. Нельзя сравнивать так модели и людей.”

🧠 Вопрос к читателю:
Где грань между научным прогрессом и этикой в публичных заявлениях ИИ-компаний?

@data_analysis_ml
🔥228👍5
🧠 Нейроаналитик — AI-агент для анализа и визуализации данных от Yandex B2B Tech.

🔍 Что делает:
• Помогает искать инсайты в таблицах и графиках
• Строит и редактирует визуализации по запросу на естественном языке
• Ускоряет отчёты и проверку гипотез примерно на 30%
• Работает внутри BI-сервиса Yandex DataLens
• Доступен в облаке и on-premises
• Не требует знаний синтаксиса формул или кода

Построен на базе Yandex Cloud AI Studio, где также можно собирать своих ИИ-ассистентов. Первая версия фичи появится в сентябре этого года, а пока можно записаться в лист ожидания.

Реклама. ООО Яндекс.Облако. ИНН 7704458262
9👍5🔥5
🔍T-one — открытая русскоязычная модель распознавания речи, выпущенная Т-Технологиями специально для звонков и телефонии

🧠 Главное:
— Обрабатывает речь кусками по 300 мс и запоминает контекст, подходит для реального времени

— Основа — Conformer и CTC-декодер, дополнительно подключается языковая модель (5-грамм, KenLM), чтобы повысить точность

— Задержка небольшая: около 1–1.2 секунды вместе с постобработкой

— Хорошо справляется с шумом, паузами и разговорной речью по телефону (8 кГц)

— Обучена на 80 тысячах часов аудио, в том числе 6 тысяч часов — это реальные телефонные звонки

— Используется в продуктах Т-Банка

— Дает заметно лучшее качество, если подключить языковую модель

https://habr.com/ru/companies/tbank/articles/929850/
🔥1611🤩3👏2
🚀 Qwen3-Coder — новая мощная open-source модель от Alibaba для кодинга

Модель с архитектурой MoE:
- 480B параметров в общей сложности
- 35B активных параметров
- Контекст 256k, но легко масштабируется до 1M токенов

📈 Производительность:
- На уровне Claude 4 Sonnet
- Лучше или на уровне GPT-4.1 на многих задачах
- Обходит Kimi K2, DeepSeek V3 на ряде бенчмарков

🧩 Модель уже доступна:
- На HuggingFace — можно скачать и запускать
- В OpenRouter — $1/M токенов вход, $5/M выход
(в 3 раза дешевле Claude Sonnet: $3 и $15)

Попробовать бесплатно можно:
🟡Через чат: ttps://chat.qwen.ai/)
🟡GitHub link: https://github.com/QwenLM/qwen-code
🟡 Blog:https://qwenlm.github.io/blog/qwen3-coder/
🟡 Model: https://hf.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

Qwen3-Coder — это просто одна из лучших моделей для программирования, которые мы когда-либо видели.

#qwen #ml #ai #llm #Alibaba

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍97
🚀 Новинка: Code Sandbox MCP — простой интерпретатор кода для ИИ-агентов

Теперь ты можешь запускать код прямо из LLM (например, Gemini) в локальной изолированной среде, которую полностью контролируешь.

🛠 Как работает:
1. Запускается контейнер (Docker или Podman)
2. Код сохраняется во временный файл
3. Файл копируется внутрь контейнера
4. Выполняется (Python, JS и др.)
5. Вывод и ошибки считываются
6. Всё возвращается клиенту
7. Контейнер удаляется

🔗 Примеры и исходники — в блоге и на GitHub

@data_analysis_ml
🔥109👍4
🚀 Новый релиз: MegaScience

Открыт крупнейший и самый качественный датасет для постобучения моделей научному мышлению — 1.25 миллиона QA-пар!

🔬 Покрывает 7+ дисциплин: от физики до биомедицины
📚 Вопросы и ответы уровня университетских учебников
📈 Обученные на нём модели обгоняют официальные Instruct-бейзлайны

📄 Статья: https://huggingface.co/papers/2507.16812
🤖 Датасет и модели: https://huggingface.co/MegaScience
💻 Код: https://github.com/GAIR-NLP/MegaScience
🎯 Система оценки: https://github.com/GAIR-NLP/lm-open-science-evaluation

@data_analysis_ml
12🔥9👍5
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI анонсировала дату проведения DevDay.

OpenAI объявила, что ее следующая конференция для разработчиков, DevDay, состоится 6 октября 2025 года в Сан-Франциско. На мероприятии выступят Сэм Альтман и Грэг Брокман. DevDay традиционно становится площадкой для главных анонсов OpenAI, и в этом году разработчикам обещают ранний доступ к информации о будущих продуктах и технологиях.

Конференция планирует собрать более 1500 разработчиков. Регистрация на очное участие открыта в формате подачи заявок до 30 июля, а приглашения будут разосланы в середине августа. Стоимость участия составит 650 долларов. Для тех, кто не сможет присутствовать лично, будет организована прямая трансляция основной части мероприятия, а записи остальных сессий опубликуют позже.
openai.com

✔️ Proton представила Lumo: защищенный чат-бот с фокусом на приватность.

Швейцарская компания Proton, известная своим одноименным почтовым сервисом, выпустила автономного ИИ-ассистента Lumo. Чат-бот позиционируется как безопасная альтернатива продуктам от крупных технологических корпораций.

Lumo умеет обобщать документы, писать код, составлять черновики писем и отвечать на веб-запросы. Сервис работает исключительно на открытых языковых моделях, размещенных в собственных дата-центрах Proton в Европе. Вся переписка защищена сквозным шифрованием с "нулевым доступом", что не позволяет самой компании или третьим лицам читать и хранить сообщения.

Попробовать Lumo можно без регистрации через веб-клиент или мобильные приложения, но с ограничениями. Платная подписка Lumo Plus за $12.99 в месяц снимает лимиты на общение и позволяет загружать файлы большего размера.
proton.me

✔️ Google DeepMind Aeneas: открытая ИИ-система для восстановления латинских надписей.

Google DeepMind выпустила Aeneas, опенсорсный инструмент на базе ИИ, предназначенный для помощи историкам в работе с фрагментарными древними надписями. Система анализирует неполные транскрипции и изображения, после чего определяет вероятное место и дату происхождения текста, предлагает варианты недостающих слов и находит аналоги в корпусе известных надписей.

Модель, обученная на 200 000 каталогизированных текстов, является развитием более ранней системы Ithaca для греческого языка. В исследовании, опубликованном в Nature, Aeneas улучшил генерацию научных гипотез в 90% случаев, а его оценки происхождения и датировки совпали с консенсусом ученых.

Aeneas доступна бесплатно для ученых, преподавателей и сотрудников музеев.
theguardian.com

✔️ AWS закрывает свою ИИ-лабораторию в Шанхае.

Amazon Web Services объявила о закрытии своей исследовательской ИИ-лаборатории в Шанхае. В компании это решение назвали трудным, оно завершает семилетнюю историю работы центра, который занимался передовыми разработками в области машинного обучения. По словам одного из научных сотрудников, подразделение расформировывают из-за "стратегических корректировок на фоне напряженности между США и Китаем".

Лаборатория, открытая в 2018 году, была весьма продуктивной: на ее счету более 100 научных публикаций и создание популярной open-source библиотеки Deep Graph Library. В лучшие времена в ней работало более 1000 человек.
ft.com

✔️ Компания Марка Цукерберга разработала нейромоторный браслет, работающий без персональной калибровки.

Устройство, разработанное в Reality Labs представляет собой браслет, который считывает электрическую активность мышц предплечья (sEMG), напрямую декодируя двигательные намерения пользователя.

Главное достижение - разработка универсальной модели, обученной на данных тысяч людей. В отличие от аналогов, требующих длительной настройки под каждого человека, эта система работает из коробки, без предварительной калибровки под новых пользователей.

В тестах интерфейс продемонстрировал распознавание рукописного ввода со скоростью почти 21 слово в минуту, точное определение дискретных жестов (щипки, свайпы) и плавное управление курсором. При этом короткая персональная донастройка на данных конкретного пользователя может повысить точность еще на 16%.
nature.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍3🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🎙 Lex Fridman выпустил новое интервью с Demis Hassabis — CEO Google DeepMind.

🔍 В подкасте — всё, что волнует мир ИИ:
— будущее AI & AGI
— моделирование биологии и физики
— видеоигры, программирование, генерация видео
— world models и Gemini 3
— scaling laws, вычисления, P vs NP
— сложность, энергия, солнце и термояд
и многое другое.

💡 Техническое, глубокое и очень увлекательное интервью. Настоящий разговор о том, куда идёт ИИ.

📺 Смотреть на youtube
📺 Смотреть в X

@data_analysis_ml
🔥126👍3🤨1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 Сооснователь Anthropic Бен Манн:

🧠 «Вероятность того, что суперинтеллект появится в ближайшие годы — около 50%.
И это не просто спекуляция — за этим стоят данные, законы масштабирования и чёткие научные тренды».

Он подчёркивает: даже если технический прорыв случится быстро,
его влияние на общество может проявиться с задержкой — через годы.

📌 Вопрос уже не в том, "если", а "как скоро" — и что мы с этим сделаем.
👍1310🤨6🔥4🍌2🎉1
🚀 Команда Qwen только что представила новую модель: Qwen3‑235B‑A22B‑Thinking‑2507, нацеленную на глубокие рассуждения.

За последние 3 месяца модель была масштабирована и доработана специально для задач логики, математики, науки и программирования. Среди ключевых улучшений:

Улучшенные способности к рассуждению, решению задач и анализу
Повышенная точность в следовании инструкциям и использовании инструментов
Поддержка нативного 256K контекста — для полноценной работы с длинными цепочками мыслей

🧠 Модель изначально работает в режиме reasoning — включать ничего не нужно. Она самостоятельно строит длинные логические цепочки, обеспечивая максимальную глубину и точность.

🟡Hugging Face: https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507
or https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507-FP8
🟡ModelScope: https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507
or https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507-FP8
🟡API Doc: https://alibabacloud.com/help/en/model-studio/models#16ff9753e1ctz

🧩 Новый Thinking‑режим поднимает планку для reasoning‑моделей в открытом доступе.

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5🔥3
🔮 SuperDuperDB — фреймворк для создания AI-приложений, напрямую интегрированных с базами данных. Позволяет развертывать модели машинного обучения и векторные поиски прямо в MongoDB, SQL, Snowflake или Redis, избегая сложных ETL-процессов.

Вместо выгрузки данных в отдельные ML-пайплайны, вы добавляете AI-функциональность поверх существующей БД через простые Python-декораторы. Поддерживает популярные библиотеки вроде PyTorch и Hugging Face, что упрощает переход от прототипа к продакшену.

🤖 GitHub

@data_analysis_ml
🔥8👍4🥰4🤣2🤔1
Андрей Рыбинцев из Авито стал управляющим директором по ИИ

Также в компании будет сформирован новый кластер AI Experience. В этой роли вместе с командой из 900 специалистов он будет работать над развитием ассистентов на базе генеративных моделей, внедрение агентского ИИ и интеграцию ML в бизнес-процессы. Эти структурные изменения — сигнал, что компания настроена серьезно качнуть ИИ-направление.

За 10 лет в компании Рыбинцев курировал ключевые технологии: антифрод, автоматическую модерацию, IMV, A-Vibe, A-Vision. Сейчас фокус — системное масштабирование.
👍5🔥5🥱3🙏2🥰1🤔1👌1🌭1
📊 Argilla — инструмент для создания качественных датасетов под AI. Проект помогает разработчикам и экспертам совместно работать над разметкой данных для NLP, LLM и мультимодальных моделей.

Платформа предлагает удобный интерфейс для аннотирования с фильтрами, семантическим поиском и AI-подсказками. Argilla используют в Red Cross и других организациях для задач классификации, RAG и тонкой настройки моделей.

🤖 GitHub

@data_analysis_ml
11🔥4👍3
✔️ Новый крутой выпуск 3Blue1Brown о диффузионных моделях!

Популярный ютубер (совместно с Welch Labs) простыми словами и красивой анимацией объяснил, как работают генераторы изображений и видео.

40 минут — от основ до тонкостей
Для новичков + русские субтитры

P.S. Отличный вариант для первого знакомства с технологией и анимация на канале вышла реально на новый уровень!

🟠 Смотрим: тут
🟠 Смотрим в телеграм

@data_analysis_ml

#ИИ #ДиффузионныеМодели #МашинноеОбучение
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍54
🤖 Mcp-telegram* — Telegram-клиент для AI-агентов

Этот проект позволяет подключить LLM-агента к Telegram через простую оболочку. По сути, это каркас, который превращает любую LLM (через API) в полноценного Telegram-бота.

🧩 Особенности:
— Поддержка OpenAI API (можно подключить GPT-4, GPT-3.5 и др.)
— Хранение диалогов в SQLite
— История чатов и контекст сохраняются между сообщениями
— Обработка команд и markdown-разметки
— Поддержка нескольких пользователей (по Telegram ID)

📦 Используется:
— Python
python-telegram-bot
openai
sqlite3

👨‍💻 Подходит для:
— Быстрого запуска собственного GPT-бота в Telegram
— MVP-прототипов
— Экспериментов с интерфейсами тг

uv tool install mcp-telegram

🔗 GitHub

@data_analysis_ml
👍86🔥3🥱2