Математика Дата саентиста – Telegram

Математика Дата саентиста

14K subscribers

447 photos

170 videos

40 files

392 links

@workakkk - админ

@data_analysis_ml - ds

https://gosuslugi.ru/snet/67b55bb01a1c5a6fb6ecc946

Download Telegram

About

Blog

Apps

Platform

Математика Дата саентиста

14K subscribers

Математика Дата саентиста

Forwarded from Machinelearning

⚡

Speculative Cascades — как ускорить работу LLM

Google Research придумали новый способ сделать большие языковые модели быстрее и дешевле.

Что это такое:

🔹

Каскады
Сначала отвечает маленькая модель. Если задача слишком сложная - подключается большая. Так экономятся ресурсы, но качество может прыгать.

🔹

Спекулятивная декодировка
Маленькая модель угадывает сразу несколько слов вперёд. Большая быстро проверяет данные и подтверждает. Скорость выше, но большая модель всё равно тратит много ресурсов.

🟢

Speculative Cascades
Это комбинация: маленькая модель иногда отвечает полностью сама, а иногда используется как ускоритель для большой. В итоге получаем меньше затрат, больше скорости и то же качество.

🔥

Что показали тесты (тестили на Gemma, T5):
- быстрее, чем обычная спекулятивная декодировка
- дешевле и качественнее, чем каскады
- удобнее настраивать баланс «скорость ↔ качество»

При том же уровне качества, что и у спекулятивной декодировки, новый метод работает быстрее (генерирует больше токенов за один вызов большой модели).

А в задачах математических рассуждений получен явный апгрейд по скорости при сохранении или даже улучшении качества.

LLM всё чаще используются в поиске, чатах, ассистентах. Чтобы они реально были полезными, их нужно ускорять и удешевлять. *Speculative cascades* помогают это сделать без потери качества.

🔗 Подробнее: https://research.google/blog/speculative-cascades-a-hybrid-approach-for-smarter-faster-llm-inference/

@ai_machinelearning_big_data

#AI #LLM #Inference #SpeculativeDecoding #Cascades #GoogleResearch

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍3💩2💔1

3.64K views12:03

Математика Дата саентиста

🌟 Lumina-DiMOO

Lumina-DiMOO — это передовая модель, использующая дискретную диффузию для обработки мультимодальных задач, таких как генерация изображений и их редактирование.

Она демонстрирует высокую эффективность и превосходит существующие решения по множеству показателей.

🚀Основные моменты:
- Унифицированная архитектура для различных модальностей.
- Поддержка текстово-изображенческой генерации и понимания.
- Увеличенная скорость выборки с помощью кэширования.
- Достижение состояния искусства в нескольких бенчмарках.

📌 GitHub: https://github.com/Alpha-VLLM/Lumina-DiMOO

#python

GitHub - Alpha-VLLM/Lumina-DiMOO: Lumina-DiMOO - An Open-Sourced Multi-Modal Large Diffusion Language Model

Lumina-DiMOO - An Open-Sourced Multi-Modal Large Diffusion Language Model - Alpha-VLLM/Lumina-DiMOO

💩1

3.02K views21:10

Математика Дата саентиста

Forwarded from DevOps

This media is not supported in your browser

VIEW IN TELEGRAM

🎮 DOOMscrolling: The Game

Думскроллинг превратился в игру! Энтузиаст сделал пародию на DOOM, где вместо стрелялки — бесконечная лента новостей.

⚡ Как играть:
- листаешь вниз/вверх → так двигается персонаж
- на пути — монстры, оружие с апгрейдами, ловушки и даже стена огня, которая подгоняет вперёд
- сверху накладываются реальные заголовки из RSS

В итоге получается безумный микс: привычный думскроллинг, но теперь он реально «убивает».

👉 Попробовать: https://gisnep.com/doomscroll/?ref=ironicsans.ghost.io

❤‍🔥4

3.21K views11:00

Математика Дата саентиста

This media is not supported in your browser

VIEW IN TELEGRAM

🔍 Интерактивный визуальный гид по математике и алгоритмам через концепты геймдева

Это отличный ресурс, где сложные идеи показываются через визуализацию и примеры из геймдева.

💡 Особое внимание главам про теорию графов
- визуализация узлов, рёбер, путей
- алгоритмы поиска: DFS, BFS, A*
- минимальные остовные деревья и прочие структурные концепты

Если хочешь, могу собрать подборку самых полезных страниц/статей с Red Blob Games про графы, которые стоит сохранить.

https://redblobgames.com

❤12😁9👍5

4.31K views09:02

Математика Дата саентиста

📐 Генерируйте пошаговую LaTeX-документацию прямо из Python-кода с помощью handcalcs

Показывать промежуточные шаги расчёта — критично для отчётов и верификации: так стейкхолдеры видят логику, а не только итоговое число. Писать LaTeX вручную для каждого шага — долго и рутинно. handcalcs снимает эту боль: он автоматически превращает ваш Python-код в понятные математические выкладки (с формулами и подстановками), готовые для вставки в отчёт, ноутбук или публикацию.

Зачем это нужно
• инженерные записки и техотчёты с проверяемыми шагами
• документация к моделям данных и расчётам в DS/ML
• учебные материалы и туториалы с «развёрнутыми» формулами

Как это выглядит на практике


# pip install handcalcs

from math import pi
from handcalcs.decorator import handcalc

# handcalcs возьмёт выражения внутри функции и сгенерирует пошаговые формулы
@handcalc()
def circle_area(r):
    A = pi * r**2
    return A

latex_output = circle_area(3)   # возвращает LaTeX со всеми шагами: A = π·r^2 → подстановка → результат
print(latex_output)

# Пример для инженерной механики
@handcalc()
def bending_stress(F, L, b, h):
    I = b * h**3 / 12
    M = F * L
    y = h / 2
    sigma = M * y / I
    return sigma

print(bending_stress(F=1500, L=2.0, b=0.05, h=0.02))

Подсказки к использованию
• держите формулы в чистом виде: переменные и выражения — внутри функций, без «магических» чисел
• для отчётов экспортируйте LaTeX-строки в файл и подключайте в шаблон (или вставляйте в Markdown с MathJax)
• фиксируйте входные параметры: handcalcs красиво покажет подстановку значений и все промежуточные шаги

Итог: вы пишете расчёты один раз на Python, а читатели получают понятные формулы со всеми шагами — быстро, прозрачно и без ручного набора LaTeX.

❤12👍7🔥4🤝3

5.18K views12:01

Математика Дата саентиста

This media is not supported in your browser

VIEW IN TELEGRAM

Ряд Тейлора - это мощный инструмент в математическом анализе, который позволяет представить гладкую функцию в виде бесконечной суммы её производных в одной точке.

По сути, он даёт способ приближать сложные функции с помощью многочленов. Каждый член ряда включает производную более высокого порядка, вычисленную в выбранной точке, и умноженную на соответствующую степень переменной.

Вблизи этой точки многочлен Тейлора точно повторяет поведение исходной функции, и чем больше членов ряда учитывать, тем точнее становится приближение. Эта концепция является фундаментальной как в теоретической, так и в прикладной математике - от решения дифференциальных уравнений до работы алгоритмов в численном анализе и физике.

❤‍🔥34❤5

4.77K views10:40

Математика Дата саентиста

✔️

Математика в машинном обучении» - бесплатный курс, который предназначен для тех, кто хочет углубить свои знания в области математики, необходимой для понимания и применения методов машинного обучения и искусственного интеллекта.

Этот курс охватывает ключевые математические концепции, лежащие в основе современных алгоритмов машинного обучения, таких как линейная алгебра, теория вероятностей, статистика и оптимизация.

Курс

Please open Telegram to view this post

VIEW IN TELEGRAM

❤17👍6🔥4

4.5K views14:30

Математика Дата саентиста

✔️ ИИ помог Теренсу Тао найти контрпример в математике

Один из величайших математиков современности, Теренс Тао, использовал искусственный интеллект, чтобы решить задачу на MathOverflow о последовательности наименьших общих кратных.

У него было теоретическое подозрение, что ответ отрицательный, но требовались конкретные числовые параметры для построения контрпримера. Сначала Тао просил ИИ сгенерировать Python-код для поиска, но из-за неверных параметров и долгого времени выполнения этот путь оказался неэффективным.

Затем он перешёл к пошаговому алгоритму: ИИ выполнял эвристические расчёты, помогая сузить диапазон параметров. В итоге удалось получить рабочие значения, которые Тао проверил самостоятельно с помощью короткого Python-скрипта, также созданного ИИ.

Такая стратегия позволила сэкономить часы ручного кодирования и отладки: ИИ не только ускорил поиск, но и выявил несколько ошибок в начальных рассуждениях. Этот случай показывает, как современные системы могут становиться реальными ассистентами даже в фундаментальной математике.
mathstodon

Please open Telegram to view this post

VIEW IN TELEGRAM

👍29❤16🔥6😐4👎2

4.02K views11:50

Математика Дата саентиста

🔥 Успех в IT = скорость + знания + окружение

Здесь ты найдёшь всё это — коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: https://t.iss.one/+EPEFXp67QfIyMjMy
Python: https://t.iss.one/+cq7O4sOHldY1ZTIy
Linux: t.iss.one/linuxacademiya
Собеседования DS: t.iss.one/machinelearning_interview
C++ t.iss.one/cpluspluc
Docker: t.iss.one/DevopsDocker
Хакинг: t.iss.one/linuxkalii
Devops: t.iss.one/DevOPSitsec
Data Science: t.iss.one/data_analysis_ml
Javascript: t.iss.one/javascriptv
C#: t.iss.one/csharp_1001_notes
Java: t.iss.one/java_library
Базы данных: t.iss.one/sqlhub
Python собеседования: t.iss.one/python_job_interview
Мобильная разработка: t.iss.one/mobdevelop
Golang: t.iss.one/Golang_google
React: t.iss.one/react_tg
Rust: t.iss.one/rust_code
ИИ: t.iss.one/vistehno
PHP: t.iss.one/phpshka
Android: t.iss.one/android_its
Frontend: t.iss.one/front
Big Data: t.iss.one/bigdatai
МАТЕМАТИКА: t.iss.one/data_math
Kubernets: t.iss.one/kubernetc
Разработка игр: https://t.iss.one/gamedev
Haskell: t.iss.one/haskell_tg
Физика: t.iss.one/fizmat

💼 Папка с вакансиями: t.iss.one/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.iss.one/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.iss.one/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.iss.one/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.iss.one/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.iss.one/memes_prog
🇬🇧Английский: t.iss.one/english_forprogrammers
🧠ИИ: t.iss.one/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.iss.one/addlist/BkskQciUW_FhNjEy

Подпишись, если хочешь быть в числе тех, кого зовут в топовые проекты!

❤2

3.73K views11:20

Математика Дата саентиста

🚀

Крутая новость в области термоядерной энергии

Учёные из MIT создали прорывную гибридную модель - сочетание искусственного интеллекта + физики, которая прогнозирует поведение плазмы в термоядерных реакторах и делает будущие функционирующие установки более надёжными.

🔥 Особо важный момент: модель умеет предсказывать, как ведёт себя сверхгорячая плазма во время остановки (выключения/снижения мощности), это один из самых опасных моментов работы реактора, когда могут происходить разрушительные возмущения.

В отличие от обычных ИИ-моделей, эта требует гораздо меньше тренировочных данных, но остаётся очень точной.

Учёные также разработали алгоритм, который превращает прогнозы модели в конкретные инструкции по управлению плазмой: например, как менять силу магнитов или температуру, чтобы плазма оставалась стабильной и безопасно “загасла”.

🟢

Новость: https://news.mit.edu/2025/new-prediction-model-could-improve-reliability-fusion-power-plants-1007

@data_math

Please open Telegram to view this post

VIEW IN TELEGRAM

❤9👍8🔥3👎2

4.07K viewsedited 13:46

Математика Дата саентиста

LLM берет золото на олимпиаде по астрофизике

Исследователи проверили, как современные большие языковые модели (LLM) справятся с задачами Международной олимпиады по астрономии и астрофизике (IOAA) за 2022–2025 годы.
Результаты впечатляют.

🧠 Тестировались модели:
GPT-5, OpenAI o3, Gemini 2.5 Pro, Claude 4.1 Opus и Claude 4 Sonnet.

📊 Что показали:
- GPT-5 и Gemini 2.5 Pro набрали 85–88 % - это уровень золотой медали .
- Остальные модели показали результат в диапазоне 48–76 %.
- Особенно сильны GPT-5 в анализе данных и Gemini в теории.

💡 Почему это важно:
- LLM впервые достигли уровня лучших олимпиадников по астрофизике.
- Это демонстрирует, что модели уже решают не только текстовые, но и научные, количественные и логические задачи.
- Потенциал таких систем — помощь в научных исследованиях, автоматическом анализе данных и обучении.

⚠️ Ограничения:
- Олимпиадные задачи не охватывают весь спектр реальной астрофизики.
- Возможны «угадывания» и шаблонные решения.
- Неясно, насколько стабильно поведение моделей при реальных данных с шумом и погрешностями.

🟢

Подробности: arxiv.org/abs/2510.05016

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍4😁1

3.32K views15:43

Математика Дата саентиста

This media is not supported in your browser

VIEW IN TELEGRAM

✔️

RAG - как GPT перестал галлюцинировать и научился думать с источниками

Классические LLM ограничены собственным контекстом: они выдают только то, что успели "запомнить" при обучении.
RAG (Retrieval-Augmented Generation) ломает эту границу — модель получает доступ к внешним данным и способна подгружать нужные факты *в момент запроса*.

Механика проста, но мощна:
LLM → делает эмбеддинг запроса → ищет близкие документы в векторном хранилище → получает top-k контексты → формирует ответ на их основе.
В итоге модель не "вспоминает", а всегда рассуждает на свежих данных.

Где это реально работает:
- в Copilot для кода, когда модель тянет сниппеты из корпоративных репозиториев;
- в внутренних чатах компаний - поиск по Confluence, Notion, Jira и документации;
- в R&D и науке - динамическая генерация отчётов с ссылками на реальные статьи;
- в юридических и медтех-системах, где каждый ответ должен быть подтверждён источником.

RAG - это уже не просто “надстройка над GPT”.
Это новая архитектура, где память отделена от рассуждения, и ИИ получает навык работы с контекстом, как человек с поисковиком.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10❤3👏2🔥1😁1

2.39K views11:04

Математика Дата саентиста

Elementary.Linear.Algebra.pdf

Elementary Linear Algebra (Eng ver)
Авторы: Howard Anton, Anton Kaul (2019)

Авторы предоставляют простое изложение линейной алгебры, которое подходит для студентов первого курса бакалавриата. Цель учебника состоит в том, чтобы как можно более подробно объяснить основы линейной алгебры. Знания матанализа не являются обязательным условием для начала чтения, но есть четко обозначенные упражнения и примеры для студентов, изучавших математический анализ.

🔥13❤6🥰2

2.74K views16:03

Математика Дата саентиста

📄 Nanonets-OCR2-3B - новая модель для интеллектуального OCR

Модель от Nanonets на базе Qwen2.5-VL-3B умеет не просто распознавать текст, а превращать изображение документа в структурированный Markdown: с таблицами, формулами, подписями и даже схемами.

🔍 Что умеет

- Распознаёт формулы и преобразует их в LaTeX
- Понимает таблицы и сохраняет структуру в Markdown или HTML
- Выделяет чекбоксы и радиокнопки (☐ / ☑ / ☒)
- Распознаёт подписи, водяные знаки, изображения
- Может описать картинки внутри документа с помощью <img>
-Поддерживает рукописные тексты и разные языки
- Для схем и блок-схем генерирует Mermaid-код
- Умеет отвечать на вопросы по документу (Visual QA)

👉 huggingface.co/nanonets/Nanonets-OCR2-3B

👍8❤5

3.17K views12:57

Математика Дата саентиста

🧠 Могут ли мультимодальные модели действительно понимать инструменты?

Новая работа проверяет, способны ли модели действительно понимать физические инструменты, а не просто узнавать их по картинке.

📷 В задаче модели показывают фото и просят выбрать нужный инструмент с номером.
Датасет включает 1 000 пар изображение + текст и три уровня сложности:
1. Базовое распознавание инструмента;
2. Понимание ограничений (например, работает ли он, цел ли);
3. Конструирование инструмента из других предметов.

🧩 Условия:
- Можно использовать только предметы на фото;
- Ответ - номер инструмента или None.

👨‍🔬 Результаты:
- Люди: ~90 %
- Топ-модели: ~63 %
- Внутренние бэкенды Vision-Language-Action моделей — < 15 %.

Типичные ошибки:
- Считают сломанный инструмент рабочим;
- Путают похожие кабели и порты.

🔧 Немного помогает масштаб — примерно с 10 B параметров появляется базовое “чувство инструмента”.
Метод chain-of-thought даёт небольшой прирост,
а vision-centric пайплайн (распознавание объектов + рассуждение по вырезкам) улучшает самые трудные случаи.

💡 Главное открытие: современные мультимодальные модели знают названия предметов,
но не понимают, как инструменты работают.
Этот бенчмарк даёт чёткий ориентир, где они пока “проваливаются”.

📘 Cтатья: https://arxiv.org/abs/2510.09507

❤5🔥5👏3

3.4K views18:02

Математика Дата саентиста

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

🔥 Парадоксы теории вероятностей
ВМК МГУ. Ульянов В.В.

источник

❤14🔥8👍6🥰1

3.17K views13:02