Математика Дата саентиста

🔝 Вступительный экзамен МГУ биофак 1975 год - Задача по планиметрии

📌 источник

@data_math

👍10❤1👎1🔥1

4.7K views09:01

⚡️ Шпаргалка по статистике

Если у вас предстоят собеседования или экзамены по статистике в университете, вот полезная полная шпора. В ней рассмотрены ключевые понятия, такие как выборка, распределение, мода, медиана и другие.

Также приведено практическое занятие по статистическому наблюдению на примере производственной компании.

@data_math

❤10🔥5👍2😭1

4.69K viewsedited 14:46

Математика Дата саентиста

Shpargalki_po_GEOMETRII_Shkola_Pifagora.pdf

1.6 MB

Shpargalki_po_PROIZVODNOJ_Shkola_Pifagora.pdf

1.1 MB

Shpargalki_po_TEKSTOVYM_ZADAChAM_Shkola_Pifagora.pdf

2.2 MB

Shpargalki_po_TEORII_VEROYaTNOSTEJ_Shkola_Pifagora.pdf

1.7 MB

Shpargalki_po_TRIGONOMETRII_Shkola_Pifagora.pdf

366.6 KB

⚡️ Полезные шпаргалки по математике

- Шпаргалки по ТРИГОНОМЕТРИИ
- Шпаргалки по ТЕОРИИ ВЕРОЯТНОСТЕЙ
- Шпаргалки по ПРОИЗВОДНОЙ
- Шпаргалки по ГЕОМЕТРИИ
- Шпаргалки по ТЕКСТОВЫМ ЗАДАЧАМ

@data_math

👍10👎8❤4🔥3😁1

11.9K views10:04

Математика Дата саентиста

Forwarded from Анализ данных (Data analysis)

♠️ Бесплатный курс от MIT: Теория и Аналитика покера

В этом курсе от MIT подробно рассматривается теория покера, математика покера и применение покерной аналитики в управлении инвестициями и трейдинге.

▪️Материалы Курса

@data_analysis_ml

🔥13👍7❤3👎1😁1

3.45K views14:01

Математика Дата саентиста

A_V_Pechinkin_O_I_Teskin_G_M_Tsvetkova_i_dr_Teoria_veroyatnostey.pdf

24.3 MB

Теория вероятностей Учеб. для вузов. - 3-е изд.
А.В. Печинкин, О.И. Тескин, Г.М. Цветкова и др. (2004)

Несмотря на большое количество учебных руководств по теории вероятностей, в том числе появившихся и в последние годы, в настоящее время отсутствует учебник, предназначенный для технических университетов с усиленной математической подготовкой. Отличительной особенностью данной книги является взвешенное сочетание математической строгости изложения основ теории вероятностей с прикладной направленностью задач и примеров, иллюстрирующих теоретические положения. Каждую главу книги завершает набор большого числа контрольных вопросов, типовых примеров и задач для самостоятельного решения.
Содержание учебника соответствует курсу лекций, который авторы читают в МГТУ им. Н.Э.Баумана.
Для студентов технических университетов. Может быть полезен преподавателям и аспирантам.

@data_math

👍15🔥4💩2🥰1

4.58K views09:10

Математика Дата саентиста

👩‍💻

Great Great Numbers (GGN) — это простая библиотека на C для работы с целыми числами произвольной длины. Она поддерживает арифметические операции (сложение, вычитание, умножение и деление) над числами, которые превышают стандартные типы данных.

🌟 GGN позволяет работать со знаковыми числами, выполнять инициализацию больших чисел с помощью строк и предоставляет утилиты для вывода и сравнения. Библиотека ориентирована на разработчиков, которым необходима работа с большими числами в приложениях на C

🔐 Лицензия: MIT

▪️GitHub

@data_math

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10🔥2🥱2

4.57K views10:01

Математика Дата саентиста

Forwarded from Machinelearning

🌟 OpenMathInstruct-2: математический датасет и набор моделей от NVIDIA.

OpenMathInstruct-2 состоит из 14 млн. пар "вопрос-решение" (примерно 600 тысяч уникальных вопросов) и является одним из крупнейших общедоступных наборов данных для обучения LLM в математике.

Набор данных создан на основе Llama-3.1-405B-Instruct путем синтеза решений для существующих вопросов из наборов данных MATH и GSM8K и генерации новых задач и решений.

Результаты абляционных экспериментов, которые проводились для поиска оптимальных параметров синтеза, показали, что:

🟢формат решения имеет значение, причем чрезмерно подробные решения негативно сказываются на производительности модели;

🟢данные, сгенерированные сильной моделью-учителем, превосходят по качеству данные, полученные от более слабой модели;

🟢процесс обучения устойчив к наличию до 20% решений низкого качества;

🟢разнообразие вопросов имеет решающее значение для масштабирования данных.

Итоговые данные, включенные в датасет прошли тщательную деконтаминацию с использованием конвейера lm-sys и ручной проверки на поиск дубликатов с тестовыми наборами данных.

OpenMathInstruct-2 показал высокую эффективность при обучении LLM.

Модель Llama3.1-8B-Base, обученная на OpenMathInstruct-2, превзошла Llama3.1-8B-Instruct на 15,9% по точности на наборе данных MATH, а OpenMath2-Llama3.1-70B обошла Llama3.1-70B-Instruct на 3,9%.

Датасет выпущен в 3-х размерностях: полный набор (примерно 7.5 GB) и уменьшенные версии train_1M (640 Mb), train_2M (1.3 Gb) и train_5M (3.1 Gb).

▶️ Модели, дообученные на этом датасете:

🟠

OpenMath2-Llama3.1-70B, в формате Nemo, квантованные версии GGUF (от 3-bit до 8-bit);

🟠

OpenMath2-Llama3.1-8B, в формате Nemo, квантованные версии GGUF (от 2-bit до 8-bit).

📌Лицензирование датасета : CC-BY-4.0 License.

📌Лицензирование моделей: Llama 3.1 Community License.

🟡

Набор моделей

🟡

Arxiv

🟡

Датасет

@ai_machinelearning_big_data

#AI #ML #LLM #MATH #NVIDIA #Dataset

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥3

5.42K views14:37

Математика Дата саентиста

RamdaJS

1. Функциональное программирование с RamdaJS. Основы и блок Математики
2. Обработка строк в RamdaJS и поток вызова функций
3. Методы объектов в RamdaJS и пара полезных функций
4. Логические операции в RamdaJS
5. Функции первой необходимости в RamdaJS
6. Трансдюсеры в RamdaJS - скидка на дорогие операции
7. Линзы в RamdaJS как абстракция по работе со структурами данных

#video #js

https://www.youtube.com/watch?v=XkNynJBruKY&list=PLiZoB8JBsdzkqsILPvz5jw2-OJ5rw6ukH

👍2🔥2❤1

4.08K views11:00

Математика Дата саентиста

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Объясняем математику простым способом

@data_math

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥31❤5👍1🥰1

4.65K views14:02

Математика Дата саентиста

👩‍💻

tensor.h — представляет собой минималистичную библиотеку для работы с тензорами на языке C. Основной задачей является выполнение математических операций с многомерными массивами без сложных зависимостей.

Те́нзор (от лат. tensus, «напряжённый») — объект линейной алгебры, линейно преобразующий элементы одного линейного пространства в элементы другого. Частными случаями тензоров являются скаляры, векторы, билинейные формы и т. п.

💡 В README содержится подробное руководство, где описаны примеры использования и базовые операции с тензорами, что облегчает начальную настройку и работу с библиотекой. Это делает её удобной для численных вычислений и задач машинного обучения.

▪️Github

@data_math

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10🔥5❤2🥴1

4.16K viewsedited 14:42

Математика Дата саентиста

Forwarded from Machinelearning

0:45

This media is not supported in your browser

VIEW IN TELEGRAM

🌟 SegVLAD: метод визуального распознавания мест.

SegVLAD - метод для решения задач визуального распознавания мест (VPR) в условиях значительных изменений ракурса. SegVLAD использует сегментацию изображений, разделяя их на значимые объекты ("вещи"). Вместо того, чтобы кодировать все изображение целиком, как это делают традиционные методы VPR, SegVLAD кодирует и ищет соответствия на уровне отдельных сегментов.

Основа архитектуры SegVLAD - набор перекрывающихся подграфов сегментов SuperSegments. Подграфы создаются путем расширения окрестности каждого сегмента, учитывая информацию о соседних сегментах, полученную с помощью триангуляции Делоне.

Для каждого SuperSegment вычисляется дескриптор с использованием метода VLAD (Vector of Locally Aggregated Descriptors).

VLAD агрегирует локальные дескрипторы пикселей, полученные с помощью предварительно обученного DINOv2, который способен извлекать высокоуровневые признаки, инвариантные к различным условиям съемки.

SegVLAD обучался на наборах данных, включающих как уличные, так и внутренние среды: Pitts30k, AmsterTime, Mapillary Street Level Sequences (MSLS), SF-XL, Revisted Oxford5K, Revisited Paris6k, Baidu Mall, 17Places, InsideOut и VPAir.

Тесты SegVLAD показали, что метод превосходит современные VPR, особенно на датасетах с большими изменениями точки обзора. SegVLAD является универсальным и может быть использован с различными методами сегментации изображений и кодировщиками признаков.

Проект программной реализации метода SegVLAD - Revisit Anything.

▶️Локальный запуск с набором данных 17 places из датасета AnyLock (~ 32GB) и моделями SAM+DINO:

⚠️ Перед запуском подготовьте данные датасета согласно структуре и укажите путь к данным в place_rec_global_config.py/

# Шаг1 - выбор метода (DINO/SAM):
python place_rec_SAM_DINO.py --dataset <> --method DINO/SAM

# Шаг2 - генерация VLAD cluster center (опционально):
python vlad_c_centers_pt_gen.py --dataset <>

# Шаг 3 - извлечение PCA:
place_rec_global_any_dataset_pca_extraction.py --dataset <> --experiment <> --vocab-vlad <domain/map>

# Шаг 4 - запуск SegVLAD: 
place_rec_main.py --dataset <> --experiment <> --vocab-vlad <domain/map> --save_results <True/False>

📌Лицензирование : BSD-3-Clause license.

🟡

Страница проекта

🟡

Arxiv

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #SAM #DINO #VPR #SegVLAD

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥3❤2