Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.25K photos
113 videos
64 files
4.67K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🧠 Сколько времени нужно, чтобы «успокоить» ум?

Своими наблюдениями делится один из самых известных специалистов по искусственному интеллекту, сооснователь OpenAI Андрей Карпаты.

Возвращаюсь после экспериментального двухнедельного детокса от интернета. Основной вывод заключается в том, что я не осознавал, насколько неспокойным может стать ум при перенасыщении проблемами/информацией (как взболтанная жидкость), и примерно двух недель достаточно, чтобы перейти в гораздо более спокойное состояние.

Меня поразило, как перенасыщенный мозг автоматически выталкивает на поверхность сознания проблемы, создавая состояние постоянной тревоги и нервозности. После некоторого времени в устоявшемся состоянии эта активность просто... прекращается. Вы можете сидеть, и ваш мозг не переходит сразу в режим решения проблем, он просто остаётся в тишине. Ничего не происходит.

Я уверен, это может показаться многим странным, но я думаю, что очень давно не был в таком подмножестве пространства состояний «динамики мозга», и приятно знать, что 1) это состояние существует, и 2) его можно посетить, если хочешь, но путь туда занимает несколько недель.
14🔥53
🐼 Pandas: от хаоса к красоте кода

Работа с pandas.DataFrame может превратиться в неловкую кучу старого (не очень) доброго спагетти-кода. Автор делится своим опытом и рассказывает, какие практики старается соблюдать.

Этого не стоит делать:
▫️не изменяйте DataFrame слишком сильно внутри функций;
не пишите методы, которые изменяют DataFrame и не возвращают его.

Этого стоит придерживаться:
создавайте новые объекты вместо того, чтобы изменять исходный DataFrame, и не забывайте делать глубокую копию, когда это необходимо;
выполняйте только операции аналогичного уровня внутри одной функции;
разрабатывайте функции с учётом возможности переиспользования;
тестируйте свои функции.

🔗 Ссылка на статью
👏8😁2
🤖 Матричные вычисления, лежащие в основе Transformers

Автор YouTube-канала StatQuest with Josh Starmer Джош Стармер опубликовал новое отличное видео, объясняющее матричные вычисления, на базе которых строится одна из самых известных архитектур нейросетей.

Джош пошагово, подробно и на примерах рассказывает про эмбеддинги слов (их векторные представления), позиционное кодирование, матрицы Q, K и V.

🔗 Смотреть видео
👍61
⚛️ Квантовое машинное обучение: курсы и материалы

🖥️ Открытый курс квантового машинного обучения
Курс от сообщества ODS. Содержит лекции разных уровней сложности и глубины. Все объяснения подкрепляются кодом.

🖥️ Забавный комикс о смысле квантовых вычислений
Развенчивает популярные представления о том, что такое квантовый компьютер.

🖥️ Руководство по квантовому машинному обучению для начинающих
Объясняет основные понятия из этой сферы. Автор постепенно добавляет в руководство больше контента.

🖥️ Курс CERN по квантовым вычислениям по-русски
Нужно зарегистрироваться, чтобы получить доступ ко всем видео-лекциям и конспектам.

🖥️ CERN Introductory Course
Англоязычная версия вводного курса по квантовым вычислениям.

🖥️ QuantumAlgorithms.org
Здесь лежат конспекты лекций по квантовым алгоритмам и квантовому машинному обучению.
👍7
👇 Коллеги, в связи с последними событиями, делимся своими идеями нейросетей👇
😁23👏2
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
🧑‍💻 Обучение GPT-2 на языке C

Андрей Карпаты в режиме детокса от соцсетей времени зря не терял — на днях он опубликовал реализацию языковой модели целиком на C. Хватило ему примерно тысячи строк.

Хотели когда-нибудь обучить LLM на чистом C без 245MB PyTorch и 107MB cPython? Не хотели? Ну, вы всё равно можете!


В общем, все желающие могут ознакомиться с кодом по этой ссылке 👈
🔥8
Хардкорный курс по математике для тех, кто правда любит математику!

Начать с вводных занятий можно здесь, ответив всего на 4 вопроса – https://proglib.io/w/584771bd

Что вас ждет:

– Вводный урок от CPO курса

– Лекции с преподавателями ВМК МГУ по темам: теория множеств, непрерывность функции, основные формулы комбинаторики, матрицы и операции над ними, градиентный спуск

– Практические задания для закрепления материала и ссылки на дополнительные материалы.

⚡️ Переходите и начинайте учиться уже сегодня – https://proglib.io/w/584771bd
Please open Telegram to view this post
VIEW IN TELEGRAM
3🤩1
Напишите линейную регрессию на Python с нуля

Это один из самых простых алгоритмов. Он включает следующие шаги:
1️⃣ Инициализация параметров.
2️⃣ Вычисление предсказаний.
3️⃣ Вычисление функции потерь.
4️⃣ Обновление параметров с помощью градиентного спуска.
5️⃣ Повторение до сходимости.
import numpy as np

class LinearRegression:
def __init__(self, learning_rate=0.01, n_iters=1000):
self.learning_rate = learning_rate
self.n_iters = n_iters

def fit(self, X, y):
n_samples, n_features = X.shape
self.weights = np.zeros(n_features)
self.bias = 0

for _ in range(self.n_iters):
model_preds = self.predict(X)
dw = (1 / n_samples) * np.dot(X.T, (model_preds - y))
db = (1 / n_samples) * np.sum(model_preds - y)

self.weights -= self.learning_rate * dw
self.bias -= self.learning_rate * db

def predict(self, X):
return np.dot(X, self.weights) + self.bias


#машинное_обучение
#программирование
Please open Telegram to view this post
VIEW IN TELEGRAM
👍164
🔥 Практическое видео по работе с базовым набором DS-инструментов

Автор YouTube-канала Onur Baltacı сделал 7.5-часовое видео с введением в основные библиотеки и инструменты для науки о данных и машинного обучения. Предназначено для начинающих.

Таймкоды:
🔸 Программирование на Python
🔸 Анализ данных с Pandas
🔸 Анализ данных с NumPy
🔸 Визуализация данных с Matplotlib
🔸 Визуализация данных с Seaborn
🔸 Визуализация данных с Plotly
🔸 Проект по анализу данных
🔸 Машинное обучение со Scikit-learn
🔸 Проект по машинному обучению

🔗 Ссылка на ролик
6👍3
🤖🛠️ 4 полезных инструмента для работы с ИИ: RAGFlow, The Pipe, UFO и SWE-agent

В новой статье рассматриваем 4 инструмента, которые расширяют возможности разработчика: от платформ для работы с документами до агентов, способных исправлять ошибки в коде.

🔗 Читать статью
🔗 Зеркало
👍821