Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🧠 Сколько времени нужно, чтобы «успокоить» ум?

Своими наблюдениями делится один из самых известных специалистов по искусственному интеллекту, сооснователь OpenAI Андрей Карпаты.

Возвращаюсь после экспериментального двухнедельного детокса от интернета. Основной вывод заключается в том, что я не осознавал, насколько неспокойным может стать ум при перенасыщении проблемами/информацией (как взболтанная жидкость), и примерно двух недель достаточно, чтобы перейти в гораздо более спокойное состояние.

Меня поразило, как перенасыщенный мозг автоматически выталкивает на поверхность сознания проблемы, создавая состояние постоянной тревоги и нервозности. После некоторого времени в устоявшемся состоянии эта активность просто... прекращается. Вы можете сидеть, и ваш мозг не переходит сразу в режим решения проблем, он просто остаётся в тишине. Ничего не происходит.

Я уверен, это может показаться многим странным, но я думаю, что очень давно не был в таком подмножестве пространства состояний «динамики мозга», и приятно знать, что 1) это состояние существует, и 2) его можно посетить, если хочешь, но путь туда занимает несколько недель.

❤14🔥5⚡3

2.94K views18:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🐼 Pandas: от хаоса к красоте кода

Работа с pandas.DataFrame может превратиться в неловкую кучу старого (не очень) доброго спагетти-кода. Автор делится своим опытом и рассказывает, какие практики старается соблюдать.

❌ Этого не стоит делать:
▫️не изменяйте DataFrame слишком сильно внутри функций;
◽не пишите методы, которые изменяют DataFrame и не возвращают его.

✅ Этого стоит придерживаться:
◽создавайте новые объекты вместо того, чтобы изменять исходный DataFrame, и не забывайте делать глубокую копию, когда это необходимо;
◽выполняйте только операции аналогичного уровня внутри одной функции;
◽разрабатывайте функции с учётом возможности переиспользования;
◽тестируйте свои функции.

🔗 Ссылка на статью

👏8😁2

3.11K views07:08

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

😿 Том был первым, кто потерял работу из-за ИИ

🌚17😁10😢7🥱1💯1

3.23K views18:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🤖 Матричные вычисления, лежащие в основе Transformers

Автор YouTube-канала StatQuest with Josh Starmer Джош Стармер опубликовал новое отличное видео, объясняющее матричные вычисления, на базе которых строится одна из самых известных архитектур нейросетей.

Джош пошагово, подробно и на примерах рассказывает про эмбеддинги слов (их векторные представления), позиционное кодирование, матрицы Q, K и V.

🔗 Смотреть видео

YouTube

The matrix math behind transformer neural networks, one step at a time!!!

Transformers, the neural network architecture behind ChatGPT, do a lot of math. However, this math can be done quickly using matrix math because GPUs are optimized for it. Matrix math is also used when we code neural networks, so learning how ChatGPT does…

👍6❤1

3.08K views07:11

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

⚛️ Квантовое машинное обучение: курсы и материалы

🖥️ Открытый курс квантового машинного обучения
Курс от сообщества ODS. Содержит лекции разных уровней сложности и глубины. Все объяснения подкрепляются кодом.

🖥️ Забавный комикс о смысле квантовых вычислений
Развенчивает популярные представления о том, что такое квантовый компьютер.

🖥️ Руководство по квантовому машинному обучению для начинающих
Объясняет основные понятия из этой сферы. Автор постепенно добавляет в руководство больше контента.

🖥️ Курс CERN по квантовым вычислениям по-русски
Нужно зарегистрироваться, чтобы получить доступ ко всем видео-лекциям и конспектам.

🖥️ CERN Introductory Course
Англоязычная версия вводного курса по квантовым вычислениям.

🖥️ QuantumAlgorithms.org
Здесь лежат конспекты лекций по квантовым алгоритмам и квантовому машинному обучению.

👍7

3.18K viewsedited 11:03

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

👇 Коллеги, в связи с последними событиями, делимся своими идеями нейросетей👇

😁23👏2

2.54K views18:03

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

2.68K views20:01

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🧑‍💻 Обучение GPT-2 на языке C

Андрей Карпаты в режиме детокса от соцсетей времени зря не терял — на днях он опубликовал реализацию языковой модели целиком на C. Хватило ему примерно тысячи строк.

Хотели когда-нибудь обучить LLM на чистом C без 245MB PyTorch и 107MB cPython? Не хотели? Ну, вы всё равно можете!

В общем, все желающие могут ознакомиться с кодом по этой ссылке 👈

🔥8

2.63K views07:11

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека нейросетей | ChatGPT, Midjourney, DeepSeek, Sora

This media is not supported in the widget

VIEW IN TELEGRAM

🤩4👾3

2.02K views11:03

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Хардкорный курс по математике для тех, кто правда любит математику!

Начать с вводных занятий можно здесь, ответив всего на 4 вопроса – https://proglib.io/w/584771bd

Что вас ждет:

– Вводный урок от CPO курса

– Лекции с преподавателями ВМК МГУ по темам: теория множеств, непрерывность функции, основные формулы комбинаторики, матрицы и операции над ними, градиентный спуск

– Практические задания для закрепления материала и ссылки на дополнительные материалы.

⚡️ Переходите и начинайте учиться уже сегодня – https://proglib.io/w/584771bd

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🤩1

2.68K views11:34

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека собеса по Data Science | вопросы с собеседований

Напишите линейную регрессию на Python с нуля

Это один из самых простых алгоритмов. Он включает следующие шаги:
1️⃣ Инициализация параметров.
2️⃣ Вычисление предсказаний.
3️⃣ Вычисление функции потерь.
4️⃣ Обновление параметров с помощью градиентного спуска.
5️⃣ Повторение до сходимости.

import numpy as np

class LinearRegression:
    def __init__(self, learning_rate=0.01, n_iters=1000):
        self.learning_rate = learning_rate
        self.n_iters = n_iters

    def fit(self, X, y):
        n_samples, n_features = X.shape
        self.weights = np.zeros(n_features)
        self.bias = 0

        for _ in range(self.n_iters):
            model_preds = self.predict(X)
            dw = (1 / n_samples) * np.dot(X.T, (model_preds - y))
            db = (1 / n_samples) * np.sum(model_preds - y)

            self.weights -= self.learning_rate * dw
            self.bias -= self.learning_rate * db

    def predict(self, X):
        return np.dot(X, self.weights) + self.bias

#машинное_обучение
#программирование

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16❤4

2.71K views18:25

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🔥 Практическое видео по работе с базовым набором DS-инструментов

Автор YouTube-канала Onur Baltacı сделал 7.5-часовое видео с введением в основные библиотеки и инструменты для науки о данных и машинного обучения. Предназначено для начинающих.

Таймкоды:
🔸 Программирование на Python
🔸 Анализ данных с Pandas
🔸 Анализ данных с NumPy
🔸 Визуализация данных с Matplotlib
🔸 Визуализация данных с Seaborn
🔸 Визуализация данных с Plotly
🔸 Проект по анализу данных
🔸 Машинное обучение со Scikit-learn
🔸 Проект по машинному обучению

🔗 Ссылка на ролик

⚡6👍3

3.09K views07:11

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🤖🛠️ 4 полезных инструмента для работы с ИИ: RAGFlow, The Pipe, UFO и SWE-agent

В новой статье рассматриваем 4 инструмента, которые расширяют возможности разработчика: от платформ для работы с документами до агентов, способных исправлять ошибки в коде.

🔗 Читать статью
🔗 Зеркало

👍8⚡2❤1

20K views11:04

About

Blog

Apps

Platform