Proglib.academy | IT-курсы

🐻‍❄️ Быстрее Pandas в 10 раз: Polars — высокопроизводительная библиотека для анализа больших данных на Python

Разработанная с нуля на языке Rust библиотека Polars объединяет в себе скорость, гибкость и богатый инструментарий для анализа больших данных на Питоне, что позволяет считать её достойной заменой популярной библиотеке Pandas.

👉 Читайте о Polars подробнее в нашей статье 👈

👍3

706 views11:02

Proglib.academy | IT-курсы

🔄 GitOps Workflow: упрощенное визуальное руководство от ByteByteGo (Alex Xu)

Методология GitOps привнесла изменения в способы управления кодом и инфраструктурой, сделав Git центральным узлом для управления и автоматизации всего жизненного цикла приложений. Она основана на принципах контроля версий, совместной работы и CI/CD.

📌 Ключевые особенности:

☑️ Централизация кода, конфигураций и инфраструктуры в Git для контроля совместной работы
☑️ Декларативная система
☑️ Автоматизированная доставка кода
☑️ Неизменяемая инфраструктура
☑️ Observability и обратная связь
☑️ Безопасность и комплаенс

❤1

708 views11:02

Proglib.academy | IT-курсы

Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🧑

‍🎓Правильная инициализация весов нейронной сети

При обучении нейросети используется градиентный спуск, метод нахождения локального минимума или максимума функции. В градиентном спуске нужно выбрать начальную точку для спуска, то есть начальные значения весов. Обычно эта точка выбирается случайно. Но от неё существенно зависит успех градиентного спуска. Поэтому веса нужно инициализировать наиболее удачным образом.

✔️Хорошее начальное приближение

Начальные значения весов должны быть далеко от плато
Иначе на первых итерациях градиентного спуска мы столкнёмся с затуханием градиента.

В целом, нужно вывести такое правило: «генерировать начальные значения весов с помощью случайных чисел из интервала [a, b]». И вот эти a и b следует найти.

❔Как это сделать?
Например, когда нам нужно сгенерировать веса между парой полносвязных слоёв и каждый слой состоит из n нейронов, то вполне можно было бы выбрать диапазон [-1/n; 1/n].
Если же в слоях разное число нейронов, то в вышеприведённом интервале n можно заменить на среднее арифметическое числа нейронов в соседних слоях.

❗️Выше было упрощённо описано правило Xavier. В оригинале веса генерируются не из такого простого интервала [-1/n; 1/n], а с помощью равномерного распределения с дисперсией 1/n. Но суть примерно такая же. Подробнее работу Xavier можно прочесть здесь.
Можно пользоваться готовой функцией из PyTorch:




conv1 = torch.nn.Conv2d(...)
torch.nn.init.xavier_uniform(conv1.weight)

Также в случае с инициализацией Xavier стоит помнить, что этот способ подходит для симметричных относительно нуля функций активации (например гиперболический тангенс).

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

711 views11:02

Proglib.academy | IT-курсы

🐍🎸 Курс Django: Портфолио разработчика

Покажем, как сделать личный сайт с анимированным портфолио, сортировкой работ по категориям на фронтенде, контактной формой, резюме и отзывами работодателей.

👉 Читать новую статью
🔗 Зеркало

Предыдущие статьи курса:
Курс Django. Часть 1: Django — что это? Обзор и установка фреймворка, структура проекта
Курс Django: Веб-приложение на основе XLSX вместо базы данных
Курс Django. Часть 2: ORM и основы работы с базами данных

👍1🔥1

791 views11:02

Proglib.academy | IT-курсы

📊

Самые востребованные фронтенд-фреймворки в 2023 году

Команда DevJobsScanner проанализировала около 500 тыс. фронтенд-вакансий за 14 месяцев. В качестве источников использовались Linkedin, Glassdoor, RemoteOk, Dice и многие другие.

📌 Что имеем по России: React (51%) ⏩ Angular (36%) ⏩ Vue (13%).

📌 В Бельгии, например, 60% занимает Vue.js и лишь 15% — React. А в Швейцарии Angular в 2 раза популярнее, чем React.

🤩 Остальные любопытные цифры и результаты исследования вакансий — под катом.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

864 views09:02

Proglib.academy | IT-курсы

🥇 Спортивная мотивация и мотивация в IT, что общего?

Рассказываем, как использовать психологические инструменты из спорта, чтобы увеличить внутреннюю мотивацию и повысить продуктивность.

👉 Читать статью
👉 Зеркало

801 views11:02

Proglib.academy | IT-курсы

👩‍💻

Какие языки программирования наиболее популярны прямо сейчас?

📈 Основанная на данных из GitHub статистика включает все репозитории, созданные за последние 100 дней, с недавней активностью и более чем десятью ⭐️.

💬 Как думаете, с чем связана такая популярность Python? Наверное, с тем, что студенты и многие другие используют данный язык в качестве первого языка для обучения.

👉 Источник

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

780 views10:00

Proglib.academy | IT-курсы

💙 С днем любви!

В этот день проявить любовь поможет подарок, который действительно нужен.

🌿 Курсы Proglib academy – это не только знания, топовые преподаватели из МГУ, спикеры Яндекса, Revolut и Тинькофф, но и возможность начать карьеру программиста на международном рынке.

Заходи на сайт, выбирай любой курс и дари его любимому человеку.

⚡️А по промокоду PA2024SALES15 ты получишь скидку 15% на все курсы до конца недели – https://proglib.io/w/37e301bf

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔2

763 views06:01

Proglib.academy | IT-курсы

🦾 Карта навыков ML-разработчиков

В январе Яндекс создал карту технических навыков, которые ML-разработчики регулярно используют в своей работе. Компания использовала для этого данные поиска и сайта Stack Overflow.

▶️ Размер навыка на карте соответствует числу посвящённых ему поисковых запросов. Чем ближе два навыка друг к другу, тем чаще они соседствуют с одними и теми же тегами в вопросах на Stack Overflow, то есть ближе контекст, в котором они применяются. Для оценки близости контекста рассчитали векторы совстречаемости каждого навыка со всеми остальными, затем нормализовали метрикой TF-IDF.

👉 Интерактивная карта находится по этой ссылке

752 views08:31

Proglib.academy | IT-курсы

🆒 А если у тебя нет пары, то не расстраивайся.

Мы готовы сгладить этот неловкий момент и подарить дополнительную скидку в 5% 🥰

❗️ Чтобы получить дополнительную скидку переходи на сайт, оставляй заявку на обучение, сообщи нашим менеджерам кодовое слово C-3PO. И они закрепят за тобой дополнительную скидку.

Переходи и начинай учиться уже сегодня – https://proglib.io/w/247506a4

Please open Telegram to view this post

VIEW IN TELEGRAM

😁2

813 viewsedited 10:31

Proglib.academy | IT-курсы

🎮👨‍💻 15 игр, которые научат программированию

А также помогут подготовиться к техническому собеседованию, развить алгоритмическое мышление и просто провести свободное время с пользой

👉 Читать статью

❤3

827 views11:01

Proglib.academy | IT-курсы

Forwarded from Библиотека собеса по Data Science | вопросы с собеседований

Что произойдёт, если использовать LabelEncoder с линейным алгоритмом?

▶️ Начнём с того, что такое LabelEncoder.
Это один из самых простых способов закодировать категории. Допустим, у вас есть три категории: «Лондон», «Париж» и «Москва». Тогда вы просто заменяете эти строковые значения на 0, 1 и 2.

В документации scikit-learn написано, что LabelEncoder кодирует целевые метки значениями из диапазона от 0 до n_classes-1 (где n_classes — количество классов). То есть алгоритм предлагается использовать в основном для кодирования целевых меток. Технически его, конечно, можно применять для кодирования нецелевых признаков. Но тут могут возникнуть проблемы.

✍️ Сама суть LabelEncoder способствует созданию избыточных зависимостей в данных. Например, после преобразования получилось, что по некоторому признаку значение объекта Volvo равно 6, а BMW — 1. Можно интерпретировать это как то, что Volvo в 6 раз в чём-то превосходит BMW. Однако в исходных данных таких зависимостей не было.

При работе с категориальными переменными для линейных моделей можно, например, использовать One-Hot Encoding.

#машинное_обучение

👍1

764 views12:02

Proglib.academy | IT-курсы

📚 std::exception — это базовый класс для всех стандартных исключений в C++

Почему стоит наследоваться от std::exception?

• Единообразие в обработке исключений: Когда вы наследуетесь от std::exception, ваш класс исключения приобретает интерфейс, который делает его совместимым с другими стандартными исключениями

• what() метод: std::exception предоставляет важный метод what(), который возвращает строковое представление исключения. Это позволяет вам предоставлять информативные сообщения об ошибке при обработке исключений

• Легкость в поддержке кода: Если вы используете сторонние библиотеки или фреймворки, они также могут ожидать обработку исключений, производных от std::exception

• Стандартные типы исключений: std::exception имеет несколько стандартных подклассов, таких как std::runtime_error, std::logic_error и другие. Вы можете использовать эти подклассы вместо базового std::exception, чтобы более точно определить характер ошибки

👍3

776 views09:02

Proglib.academy | IT-курсы

Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

0:59

Media is too big

VIEW IN TELEGRAM

🪄 OpenAI выпустила модель для генерации видео по тексту

Новую text-to-video модель назвали Sora. Она способна создавать видеоролики длительностью до минуты.

⭐️ Пока Sora доступна только особым командам, которые будут её оценивать, и небольшому кругу тестировщиков.

🦄 Прикреплённое к посту видео получилось из промпта:

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

🔗 Посмотреть на другие примеры генераций можно по этой ссылке

👍1🔥1

622 views13:03

Proglib.academy | IT-курсы

🐣Скоро начинается сезон праздников, а к ним лучше готовиться заранее

Именно поэтому мы запустили электронные подарочные сертификаты на курсы:

🎁 Выбирайте удобные номиналы от 1 000 до 10 000 руб;

🎁 Отправляйте получателю сразу или в конкретную дату;

🎁 Сертификат действует в течении года с момента покупки.

🙌 Дарите друзьям, сотрудникам, коллегам или партнёрам возможность получить новые знания и возможность профессионального роста в IT-сфере – https://proglib.io/w/3018f024

👍1

630 views06:01

Proglib.academy | IT-курсы

⛩️ 6 способов нестандартно войти в Айти

Стандартный способ вхождения в профессию программиста — через универ. Все, что отличается от него, уже считается нестандартным способом.

Разбираем несколько необычных способов входа в ИТ-сферу и то, какие преимущества они дают:

🛤 Роадмапы
👨‍💻 Знакомые айтишники
💬 Комментарии
🙌 Менторинг
🕹 Игры
⌨️ Стажировки

🔥1

695 views10:02

Proglib.academy | IT-курсы

Какие минимальные требования есть к специалистам в сфере Data Science?

🔹Hard skills

▪️ Писать на Python
▪️ Разбираться в алгоритмах для рекомендательных систем
▪️ Знание статестических и математических методов
▪️ Визуализация данных

🔹 Soft skills

▪️ Аналитическое и критическое мышление
▪️ Адаптивность и гибкость
▪️ Постоянное стремление к саморазвитию и обучению
▪️ Эмоциональный интеллект и решительность

Специалисты в Data Science сейчас очень востребованы, но к ним предъявляют высокие требования даже на уровне Junior.

В сферу Data Science часто переходят разработчики из смежных областей, которые пишут на Python. Если это ваш случай, однозначно рекомендуем подтянуть знания по математике, чтобы увеличить свои шансы на трудоустройство.

Посмотрите программу курса «Математика для Data Science», которая была разработана совместно с преподавателями МГУ. Курс довольно сложный, но после его прохождения, вы точно будете готовы к самым трудным заданиям на собеседованиях.

ПОСМОТРЕТЬ ПРОГРАММУ

❤1

591 views12:01

Proglib.academy | IT-курсы

🎓

Метод градиентного спуска: обзор модификаций

Градиентный спуск — это наиболее распространённый метод оптимизации, используемый в машинном обучении. Он предназначен для минимизации функции потерь, позволяя тем самым модели обучаться и постепенно улучшая её предсказательную способность.

Классический градиентный спуск может быть неэффективен в некоторых случаях. Поэтому существуют его разные модификации.

1️⃣

Стохастический градиентный спуск (SGD)
В этой модификации мы подменяем вычисление градиента по всей выборке вычислением по случайной подвыборке. Подвыборку часто называют (мини) батчем. Для вычисления можно использовать и вовсе только один элемент.

2️⃣

Метод инерции (momentum)
Добавляет концепцию инерции в обновления параметров, позволяя «ускоряться» при спуске по направлению к минимуму. Это достигается за счёт комбинирования градиента на текущем шаге с градиентом предыдущих шагов.

3️⃣Адаптивный подбор размера шага
Есть, например, алгоритм Adagrad. Он позволяет динамически подбирать размер шага для каждой координаты по отдельности. Также есть RMSprop — улучшение Adagrad, направленное на решение его проблемы быстрого уменьшения скорости обучения. Он адаптирует скорость обучения путём не просто складывания нормы градиентов, а их усреднения в скользящем режиме.

4️⃣

Adam (Adaptive Moment Estimation)
Сочетает в себе идеи моментума и RMSprop.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

699 views12:01

About

Blog

Apps

Platform