🐻❄️ Быстрее Pandas в 10 раз: Polars — высокопроизводительная библиотека для анализа больших данных на Python
Разработанная с нуля на языке Rust библиотека Polars объединяет в себе скорость, гибкость и богатый инструментарий для анализа больших данных на Питоне, что позволяет считать её достойной заменой популярной библиотеке Pandas.
👉 Читайте о Polars подробнее в нашей статье 👈
Разработанная с нуля на языке Rust библиотека Polars объединяет в себе скорость, гибкость и богатый инструментарий для анализа больших данных на Питоне, что позволяет считать её достойной заменой популярной библиотеке Pandas.
👉 Читайте о Polars подробнее в нашей статье 👈
👍3
🔄 GitOps Workflow: упрощенное визуальное руководство от ByteByteGo (Alex Xu)
Методология GitOps привнесла изменения в способы управления кодом и инфраструктурой, сделав Git центральным узлом для управления и автоматизации всего жизненного цикла приложений. Она основана на принципах контроля версий, совместной работы и CI/CD.
📌 Ключевые особенности:
☑️ Централизация кода, конфигураций и инфраструктуры в Git для контроля совместной работы
☑️ Декларативная система
☑️ Автоматизированная доставка кода
☑️ Неизменяемая инфраструктура
☑️ Observability и обратная связь
☑️ Безопасность и комплаенс
Методология GitOps привнесла изменения в способы управления кодом и инфраструктурой, сделав Git центральным узлом для управления и автоматизации всего жизненного цикла приложений. Она основана на принципах контроля версий, совместной работы и CI/CD.
📌 Ключевые особенности:
☑️ Централизация кода, конфигураций и инфраструктуры в Git для контроля совместной работы
☑️ Декларативная система
☑️ Автоматизированная доставка кода
☑️ Неизменяемая инфраструктура
☑️ Observability и обратная связь
☑️ Безопасность и комплаенс
❤1
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
При обучении нейросети используется градиентный спуск, метод нахождения локального минимума или максимума функции. В градиентном спуске нужно выбрать начальную точку для спуска, то есть начальные значения весов. Обычно эта точка выбирается случайно. Но от неё существенно зависит успех градиентного спуска. Поэтому веса нужно инициализировать наиболее удачным образом.
✔️Хорошее начальное приближение
Начальные значения весов должны быть далеко от плато
Иначе на первых итерациях градиентного спуска мы столкнёмся с затуханием градиента.
В целом, нужно вывести такое правило: «генерировать начальные значения весов с помощью случайных чисел из интервала [a, b]». И вот эти a и b следует найти.
❔Как это сделать?
Например, когда нам нужно сгенерировать веса между парой полносвязных слоёв и каждый слой состоит из n нейронов, то вполне можно было бы выбрать диапазон [-1/n; 1/n].
Если же в слоях разное число нейронов, то в вышеприведённом интервале n можно заменить на среднее арифметическое числа нейронов в соседних слоях.
❗️Выше было упрощённо описано правило Xavier. В оригинале веса генерируются не из такого простого интервала [-1/n; 1/n], а с помощью равномерного распределения с дисперсией 1/n. Но суть примерно такая же. Подробнее работу Xavier можно прочесть здесь.
Можно пользоваться готовой функцией из PyTorch:
conv1 = torch.nn.Conv2d(...)
torch.nn.init.xavier_uniform(conv1.weight)
Также в случае с инициализацией Xavier стоит помнить, что этот способ подходит для симметричных относительно нуля функций активации (например гиперболический тангенс).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🐍🎸 Курс Django: Портфолио разработчика
Покажем, как сделать личный сайт с анимированным портфолио, сортировкой работ по категориям на фронтенде, контактной формой, резюме и отзывами работодателей.
👉 Читать новую статью
🔗 Зеркало
Предыдущие статьи курса:
Курс Django. Часть 1: Django — что это? Обзор и установка фреймворка, структура проекта
Курс Django: Веб-приложение на основе XLSX вместо базы данных
Курс Django. Часть 2: ORM и основы работы с базами данных
Покажем, как сделать личный сайт с анимированным портфолио, сортировкой работ по категориям на фронтенде, контактной формой, резюме и отзывами работодателей.
👉 Читать новую статью
🔗 Зеркало
Предыдущие статьи курса:
Курс Django. Часть 1: Django — что это? Обзор и установка фреймворка, структура проекта
Курс Django: Веб-приложение на основе XLSX вместо базы данных
Курс Django. Часть 2: ORM и основы работы с базами данных
👍1🔥1
Команда DevJobsScanner проанализировала около 500 тыс. фронтенд-вакансий за 14 месяцев. В качестве источников использовались Linkedin, Glassdoor, RemoteOk, Dice и многие другие.
📌 Что имеем по России: React (51%) ⏩ Angular (36%) ⏩ Vue (13%).
📌 В Бельгии, например, 60% занимает Vue.js и лишь 15% — React. А в Швейцарии Angular в 2 раза популярнее, чем React.
🤩 Остальные любопытные цифры и результаты исследования вакансий — под катом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🥇 Спортивная мотивация и мотивация в IT, что общего?
Рассказываем, как использовать психологические инструменты из спорта, чтобы увеличить внутреннюю мотивацию и повысить продуктивность.
👉 Читать статью
👉 Зеркало
Рассказываем, как использовать психологические инструменты из спорта, чтобы увеличить внутреннюю мотивацию и повысить продуктивность.
👉 Читать статью
👉 Зеркало
📈 Основанная на данных из GitHub статистика включает все репозитории, созданные за последние 100 дней, с недавней активностью и более чем десятью ⭐️.
💬 Как думаете, с чем связана такая популярность Python? Наверное, с тем, что студенты и многие другие используют данный язык в качестве первого языка для обучения.
👉 Источник
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
💙 С днем любви!
В этот день проявить любовь поможет подарок, который действительно нужен.
🌿 Курсы Proglib academy – это не только знания, топовые преподаватели из МГУ, спикеры Яндекса, Revolut и Тинькофф, но и возможность начать карьеру программиста на международном рынке.
Заходи на сайт, выбирай любой курс и дари его любимому человеку.
⚡️ А по промокоду PA2024SALES15 ты получишь скидку 15% на все курсы до конца недели – https://proglib.io/w/37e301bf
В этот день проявить любовь поможет подарок, который действительно нужен.
Заходи на сайт, выбирай любой курс и дари его любимому человеку.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
🦾 Карта навыков ML-разработчиков
В январе Яндекс создал карту технических навыков, которые ML-разработчики регулярно используют в своей работе. Компания использовала для этого данные поиска и сайта Stack Overflow.
▶️ Размер навыка на карте соответствует числу посвящённых ему поисковых запросов. Чем ближе два навыка друг к другу, тем чаще они соседствуют с одними и теми же тегами в вопросах на Stack Overflow, то есть ближе контекст, в котором они применяются. Для оценки близости контекста рассчитали векторы совстречаемости каждого навыка со всеми остальными, затем нормализовали метрикой TF-IDF.
👉 Интерактивная карта находится по этой ссылке
В январе Яндекс создал карту технических навыков, которые ML-разработчики регулярно используют в своей работе. Компания использовала для этого данные поиска и сайта Stack Overflow.
▶️ Размер навыка на карте соответствует числу посвящённых ему поисковых запросов. Чем ближе два навыка друг к другу, тем чаще они соседствуют с одними и теми же тегами в вопросах на Stack Overflow, то есть ближе контекст, в котором они применяются. Для оценки близости контекста рассчитали векторы совстречаемости каждого навыка со всеми остальными, затем нормализовали метрикой TF-IDF.
👉 Интерактивная карта находится по этой ссылке
Мы готовы сгладить этот неловкий момент и подарить дополнительную скидку в 5% 🥰
Переходи и начинай учиться уже сегодня – https://proglib.io/w/247506a4
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2
🎮👨💻 15 игр, которые научат программированию
А также помогут подготовиться к техническому собеседованию, развить алгоритмическое мышление и просто провести свободное время с пользой
👉 Читать статью
А также помогут подготовиться к техническому собеседованию, развить алгоритмическое мышление и просто провести свободное время с пользой
👉 Читать статью
❤3
Forwarded from Библиотека собеса по Data Science | вопросы с собеседований
Что произойдёт, если использовать LabelEncoder с линейным алгоритмом?
▶️ Начнём с того, что такое LabelEncoder.
Это один из самых простых способов закодировать категории. Допустим, у вас есть три категории: «Лондон», «Париж» и «Москва». Тогда вы просто заменяете эти строковые значения на 0, 1 и 2.
В документации scikit-learn написано, что LabelEncoder кодирует целевые метки значениями из диапазона от 0 до n_classes-1 (где n_classes — количество классов). То есть алгоритм предлагается использовать в основном для кодирования целевых меток. Технически его, конечно, можно применять для кодирования нецелевых признаков. Но тут могут возникнуть проблемы.
✍️ Сама суть LabelEncoder способствует созданию избыточных зависимостей в данных. Например, после преобразования получилось, что по некоторому признаку значение объекта Volvo равно 6, а BMW — 1. Можно интерпретировать это как то, что Volvo в 6 раз в чём-то превосходит BMW. Однако в исходных данных таких зависимостей не было.
При работе с категориальными переменными для линейных моделей можно, например, использовать One-Hot Encoding.
#машинное_обучение
▶️ Начнём с того, что такое LabelEncoder.
Это один из самых простых способов закодировать категории. Допустим, у вас есть три категории: «Лондон», «Париж» и «Москва». Тогда вы просто заменяете эти строковые значения на 0, 1 и 2.
В документации scikit-learn написано, что LabelEncoder кодирует целевые метки значениями из диапазона от 0 до n_classes-1 (где n_classes — количество классов). То есть алгоритм предлагается использовать в основном для кодирования целевых меток. Технически его, конечно, можно применять для кодирования нецелевых признаков. Но тут могут возникнуть проблемы.
✍️ Сама суть LabelEncoder способствует созданию избыточных зависимостей в данных. Например, после преобразования получилось, что по некоторому признаку значение объекта Volvo равно 6, а BMW — 1. Можно интерпретировать это как то, что Volvo в 6 раз в чём-то превосходит BMW. Однако в исходных данных таких зависимостей не было.
При работе с категориальными переменными для линейных моделей можно, например, использовать One-Hot Encoding.
#машинное_обучение
👍1
📚 std::exception — это базовый класс для всех стандартных исключений в C++
Почему стоит наследоваться от std::exception?
• Единообразие в обработке исключений: Когда вы наследуетесь от std::exception, ваш класс исключения приобретает интерфейс, который делает его совместимым с другими стандартными исключениями
• what() метод: std::exception предоставляет важный метод what(), который возвращает строковое представление исключения. Это позволяет вам предоставлять информативные сообщения об ошибке при обработке исключений
• Легкость в поддержке кода: Если вы используете сторонние библиотеки или фреймворки, они также могут ожидать обработку исключений, производных от std::exception
• Стандартные типы исключений: std::exception имеет несколько стандартных подклассов, таких как std::runtime_error, std::logic_error и другие. Вы можете использовать эти подклассы вместо базового std::exception, чтобы более точно определить характер ошибки
Почему стоит наследоваться от std::exception?
• Единообразие в обработке исключений: Когда вы наследуетесь от std::exception, ваш класс исключения приобретает интерфейс, который делает его совместимым с другими стандартными исключениями
• what() метод: std::exception предоставляет важный метод what(), который возвращает строковое представление исключения. Это позволяет вам предоставлять информативные сообщения об ошибке при обработке исключений
• Легкость в поддержке кода: Если вы используете сторонние библиотеки или фреймворки, они также могут ожидать обработку исключений, производных от std::exception
• Стандартные типы исключений: std::exception имеет несколько стандартных подклассов, таких как std::runtime_error, std::logic_error и другие. Вы можете использовать эти подклассы вместо базового std::exception, чтобы более точно определить характер ошибки
👍3
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Media is too big
VIEW IN TELEGRAM
🪄 OpenAI выпустила модель для генерации видео по тексту
Новую text-to-video модель назвали Sora. Она способна создавать видеоролики длительностью до минуты.
⭐️ Пока Sora доступна только особым командам, которые будут её оценивать, и небольшому кругу тестировщиков.
🦄 Прикреплённое к посту видео получилось из промпта:
🔗 Посмотреть на другие примеры генераций можно по этой ссылке
Новую text-to-video модель назвали Sora. Она способна создавать видеоролики длительностью до минуты.
⭐️ Пока Sora доступна только особым командам, которые будут её оценивать, и небольшому кругу тестировщиков.
🦄 Прикреплённое к посту видео получилось из промпта:
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
🔗 Посмотреть на другие примеры генераций можно по этой ссылке
👍1🔥1
🐣Скоро начинается сезон праздников, а к ним лучше готовиться заранее
Именно поэтому мы запустили электронные подарочные сертификаты на курсы:
🎁 Выбирайте удобные номиналы от 1 000 до 10 000 руб;
🎁 Отправляйте получателю сразу или в конкретную дату;
🎁 Сертификат действует в течении года с момента покупки.
🙌 Дарите друзьям, сотрудникам, коллегам или партнёрам возможность получить новые знания и возможность профессионального роста в IT-сфере – https://proglib.io/w/3018f024
Именно поэтому мы запустили электронные подарочные сертификаты на курсы:
🎁 Выбирайте удобные номиналы от 1 000 до 10 000 руб;
🎁 Отправляйте получателю сразу или в конкретную дату;
🎁 Сертификат действует в течении года с момента покупки.
🙌 Дарите друзьям, сотрудникам, коллегам или партнёрам возможность получить новые знания и возможность профессионального роста в IT-сфере – https://proglib.io/w/3018f024
👍1
⛩️ 6 способов нестандартно войти в Айти
Стандартный способ вхождения в профессию программиста — через универ. Все, что отличается от него, уже считается нестандартным способом.
Разбираем несколько необычных способов входа в ИТ-сферу и то, какие преимущества они дают:
🛤 Роадмапы
👨💻 Знакомые айтишники
💬 Комментарии
🙌 Менторинг
🕹 Игры
⌨️ Стажировки
Стандартный способ вхождения в профессию программиста — через универ. Все, что отличается от него, уже считается нестандартным способом.
Разбираем несколько необычных способов входа в ИТ-сферу и то, какие преимущества они дают:
🛤 Роадмапы
👨💻 Знакомые айтишники
💬 Комментарии
🙌 Менторинг
🕹 Игры
⌨️ Стажировки
🔥1
Какие минимальные требования есть к специалистам в сфере Data Science?
🔹Hard skills
▪️ Писать на Python
▪️ Разбираться в алгоритмах для рекомендательных систем
▪️ Знание статестических и математических методов
▪️ Визуализация данных
🔹 Soft skills
▪️ Аналитическое и критическое мышление
▪️ Адаптивность и гибкость
▪️ Постоянное стремление к саморазвитию и обучению
▪️ Эмоциональный интеллект и решительность
Специалисты в Data Science сейчас очень востребованы, но к ним предъявляют высокие требования даже на уровне Junior.
В сферу Data Science часто переходят разработчики из смежных областей, которые пишут на Python. Если это ваш случай, однозначно рекомендуем подтянуть знания по математике, чтобы увеличить свои шансы на трудоустройство.
Посмотрите программу курса «Математика для Data Science», которая была разработана совместно с преподавателями МГУ. Курс довольно сложный, но после его прохождения, вы точно будете готовы к самым трудным заданиям на собеседованиях.
ПОСМОТРЕТЬ ПРОГРАММУ
🔹Hard skills
▪️ Писать на Python
▪️ Разбираться в алгоритмах для рекомендательных систем
▪️ Знание статестических и математических методов
▪️ Визуализация данных
🔹 Soft skills
▪️ Аналитическое и критическое мышление
▪️ Адаптивность и гибкость
▪️ Постоянное стремление к саморазвитию и обучению
▪️ Эмоциональный интеллект и решительность
Специалисты в Data Science сейчас очень востребованы, но к ним предъявляют высокие требования даже на уровне Junior.
В сферу Data Science часто переходят разработчики из смежных областей, которые пишут на Python. Если это ваш случай, однозначно рекомендуем подтянуть знания по математике, чтобы увеличить свои шансы на трудоустройство.
Посмотрите программу курса «Математика для Data Science», которая была разработана совместно с преподавателями МГУ. Курс довольно сложный, но после его прохождения, вы точно будете готовы к самым трудным заданиям на собеседованиях.
ПОСМОТРЕТЬ ПРОГРАММУ
❤1
Градиентный спуск — это наиболее распространённый метод оптимизации, используемый в машинном обучении. Он предназначен для минимизации функции потерь, позволяя тем самым модели обучаться и постепенно улучшая её предсказательную способность.
Классический градиентный спуск может быть неэффективен в некоторых случаях. Поэтому существуют его разные модификации.
В этой модификации мы подменяем вычисление градиента по всей выборке вычислением по случайной подвыборке. Подвыборку часто называют (мини) батчем. Для вычисления можно использовать и вовсе только один элемент.
Добавляет концепцию инерции в обновления параметров, позволяя «ускоряться» при спуске по направлению к минимуму. Это достигается за счёт комбинирования градиента на текущем шаге с градиентом предыдущих шагов.
Есть, например, алгоритм Adagrad. Он позволяет динамически подбирать размер шага для каждой координаты по отдельности. Также есть RMSprop — улучшение Adagrad, направленное на решение его проблемы быстрого уменьшения скорости обучения. Он адаптирует скорость обучения путём не просто складывания нормы градиентов, а их усреднения в скользящем режиме.
Сочетает в себе идеи моментума и RMSprop.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3