🙌 Делимся вебинарами, которые прошли у нас в этом году:
🔹Стратегии трудоустройства в международную IT-компанию
Специалисты BigTech компаний рассказывали о своем опыте трудоустройства. Делились советами по поиску вакансий, составлению резюме и прохождению технических собеседований.
🔹Какие знания в области математики требуются специалистам в Machine Learning и Data Science?
Сооснователь и CPO Wale рассказывал о своем карьерном пути, о том как развивать математическое мышление и как улучшать качество продукта с помощью математических методов.
🔹Разбор задач из интервью в российские и международные компании на позицию Data Science
Разбирали задачи с реальных интервью в российские и международные компании. Практиковались в решении задач. Учились тестировать статистические гипотезы для A/B тестов.
🔹Очередь с приоритетом из курса «Алгоритмы и структуры данных»
Преподаватель курса «Алгоритмы и структуры данных» рассказывал, какие бывают алгоритмы, что такое двоичная куча, глубина кучи, индексация и тд.
🔹Краткое введение в A/B тестирование и его применение в Data Science Рассказывали об основных методах A/B тестирования и их применении на реальных примерах финтех продуктов.
🔹NP-трудные задачи: почему их плохо решают
Рассматривали примеры NP-трудных задач и задачи, связанные с числами Рамсея. Узнали как перейти от постановки задач к программированию, и найти минимальный размер множества для их оценки.
🔹Графы: алгоритмы и структуры данных на Python
Как графы представляются в коде, что такое топологическая сортировка и где она бывает полезна.
🔹Собеседование на разработчика: разбор задач и ошибок
Рассказывали, как проходить технические собеседования. Разбирали распространенные ошибки в коде, а также как правильно подходить к задачам, тестировать решения и избегать распространенных заблуждений на собеседованиях.
👉 А если вы хотите еще больше полезного контента, переходите на сайт – https://proglib.io/w/ba3afbf5
Там можно получить записи ранних вебинаров, а также бесплатно начать любой из курсов!
🔹Стратегии трудоустройства в международную IT-компанию
Специалисты BigTech компаний рассказывали о своем опыте трудоустройства. Делились советами по поиску вакансий, составлению резюме и прохождению технических собеседований.
🔹Какие знания в области математики требуются специалистам в Machine Learning и Data Science?
Сооснователь и CPO Wale рассказывал о своем карьерном пути, о том как развивать математическое мышление и как улучшать качество продукта с помощью математических методов.
🔹Разбор задач из интервью в российские и международные компании на позицию Data Science
Разбирали задачи с реальных интервью в российские и международные компании. Практиковались в решении задач. Учились тестировать статистические гипотезы для A/B тестов.
🔹Очередь с приоритетом из курса «Алгоритмы и структуры данных»
Преподаватель курса «Алгоритмы и структуры данных» рассказывал, какие бывают алгоритмы, что такое двоичная куча, глубина кучи, индексация и тд.
🔹Краткое введение в A/B тестирование и его применение в Data Science Рассказывали об основных методах A/B тестирования и их применении на реальных примерах финтех продуктов.
🔹NP-трудные задачи: почему их плохо решают
Рассматривали примеры NP-трудных задач и задачи, связанные с числами Рамсея. Узнали как перейти от постановки задач к программированию, и найти минимальный размер множества для их оценки.
🔹Графы: алгоритмы и структуры данных на Python
Как графы представляются в коде, что такое топологическая сортировка и где она бывает полезна.
🔹Собеседование на разработчика: разбор задач и ошибок
Рассказывали, как проходить технические собеседования. Разбирали распространенные ошибки в коде, а также как правильно подходить к задачам, тестировать решения и избегать распространенных заблуждений на собеседованиях.
👉 А если вы хотите еще больше полезного контента, переходите на сайт – https://proglib.io/w/ba3afbf5
Там можно получить записи ранних вебинаров, а также бесплатно начать любой из курсов!
🔥5
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
cs229_2018_cheatsheet.pdf
1.3 MB
✏️Шпаргалка по основам машинного обучения с формулами и графиками
В шпаргалке собраны:
▫️основные алгоритмы (от линейной регрессии до нейросетей);
▫️метрики;
▫️способы валидации и регуляризации;
▫️базовые понятия из теории вероятностей и комбинаторики;
▫️матричные операции.
Всё на 16 страницах. Подойдёт, чтобы освежить память перед собеседованием.
🔗Шпаргалка находится по этой ссылке
В шпаргалке собраны:
▫️основные алгоритмы (от линейной регрессии до нейросетей);
▫️метрики;
▫️способы валидации и регуляризации;
▫️базовые понятия из теории вероятностей и комбинаторики;
▫️матричные операции.
Всё на 16 страницах. Подойдёт, чтобы освежить память перед собеседованием.
🔗Шпаргалка находится по этой ссылке
👍2❤1
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
🐍⚙️ Python или Rust: что выбрать для анализа данных и машинного обучения
Хоть Python давно стал основным языком машинного обучения и анализа данных, у него есть конкуренты. На этот раз поговорим про Rust. Он гораздо сложнее Python, но у него есть два важных преимущества — высокая производительность, сопоставимая с C/C++, и надёжный механизм обеспечения безопасности. В статье сравниваем два языка подробнее.
👉Читать статью
Хоть Python давно стал основным языком машинного обучения и анализа данных, у него есть конкуренты. На этот раз поговорим про Rust. Он гораздо сложнее Python, но у него есть два важных преимущества — высокая производительность, сопоставимая с C/C++, и надёжный механизм обеспечения безопасности. В статье сравниваем два языка подробнее.
👉Читать статью
👍1
🎉За последнее время к нам прибавилось много новых подписчиков, давайте знакомиться!
👨💻 Proglib Academy – это онлайн-школа по программированию, которая помогает начать путь в IT или прокачать навыки опытным разработчикам.
Курсы для продвинутых:
▪️Математика для Data Science
▪️Алгоритмы и структуры данных
▪️Архитектуры и шаблоны проектирования
Курсы для начинающих:
▪️Основы программирования на Python
▪️Frontend Basic: принцип работы современного веба
Proglib Academy – проект от медиа «Библиотека программиста». Это сообщество из 800 000 разработчиков, многие их них начинали свой путь в IT вместе с нами! Кстати, буквально неделю назад медиа исполнилось 10 лет🌟
Библиотека программиста – это источник образовательного контента в IT-сфере. Оставайтесь с нами, мы регулярно проводим вебинары на разные темы с опытными разработчиками, а также планируем запуск новых полезных образовательных продуктов!
👨💻 Proglib Academy – это онлайн-школа по программированию, которая помогает начать путь в IT или прокачать навыки опытным разработчикам.
Курсы для продвинутых:
▪️Математика для Data Science
▪️Алгоритмы и структуры данных
▪️Архитектуры и шаблоны проектирования
Курсы для начинающих:
▪️Основы программирования на Python
▪️Frontend Basic: принцип работы современного веба
Proglib Academy – проект от медиа «Библиотека программиста». Это сообщество из 800 000 разработчиков, многие их них начинали свой путь в IT вместе с нами! Кстати, буквально неделю назад медиа исполнилось 10 лет🌟
Библиотека программиста – это источник образовательного контента в IT-сфере. Оставайтесь с нами, мы регулярно проводим вебинары на разные темы с опытными разработчиками, а также планируем запуск новых полезных образовательных продуктов!
👍3❤1
Делимся подборкой из 5 лучших статей для тех, кто начинает свой путь в Data Science
🔹Решаем задачи машинного обучения с помощью алгоритма градиентного бустинга
Градиентный бустинг (Gradient Boosting) – один из самых эффективных инструментов для решения задач машинного обучения, в особенности на соревнованиях Kaggle. Чтобы научиться правильно его применять, разберем подробнее лежащие в основе алгоритма процессы.
🔹Наивный байесовский алгоритм классификации: преимущества и недостатки
Наивный байесовский классификатор (Naive Bayes classifier) – это очень популярный в машинном обучении алгоритм, который в основном используется для получения базовой точности набора данных. Изучим его преимущества и недостатки, а также реализацию на языке Python.
🔹Метод k-ближайших соседей (k-nearest neighbour)
Метод k-ближайших соседей (k Nearest Neighbors, или kNN) – популярный алгоритм классификации, который используется в разных типах задач машинного обучения. Наравне с деревом решений это один из самых понятных подходов к классификации.
🔹Вариационные автоэнкодеры (VAE) для чайников – пошаговое руководство
Практическое руководство в стиле "сделай сам" с работающим кодом создания и обучения VAE для лиц знаменитостей на Keras.
🔹Генеративная состязательная сеть (GAN) для чайников – пошаговое руководство
Лучшее руководство для новичков по пониманию, созданию и обучению GAN с надежным кодом на Python.
🔹Решаем задачи машинного обучения с помощью алгоритма градиентного бустинга
Градиентный бустинг (Gradient Boosting) – один из самых эффективных инструментов для решения задач машинного обучения, в особенности на соревнованиях Kaggle. Чтобы научиться правильно его применять, разберем подробнее лежащие в основе алгоритма процессы.
🔹Наивный байесовский алгоритм классификации: преимущества и недостатки
Наивный байесовский классификатор (Naive Bayes classifier) – это очень популярный в машинном обучении алгоритм, который в основном используется для получения базовой точности набора данных. Изучим его преимущества и недостатки, а также реализацию на языке Python.
🔹Метод k-ближайших соседей (k-nearest neighbour)
Метод k-ближайших соседей (k Nearest Neighbors, или kNN) – популярный алгоритм классификации, который используется в разных типах задач машинного обучения. Наравне с деревом решений это один из самых понятных подходов к классификации.
🔹Вариационные автоэнкодеры (VAE) для чайников – пошаговое руководство
Практическое руководство в стиле "сделай сам" с работающим кодом создания и обучения VAE для лиц знаменитостей на Keras.
🔹Генеративная состязательная сеть (GAN) для чайников – пошаговое руководство
Лучшее руководство для новичков по пониманию, созданию и обучению GAN с надежным кодом на Python.
Библиотека программиста
🤖 Решаем задачи машинного обучения с помощью алгоритма градиентного бустинга
Градиентный бустинг (Gradient Boosting) – один из самых эффективных инструментов для решения задач машинного обучения, в особенности на соревнованиях Kaggle. Чтобы научиться правильно его применять, разберем подробнее лежащие в основе алгоритма процессы.
❤1
🎅 Новый год – отличное время для старта!
🎄Новый год начинается с подарков, а лучший подарок для себя – новые знания! Потому что ну а когда начинать учиться новому, если не в новом году. Выбирайте курс, оставляйте заявку и менеджер вас проконсультирует – https://proglib.io/w/584eda69
📚 Начать всегда можно с вводных занятий, чтобы познакомиться с преподавателями и форматом обучения.
Конечно, советуем обратить внимание на наши самые популярные курсы:
– Математика для Data Science
– Алгоритмы и структуры данных
🔥 Все цены на сайте уже включают скидку 35%, поэтому не упустите возможность зайти на курс по самой выгодной цене.
☺️ Доступ бессрочный, поэтому учиться вы сможете в своем темпе.
👉 Если вы сомневаетесь в пользе обучения для своего профессионального трека, оставляете заявку. Менеджер поможет разобраться с этим и любым другим вопросом – https://proglib.io/w/584eda69
🫶 Всех с наступающим новым годом!
🎄Новый год начинается с подарков, а лучший подарок для себя – новые знания! Потому что ну а когда начинать учиться новому, если не в новом году. Выбирайте курс, оставляйте заявку и менеджер вас проконсультирует – https://proglib.io/w/584eda69
📚 Начать всегда можно с вводных занятий, чтобы познакомиться с преподавателями и форматом обучения.
Конечно, советуем обратить внимание на наши самые популярные курсы:
– Математика для Data Science
– Алгоритмы и структуры данных
🔥 Все цены на сайте уже включают скидку 35%, поэтому не упустите возможность зайти на курс по самой выгодной цене.
☺️ Доступ бессрочный, поэтому учиться вы сможете в своем темпе.
👉 Если вы сомневаетесь в пользе обучения для своего профессионального трека, оставляете заявку. Менеджер поможет разобраться с этим и любым другим вопросом – https://proglib.io/w/584eda69
🫶 Всех с наступающим новым годом!
👍1
🏆 Собрали топ-10 Python-библиотек 2023 года
С 2015 года ребята из компании Tryolabs выпускают списки лучших библиотек для Python. Это новый топ за 2023 год. Критерии отбора неизвестны, но посмотреть всё равно интересно — можно найти что-то полезное для себя.
🔸LiteLLM — обеспечивает бесшовную интеграцию с различными языковыми моделями, позволяя использовать унифицированный формат как для ввода, так и для вывода вне зависимости от применяемой LLM.
🔸PyApp — упрощает распространение и установку Python-приложений. Это достигается за счёт встраивания Python в самоустанавливающийся пакет, совместимый со всеми операционными системами.
🔸Taipy — позволяет дата-сайентистам создавать интерактивный Web UI для ML-продуктов.
🔸MLX — это библиотека от Apple для машинного обучения на процессорах Apple Silicon.
🔸Unstructured — набор инструментов для предварительной обработки текста.
🔸ZenML и AutoMLOps — два мощных инструмента для создания MLOps-пайплайнов.
🔸WhisperX — библиотека для распознавания речи, способная обнаружить нескольких говорящих и менее склонная к галлюцинациям.
🔸AutoGen — позволяет создавать LLM-приложения с несколькими агентами, способными общаться друг с другом для решения задач.
🔸Guardrails — помогает заставить LLM возвращать структурированные, качественные ответы определённого типа.
🔸Temporian — библиотека для простой и эффективной предобработки и фича-инжиниринга временных данных в Python.
С 2015 года ребята из компании Tryolabs выпускают списки лучших библиотек для Python. Это новый топ за 2023 год. Критерии отбора неизвестны, но посмотреть всё равно интересно — можно найти что-то полезное для себя.
🔸LiteLLM — обеспечивает бесшовную интеграцию с различными языковыми моделями, позволяя использовать унифицированный формат как для ввода, так и для вывода вне зависимости от применяемой LLM.
🔸PyApp — упрощает распространение и установку Python-приложений. Это достигается за счёт встраивания Python в самоустанавливающийся пакет, совместимый со всеми операционными системами.
🔸Taipy — позволяет дата-сайентистам создавать интерактивный Web UI для ML-продуктов.
🔸MLX — это библиотека от Apple для машинного обучения на процессорах Apple Silicon.
🔸Unstructured — набор инструментов для предварительной обработки текста.
🔸ZenML и AutoMLOps — два мощных инструмента для создания MLOps-пайплайнов.
🔸WhisperX — библиотека для распознавания речи, способная обнаружить нескольких говорящих и менее склонная к галлюцинациям.
🔸AutoGen — позволяет создавать LLM-приложения с несколькими агентами, способными общаться друг с другом для решения задач.
🔸Guardrails — помогает заставить LLM возвращать структурированные, качественные ответы определённого типа.
🔸Temporian — библиотека для простой и эффективной предобработки и фича-инжиниринга временных данных в Python.
В чём суть логистической регрессии
Логистическую регрессию относят к линейным моделям и применяют для задачи классификации. Регрессией она называется потому, что предсказываются тут не сами классы, а вещественные числа — логиты.
👉 Логистическая регрессия позволяет создать такую линейную модель, которая предсказывает число, связанное с вероятностью принадлежности к определённому классу, но с диапазоном значений от минус бесконечности до плюс бесконечности. Это число и есть логит, или логарифм отношения вероятности положительного события к отрицательному. Из него нетрудно через сигмоидную функцию вывести саму вероятность — число в диапазоне от нуля до единицы.
✍️ Пример: допустим, для некоторого объекта мы получили предсказание 0.8. В зависимости от выбранного порога мы принимаем решение о том, отнести этот объект к положительному классу или нет. Если порог был равен 0.6, то мы относим объект к положительному классу.
👉 Для оптимизации используется метод максимального правдоподобия.
Логистическую регрессию относят к линейным моделям и применяют для задачи классификации. Регрессией она называется потому, что предсказываются тут не сами классы, а вещественные числа — логиты.
👉 Логистическая регрессия позволяет создать такую линейную модель, которая предсказывает число, связанное с вероятностью принадлежности к определённому классу, но с диапазоном значений от минус бесконечности до плюс бесконечности. Это число и есть логит, или логарифм отношения вероятности положительного события к отрицательному. Из него нетрудно через сигмоидную функцию вывести саму вероятность — число в диапазоне от нуля до единицы.
✍️ Пример: допустим, для некоторого объекта мы получили предсказание 0.8. В зависимости от выбранного порога мы принимаем решение о том, отнести этот объект к положительному классу или нет. Если порог был равен 0.6, то мы относим объект к положительному классу.
👉 Для оптимизации используется метод максимального правдоподобия.
👍2👎1😁1
Forwarded from Книги для дата сайентистов | Data Science
This media is not supported in the widget
VIEW IN TELEGRAM
🔥5👍1
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
🤖 Наиболее заметные ИИ-релизы 2023 года
На Reddit поделились картинкой, которая наглядно показывает, как много всего случилось в ИИ-отрасли за прошедший год.
🌷 Март был месяцем продвинутых чат-ботов: вышли GPT-4 и Google Bard.
🐇 В апреле Илон Маск объявил о создании нового ИИ-стартапа X.AI, который в результате релизнул чат-бота Grok.
🌿 В мае стало известно о французском стартапе Mistral AI, который затем представил опенсорсные большие языковые модели.
🌤️ Июнь запомнился выходом мультимодальной Runway Gen-2, которая генерирует видео по текстовому промпту.
☀️ В июле вышла LLaMa-2 — одна из самых мощных языковых моделей в открытом доступе.
🍂 В сентябре представили третью версию DALL-E и интегрировали её с ChatGPT.
🍁 В ноябре был большой анонс OpenAI, на котором Сэм Альтман рассказал про кастомные GPT.
❄️ В декабре Google представила свою главную ИИ-модель Gemini.
С интересом ждём, что же нам покажет наступающий 2024 год✨
На Reddit поделились картинкой, которая наглядно показывает, как много всего случилось в ИИ-отрасли за прошедший год.
🌷 Март был месяцем продвинутых чат-ботов: вышли GPT-4 и Google Bard.
🐇 В апреле Илон Маск объявил о создании нового ИИ-стартапа X.AI, который в результате релизнул чат-бота Grok.
🌿 В мае стало известно о французском стартапе Mistral AI, который затем представил опенсорсные большие языковые модели.
🌤️ Июнь запомнился выходом мультимодальной Runway Gen-2, которая генерирует видео по текстовому промпту.
☀️ В июле вышла LLaMa-2 — одна из самых мощных языковых моделей в открытом доступе.
🍂 В сентябре представили третью версию DALL-E и интегрировали её с ChatGPT.
🍁 В ноябре был большой анонс OpenAI, на котором Сэм Альтман рассказал про кастомные GPT.
❄️ В декабре Google представила свою главную ИИ-модель Gemini.
С интересом ждём, что же нам покажет наступающий 2024 год✨
👍3
😺🐙✅ Как разобраться в Git: краткая инструкция для джунов
Расскажем, как Git хранит данные, отслеживает изменения и позволяет разработчикам управлять историей коммитов.
Расскажем, как Git хранит данные, отслеживает изменения и позволяет разработчикам управлять историей коммитов.
🔥4❤1
Больше половины программистов страдают профессиональным выгоранием. Здесь может спасти отпуск. Но как понять, когда он нужен? В статье рассматривается 12 признаков, указывающих на то, что вам нужен отдых.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2👎1
Forwarded from Библиотека программиста | программирование, кодинг, разработка
🎄🎁 10 абсурдных подарков программисту на Новый год
Мечтаете подарить что-то эдакое своему другу-айтишнику? Как насчет масла для клавиатуры, специальных AR-очков или симулятора случайных сбоев в сети?
💬 В комментарии пишите свои варианты абсурдных подарков👇
Мечтаете подарить что-то эдакое своему другу-айтишнику? Как насчет масла для клавиатуры, специальных AR-очков или симулятора случайных сбоев в сети?
💬 В комментарии пишите свои варианты абсурдных подарков👇
😁2👎1
🏖️ Чек лист идеального отдыха: 5 психологических техник расслабления
Измотаны бесконечной работой и не можете расслабиться? Попробуйте 5 психологических техник — от глубокого дыхания до визуализации пляжа — которые помогут насладиться заслуженным отдыхом.
Читать статью
Измотаны бесконечной работой и не можете расслабиться? Попробуйте 5 психологических техник — от глубокого дыхания до визуализации пляжа — которые помогут насладиться заслуженным отдыхом.
Читать статью
👍3❤1
🌟 Длинные праздники не повод откладывать учебу
Пока все доедают новогодние салаты, наши студенты продолжают свою учебу. В чатике учеников курса «Математика для Data Science» постоянно идут обсуждения разных математических задачек и новых тем 🙌🏻
Пока все доедают новогодние салаты, наши студенты продолжают свою учебу. В чатике учеников курса «Математика для Data Science» постоянно идут обсуждения разных математических задачек и новых тем 🙌🏻