📊 Построение и отбор признаков. Часть 2: feature selection
Мы уже знаем, что такое признаки и почему они важны в моделях машинного обучения. Попробуем разобраться со следующей после построения “фич” техникой – их отбором.
https://proglib.io/sh/XxDRvJwC1j
Мы уже знаем, что такое признаки и почему они важны в моделях машинного обучения. Попробуем разобраться со следующей после построения “фич” техникой – их отбором.
https://proglib.io/sh/XxDRvJwC1j
👍1
Учиться чему-либо бывает непросто: многие откладывают обучение, не могут выделить на него время, теряются в количестве информации или, наоборот, не могут найти актуальные источники. Команда «Библиотеки программиста» хотела бы исследовать вопрос для дальнейшего развития проекта и посему просим вас выделить пару минут своего времени на гугл форму: https://forms.gle/qVJEULRbbHTJTzYr6
Google Docs
Чему бы вы хотели научиться?
Мы в активном поиске идей для образовательных продуктов и будем рады узнать ваши пожелания по обучению.
«Лаборатория Касперского» ищет крутых специалистов по направлению System Analysis в команду.
System analyst (KasperskyOS, TrustZone/TEE) — откликайтесь, если у вас есть опыт работы в качестве системного аналитика требований в проектах разработки программного обеспечения в сфере информационной безопасности (от 2 лет), а также опыт разработки спецификаций технических требований к программным продуктам.
System Analyst (SDK) — подойдет специалисту с опытом работы в качестве системного аналитика в проектах разработки программных продуктов или информационных систем (от 1 года), пониманием C++ на уровне чтения кода и опытом программирования на Python или других скриптовых языках.
Переходите по ссылкам — там вы получите подробную информацию о вакансиях и сможете присоединиться к команде лучших экспертов.
System analyst (KasperskyOS, TrustZone/TEE) — откликайтесь, если у вас есть опыт работы в качестве системного аналитика требований в проектах разработки программного обеспечения в сфере информационной безопасности (от 2 лет), а также опыт разработки спецификаций технических требований к программным продуктам.
System Analyst (SDK) — подойдет специалисту с опытом работы в качестве системного аналитика в проектах разработки программных продуктов или информационных систем (от 1 года), пониманием C++ на уровне чтения кода и опытом программирования на Python или других скриптовых языках.
Переходите по ссылкам — там вы получите подробную информацию о вакансиях и сможете присоединиться к команде лучших экспертов.
🎥 ТОП-10 фильмов и сериалов последних лет про современные технологии
Есть мнение, что после культовых «Хакеров», «Джони Мнемоника» и первой «Матрицы» больше не снимали хороших фильмов на околоайтишную тематику. Так ли это? Попробуем разобраться в обзоре лучших кинокартин о современных технологиях, вышедших за последние несколько лет.
https://proglib.io/sh/21yUtZI4wu
Есть мнение, что после культовых «Хакеров», «Джони Мнемоника» и первой «Матрицы» больше не снимали хороших фильмов на околоайтишную тематику. Так ли это? Попробуем разобраться в обзоре лучших кинокартин о современных технологиях, вышедших за последние несколько лет.
https://proglib.io/sh/21yUtZI4wu
Как использовать Spark по максимуму?
Знают в NewProLab: ведущий провайдер курсов в области Big Data объявляет запуск сразу 2 онлайн-курсов по работе с фреймворком Spark.
📌"Apache Spark и Scala для дата инжиниринга": старт 5 октября 👉🏻 https://clck.ru/SzCbb
Вас ждет: подготовка витрин данных, создание real-time приложений, работа со Scala API, Dataframes, Structured Streaming, Kafka, Elasticsearch, Cassandra, PostgreSQL, HDFS.
Преподает: Андрей Титов (NVIDIA) и Егор Матешук (Qvant).
📌"Apache Spark Advanced": начало 16 ноября 👉🏻https://clck.ru/Xkxkp
Новый продвинутый курс для дата-инженеров и разработчиков, имеющих практический опыт работы со Spark. Курс позволяет отработать навыки, необходимые для ускорения обработки данных и усовершенствования архитектуры существующих проектов. Вы глубоко погрузитесь в Dataframe API, py4j в pyspark, Spark Structured Streaming, Scala UDF в pyspark, org.apache.spark.sql.Row, разработку коннекторов с использованием Datasource v1 API, параллелизм задач.
Преподает: Андрей Титов (NVIDIA).
Специально для подписчиков нашего канала действует дополнительная скидка 15% (от цены, указанной на сайте) по промокоду "dsproglib".
Выбирайте программу. Оставляйте заявку. Задавайте вопросы.
Знают в NewProLab: ведущий провайдер курсов в области Big Data объявляет запуск сразу 2 онлайн-курсов по работе с фреймворком Spark.
📌"Apache Spark и Scala для дата инжиниринга": старт 5 октября 👉🏻 https://clck.ru/SzCbb
Вас ждет: подготовка витрин данных, создание real-time приложений, работа со Scala API, Dataframes, Structured Streaming, Kafka, Elasticsearch, Cassandra, PostgreSQL, HDFS.
Преподает: Андрей Титов (NVIDIA) и Егор Матешук (Qvant).
📌"Apache Spark Advanced": начало 16 ноября 👉🏻https://clck.ru/Xkxkp
Новый продвинутый курс для дата-инженеров и разработчиков, имеющих практический опыт работы со Spark. Курс позволяет отработать навыки, необходимые для ускорения обработки данных и усовершенствования архитектуры существующих проектов. Вы глубоко погрузитесь в Dataframe API, py4j в pyspark, Spark Structured Streaming, Scala UDF в pyspark, org.apache.spark.sql.Row, разработку коннекторов с использованием Datasource v1 API, параллелизм задач.
Преподает: Андрей Титов (NVIDIA).
Специально для подписчиков нашего канала действует дополнительная скидка 15% (от цены, указанной на сайте) по промокоду "dsproglib".
Выбирайте программу. Оставляйте заявку. Задавайте вопросы.
📊 Kaggle за 30 минут: разбираемся с соревнованием House Prices
Из предыдущей статьи мы узнали, что такое Kaggle и какие разделы предлагает этот ресурс. Теперь разберемся с одним из самых базовых соревнований Kaggle – House Prices.
https://proglib.io/sh/rckgt1HD0I
Из предыдущей статьи мы узнали, что такое Kaggle и какие разделы предлагает этот ресурс. Теперь разберемся с одним из самых базовых соревнований Kaggle – House Prices.
https://proglib.io/sh/rckgt1HD0I
⛓ Что такое NFT и где они используются?
Технологии постоянно совершенствуются и все глубже проникают в жизнь человека, меняя ее и заставляя нас иначе смотреть на обыденные вещи. Поговорим о невзаимозаменяемых токенах (NFT) и причинах их популярности.
https://proglib.io/sh/Y07iIXqjoW
Технологии постоянно совершенствуются и все глубже проникают в жизнь человека, меняя ее и заставляя нас иначе смотреть на обыденные вещи. Поговорим о невзаимозаменяемых токенах (NFT) и причинах их популярности.
https://proglib.io/sh/Y07iIXqjoW
1 октября в Москве пройдет Russia Open Source Summit, где на одной площадке соберутся все, кто в России создает программное обеспечение на основе открытого кода.
На открытии саммита будет представлен проект стратегии развития Open Source в России. После презентации проекта всем участникам мероприятия предложат выбрать одну из рабочих групп для внесения предложений в документ.
В рамках деловой программы будет выделен отдельный трек для шоу-кейсов (питчей) от стартапов, созданных на базе открытого кода. Можно подать заявку на выступление.
Принять участие можно бесплатно, регистрация на сайте.
Мероприятие начнется в 10:00 на площадке Radisson Collection Hotel.
Подготовка стратегии ведется российским экспертным ИТ-сообществом в открытом формате, в том числе на площадке Telegram.
На открытии саммита будет представлен проект стратегии развития Open Source в России. После презентации проекта всем участникам мероприятия предложат выбрать одну из рабочих групп для внесения предложений в документ.
В рамках деловой программы будет выделен отдельный трек для шоу-кейсов (питчей) от стартапов, созданных на базе открытого кода. Можно подать заявку на выступление.
Принять участие можно бесплатно, регистрация на сайте.
Мероприятие начнется в 10:00 на площадке Radisson Collection Hotel.
Подготовка стратегии ведется российским экспертным ИТ-сообществом в открытом формате, в том числе на площадке Telegram.
Как выбрать IT-инфраструктуру в 2021?
Присоединяйтесь к трансляции от @SelectelNews, где мы расскажем, как выбрать провайдера и IT-инфраструктуру под ваши задачи.
Помимо этого, разберем на вебинаре:
— Как оценить надежность инфраструктуры
— Из чего складывается стоимость владения IT-инфраструктурой (не только из затрат на оборудование)
— Какие продукты подойдут для решения оперативных задач инфраструктуры (серверы, облака, managed-сервисы)
Отдельно рассмотрим реальные кейсы клиентов — какие задачи они хотят решить, какие выбирают продукты и сервисы.
Участие бесплатное, регистрируйтесь по ссылке: https://slc.tl/1yemA
Присоединяйтесь к трансляции от @SelectelNews, где мы расскажем, как выбрать провайдера и IT-инфраструктуру под ваши задачи.
Помимо этого, разберем на вебинаре:
— Как оценить надежность инфраструктуры
— Из чего складывается стоимость владения IT-инфраструктурой (не только из затрат на оборудование)
— Какие продукты подойдут для решения оперативных задач инфраструктуры (серверы, облака, managed-сервисы)
Отдельно рассмотрим реальные кейсы клиентов — какие задачи они хотят решить, какие выбирают продукты и сервисы.
Участие бесплатное, регистрируйтесь по ссылке: https://slc.tl/1yemA
😸 Состоялся релиз библиотеки CatBoost версии 1.0.0
В описании релиза можно найти и ускорение обучения в режиме бинарной классификации, и поддержку Apache Spark. Подробнее об этом рассказал один из разработчиков CatBoost в посте на Хабре:
https://habr.com/ru/company/yandex/blog/580950/
В описании релиза можно найти и ускорение обучения в режиме бинарной классификации, и поддержку Apache Spark. Подробнее об этом рассказал один из разработчиков CatBoost в посте на Хабре:
https://habr.com/ru/company/yandex/blog/580950/
👍1