Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.41K photos
121 videos
64 files
4.86K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Будущее рядом — освой профессию Data Scientist

Раньше мы с огромным интересом смотрели фильмы про искусственный интеллект и гадали, как же это пришло в голову сценаристам и режиссёрам, ведь так не бывает.
Но в реалиях настоящей жизни искусственный интеллект — это не фантазии американских сценаристов-выдумщиков. Это реальность, которая стремительно врывается в нашу жизнь. Но с одной поправкой. Незаменимый помощник Data Scientist — специалист по машинному обучению, который выбирает архитектуру и обучающие алгоритмы, для работы с этими данными.

И у тебя как раз есть шанс стать тем самым незаменимым специалистом благодаря курсу от Skillbox «Профессия Data Scientist».

На курсе тебе предстоит научиться очень многим интересным вещам: от программирования на Python и визуализации данных до программирования на R и применения нейронных сетей для решения реальных задач.
Skillbox даёт возможность сначала уделить время обучению, а заботы с оплатой можно отложить на полгода.

После прохождения курса не стоит переживать о том, где найти работу. Эти заботы берут на себя опытные HR-специалисты.

Открой мир будущего — переходи по ссылке ▶️ https://clc.am/85_baw и бронируй место на курсе со скидкой 40%.
Building Machine Learning Pipelines (2020)
Авторы: Hannes Hapke, Catherine Nelson
Количество страниц: 366

Компании тратят миллиарды на проекты машинного обучения, но деньги пропадают зря, если модели не могут быть эффективно развернуты. В этом практическом руководстве авторы проведут вас по этапам автоматизации конвейера машинного обучения с использованием фреймворка TensorFlow. Вы изучите методы и инструменты, которые сократят время развертывания с дней до минут, чтобы вы могли сосредоточиться на разработке новых моделей, а не на обслуживании устаревших систем.

Скачать книгу
Онлайн-форум “INFADAY 2020. Как обеспечить готовность цифровых организаций“

Когда:
24 сентября 2020 года, с 10:00 до 17:30 по Москве.
Где: онлайн.
Стоимость: бесплатно

О мероприятии:
Текущая ситуация стала вызовом для всех сфер бизнеса и коснулась каждой компании. Мы обобщили самые частые запросы, которые к нам поступают, и организовали онлайн-форум для их обсуждения. На форуме выступят эксперты DIS Group и представители международных лидирующих компаний: Банк ВТБ, Теле2, Онлайн-кинотеатр ivi, Сбербанк, банк Монте дей Паски ди Сиена, Lamoda, Утконос, и других.

Среди проблем, которые будут обсуждаться на форуме:
Кратчайший путь к цифровой организации с помощью данных.
Как оценить уровень Data Excellence в организации.
Что важно учесть и не упустить при планировании и реализации Data Strategy.
Какие технологии необходимы, чтобы поддержать стратегию.
Как бизнес-пользователю сделать правильный заказ на данные.
«Я могу найти данные сам». Self-service для бизнес-пользователей, или как получить данные без обращения в ИТ.
Какие данные есть в системах и насколько они достоверны — инструменты оценки.
Классификация и терминология — сокращение времени на подготовку качественной отчетности.
Более точные прогнозы, более результативные предложения для клиентов.
Контроль доступа к данным — технологические возможности актуальны как никогда.
Как и где хранить данные («Аренадата»).
Бесперебойная работа ИТ.
Взгляд в будущее: roadmap цифровой организации.

Ключевые спикеры мероприятия:
👤 Олег Гиацинтов, технический директор, DIS Group.
👤 Павел Лихницкий, генеральный директор, DIS Group.
👤 Эмилио Вальдес (Emilio Valdes), вице-президент, регион EMEA, EE, MEA & LATAM, Informatica.
👤 Эндрю Джосс (Andrew Joss), директор индустриального консалтинга, Informatica.
👤 Иван Черницын, руководитель Центра аналитических решений Дирекции региональных продаж, «Газпром нефть».
👤 Сергей Золотарев, генеральный директор, Arenadata.
👤 Виктор Булгаков, руководитель службы развития систем управления данными, банк ВТБ.
👤 Фабио Скиера, банк «Монте дей Паски ди Сиена».
👤 Евгений Васильев, руководитель направления BMC Software, DIS Group.
👤 Василий Хасанов, ведущий эксперт по маскированию данных, DIS Group

Подробности и регистрация: https://bit.ly/2FH6SRy
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «Онлайн-форум “INFADAY 2020. Как обеспечить готовность цифровых организаций“ Когда: 24 сентября 2020 года, с 10:00 до 17:30 по Москве. Где: онлайн. Стоимость: бесплатно О мероприятии: Текущая ситуация стала вызовом для всех сфер бизнеса и коснулась каждой…»
Чтение HTML-таблиц с помощью Pandas

Функция pandas read_html() может быстро собирать данные из таблиц HTML. Вы узнаете, как её использовать, а также познакомитесь с некоторыми методами очистки данных HTML.

https://proglib.io/w/656c7bb8
💠 Как выбрать видеокарту для нейронных сетей и глубокого обучения

Выбираем видеокарту под разные задачи машинного обучения и обходим «подводные камни». Узнаем, какие карты не стоит покупать, из чего составить кластер и что делать при скромном бюджете.

https://proglib.io/sh/Sena6Eotqu
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems (2019)
Автор: Aurélien Géron
Количество страниц: 856

Благодаря недавней серии прорывов глубокое обучение расширило всю область машинного обучения в целом. Теперь программисты, которые почти ничего не знают о работе этой технологии, могут использовать простые и эффективные инструменты для реализации программ, обучающихся на данных. Книга показывает читателю, как это делается. Используя конкретные примеры, минимум теории и два фреймворка Python — Scikit-Learn и TensorFlow — автор поможет вам получить интуитивное понимание концепций и инструментов для построения интеллектуальных систем. Книга была обновлена после выхода TensorFlow 2.0.

Скачать книгу
👍1
🍃 В сентябре многие родители задумываются о будущем детей: хочется увлечь ребёнка тем, что пригодится в жизни. Таким ответственным родителям мы рекомендуем модульные курсы GeekSchool, где ученики тренируют логику, развивают творческое мышление, навыки решения практических задач и привычку работать на результат. Такой опыт пригодится в любой отрасли и на любой должности.

👩‍🏫 Занятия – это живые вебинары с преподавателями, в любой момент можно задать вопрос и получить ответ. После урока – практическое задание, преподаватель проверяет результат и даёт обратную связь. В конце каждого курса ученики создают финальный проект: например, готовый сайт или компьютерную игру.

За один учебный год можно освоить три направления и решить, что нравится больше. Все подробности здесь: https://proglib.io/w/0f7249d8
🎱 Сможет ли программа заменить Data Scientist: платформы для машинного обучения без программирования

Было бы здорово, если бы модель машинного обучения можно было просто перетащить иконкой в проект, drag-and-drop. Стоп… но ведь такое уже есть! Рассказываем о восьми сервисах автоматизации задач Data Science.

https://proglib.io/sh/a9nuG1hfkY
#вакансия #Минск
Вакансия: Python Data Engineer в Tripledot Studios

Студия основана в 2017 году в Лондоне. В 2018 году компания привлекла 8 млн. долларов инвестиций и за короткий промежуток времени вышла на уровень самоокупаемости.

Мы - дружная команда профессионалов, в которой каждый наш коллега имеет возможность влиять на развитие команды, компании и продуктов. Мы ценим профессионализм, долгосрочные отношения, проявление инициативы, а также желание приобретать и делиться с коллегами новыми знаниями.

На данный момент мы расширяем Data Engineering команду и приглашаем Python Data Engineer, чтобы работать над следующими задачами:

Разработка и поддержка ETL (python/pandas);
Разработка и поддержка Data warehouse и Data Lake;
Разработка и поддержка платформы для machine learning;
Разработка и поддержка пайплайнов обработки данных.

Контакты: @Sir_Alejandro

➡️ Подробности - https://join.onthespotdev.com/tds-python-data-engineer