Точка входа в программирование
20.4K subscribers
1.23K photos
214 videos
2 files
2.75K links
Фундаментальные знания по основам программирования

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Сайт: https://tprg.ru/site

Регистрация в перечне РКН: https://tprg.ru/zrgj
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Как Netflix использует ML?

Интересно, как работают алгоритмы поиска в Netflix? Каждый год компания старается улучшить данные поиска и их визуализацию для пользователей и даже тут не обошлось без подводных камней. Большая часть литературы по ML посвящена обучению моделей, оценке и подсчёту очков, а не онлайн-сервисам.

В этой статье рассматривается жизненный цикл ML: интеграция данных в приложении и как его реализуют разработчики:

https://netflixtechblog.com/building-a-media-understanding-platform-for-ml-innovations-9bef9962dcb7

#ml
👍21
Краткое введение в Машинное обучение

Прочтение этой статьи даст вам важную базу для понимания работы искусственного интеллекта, что поможет вам увереннее продвигаться в изучении ML. Кстати, она написана без сотен формул и тривиальных рассуждений, которые часто так сложны для начинающих.

#ml #ии #статья
❤‍🔥3👍32🍌1
Полезные материалы по Data Science и машинному обучению

Автор данной статьи делится полезными материалами для абсолютных новичков и более уверенных специалистов, которые помогут найти и заполнить не только теоретические, но и практические провалы.

#ml #datascience
👍7🍌2
Почему дата-сайентистам нужны ещё и графы

Графы — это абстракция, которую используют для выявления связей между сущностями: множество вершин и множество рёбер, которые их соединяют.

В настоящее время многие крупные компании переходят на графы, мотивируя это тем, что производительность таких методов выше, по сравнению с другими современными ИИ-архитектурами. А по прогнозам Gartner к 2025 году графы будут использоваться в 80% инноваций в области данных и аналитики.

Какие же задачи можно решать графами?
— составлять рекомендации (друзей, товаров, музыки и т.п.);
— выявлять мошенничество;
— строить маршруты;
— ранжировать информацию по достоверности;
— хранить взаимосвязи между сущностями.

Более подробную информацию о том, где используются графы и каким именно образом, а также подборку материалов для их изучения вы сможете найти в этой статье.

#datascience #ml #bigdata
👍8🔥3😁2🍌1
​​Полезные материалы по Data Science и машинному обучению

Data Science - довольно сложная сфера, особенно для новичков. С чего стоит начать, на какие темы стоит обратить особое внимание, а какие лучше оставить на потом? Ответы на эти и многие другие вопросы вы сможете найти в этой ценнейшей статье. Её автор — опытный MLOps-инженер в отделе Data- и ML-продуктов Selectel.

В материале не просто даются названия книг и курсов, которые полезно было бы прочитать, но и дается понятие о том, почему это важно знать конкретно эту информацию и чем она поможет в будущем.

#ml #bigdata
7🥰2👍1🍌1
Forwarded from Нейроканал
Все перечисленные библиотеки имеют открытый исходный код и предназначены в основном для питонистов.
 
Анализ, очистка и подготовка данных:
  Pandas — быстрая и гибкая очистка и подготовка данных.
  Numpy — предварительная обработка данных, применяется для математических вычислений.
  Statsmodels — статистический анализ временных рядов, выживаемости и многого другого.
  YData Profiling — упрощает этап EDA, тщательно анализируя ваши данные в одной строке кода.
 
Машинное и глубокое обучение:
  Scikit-learn — ключевая библиотека машинного обучения, содержит реализацию популярных алгоритмов (регрессия, кластеризация).
  Keras — создание, настройка моделей, работает поверх таких фреймворков, как TensorFlow.
  TensorFlow — создание, моделирование и тренировка нейросетей.
  XGBoost — предоставляет эффективные алгоритмы для задач регрессии, классификации и ранжирования.
  CatBoost — градиентный бустинг.
 
#библиотеки #ml #deeplearning #python
👍72🔥2🍌2
​​Что почитать: «Как учится машина. Революция в области нейронных сетей и глубокого обучения» Яна Лекуна

Знаменитый учёный в области нейросетей — Ян Лекун стоит у истоков современной технической революции.

В своей книге он, не прибегая к метафорам, делится своим научным подходом на стыке компьютерных наук и нейробиологии, проливая свет на будущее искусственного интеллекта, связанные с ним проблемы и перспективы. 

Эта понятная и доступная книга перенесет вас в самое сердце машины, открывая новый увлекательный мир, который уже является нашей реальностью.

#книги #ml #bigdata
👍6🔥2🆒2🍌1
​​Как работает обучение без учителя

В обучении с учителем для каждой обучающей ситуации, алгоритму дается понимание, какой ответ с нашей точки зрения тут правильный.
В обучении без учителя для каждой конкретной ситуации такого ответа алгоритму не дается. Алгоритм сам должен научиться решать, как ему поступать в каждом конкретном случае, исходя из конечной оценки совокупности всех его действий.

В этом материале на примерах вы сможете разобраться, какие задачи можно решить с помощью этих методов, какими алгоритмами и есть ли у них недостатки.

#bigdata #ml #datascience
👍31🍌1
​​Что лучше использовать: PyTorch или TensorFlow?

Хотите разобраться в инструментах машинного обучения? Давайте разберём в сравнении PyTorch и TensorFlow:

PyTorch — это простой инструмент, который хорошо дружит с Python и создан на базе библиотеки Torch.

TensorFlow — это большая система от Google Brain, поддерживающая различные платформы и языки программирования. Есть множество предварительно обученных моделей.

У первого из преимуществ простота, гибкость, удобство с Python. Но есть ограничения с визуализацией и сервированием моделей. А TensorFlow хорошо может в производительность и масштабируемость, но иногда подводит с обратной совместимостью и скоростью.

Эта статья поможет определиться с выбором из двух инструментов для конкретной задачи.

#pytorch #tensorflow #ml
🍌31
Знакомимся с Data Science и машинным обучением

Делать мы это будем с помощью бесплатного курса, который включает 30 уроков, 54 теста и 21 задачу. В рамках курса вы изучите основные теоретические понятия, а также познакомитесь с библиотеками Pandas и Scikit-learn — наиболее популярными инструменатами для анализа данных и машинного обучения, используя язык программирования Python.

Этих знаний более чем достаточно для старта в этой области. А начать можно уже сейчас по ссылке.

#курс #datascience #ml
😁6👍3