10 первых ошибок в карьере ML-инженера
Специалист по машинному обучению (ML-engineer) — это программист, который занимается исследованием, созданием и проектированием систем ИИ. Начинающий
ML-инженер должен неплохо разбираться в математике и алгоритмах.
В этой статье собраны реальные примеры ошибок, которые чаще всего допускают программисты:
https://habr.com/ru/post/718942/
#it #ml #профессии
Специалист по машинному обучению (ML-engineer) — это программист, который занимается исследованием, созданием и проектированием систем ИИ. Начинающий
ML-инженер должен неплохо разбираться в математике и алгоритмах.
В этой статье собраны реальные примеры ошибок, которые чаще всего допускают программисты:
https://habr.com/ru/post/718942/
#it #ml #профессии
This media is not supported in your browser
VIEW IN TELEGRAM
Как Netflix использует ML?
Интересно, как работают алгоритмы поиска в Netflix? Каждый год компания старается улучшить данные поиска и их визуализацию для пользователей и даже тут не обошлось без подводных камней. Большая часть литературы по ML посвящена обучению моделей, оценке и подсчёту очков, а не онлайн-сервисам.
В этой статье рассматривается жизненный цикл ML: интеграция данных в приложении и как его реализуют разработчики:
https://netflixtechblog.com/building-a-media-understanding-platform-for-ml-innovations-9bef9962dcb7
#ml
Интересно, как работают алгоритмы поиска в Netflix? Каждый год компания старается улучшить данные поиска и их визуализацию для пользователей и даже тут не обошлось без подводных камней. Большая часть литературы по ML посвящена обучению моделей, оценке и подсчёту очков, а не онлайн-сервисам.
В этой статье рассматривается жизненный цикл ML: интеграция данных в приложении и как его реализуют разработчики:
https://netflixtechblog.com/building-a-media-understanding-platform-for-ml-innovations-9bef9962dcb7
#ml
Краткое введение в Машинное обучение
Прочтение этой статьи даст вам важную базу для понимания работы искусственного интеллекта, что поможет вам увереннее продвигаться в изучении ML. Кстати, она написана без сотен формул и тривиальных рассуждений, которые часто так сложны для начинающих.
#ml #ии #статья
Прочтение этой статьи даст вам важную базу для понимания работы искусственного интеллекта, что поможет вам увереннее продвигаться в изучении ML. Кстати, она написана без сотен формул и тривиальных рассуждений, которые часто так сложны для начинающих.
#ml #ии #статья
Полезные материалы по Data Science и машинному обучению
Автор данной статьи делится полезными материалами для абсолютных новичков и более уверенных специалистов, которые помогут найти и заполнить не только теоретические, но и практические провалы.
#ml #datascience
Автор данной статьи делится полезными материалами для абсолютных новичков и более уверенных специалистов, которые помогут найти и заполнить не только теоретические, но и практические провалы.
#ml #datascience
Почему дата-сайентистам нужны ещё и графы
Графы — это абстракция, которую используют для выявления связей между сущностями: множество вершин и множество рёбер, которые их соединяют.
В настоящее время многие крупные компании переходят на графы, мотивируя это тем, что производительность таких методов выше, по сравнению с другими современными ИИ-архитектурами. А по прогнозам Gartner к 2025 году графы будут использоваться в 80% инноваций в области данных и аналитики.
Какие же задачи можно решать графами?
— составлять рекомендации (друзей, товаров, музыки и т.п.);
— выявлять мошенничество;
— строить маршруты;
— ранжировать информацию по достоверности;
— хранить взаимосвязи между сущностями.
Более подробную информацию о том, где используются графы и каким именно образом, а также подборку материалов для их изучения вы сможете найти в этой статье.
#datascience #ml #bigdata
Графы — это абстракция, которую используют для выявления связей между сущностями: множество вершин и множество рёбер, которые их соединяют.
В настоящее время многие крупные компании переходят на графы, мотивируя это тем, что производительность таких методов выше, по сравнению с другими современными ИИ-архитектурами. А по прогнозам Gartner к 2025 году графы будут использоваться в 80% инноваций в области данных и аналитики.
Какие же задачи можно решать графами?
— составлять рекомендации (друзей, товаров, музыки и т.п.);
— выявлять мошенничество;
— строить маршруты;
— ранжировать информацию по достоверности;
— хранить взаимосвязи между сущностями.
Более подробную информацию о том, где используются графы и каким именно образом, а также подборку материалов для их изучения вы сможете найти в этой статье.
#datascience #ml #bigdata
Полезные материалы по Data Science и машинному обучению
Data Science - довольно сложная сфера, особенно для новичков. С чего стоит начать, на какие темы стоит обратить особое внимание, а какие лучше оставить на потом? Ответы на эти и многие другие вопросы вы сможете найти в этой ценнейшей статье. Её автор — опытный MLOps-инженер в отделе Data- и ML-продуктов Selectel.
В материале не просто даются названия книг и курсов, которые полезно было бы прочитать, но и дается понятие о том, почему это важно знать конкретно эту информацию и чем она поможет в будущем.
#ml #bigdata
Data Science - довольно сложная сфера, особенно для новичков. С чего стоит начать, на какие темы стоит обратить особое внимание, а какие лучше оставить на потом? Ответы на эти и многие другие вопросы вы сможете найти в этой ценнейшей статье. Её автор — опытный MLOps-инженер в отделе Data- и ML-продуктов Selectel.
В материале не просто даются названия книг и курсов, которые полезно было бы прочитать, но и дается понятие о том, почему это важно знать конкретно эту информацию и чем она поможет в будущем.
#ml #bigdata
Forwarded from Нейроканал
Все перечисленные библиотеки имеют открытый исходный код и предназначены в основном для питонистов.
Анализ, очистка и подготовка данных:
Pandas — быстрая и гибкая очистка и подготовка данных.
Numpy — предварительная обработка данных, применяется для математических вычислений.
Statsmodels — статистический анализ временных рядов, выживаемости и многого другого.
YData Profiling — упрощает этап EDA, тщательно анализируя ваши данные в одной строке кода.
Машинное и глубокое обучение:
Scikit-learn — ключевая библиотека машинного обучения, содержит реализацию популярных алгоритмов (регрессия, кластеризация).
Keras — создание, настройка моделей, работает поверх таких фреймворков, как TensorFlow.
TensorFlow — создание, моделирование и тренировка нейросетей.
XGBoost — предоставляет эффективные алгоритмы для задач регрессии, классификации и ранжирования.
CatBoost — градиентный бустинг.
#библиотеки #ml #deeplearning #python
Анализ, очистка и подготовка данных:
Pandas — быстрая и гибкая очистка и подготовка данных.
Numpy — предварительная обработка данных, применяется для математических вычислений.
Statsmodels — статистический анализ временных рядов, выживаемости и многого другого.
YData Profiling — упрощает этап EDA, тщательно анализируя ваши данные в одной строке кода.
Машинное и глубокое обучение:
Scikit-learn — ключевая библиотека машинного обучения, содержит реализацию популярных алгоритмов (регрессия, кластеризация).
Keras — создание, настройка моделей, работает поверх таких фреймворков, как TensorFlow.
TensorFlow — создание, моделирование и тренировка нейросетей.
XGBoost — предоставляет эффективные алгоритмы для задач регрессии, классификации и ранжирования.
CatBoost — градиентный бустинг.
#библиотеки #ml #deeplearning #python
Что почитать: «Как учится машина. Революция в области нейронных сетей и глубокого обучения» Яна Лекуна
Знаменитый учёный в области нейросетей — Ян Лекун стоит у истоков современной технической революции.
В своей книге он, не прибегая к метафорам, делится своим научным подходом на стыке компьютерных наук и нейробиологии, проливая свет на будущее искусственного интеллекта, связанные с ним проблемы и перспективы.
Эта понятная и доступная книга перенесет вас в самое сердце машины, открывая новый увлекательный мир, который уже является нашей реальностью.
#книги #ml #bigdata
Знаменитый учёный в области нейросетей — Ян Лекун стоит у истоков современной технической революции.
В своей книге он, не прибегая к метафорам, делится своим научным подходом на стыке компьютерных наук и нейробиологии, проливая свет на будущее искусственного интеллекта, связанные с ним проблемы и перспективы.
Эта понятная и доступная книга перенесет вас в самое сердце машины, открывая новый увлекательный мир, который уже является нашей реальностью.
#книги #ml #bigdata
Как работает обучение без учителя
В обучении с учителем для каждой обучающей ситуации, алгоритму дается понимание, какой ответ с нашей точки зрения тут правильный.
В обучении без учителя для каждой конкретной ситуации такого ответа алгоритму не дается. Алгоритм сам должен научиться решать, как ему поступать в каждом конкретном случае, исходя из конечной оценки совокупности всех его действий.
В этом материале на примерах вы сможете разобраться, какие задачи можно решить с помощью этих методов, какими алгоритмами и есть ли у них недостатки.
#bigdata #ml #datascience
В обучении с учителем для каждой обучающей ситуации, алгоритму дается понимание, какой ответ с нашей точки зрения тут правильный.
В обучении без учителя для каждой конкретной ситуации такого ответа алгоритму не дается. Алгоритм сам должен научиться решать, как ему поступать в каждом конкретном случае, исходя из конечной оценки совокупности всех его действий.
В этом материале на примерах вы сможете разобраться, какие задачи можно решить с помощью этих методов, какими алгоритмами и есть ли у них недостатки.
#bigdata #ml #datascience
Что лучше использовать: PyTorch или TensorFlow?
Хотите разобраться в инструментах машинного обучения? Давайте разберём в сравнении PyTorch и TensorFlow:
PyTorch — это простой инструмент, который хорошо дружит с Python и создан на базе библиотеки Torch.
TensorFlow — это большая система от Google Brain, поддерживающая различные платформы и языки программирования. Есть множество предварительно обученных моделей.
У первого из преимуществ простота, гибкость, удобство с Python. Но есть ограничения с визуализацией и сервированием моделей. А TensorFlow хорошо может в производительность и масштабируемость, но иногда подводит с обратной совместимостью и скоростью.
Эта статья поможет определиться с выбором из двух инструментов для конкретной задачи.
#pytorch #tensorflow #ml
Хотите разобраться в инструментах машинного обучения? Давайте разберём в сравнении PyTorch и TensorFlow:
PyTorch — это простой инструмент, который хорошо дружит с Python и создан на базе библиотеки Torch.
TensorFlow — это большая система от Google Brain, поддерживающая различные платформы и языки программирования. Есть множество предварительно обученных моделей.
У первого из преимуществ простота, гибкость, удобство с Python. Но есть ограничения с визуализацией и сервированием моделей. А TensorFlow хорошо может в производительность и масштабируемость, но иногда подводит с обратной совместимостью и скоростью.
Эта статья поможет определиться с выбором из двух инструментов для конкретной задачи.
#pytorch #tensorflow #ml
Знакомимся с Data Science и машинным обучением
Делать мы это будем с помощью бесплатного курса, который включает 30 уроков, 54 теста и 21 задачу. В рамках курса вы изучите основные теоретические понятия, а также познакомитесь с библиотеками Pandas и Scikit-learn — наиболее популярными инструменатами для анализа данных и машинного обучения, используя язык программирования Python.
Этих знаний более чем достаточно для старта в этой области. А начать можно уже сейчас по ссылке.
#курс #datascience #ml
Делать мы это будем с помощью бесплатного курса, который включает 30 уроков, 54 теста и 21 задачу. В рамках курса вы изучите основные теоретические понятия, а также познакомитесь с библиотеками Pandas и Scikit-learn — наиболее популярными инструменатами для анализа данных и машинного обучения, используя язык программирования Python.
Этих знаний более чем достаточно для старта в этой области. А начать можно уже сейчас по ссылке.
#курс #datascience #ml
Forwarded from Метод утёнка
Начните новую неделю с инструментом, который упростит вам жизнь
napkin — это бесплатная нейронка, которая поможет вам создавать красивые графики и таблицы из любого текста. При этом она предложит вам сразу несколько вариантов, которые можно сохранить в формате PDF, PNG или SVG.
Попробовать можно по ссылке.
#инструменты #ml
napkin — это бесплатная нейронка, которая поможет вам создавать красивые графики и таблицы из любого текста. При этом она предложит вам сразу несколько вариантов, которые можно сохранить в формате PDF, PNG или SVG.
Попробовать можно по ссылке.
#инструменты #ml
Компьютерное зрение на С++
У нас тут периодически бывают статьи про машинное обучение и компьютерное зрение. Но, как правило, все они касаются Python. Сейчас же предлагаю посмотреть на реализацию на C++.
Здесь вы узнаете, как реализовать обнаружение объектов в реальном времени с помощью камеры на мобильной платформе Android с использованием библиотек PyTorch и NCNN и моделей компьютерного зрения YOLOv5 и YOLOv4.
Часть 1
Часть 2
#cpp #cv #ml
У нас тут периодически бывают статьи про машинное обучение и компьютерное зрение. Но, как правило, все они касаются Python. Сейчас же предлагаю посмотреть на реализацию на C++.
Здесь вы узнаете, как реализовать обнаружение объектов в реальном времени с помощью камеры на мобильной платформе Android с использованием библиотек PyTorch и NCNN и моделей компьютерного зрения YOLOv5 и YOLOv4.
Часть 1
Часть 2
#cpp #cv #ml
Студент взломал топовую нейронку
Всё началось с того, что ему нужно было написать научную статью по теме ИБ. И в ходе работы над ней так увлёкся, что взломал известную Claude 3.5 Sonnet.
К его сожалению и нашему счастью весь материал в научную статью поместить не удалось. Поэтому он написал отдельную статью, где поделился всеми подробностями. А мы её принесли вам, так что скорее читайте — там много интересного.
#иб #ml
Всё началось с того, что ему нужно было написать научную статью по теме ИБ. И в ходе работы над ней так увлёкся, что взломал известную Claude 3.5 Sonnet.
К его сожалению и нашему счастью весь материал в научную статью поместить не удалось. Поэтому он написал отдельную статью, где поделился всеми подробностями. А мы её принесли вам, так что скорее читайте — там много интересного.
#иб #ml
Как построить карьеру в области искусственного интеллекта. Советы от Эндрю Ына
Эндрю Ын — известный учёный в области информатики, доцент Стэнфордского университета, исследователь робототехники, машинного обучения и искусственного интеллекта. На протяжении многих лет он смог наблюдать, как тысячи его студентов начинают свою карьеру в этой области.
На основе своих наблюдений он предложил практическую схему, по которой можно проложить собственный карьерный трек. Подробнее о схеме и каждом её пункте можно прочитать в этой статье.
#ml #советы #карьера
Эндрю Ын — известный учёный в области информатики, доцент Стэнфордского университета, исследователь робототехники, машинного обучения и искусственного интеллекта. На протяжении многих лет он смог наблюдать, как тысячи его студентов начинают свою карьеру в этой области.
На основе своих наблюдений он предложил практическую схему, по которой можно проложить собственный карьерный трек. Подробнее о схеме и каждом её пункте можно прочитать в этой статье.
#ml #советы #карьера