Big data world
2.35K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Памятка по алгоритмам машинного обучения
Краткое справочное руководство по 5 распространенным алгоритмам
https://shly.link/pG7gv
Big Data – один из ключевых юнитов МТС. Мы знаем о точках концентрации абонентов и их миграции, пользовательском опыте, помогаем развивать городские инфраструктуры. С помощью Big Data мы планируем развитие сети базовых станций, определяем места и форматы новых розничных салонов, управляем ассортиментом розничных точек, снижаем фродовые действия и не только.

Сегодня Big Data – это: 20 петабайт данных, 5 000 метрик на профиль и 400 увлеченных профессионалов в команде.

В команду ищем аналитиков:

Middle/Senior системный аналитик на продукт МТС Аналитика

Что нужно делать:
· анализировать работу платформы;
· проектировать интеграционные решения;
· снижать time to market команды разработки;
· собирать и анализировать требования от заказчиков;
· разрабатывать проектную и техническую документацию.

Middle/Senior системный аналитик на продукт Golden Record

Что нужно делать:
· проектировать решения, потоки и витрины данных;
· проводить интервью с заказчиками;
· документировать и согласовывать с архитектором логические и физические модели данных;
· разрабатывать бизнес-логику для повышения точности моделей.

Что мы предлагаем: гибридный формат работы, ДМС с первого дня, внутреннее и внешнее обучение за счет компании, психолог, карьерный коуч и даже массажист в офисе и, конечно, бесплатная сотовая связь.

Переходи по ссылкам в названиях вакансий, оставляй отклик и присоединяйся к нашей команде.
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
«Пол - Microsoft Excel», — я, специалист по данным:
🔥14😁3👍2
Прогнозирование чемпионата мира по футболу FIFA 2022 с помощью простой модели с использованием Python

И победителем становится…
если пост полностью не открывается, откройте его в новой вкладке
https://shly.link/mdmA1C6
👍1
Как я изучаю машинное обучение
Контекст совета, которым я собираюсь поделиться, таков: я начал без инженерного образования и благодаря упорному труду и большой удаче стал инженером по машинному обучению... Моя главная цель как MLE состоит в том, чтобы постоянно работать над проектированием и развертыванием хорошо спроектированных и прозрачных систем машинного обучения и изучать передовые методы разработки программного обеспечения для этого... Так что, как всегда, воспринимайте этот пост в блоге в основном как совет самому себе в прошлом, который может сработать, а может и не сработать для вас в зависимости от ваших целей...
https://shly.link/Zg11h
Супермагистраль данных

Я работаю в сфере науки о данных с 2015 года. За последние 7–8 лет индустрия данных претерпела множество изменений. Тем не менее, самым частым вопросом остается: что такое наука о данных?

(если пост не открывается полностью, откройте в режиме инкогнито
)

https://shly.link/mdmWNxc
Памятка по Linux для науки о данных

Настоящая хитрость в освоении командной строки Linux, помимо изучения доступных команд, состоит в том, чтобы иметь под рукой справочные материалы по этому вопросу. Вот тут и вступает в игру последняя шпаргалка KDnuggets.

Эта шпаргалка охватывает 16 наиболее полезных команд терминала Linux, и этого достаточно, чтобы вы прямо сейчас могли выполнять большую часть своих повседневных операций с ОС из командной строки. Немного потренировавшись, вы обнаружите, что все это делает вашу повседневную деятельность более быстрой, легкой и податливой благодаря указыванию и щелчку.

https://shly.link/Tbyje
👍3
500 проектов ИИ Машинное обучение Глубокое обучение Компьютерное зрение НЛП

Проекты с кодом

https://shly.link/ghono2
🧬 Присоединяйтесь к онлайн-митапу ВТБ «Применение ML-инструментов в бизнес-процессах», который пройдёт 8 декабря 2022 года в 18:30 по мск. Митап будет полезен всем, кто интересуется Data Science и Machine Learning.

Темы митапа:

📌 «Инструменты для автоматизации решения бизнес задач»

Спикер: Дмитрий Тимохин, Data Scientist, ВТБ

📌«Модель для матчинга резюме и вакансий»

Спикер: Ярослав Пудяков, Data Scientist, ВТБ

📌 «Модель предсказания связанности компаний для привлечения клиентов в Банк»

Спикер: Роман Гончар, лидер команды Графовой аналитики стрима КиБ и СМБ моделирования, ВТБ

📌 Q&A-сессия, модератор: Артём Летин, лидер стрима КиБ и СМБ моделирования, ВТБ

👉 Зарегистрируйтесь по ссылке, и мы пришлём вам напоминание о митапе: https://cnrlink.com/dsmeetup25

🎁 Авторы самых интересных вопросов получат фирменный мерч
Узнайте, как ответственно разрабатывать, развертывать и поддерживать рабочие приложения машинного обучения.

Изучите основы машинного обучения с помощью интуитивно понятных объяснений, чистого кода и визуализаций.
https://shly.link/ghJ30f
Готовится PyCaret 3… Что нового?

PyCaret — это библиотека машинного обучения с открытым исходным кодом на Python, которая автоматизирует рабочие процессы машинного обучения. Это комплексный инструмент машинного обучения и управления моделями, который экспоненциально ускоряет цикл экспериментов и повышает вашу продуктивность.
https://shly.link/mdmDRHz
Python против R против Scala для науки о данных

Наука о данных — динамичная, увлекательная и многообещающая область. Влияние и варианты использования науки о данных постоянно растут, и набор инструментов, необходимых для достижения этих приложений, быстро расширяется. В результате специалисты по данным должны знать лучшие решения для каждого задания.

Хотя существует множество языков, которые могут быть полезны исследователю данных , Python для науки о данных является одним из широко используемых решений для обработки данных. Однако R и Scala также являются мощными решениями с мощными библиотеками. Мы хотим сосредоточиться на пакетах обработки данных, которые лучше всего подходят для машинного обучения, основанные на анализе данных, визуализации размера проекта и воспроизводимых исследованиях для реализации надлежащих решений машинного обучения.

https://shly.link/PePK7
Шпаргалка Scikit-learn по машинному обучению

Вы хотите начать работу с машинным обучением. У вас есть базовое понимание концепций машинного обучения. Вы знаете Питон. Что вы делаете?

Самый очевидный ответ — начать работать с Scikit-learn . Scikit-learn — это библиотека Python с открытым исходным кодом для всех видов прогнозного анализа данных. Вы можете выполнять задачи классификации, регрессии, кластеризации, уменьшения размерности, настройки модели и предварительной обработки данных.

Унифицированный API-интерфейс Scikit-learn значительно упрощает изучение реализации различных алгоритмов и задач. Как только вы изучите шаблон того, как делать вызовы Scikit-learn, вы готовы к работе. Единственное, что вам нужно после этого, помимо вашего воображения и решимости, это удобный справочник.

KDnuggets собрал именно то, что вам нужно. Эта шпаргалка охватывает основы того, что необходимо для изучения того, как использовать Scikit-learn для машинного обучения, и предоставляет справочную информацию для продвижения ваших проектов машинного обучения. Охвачена большая часть наиболее распространенных функций, которые вы будете использовать снова и снова. Посмотрите ниже для подтверждения.

https://shly.link/43a87
👍6
Что такое теорема Чебычева и как она применяется в науке о данных?

Теорема Чебышева применима к каждому набору данных и активно используется статистиками, специалистами по данным и инженерами по машинному обучению.


https://shly.link/2BCJX
👍2
Flux Julia против TensorFlow Python: как они сравниваются?

В этой статье рассматривается проблема глубокого обучения классификации изображений от начала до конца как в TensorFlow, так и в Flux (родной эквивалент TensorFlow Джулии). Это должно дать хороший обзор того, как два языка сравниваются в общем использовании, и, надеюсь, поможет вам понять, является ли Джулия потенциальным вариантом (или преимуществом) для вас в этом контексте.

Я также постараюсь выделить преимущества и, что более важно, пробелы или недостатки, которые в настоящее время существуют в экосистеме Julia по сравнению с проверенным сочетанием Python и TensorFlow.

https://shly.link/VoUqE
Media is too big
VIEW IN TELEGRAM
Perceiver-Actor: многозадачный преобразователь для роботизированных манипуляций

Документ: https://arxiv.org/abs/2209.05451
Веб-сайт: https://peract.github.io/
Код: https://github.com/peract/peract
Colab: https://colab.research.google.com/drive/1wpaosDS94S0rmtGmdnP0J1TjS7mEM14V?usp=sharing
🔥2
⚡️Приглашаем на вебинар «Обучение с подкреплением: от игр к реальным задачам», который пройдет 13 декабря в 10:00

В настоящее время технологии обучения с подкреплением активно применяются во многих сферах: от ритейла до автономных транспортных средств. Может быть лучше: основной сложностью этого подхода является отсутствие размеченных данных, и, к сожалению, нет формализованного подхода как данные могут быть размечены для этой задачи. Другая сложность — это формализация функции вознаграждения. От удачного ее выбора зависит конечный успех настройки алгоритма управления.

В докладе будет рассказано о применении алгоритмов обучения с подкреплением к различным задачам: от простых игровых задач до задачи навигации мобильного робота. Также будут представлены результаты сравнения различных алгоритмов в задачах избежания столкновения и навигации мобильного робота MIT RACECAR, оснащенного лидаром.

Регистрируйтесь тут👈
🔥1
Анализ данных стал проще: учебник по Python Pandas

Python Pandas — один из самых важных и востребованных инструментов, который необходимо изучить любому начинающему аналитику данных. Сегодня мы познакомим вас с основами Pandas.
https://shly.link/devoQkh
5 библиотек Python, которые стоит изучить, чтобы начать карьеру в науке о данных

Итак, если вы хотите начать карьеру в Data Science, в этой статье я покажу вам пять библиотек Python, которые вам обязательно нужно знать.
https://shly.link/WsnsJ

(если пост не открывается полностью, откройте в режиме инкогнито)
This media is not supported in your browser
VIEW IN TELEGRAM
Представляем ChatGPT!
Революционно новый инструмент для создания разговоров

Сегодня я хочу демистифицировать ChatGPT — увлекательное новое приложение GAN* (генеративно-состязательные сети), которое вызвало много шума в сообществе ИИ.

Для тех, кто не знаком с GAN, это тип нейронной сети, которая использует две конкурирующие сети — генератор и дискриминатор — для создания реалистичных результатов. Генератор создает поддельные выходные данные, а дискриминатор пытается отличить поддельные выходные данные от реальных данных. Благодаря этому обратному процессу GAN может создавать выходные данные, которые неотличимы от реальных данных.
https://shly.link/E8c5n

(если пост не открывается полностью, откройте в режиме инкогнито)