Big data world
2.35K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Finetuned Diffusion: несколько точно настроенных моделей Stable Diffusion, обученных различным стилям.

демо: https://huggingface.co/spaces/anzorq/finetuned_diffusion

colab: https://colab.research.google.com/gist/qunash/42112fb104509c24fd3aa6d1c11dd6e0/copy-of-fine-tuned-diffusion-gradio.ipynb
🧐Какие SQL-задачи нужно уметь решать веб-разработчикам на собеседовании?

⚡️Разберем типовые задачи 16 ноября в 20:00 с Дмитрием Кирилловым, техническим директором 1С-Старт.

📚 В OTUS пройдет открытый урок, на котором мы:
- обсудим, какие знания SQL требуются от веб-разработчиков
- вспомним базовые приёмы для работы с данными
- совместно разберём несколько несложных задач
После вебинара вы сможете продолжить осваивать новые навыки на онлайн-курсе «Базы данных».

👉🏻Для регистрации на занятия пройдите вступительный тест: https://otus.pw/NXI0/

Это занятие является частью онлайн-курса «Базы данных» от OTUS.
👍2👌1
#Python Machine Learning Projects

https://shly.link/yzyye
Два убийственных лайфхака Jupyter, которые гарантированно сэкономят вам часы рабочего времени
В тот момент, когда вы начинаете их использовать

https://shly.link/WnFcq
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Знакомство с Галактикой. Большая языковая модель для науки. Может обобщать академическую литературу, решать математические задачи, создавать статьи для Wiki, писать научный код, аннотировать молекулы и белки и многое другое.
galactica.org
На бесплатном вебинаре расскажем, чем аналитики данных и продуктовые аналитики отличаются от системных и бизнес-аналитиков. Разберём, что каждому из них нужно уметь на старте.

Вы узнаете, как выбрать направление по душе и в каких компаниях искать работу. А эксперты ответят на вопросы.

→ Бесплатный вебинар Яндекс Практикума, 21 ноября в 15:00
→ Зарегистрироваться на вебинар
Памятка по алгоритмам машинного обучения
Краткое справочное руководство по 5 распространенным алгоритмам
https://shly.link/pG7gv
Big Data – один из ключевых юнитов МТС. Мы знаем о точках концентрации абонентов и их миграции, пользовательском опыте, помогаем развивать городские инфраструктуры. С помощью Big Data мы планируем развитие сети базовых станций, определяем места и форматы новых розничных салонов, управляем ассортиментом розничных точек, снижаем фродовые действия и не только.

Сегодня Big Data – это: 20 петабайт данных, 5 000 метрик на профиль и 400 увлеченных профессионалов в команде.

В команду ищем аналитиков:

Middle/Senior системный аналитик на продукт МТС Аналитика

Что нужно делать:
· анализировать работу платформы;
· проектировать интеграционные решения;
· снижать time to market команды разработки;
· собирать и анализировать требования от заказчиков;
· разрабатывать проектную и техническую документацию.

Middle/Senior системный аналитик на продукт Golden Record

Что нужно делать:
· проектировать решения, потоки и витрины данных;
· проводить интервью с заказчиками;
· документировать и согласовывать с архитектором логические и физические модели данных;
· разрабатывать бизнес-логику для повышения точности моделей.

Что мы предлагаем: гибридный формат работы, ДМС с первого дня, внутреннее и внешнее обучение за счет компании, психолог, карьерный коуч и даже массажист в офисе и, конечно, бесплатная сотовая связь.

Переходи по ссылкам в названиях вакансий, оставляй отклик и присоединяйся к нашей команде.
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
«Пол - Microsoft Excel», — я, специалист по данным:
🔥14😁3👍2
Прогнозирование чемпионата мира по футболу FIFA 2022 с помощью простой модели с использованием Python

И победителем становится…
если пост полностью не открывается, откройте его в новой вкладке
https://shly.link/mdmA1C6
👍1
Как я изучаю машинное обучение
Контекст совета, которым я собираюсь поделиться, таков: я начал без инженерного образования и благодаря упорному труду и большой удаче стал инженером по машинному обучению... Моя главная цель как MLE состоит в том, чтобы постоянно работать над проектированием и развертыванием хорошо спроектированных и прозрачных систем машинного обучения и изучать передовые методы разработки программного обеспечения для этого... Так что, как всегда, воспринимайте этот пост в блоге в основном как совет самому себе в прошлом, который может сработать, а может и не сработать для вас в зависимости от ваших целей...
https://shly.link/Zg11h
Супермагистраль данных

Я работаю в сфере науки о данных с 2015 года. За последние 7–8 лет индустрия данных претерпела множество изменений. Тем не менее, самым частым вопросом остается: что такое наука о данных?

(если пост не открывается полностью, откройте в режиме инкогнито
)

https://shly.link/mdmWNxc
Памятка по Linux для науки о данных

Настоящая хитрость в освоении командной строки Linux, помимо изучения доступных команд, состоит в том, чтобы иметь под рукой справочные материалы по этому вопросу. Вот тут и вступает в игру последняя шпаргалка KDnuggets.

Эта шпаргалка охватывает 16 наиболее полезных команд терминала Linux, и этого достаточно, чтобы вы прямо сейчас могли выполнять большую часть своих повседневных операций с ОС из командной строки. Немного потренировавшись, вы обнаружите, что все это делает вашу повседневную деятельность более быстрой, легкой и податливой благодаря указыванию и щелчку.

https://shly.link/Tbyje
👍3
500 проектов ИИ Машинное обучение Глубокое обучение Компьютерное зрение НЛП

Проекты с кодом

https://shly.link/ghono2
🧬 Присоединяйтесь к онлайн-митапу ВТБ «Применение ML-инструментов в бизнес-процессах», который пройдёт 8 декабря 2022 года в 18:30 по мск. Митап будет полезен всем, кто интересуется Data Science и Machine Learning.

Темы митапа:

📌 «Инструменты для автоматизации решения бизнес задач»

Спикер: Дмитрий Тимохин, Data Scientist, ВТБ

📌«Модель для матчинга резюме и вакансий»

Спикер: Ярослав Пудяков, Data Scientist, ВТБ

📌 «Модель предсказания связанности компаний для привлечения клиентов в Банк»

Спикер: Роман Гончар, лидер команды Графовой аналитики стрима КиБ и СМБ моделирования, ВТБ

📌 Q&A-сессия, модератор: Артём Летин, лидер стрима КиБ и СМБ моделирования, ВТБ

👉 Зарегистрируйтесь по ссылке, и мы пришлём вам напоминание о митапе: https://cnrlink.com/dsmeetup25

🎁 Авторы самых интересных вопросов получат фирменный мерч
Узнайте, как ответственно разрабатывать, развертывать и поддерживать рабочие приложения машинного обучения.

Изучите основы машинного обучения с помощью интуитивно понятных объяснений, чистого кода и визуализаций.
https://shly.link/ghJ30f
Готовится PyCaret 3… Что нового?

PyCaret — это библиотека машинного обучения с открытым исходным кодом на Python, которая автоматизирует рабочие процессы машинного обучения. Это комплексный инструмент машинного обучения и управления моделями, который экспоненциально ускоряет цикл экспериментов и повышает вашу продуктивность.
https://shly.link/mdmDRHz
Python против R против Scala для науки о данных

Наука о данных — динамичная, увлекательная и многообещающая область. Влияние и варианты использования науки о данных постоянно растут, и набор инструментов, необходимых для достижения этих приложений, быстро расширяется. В результате специалисты по данным должны знать лучшие решения для каждого задания.

Хотя существует множество языков, которые могут быть полезны исследователю данных , Python для науки о данных является одним из широко используемых решений для обработки данных. Однако R и Scala также являются мощными решениями с мощными библиотеками. Мы хотим сосредоточиться на пакетах обработки данных, которые лучше всего подходят для машинного обучения, основанные на анализе данных, визуализации размера проекта и воспроизводимых исследованиях для реализации надлежащих решений машинного обучения.

https://shly.link/PePK7
Шпаргалка Scikit-learn по машинному обучению

Вы хотите начать работу с машинным обучением. У вас есть базовое понимание концепций машинного обучения. Вы знаете Питон. Что вы делаете?

Самый очевидный ответ — начать работать с Scikit-learn . Scikit-learn — это библиотека Python с открытым исходным кодом для всех видов прогнозного анализа данных. Вы можете выполнять задачи классификации, регрессии, кластеризации, уменьшения размерности, настройки модели и предварительной обработки данных.

Унифицированный API-интерфейс Scikit-learn значительно упрощает изучение реализации различных алгоритмов и задач. Как только вы изучите шаблон того, как делать вызовы Scikit-learn, вы готовы к работе. Единственное, что вам нужно после этого, помимо вашего воображения и решимости, это удобный справочник.

KDnuggets собрал именно то, что вам нужно. Эта шпаргалка охватывает основы того, что необходимо для изучения того, как использовать Scikit-learn для машинного обучения, и предоставляет справочную информацию для продвижения ваших проектов машинного обучения. Охвачена большая часть наиболее распространенных функций, которые вы будете использовать снова и снова. Посмотрите ниже для подтверждения.

https://shly.link/43a87
👍6
Что такое теорема Чебычева и как она применяется в науке о данных?

Теорема Чебышева применима к каждому набору данных и активно используется статистиками, специалистами по данным и инженерами по машинному обучению.


https://shly.link/2BCJX
👍2
Flux Julia против TensorFlow Python: как они сравниваются?

В этой статье рассматривается проблема глубокого обучения классификации изображений от начала до конца как в TensorFlow, так и в Flux (родной эквивалент TensorFlow Джулии). Это должно дать хороший обзор того, как два языка сравниваются в общем использовании, и, надеюсь, поможет вам понять, является ли Джулия потенциальным вариантом (или преимуществом) для вас в этом контексте.

Я также постараюсь выделить преимущества и, что более важно, пробелы или недостатки, которые в настоящее время существуют в экосистеме Julia по сравнению с проверенным сочетанием Python и TensorFlow.

https://shly.link/VoUqE