Big data world
2.35K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Хотите стать аналитиком, но не уверены, что вам подойдёт эта специальность? Сомневаетесь в своих силах и что сможете освоить материал?

У нас есть для вас решение.

В GeekBrains начинается курс для будущих аналитиков. За 7 дней вы погрузитесь в направление «Аналитика», пройдёте мастер-класс от ведущих специалистов и выберите себе специализацию.

Начните учиться бесплатно прямо сейчас вместе с GeekBrains. Переходите по ссылке, регистрируйтесь, обязательно заполняйте анкету и переходите сразу к обучению — https://clc.to/hzqpyg

Ждём вас на занятиях.
Генеративно-состязательные сети со сверхвысоким разрешением (SRGAN)

SRGAN достигают лучших результатов сверхвысокого разрешения изображения за счет объединения традиционных элементов GAN с рецептами, предназначенными для повышения визуальной производительности. Узнайте больше о них в этом руководстве!

https://pyimagesearch.com/2022/06/06/super-resolution-generative-adversarial-networks-srgan/
This media is not supported in your browser
VIEW IN TELEGRAM
Multiface: набор данных для нейрорендеринга лица
______

https://shly.link/ghcv2W
Автоматизированное тестирование в проектах машинного обучения [Лучшие практики для MLOps]
__________________________________

Автоматизированное тестирование в машинном обучении — очень полезный сегмент проекта машинного обучения, который может иметь некоторые долгосрочные последствия. Вероятно, недооцененный на ранних стадиях разработки, он привлекает внимание только на поздних стадиях, когда система начинает разваливаться из-за надоедливых ошибок, которые со временем только растут. Чтобы облегчить эти проблемы и уменьшить количество ошибок, рекомендуется добавить в проект несколько автоматических тестов.

В этой статье мы попробуем разобраться:

—что такое автоматизированное тестирование
—и как с их помощью улучшить проекты машинного обучения.

https://shly.link/wfAPo
This media is not supported in your browser
VIEW IN TELEGRAM
Безусловно, наиболее точное представление конвейеров машинного обучения в реальном мире.😁
😁9
Как Uber предсказывает время прибытия с помощью глубокого обучения
____________________________

https://shly.link/zubTg
Классификация изображений на Android с помощью TensorFlow Lite и CameraX
______________________________

TensorFlow Lite — это облегченная версия TensorFlow Mobile. Он здесь, чтобы раскрыть возможности машинного обучения на ваших смартфонах, гарантируя, что размер двоичного файла модели не слишком велик, а задержка будет низкой. Кроме того, он также поддерживает аппаратное ускорение с использованием API нейронных сетей и предназначен для работы в 4 раза быстрее с поддержкой графического процессора.

CameraX — это новейший API камеры, выпущенный с библиотекой поддержки Jetpack. Он создан для того, чтобы упростить разработку с помощью камеры, а благодаря автоматизированному лабораторному тестированию Google стремится обеспечить единообразие на всех устройствах Android, которых существует множество. CameraX представляет собой значительное улучшение по сравнению с Camera 2 API с точки зрения простоты и простоты использования.

Цель этой статьи — объединить миры камеры и машинного обучения путем обработки кадров CameraX для классификации изображений с использованием модели TensorFlow Lite. Мы будем создавать Android-приложение с использованием Kotlin, которое использует мощность графических процессоров ваших смартфонов.

https://shly.link/SDzbv
👍3
20% функций NumPy, которые специалисты по данным используют 80% времени
______
Кто сказал, что вы должны знать все?

NumPy (или Numeric Python) лежит в основе каждого проекта по науке о данных и машинному обучению. Это, несомненно, одна из самых важных библиотек, когда-либо созданных для Python. Более того, вся управляемая данными экосистема так или иначе зависит от NumPy и его основных функций.

Учитывая, что библиотека имеет широкое применение в промышленности и научных кругах благодаря своему беспрецедентному потенциалу, знакомство с ее функциями и синтаксисом стало крайней необходимостью для начинающих специалистов по данным. Однако изучение всей библиотеки Python, такой как NumPy , может быть сложным и непосильным для всех.
https://shly.link/x8rx4
👍6
📚Подборка тематичеких каналов для программистов📚


СИСТЕМНОЕ АДМИНИСТРИРОВАНИЕ


🐧 Новости и информация из мира Linux
https://t.iss.one/linux_sup

⚙️ Контейнеры, оркестраторы, мониторинг и др.
https://t.iss.one/dev_ops_info

🕸 Сетевая архитектура и администрирование
https://t.iss.one/network_arch


ПРОГРАММИРОВАНИЕ


🧑‍💻 Разработка внешнего интерфейса
https://t.iss.one/Frontend_now

🎨 Веб дизайн
https://t.iss.one/goodw_design

🔺 Все что связано с Angular, Vuejs
https://t.iss.one/Angular_Vuejs

⚛️ Все что связано с reactjs
https://t.iss.one/react_prog

🐍 Программирование Python
https://t.iss.one/Welcome_Python

☕️ Программирование Java
https://t.iss.one/java_sup

📲 Все по мобильной разработке: iOS, Android
https://t.iss.one/imobile_dev

🗃 Базы данных SQL/NOSQL
https://t.iss.one/database_group

🌥 Облачные сервисы, вычисления и безопасность
https://t.iss.one/cloud_comp

🔬 Data Science, Big Data, Machine Learning
https://t.iss.one/bigdata_world

🤯 Программирование для новичков
https://t.iss.one/easy_program

🪲 Тестирование программного обеспечения
https://t.iss.one/testin_new

🪛 General programming (инструменты и руководства для программистов)
https://t.iss.one/generalprog

📚Шпаргалки для айтишников (шпаргалки и руководства для системных администраторов, программистов, специалистов по безопасности и т.п.)
https://t.iss.one/itcheat_sheet


НОВОСТНЫЕ РЕСУРСЫ


🚀 Новости HighTech
https://t.iss.one/htech_news

🎩 IT новости на английском
https://t.iss.one/all_itnews

🕰 Последнии новости из мира науки
https://t.iss.one/gmorning_news

Технологические советы и хитрости
https://t.iss.one/youtips_tricks


GITHAB

🐍 Python (гитхаб тренды)
https://t.iss.one/pythonghub

☕️ Java (гитхаб тренды)
https://t.iss.one/javaghub

🟨 Javascript (гитхаб тренды)
https://t.iss.one/Jsghub

БУДНИ ПРОГРАММИСТА (ЮМОР) 📌


😁 Daily Dev Jokes
https://t.iss.one/dev_jokes


ЗАЩИТА ВЗЛОМ БЕЗОПАСНОСТЬ


🔒 Информационная безопасность
https://t.iss.one/crypto_security_lab

👨‍✈️ Новости из мира хакинга
https://t.iss.one/Hackme_news


КРИПТА


🏦 Криптовалюты/Блокчейн
https://t.iss.one/crypto_moneygo


ВИРТУАЛЬНАЯ РЕАЛЬНОСТЬ, РОБОТОТЕХНИКА

👓 Компьютерное зрение, виртуальная реальность
https://t.iss.one/AR_VR_vision

🦾 Канал о Робототехнике и автоматизации
https://t.iss.one/robotics_scince

🕹 IOT (мир интернета вещей)
https://t.iss.one/IoTprog

SEO WORDPRESS SMM

〰️Wordpress (советы, плагины, новости)
https://t.iss.one/news_wordpress

📈SEO
https://t.iss.one/seo_go

📊SMM (социальные сети - новости продвижение)
https://t.iss.one/allsocial_news
👍2
✏️Лучшие книги по аналитике данных
______

В эту статью мы включили 7 лучших книг по аналитике данных. Итак, прочитайте всю статью, чтобы выбрать, какая книга идеальна для вас.
https://shly.link/Km08h

✏️Введение в EDA
______

Предварительная обработка данных, разработка функций и EDA являются фундаментальными первыми шагами после сбора данных.
https://shly.link/Pnh59
11 августа состоится Alfa Data Science MeetUp в стиле кибер-футуризма📟

Если вы в Москве 👉 регистрируйтесь на сайте и приезжайте в офис Альфа-Банка по адресу: проспект Андропова 18, корп. 6 или подключайтесь к онлайн трансляции!

Темы и спикеры:
🖲 Развитие клиентской базы: моделирование LTV и прогноз будущих доходов
Сергей Королёв, Middle Data Scientist Альфа-Банк
🖲 Uplift-моделирование в ценообразовании кредитных продуктов
Максим Коматовский, Junior Data Scientist Альфа-Банк
🖲 Совершенный код расчёт
Максим Cтаценко, Team Lead/Senior DWH Developer в Яндекс
🖲 Применение подхода reject/inference в нейросетевом кредитном скоринге
Алексей Фирстов, Senior Data Scientist Альфа-Банк

Мероприятие пройдет в необычном формате. У вас будет время вспомнить «Бегущего по лезвию» или «Cyberpunk 2077», вдохновиться, поучаствовать в конкурсе и получить призы за креативность 🕶
Регистрируйтесь на сайте, приходите в гости, будет интересно!
Материалы курса Harvard CS109A #DataScience — огромная бесплатная и открытая коллекция! 1. Конспекты лекций 2. R-код, блокноты #Python 3. Лабораторные материалы 4. Расширенные разделы. Все это можно найти здесь: https://shly.link/9CCDw
Проекты машинного обучения с исходным кодом на Python 😲

1. HealthCure — медицинский проект — 7 выявлений заболеваний
https://shly.link/2yXiw

2. Обнаружение объектов с помощью SSD
https://shly.link/h45vv

3.Социальное дистанцирование с использованием YOLOv3
https://shly.link/SV0UT

4. Прогноз качества вина
https://shly.link/TTDNb

5. Распознавание лиц и глаз в cv2 с использованием Haarcascades
https://shly.link/wwaD1

6. Система рекомендаций фильмов
https://shly.link/EbrVe

7. Найдите наиболее доминирующие цвета на изображении с помощью кластеризации KMeans.
https://shly.link/SJTZS

8. Аутентификация банкнот с использованием Random Forest
https://shly.link/n36yB
👍5
Практическое руководство по Pandas Data ETL с примерами кода
____________________________

Pandas — это де-факто стандартный пакет Python для базовых заданий ETL (извлечение, преобразование и загрузка) данных. Независимо от того, являетесь ли вы начинающим специалистом по данным/аналитиком, который хочет применить недавно изученный синтаксис Pandas к конкретному варианту использования, или опытным гуру данных, который некоторое время не использовал Pandas и хочет быстро освежить свои знания, вы пришли к нужное место.

https://shly.link/mdmboR3
Почему специалисты по аналитике и Data Science востребованы на рынке

Для принятия взвешенных решений бизнесу нужны специалисты, которые умеют работать с данными. Особенно они нужны в меняющихся условиях рынка. Если вы присматриваетесь к сфере работы с данными и хотите разобраться в её карьерных перспективах, приглашаем вас на день открытых дверей «Как начать карьеру в аналитике и Data Science». Вы узнаете:
Какие направления существуют в сфере аналитики и Data Science и чем они отличаются друг от друга
Какие сферы бизнеса имеют самые большие перспективы на рынке и почему им сейчас нужны аналитики
С чего лучше начать развитие карьеры в сфере аналитики и Data Science

Записаться на ДОД
This media is not supported in your browser
VIEW IN TELEGRAM
Высокоточная дихотомическая сегментация изображений + веб-демонстрация Gradio

демо: https://huggingface.co/spaces/ECCV2022/dis-background-removal

гитхаб: https://github.com/xuebinqin/DIS

статья: https://arxiv.org/abs/2203.03041

Gradio: https://github.com/gradio-app/gradio
Введение в графовые нейронные сети

______________________________

Глубокое обучение подходит для захвата скрытых шаблонов евклидовых данных , таких как изображения (двумерные сетки) и тексты (одномерные последовательности). Но как насчет приложений, в которых данные генерируются из неевклидовых областей, изображаемых в виде графов со сложными отношениями и взаимозависимостями между сущностями?
В этом посте мы узнаем о теориях графов, формах и принципах GNN, а также о приложениях GNN.

https://shly.link/oeDdP
Это руководство поможет вам освоить регрессионный анализ

https://shly.link/1av2b
Заменит ли Джулия Python? И стоит ли вам беспокоиться?
___________________________

Python — это один из объектно-ориентированных языков программирования, разработанный в 1991 году. Он используется в области искусственного интеллекта, веб-разработки, разработки мобильных приложений и т. д. Но на сцене есть еще один язык программирования. Julia начинает набирать популярность, в основном из-за его многочисленных преимуществ по сравнению с Python.

Давайте узнаем больше о языке программирования Julia.

https://shly.link/fV3xi
🤔5😁1
✏️Создание генератора сопроводительных писем с использованием Python и GPT-3

Можем ли мы использовать НЛП, чтобы помочь соискателям найти более подходящую работу?
https://shly.link/mdmRhNi

✏️Я провел 7 месяцев, собирая самые лучшие бесплатные курсы, которые только мог найти в Интернете

Включая курсы Гарварда, Массачусетского технологического института и Стэнфорда.
https://shly.link/mdmxTBM
👍6