Big Data AI
16.8K subscribers
807 photos
97 videos
19 files
815 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
20+ открытых датасетов для Computer Vision

Список

@bigdatai
👍5🔥21
🔍 A meta-dataset for few-shot image classification

Meta Album is a meta-dataset created for few-shot learning, meta-learning, continual learning and so on.

Meta-datase — это набор метаданных, созданный , состоящий из 40 датасетов разбитых на 10 уникальных категорий. Это постоянно пополняемый набор метаданных.

⭐️ Meta-dataset: https://meta-album.github.io/

🖥 Github: https://github.com/ihsaan-ullah/meta-album

⭐️Paper: https://arxiv.org/abs/2302.08909v1

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥31
🖥 PyGWalker: A Python Library for Exploratory Data Analysis with Visualization

PyGWalker: преобразуем датафрейм pandas в пользовательский интерфейс в стиле таблицы для визуального анализа.


pip install pygwalker

🖥 Github
🖥 Colab

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥32
🎨ArtiFact

Крупный набор данных с искусственными изображениями для задач синтеза.

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥21
Data Viz Project

Data Viz Project - набор различных видов визуализаций, которые могут быть полезны для вашего Data Science проекта.

https://100.datavizproject.com/

@bigdatai
👍81🔥1
11 Инструментов исследования данных с открытым исходным кодом, которые вам следует знать в 2023 году

Существует множество известных библиотек и платформ для анализа данных, таких как Pandas и Tableau, в дополнение к аналитическим базам данных, таким как ClickHouse, MariaDB, Apache Druid, Apache Pinot, Google BigQuery, Amazon RedShift и т.д. Хотя фреймворки и платформы машинного обучения, такие как PyTorch, TensorFlow и scikit-learn, могут помочь в исследовании данных, это не является их основной целью.

Существует также множество доступных библиотек визуализации данных, которые могут обрабатывать данные, таких как Plotly, matplotlib, D3, Apache ECharts, Bokeh и т.д. В этой статье мы рассмотрим 11 инструментов, которые разработаны специально для исследования и анализа данных.

Читать

@bigdatai
👍6🔥41
🖥 10 неизвестных функций и 10 популярных ошибок в Pandas для Датасаентиста

🎞 Смотреть

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Вакансия

⚡️Старший BI-аналитик в HR Tech

Стек: SQL, Tableau, Power BI, DataLens Python, Spark, JavaScript

Принимать решения на основе данных Яндексу помогает экосистема интерактивных дашбордов, которая показывает динамику самых важных HR-метрик. Мы ищем Старшего BI-аналитика, который будет собирать, анализировать и визуализировать данные с помощью BI-инструментов. Вам предстоит создавать экосистему аналитических продуктов по ключевым метрикам — найму, движению, обучению, вовлечённости и другим сторонам жизни сотрудников

🌙Что нужно делать:
— разрабатывать макеты дашбордов;
— визуализировать метрики и данные с использованием BI-инструментов;
— управлять пулом дашбордов как продуктом: собирать требования, вести бэклог доработок и идей, отвечать за улучшения;
— вместе с командой разрабатывать, поддерживать и развивать удобные и полезные аналитические продукты;
— участвовать в обновлении и улучшении методологии расчёта метрик в других проектах команды HR-дашбордов

🌙Мы предлагаем:
— экспертная и талантливая команда, у которой можно многому научиться и перенять опыт;
— культура открытости и взаимопомощи: у нас работают люди, вовлечённые в процесс и небезразличные к тому, что они делают;
— высокая скорость работы и возможность быстро увидеть свой вклад и результаты;
— сложные задачи для сервисов с тысячами пользователей
— возможность работать удалённо или из офиса
— премии каждые полгода для всех, кто успешно прошёл ревью
— расширенная программа ДМС
— компенсация оплаты питания
— программы жилищных займов для сотрудников

⚡️для отклика и по всем вопросам @irinavlsv

@bigdatai
👍42
🏅 Silero Models

Предварительно обученные модели преобразования речи в текст, текста в речь и улучшения текста.

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81🔥1
💡 Delivering Arbitrary-Modal Semantic Segmentation

DeLiVER - новый датасет для проведения произвольной модальной семантической сегментации. В нем содержатся фотографии для четыре типов суровых погодных условий.

🖥 Github
📌 Paper
💨 Dataset

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🧩 Building LEGO for 3D Reconstruction on Mobile Devices

MobileBrick - это первый многоракурсный набор данных RGBD, снятый на мобильное устройство, с точными 3D-аннотациями для детальной реконструкции 3D-объектов.

🖥 Github:https://github.com/ActiveVisionLab/MobileBrick

Paper: https://arxiv.org/abs/2303.01932

⭐️ Dataset: https://www.robots.ox.ac.uk/~victor/data/MobileBrick/MobileBrick_Mar23.zip

💨 Project: https://code.active.vision/MobileBrick/

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥1
Awesome-Dataset-Distillation

Список Awesome статей и наборов данных на все случаи жизни.

Github: https://github.com/Guang000/Awesome-Dataset-Distillation

Awesome Computer Vision: https://github.com/jbhuang0604/awesome-computer-vision

Paper: https://arxiv.org/abs/2208.11311v1

Datasets: https://paperswithcode.com/dataset/cifar-10

@bigdatai
👍51🔥1
Библиотека для случайной генерации тестовых демо-данных

Faker — один из самых популярных инструментов для создания случайных данных на PHP, Python и Ruby. К примеру, если нужно сгенерировать информацию о пользователе, то это несложно сделать, воспользовавшись методами name, bio, address, image и email:

https://fakerjs.dev/

#tools

@bigdatai
👍611🔥1
Как выучить SQL и подтянуть географию?

Census GPT — это инструмент, который позволяет пользователям осуществлять поиск данных о городах, микрорайонах и других географических зонах.

На сайте Census GPT пользователи также могут улучшать существующие карты. Результаты данных вы получаете вместе с SQL-запросом. Соответственно, можно учить SQL и автоматически проверять себя на реальных примерах:

https://censusgpt.com/

@Chatgpturbobot - chatgpt bot

#sql

@bigdatai
👍611🔥1
Вопросы и ответы к интервью для Python Developer

В этом репозитории собраны популярные вопросы по Python и смежным темам: Django, ООП, принципы программирования.

Также в проекте есть вопросы по основам HTML, фронтенд и БД, которые позволят вам повторить важные моменты, на которых зачастую останавливаются интервьюеры:

https://github.com/yakimka/python_interview_questions

#python

@bigdatai
👍42🔥1
Руководство по PyQtGraph для создания интерактивных графиков

PyQtGraph — это библиотека, в которой элементы интерфейса реализованы на PyQt4, PySide и NumPy. PyQtGraph позволяет легко настраивать графики с помощью графических виджетов Qt и имеет больше преимуществ, чем matplotlib в сборе и отображении данных в реальном времени.

Гайд по реализации интерактивных графиков:

https://www.pythonguis.com/tutorials/pyqt6-plotting-pyqtgraph/

#python
4👍2🔥1🥰1
Крутая шпаргалка по Pandas с примерами основных функций, которая охватывает 90% работы с данной библиотекой.

Если часто работаете с данными — сохраняем в закладки.

@bigdatai
👍13🔥43