Big Data AI
16.8K subscribers
807 photos
97 videos
19 files
815 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
🖥 fiftyone

Инструмент с открытым исходным кодом для создания высококачественных наборов данных и моделей компьютерного зрения.

pip install fiftyone

🖥 Github
📎 Docs

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥32
📃 Крупнейший датасет документов, удостоверяющих личность

В этой статье мы хотим рассказать как мы создали крупнейший на данный момент набор искусственно созданных документов с большим разнообразием типов документов, их содержания и условий съемки.

Каждый из документов имеет уникальные (хоть и выдуманные) значения текстовых полей, уникальную подпись и уникальные искусственно созданные лица.

📌 Смотреть

@bigdatai
👍82🔥1
🔥 Подборка каналов для Дата сайентиста

⭐️ Нейронные сети
@vistehno - chatgpt ведет блог, решает любые задачи и отвечает на любые ваши вопросы.
@aigen - сети для генерации картинок. видео, музыки и многого другого.
@neural – погружение в нейросети.

🖥 Machine learning
@ai_ml – погружение в нейросети, ai, Chatgpt, midjourney, машинное обучение.
@machinelearning_ru – машинное обучении на русском от новичка до профессионала.
@machinelearning_interview – подготовка к собеседованию.
@datascienceiot – бесплатные книги Machine learning
@ArtificialIntelligencedl – канал о искусственном интеллекте

@machinee_learning – чат о машинном обучении
@datascienceml_jobs - работа ds, ml
@Machinelearning_Jobs - чат работы мл


🖥 Javascript / front

@react_tg - 40,14% разработчиков сайтов использовали React в 2022 году - это самая популярная библиотека для создания сайтов.
@javascript - javascript крупнейший канал.
@Js Tests - каверзные тесты JS
@hashdev - погружение в web разработку.
@javascriptjobjs - отборные вакансии и работа FrontEnd.
@jsspeak - чат поиска FrontEnd работы.
@javascript -канал для JS и FrontEnd разработчиков. Лучшие практики и примеры кода. Туториалы и фишки JS

🖥 SQL базы данных

@sqlhub - эффективности кода с грамотным использованием бд.
@chat_sql - чат изучения бд.

🖥 Python

@pythonl - главный канал самого популярного языка программирования.
@pro_python_code – учим python с ментором.
@python_job_interview – подготовка к Python собеседованию.
@python_testit - проверочные тесты на python
@pythonlbooks - современные книги Python
@python_djangojobs - работа для Python программистов
@python_django_work - чат обсуждения вакансий

🖥 Java
@javatg - выучить Java с senior разработчиком по профессиональной методике.
@javachats - чат для ответов на вопросы по Java
@java_library - библиотека книг Java
@android_its - Android разработка
@java_quizes - тесты Java
@Java_workit - работа Java
@progersit - шпаргалки ит

👣 Golang
@Golang_google - восхитительный язык от Google, мощный и перспективный.
@golang_interview - вопросы и ответы с собеседований по Go. Для всех уровней разработчиков.
@golangtests - интересные тесты и задачи GO
@golangl - чат изучающих Go
@GolangJobsit - отборные вакансии и работа GO
@golang_jobsgo - чат для ищущих работу.
@golang_books - полезные книги Golang
@golang_speak - обсуждение языка Go

🖥 Linux
@linux -топ фишки, гайды, уроки по работе  с Linux.
@linux chat - чат linux для обучения и помощи.
@linux_read - бесплатные книги linux

👷‍♂️ IT работа

@hr_itwork -кураторский список актуальных ит-ваканнсии

🤡It memes
@memes_prog - ит-мемы

⚙️ Rust
@rust_code - Rust избавлен от болевых точек, которые есть во многих современных яп
@rust_chats - чат rust

#️⃣ c# c++
C# - объединяет лучшие идеи современных языков программирования
@csharp_cplus чат
С++ - Универсальность. Возможно, этот главный плюс C++.

📓 Книги

@programming_books_it - большая библиотека. программиста
@datascienceiot -ds книги
@pythonlbooks - python библиотека.
@golang_books - книги Golang
@frontendbooksit - front книги
@progersit - ит-шпаргалки
@linux_read - Linux books
@java_library - Java books

🖥 Github
@github_code - лучшие проекты с github
@bigdatai - инструменты по работе с данными

🖥 Devops
Devops - специалист общего профиля, которому нужны обширные знания в области разработки.

📢 English for coders

@english_forprogrammers - Английский для программистов
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍31😁1
🖥 Awesome Docker 🐳

Кураторский список ресурсов и проектов Docker.

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥2
Colossal-AI

Colossal-AI: унифицированная система глубокого обучения для больших моделей

🖥 Github
📝 Документация
📌 Примеры

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1🥰1
Indoor Scene Recognition

Один из наиболее крупных датасетов интерьеров. В нем содержится 67 категорий включающих 15620 картинок.

https://web.mit.edu/torralba/www/indoor.html

@bigdatai
👍4👏21
🚀 Большая Шпаргалка по Python

-
Определение ключевых слов
- Типы данных
- Функции
- Классы
- Различные методы, встроенные функции и примеры работы с ними
- Решение задач с собеседования с примерами кода

#doc #python #cheatsheet
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥21
Big Data-проекты в облаке: технологический стек, этапы и подводные камни

В новой статье на Хабре авторы расскажут про нюансы и неочевидные особенности запуска процессов при работе с Big Data-проектами в облаке.

📌 Читать

@bigdatai
🔥3👍21
✔️ Amazon Reviews

Содержит около 35 млн отзывов с Amazon за 18 лет. Данные включают информацию о продукте и пользователе, оценки и сам текст отзыва.

📌 Датасет

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🔥1
World Bank Open Data.

Наборы данных, охватывающих демографическую ситуацию, огромное количество экономических показателей и индикаторов развития со всего мира.

https://data.worldbank.org/

@bigdatai
👍73🔥1
🎞 Trending YouTube Video Statistics

Этот набор данных включает в себя несколько данных о ежедневных трендах видео на YouTube. Данные для регионов США, Великобритании, Германии, Калифорнии и Франции (США, Великобритания, Германия, Канада и Франция соответственно), до 200 популярных видео в день.

Trending YouTube Video
YouTube-8M Segments Dataset

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥4👍2
📉 High-Tech Companies on NASDAQ

Этот набор данных предлагает глубокий анализ эффективности высокотехнологичных компаний, котирующихся на бирже NASDAQ .

Более чем 8000 компаний в секторах электроники, компьютеров, телекоммуникаций и биотехнологий, это невероятно полезный источник информации для исследователей, трейдеров, инвесторов и специалистов по данным, заинтересованных в анализе данных.

Dataset

@bigdatai
👍8🔥21
Dataset Interfaces

Dataset Interfaces: Diagnosing Model Failures Using Controllable Counterfactual Generation

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1
19 Датасетов для анализа данных, о которых вы скорее всего не слышали.

Работа с представленными датасетами сделает ваше портфолио в области науки о данных более привлекательным и разнообразным для работодателей.

Эти необычные датасеты могут стать идеальным способом найти вдохновение в мире Data Science.

Смотреть

@bigdatai
👍6🔥31
20+ открытых датасетов для Computer Vision

Список

@bigdatai
👍5🔥21
🔍 A meta-dataset for few-shot image classification

Meta Album is a meta-dataset created for few-shot learning, meta-learning, continual learning and so on.

Meta-datase — это набор метаданных, созданный , состоящий из 40 датасетов разбитых на 10 уникальных категорий. Это постоянно пополняемый набор метаданных.

⭐️ Meta-dataset: https://meta-album.github.io/

🖥 Github: https://github.com/ihsaan-ullah/meta-album

⭐️Paper: https://arxiv.org/abs/2302.08909v1

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥31
🖥 PyGWalker: A Python Library for Exploratory Data Analysis with Visualization

PyGWalker: преобразуем датафрейм pandas в пользовательский интерфейс в стиле таблицы для визуального анализа.


pip install pygwalker

🖥 Github
🖥 Colab

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥32
🎨ArtiFact

Крупный набор данных с искусственными изображениями для задач синтеза.

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥21
Data Viz Project

Data Viz Project - набор различных видов визуализаций, которые могут быть полезны для вашего Data Science проекта.

https://100.datavizproject.com/

@bigdatai
👍81🔥1
11 Инструментов исследования данных с открытым исходным кодом, которые вам следует знать в 2023 году

Существует множество известных библиотек и платформ для анализа данных, таких как Pandas и Tableau, в дополнение к аналитическим базам данных, таким как ClickHouse, MariaDB, Apache Druid, Apache Pinot, Google BigQuery, Amazon RedShift и т.д. Хотя фреймворки и платформы машинного обучения, такие как PyTorch, TensorFlow и scikit-learn, могут помочь в исследовании данных, это не является их основной целью.

Существует также множество доступных библиотек визуализации данных, которые могут обрабатывать данные, таких как Plotly, matplotlib, D3, Apache ECharts, Bokeh и т.д. В этой статье мы рассмотрим 11 инструментов, которые разработаны специально для исследования и анализа данных.

Читать

@bigdatai
👍6🔥41