Big Data AI
16.8K subscribers
807 photos
97 videos
19 files
815 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
Вопросы и ответы к интервью для Python Developer

В этом репозитории собраны популярные вопросы по Python и смежным темам: Django, ООП, принципы программирования.

Также в проекте есть вопросы по основам HTML, фронтенд и БД, которые позволят вам повторить важные моменты, на которых зачастую останавливаются интервьюеры:

https://github.com/yakimka/python_interview_questions

#python

@bigdatai
👍42🔥1
Руководство по PyQtGraph для создания интерактивных графиков

PyQtGraph — это библиотека, в которой элементы интерфейса реализованы на PyQt4, PySide и NumPy. PyQtGraph позволяет легко настраивать графики с помощью графических виджетов Qt и имеет больше преимуществ, чем matplotlib в сборе и отображении данных в реальном времени.

Гайд по реализации интерактивных графиков:

https://www.pythonguis.com/tutorials/pyqt6-plotting-pyqtgraph/

#python
4👍2🔥1🥰1
Крутая шпаргалка по Pandas с примерами основных функций, которая охватывает 90% работы с данной библиотекой.

Если часто работаете с данными — сохраняем в закладки.

@bigdatai
👍13🔥43
Сообщество GitHub собирает awesome-списки ресурсов и инструментов, относящихся к определенной теме и значительно упрощающие работу в ней. Держите самые интересные из тех, что точно вам пригодятся:

JavaScript: awesome-javascript
React: awesome-react
Vue: awesome-vue
Angular: awesome-angular
Node.js: awesome-nodejs
Typescript: awesome-typescript
Java: awesome-java
Go: awesome-go
Ruby: awesome-ruby
PHP: awesome-php
Kotlin: awesome-kotlin
Rust: awesome-rust
Swift: awesome-swift
iOS-разработка: awesome-ios
Android-разработка: awesome-android
C: awesome-c
C++: awesome-cpp
C#: awesome-dotnet
Unreal Engine: awesome-unreal
Unity: awesome-unity3d
Python: awesome-python
Django: awesome-django
‍Data Science: awesome-datascience

@bigdatai
👍12🔥32
Математика дата саентиста - здесь мы публикуем математические задачи и гайды для машинного обучения с упором на практику. Проверяем ваши знания, а затем на основе ошибок предлагаем статьи и уроки.

Если хочешь познать дзен и понимать как работают алгоритмы, а не просто импортировать их, подписывайся. Здесь реально учат.

@ds_math
6💩1
This media is not supported in your browser
VIEW IN TELEGRAM
💨 SLOPER4D: A Scene-Aware Dataset for Global 4D Human Pose Estimation in Urban Environments

Новый датасет с различными позами людей в городской среде.

🖥 Github
🗒 Статья
⭐️ Dataset

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥31
ChatGPT Paraphrases

Это набор данных парафраз, созданный ChatGPT. В этом наборе данных около 350 тысяч строк данных.

⭐️ Dataset

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥1
🖥 Шпаргалка по командам Git на русском

echo "# название" >> README.md - создание файла README.md
git init - инициализация репозитория
git add README.md - добавления файла README.md в проект
git commit -m "first commit" - получает проиндексированный снимок состояния и выполняет его коммит в историю проекта
git remote add origin https://github.com/stanruss/название.git - команда, которой устанавливается подключение к удаленному серверу и git репозиторию, размещающемуся на нем.
git push -u origin master - кзменения отправляются на удаленный сервер

git log --oneline - посмотреть все коммиты.
git checkout . - восстановить все.
git checkout "код коммита" - вернуть до состояния этого коммита.
git checkout master - вернуться в ветку мастер.

Восстановить файлы на локальном компьютере:
```git fetch --all
git reset --hard origin/master или git reset --hard origin/<название_ветки>

```git add text.txt - Добавить файл в репозиторий
git rm text.txt - Удалить файл
git status - Текущее состояние репозитория (изменения, неразрешенные конфликты и тп)
git commit -a -m "Commit description" - Сделать коммит
git push origin - Замерджить все ветки локального репозитория на удаленный репозиторий
git push origin master - Аналогично предыдущему, но делается пуш только ветки master
git push origin HEAD - Запушить текущую ветку, не вводя целиком ее название
git pull origin - Замерджить все ветки с удаленного репозитория
git pull origin master - Аналогично предыдущему, но накатывается только ветка master
git pull origin HEAD - Накатить текущую ветку, не вводя ее длинное имя
git fetch origin - Скачать все ветки с origin, но не мерджить их в локальный репозиторий
git fetch origin master - Аналогично предыдущему, но только для одной заданной ветки
git checkout -b some_branch origin/some_branch - Начать работать с веткой some_branch (уже существующей)
git branch some_branch - Создать новый бранч (ответвится от текущего)
git checkout some_branch - Переключиться на другую ветку (из тех, с которыми уже работаем)
git branch # звездочкой отмечена текущая ветвь - Получаем список веток, с которыми работаем
git branch -a # | grep something - Просмотреть все существующие ветви
git merge some_branch - Замерджить some_branch в текущую ветку
git branch -d some_branch - Удалить бранч (после мерджа)
git branch -D some_branch - Просто удалить бранч (тупиковая ветвь)
git show d8578edf8458ce06fbc5bb76a58c5ca4a58c5ca4 - Изменения, сделанные в заданном коммите
git push origin :branch-name - Удалить бранч из репозитория на сервере
git reset --hard d8578edf8458ce06fbc5bb76a58c5ca4a58c5ca4 - Откатиться к конкретному коммиту и удалить последующие (хэш смотрим в «git log»)
git push -f - залить на сервер измененные коммиты
git clean -f - Удаление untracked files

#git #github #doc #cheatsheet


@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍111🔥1
15 лучших шпаргалок по машинному обучению.

1- Supervised Learning

https://github.com/afshinea/stanford-cs-229-machine-learning/blob/master/en/cheatsheet-supervised-learning.pdf

2- Unsupervised Learning

https://github.com/afshinea/stanford-cs-229-machine-learning/blob/master/en/cheatsheet-unsupervised-learning.pdf

3- Deep Learning

https://github.com/afshinea/stanford-cs-229-machine-learning/blob/master/en/cheatsheet-deep-learning.pdf

4- Machine Learning Tips and Tricks

https://github.com/afshinea/stanford-cs-229-machine-learning/blob/master/en/cheatsheet-machine-learning-tips-and-tricks.pdf

5- Probabilities and Statistics

https://github.com/afshinea/stanford-cs-229-machine-learning/blob/master/en/refresher-probabilities-statistics.pdf

6- Comprehensive Stanford Master Cheat Sheet

https://github.com/afshinea/stanford-cs-229-machine-learning/blob/master/en/super-cheatsheet-machine-learning.pdf

7- Linear Algebra and Calculus

https://github.com/afshinea/stanford-cs-229-machine-learning/blob/master/en/refresher-algebra-calculus.pdf

8- Data Science Cheat Sheet

https://s3.amazonaws.com/assets.datacamp.com/blog_assets/PythonForDataScience.pdf

9- Keras Cheat Sheet

https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Keras_Cheat_Sheet_Python.pdf

10- Deep Learning with Keras Cheat Sheet

https://github.com/rstudio/cheatsheets/raw/master/keras.pdf

11- Visual Guide to Neural Network Infrastructures

https://www.asimovinstitute.org/wp-content/uploads/2016/09/neuralnetworks.png

12- Skicit-Learn Python Cheat Sheet

https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Scikit_Learn_Cheat_Sheet_Python.pdf

13- Scikit-learn Cheat Sheet: Choosing the Right Estimator

https://scikit-learn.org/stable/tutorial/machine_learning_map/

14- Tensorflow Cheat Sheet

https://github.com/kailashahirwar/cheatsheets-ai/blob/master/PDFs/Tensorflow.pdf

15- Machine Learning Test Cheat Sheet

https://www.cheatography.com/lulu-0012/cheat-sheets/test-ml/pdf/

@bigdatai
👍132🔥1
Awesome Public Datasets

Это отличная коллекция наборов данных с открытым исходным кодом, разделенных по отраслям. Некоторые из библиотек, которые вы можете там найти будут упомянуты здесь позже.

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥41
🦙🛁 Cleaned Alpaca Dataset

Alpaca - это усовершенствованная версия LLAMA, которая была обучена на базе данных Instruct Dataset, созданных GPT-3.

🖥 Github

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥31
💨 Что, где, откуда: извлекаем реляционный датасет из JSON

Когда вы сталкиваетесь с большим ненормализованным датасетом, да еще и в формате JSON, который нужно переложить в связанные SQL-таблицы, необходимо:

Читать датасет по чанкам;
Анализировать датасет на качество, смотреть на атрибуты;
Нормализовать датасет, раскрывать связи между сущностями и следить за их целостностью.

В целом, знание этих пунктов позволит сразу адаптировать датасет под реляционные СУБД и значительно сократить время, затраченное на его обработку, ведь со структурной точки зрения его не потребуется переделывать бессчётное количество раз. А для всего остального – есть функционал SQL.

📌 Читать

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥2👍1