codepedia
5.71K subscribers
1.52K photos
937 videos
623 files
876 links
💞 هدف این کانال آموزش رایگان برنامه نویسی💥
↩️دوره های موجود رو از دست ندید😍
❌️اینجا‌منبع کتاب های برنامه‌نویسی نامبروانههه🥳
Download Telegram
📌 32 datasets to uplift your skills in data science.
۳۲ دیتاست آموزشی برای ارتقای مهارت‌هاتون به عنوان یک دانشمند داده.

🔗 https://datasciencedojo.com/blog/datasets-data-science-skills/

#DataScience #DataSets
#Resources





🆔 @code_pedia
✔️ 21 Free Datasets to practice data science projects
۲۱ دیتاست رایگان برای استفاده در پروژه‌های علم داده.

1. Enron Email Dataset

2. Chatbot Intents Dataset

3. Flickr 30k Dataset

4. Parkinson Dataset

5. Iris Dataset

6. ImageNet dataset

7. Mall Customers Dataset

8. Google Trends Data Portal

9. The Boston Housing Dataset

10. Uber Pickups Dataset

11. Recommender Systems Dataset

12. UCI Spambase Dataset

13. GTSRB (German traffic sign recognition benchmark) Dataset

14. Cityscapes Dataset

15. Kinetics Dataset

16. IMDB-Wiki dataset

17. Color Detection Dataset

18. Urban Sound 8K dataset

19. Librispeech Dataset

20. Breast Histopathology Images Dataset

21. Youtube 8M Dataset

#DataSets #DataScience


🆔 @code_pedia
✔️ An Interactive Mind Map for All Pandas Operations
یک نقشه‌ذهنی تعاملی که شامل تمامی اوپراتور‌های مورد نیازتون در پانداس می‌شه.

🔗 https://blog.dailydoseofds.com/p/an-interactive-mind-map-for-all-pandas

#Pandas #Operations
#Python #DataScience
#Librarie




🆔 @code_pedia
📚 Mathematics and probability for machine learning
تقریبا تمام تکنیک‌های علم داده و روش‌های یادگیری ماشین دارای برخی جنبه‌های عمیق ریاضیاتی هستن. در نتیجه برای درک بیشتر اونها بهتره یه تسلط نسبی به مباحث ریاضی داشته باشید. اینجا ۳ تا کتاب خوب برای ریاضیات و احتمال قرار دادم که می‌تونید استفاده کنید.

🔗 Mathematics for Machine Learning


https://probability4datascience.com/index.html



🔗 Mathematics for Machine Learning

#Mathematics #MachineLearning
#Probability #DataScience




🆔 @code_pedia
Matplotlib - Complete Python Data Visualization Course

ℹ️ The course has been focused to help the trainees on achieving proficiency in working with MatPlotLib


🌐 Language: English
📌 Category: #DataScience

💰 Price: $54.99 ➡️🆓


https://www.udemy.com/course/matplotlib-complete-python-data-visualization-course/?couponCode=EDUCBABF19

‼️توجه : دوستان این دورهای تخفیفی یودمی برای تعداد نفرات محدودی رایگان است . اگه نیاز دارید زودتر استفاده کنید به سرعت ظرفیتش پر میشه و از حالت Free خارج میشه


#یودمی #علم_داده
#Free_course

🆔 @code_pedia
Data Science for Beginners Course

مایکروسافت یه درس ده هفته‌ای (بیست جلسه) برای افراد مبتدی منتشر کرده که هم بر روی تئوری و هم انجام کارهای عملی علوم داده تمرکز داره. عناوینی که در این دوره بهش پرداخته میشه:

Data structures
Statistics and probability
Python
Data wrangler
Data visualization


آدرس ریپو کد:
https://github.com/microsoft/Data-Science-For-Beginners

آدرس وبسایت:
https://microsoft.github.io/Data-Science-For-Beginners/#/


#DataScience
#Free_course



🆔 @code_pedia
3👍2🔥1🤩1
تجزیه و تحلیل شبکه مترو شامل بررسی شبکه سیستم های مترو برای درک ساختار، کارایی و اثربخشی آنها است.

در این پست نحوه تجزیه و تحلیل شبکه مترو یک شهر را با استفاده از Python بیاموزید

لینک: https://thecleverprogrammer.com/2024/01/29/delhi-metro-network-analysis-using-python/

#DataScience


🆔 @code_pedia
2
📌یکی از چالش‌های محققان و علاقه‌مندان به علم داده دسترسی به داده‌هایی برای آموزش، انجام تحقیقات و اهداف علمی خود بوده است. در این پست به معرفی منابعی برای دریافت دیتاست می پردازیم:

📥Google’s Datasets Search Engine
https://toolbox.google.com/datasetsearch

📥UCI data repository
https://archive.ics.uci.edu/ml/datasets.php

📥Kaggle Datasets
https://www.kaggle.com/datasets

📥Awesome Public Datasets Collection
https://github.com/awesomedata/awesome-public-datasets

📥Amazon Datasets
https://registry.opendata.aws

📥Microsoft Datasets
https://msropendata.com

📥Government Datasets
https://www.data.gov<br/> https://data.europa.eu/euodp/data/dataset <br/> https://data.gov.in<br/> https://data.gov.uk

📥Harvard Dataverse
https://dataverse.harvard.edu

📥kdnuggets Dataset
https://www.kdnuggets.com/datasets/index.html

📥stackoverflow page
https://stackoverflow.com/questions/381806/large-public-datasets


#DataScience

🆔 @code_pedia
👍1
🔖 دستورات مهم Pandas و Spark برای علم‌داده

#علم_داده #DataScience


🆔 @code_pedia
📚 Mathematical Methods in Data Science (2024)

💬 Tags: #datascience


🆔 @code_pedia
‼️‼️‼️ دوره های رایگان علم داده به زبان فارسی❌️

دوره علم داده دکتر محمد فزونی ۸۴ ویدئو


https://youtube.com/playlist?list=PLC6UZnripyEx7jcWGjlsPlf4RVVVz8P-y&si=MFCC9M0SLP_5rncM

ریاضی برای علم داده دکتر محمد فزونی در ۱۶ ویدئو 


https://youtube.com/playlist?list=PLC6UZnripyEwBzf3LcDu-Lf9tx0ahSYQW&si=VOTYoK_YclZ1y_cI

دوره یادگیری علم داده سایت نیک آموز ۲۰ ویدئو


https://youtube.com/playlist?list=PLfPSriIXnGeUILwrZvXq4OVc6CuqkRwf7&si=jk9UanpaK95_qITW

#علم_داده #DataScience


🆔 @code_pedia
👍1
‼️ دنبال فرصت کارآموزی هستید و پیدا نمیکنید؟ می‌خواهید دانشتون در علم داده رو توی پروژه های واقعی پیاده کنید و با اعتماد به نفس بیشتری در مصاحبه شرکت کنید؟

🔻می تونید از فضاهای کارآموزی مجازی استفاده کنید در این سایت ها می تونید بعنوان دانشمند داده بصورت رایگان کارآموزی انجام بدید 👇

https://www.theforage.com/simulations/bcg/data-science-ccdz

https://www.theforage.com/simulations/tata/data-visualisation-p5xo

https://www.theforage.com/simulations/pwc-ch/power-bi-cqxg

https://www.theforage.com/simulations/accenture-nam/data-analytics-mmlb

#علم_داده #DataScience

🆔 @code_pedia
👍10
نویسنده کتاب مشهور The Algorithm Design Manual ویدئوهای درس الگوریتمش رو در یوتیوب گذاشته:
https://www.youtube.com/playlist?list=PLOtl7M3yp-DXbHTFe_w9zFPXeau28CDao

Course Website: https://www3.cs.stonybrook.edu/~skiena/373/

Lecture notes, videos, and example sheets: https://www.cl.cam.ac.uk/teaching/2021/Algorithms/materials.html



#علم_داده #DataScience


🆔 @code_pedia
👍8
10کتاب ارزشمند اما رایگان پایتون
1. Think Python

❯ v2 (PDF)

❯ v3 (HTML)

2. Exploring Python Basics

Publisher: Manning

https://www.manning.com/books/exploring-python-basics

3. Clean Code in Python
Publisher: Packt
https://packtpub.com/free-ebook/clean-code-in-python/9781788835831

4. Automate the Boring Stuff with Python
Publisher: No Starch Press

https://automatetheboringstuff.com

5. The Hitchhiker's Guide to Python
Publisher: O'Reilly

https://docs.python-guide.org/

6. Explore Data with Python
Publisher: Manning

https://www.manning.com/books/exploring-data-with-python

7. Learn More Python 3 The Hard Way
https://learncodethehardway.org/more-python-book/

8. The Big Book of Small Python Projects
https://inventwithpython.com/bigbookpython/

9. The Recursive Book of Recursion
https://inventwithpython.com/recursion/

10. Python beyond the Basics
https://inventwithpython.com/beyond/


#Python #DataScience
#MachineLearning #AI


🆔 @code_pedia
🔥5👍4
🛠️ ۱۰ ابزار خط فرمان که هر دانشمند داده باید بشناسد

برای کارایی بیشتر در علم داده، این ابزارهای CLI ضروری هستند:

📊 ۱. jq - پردازش JSON

cat data.json | jq '.users[] | select(.age > 30)'

📈 ۲. csvkit - کار با فایل‌های CSV

csvsql --query "SELECT * FROM data WHERE salary > 50000" data.csv

🔍 ۳. grep - جستجوی پیشرفته

grep -r "pattern" data_directory/

📁 ۴. find - مدیریت فایل‌ها

find . -name "*.csv" -size +1M

📉 ۵. xargs - اجرای دستورات روی چندین فایل

find . -name "*.log" | xargs rm

📦 ۶. curl - دریافت داده از وب

curl -s "https://api.example.com/data" | jq .

🐍 ۷. python -m - اجرای اسکریپت‌های پایتون

python -m pandas --version

📊 ۸. awk - پردازش متن پیشرفته

awk -F, '{sum += $3} END {print sum}' data.csv

📋 ۹. sed - ویرایش متن

sed 's/old_text/new_text/g' file.txt

📺 ۱۰. tmux - مدیریت sessionهای ترمینال

tmux new-session -s data_analysis

این ابزارها گردش کار علم داده را سریع‌تر و قدرتمندتر می‌کنند.

#DataScience #CLI #CommandLine #Tools #Programming

🆔@code_pedia
5🤩2
🐍 پایتون ۳.۱۴ و پایان GIL: انقلابی در برنامه‌نویسی موازی

پایتون ۳.۱۴ با حذف Global Interpreter Lock (GIL) تحول بزرگی ایجاد می‌کند:

🎯 GIL چیست؟

· قفلی که اجرای همزمان تردها در پایتون را محدود می‌کرد
· مانع اصلی استفاده از چندین هسته CPU
· دلیل کندی برنامه‌های multi-threaded

تاثیرات حذف GIL:

· اجرای واقعی موازی تردها
· استفاده کامل از چندین هسته پردازنده
· بهبود عملکرد برنامه‌های CPU-intensive

🛠️ مثال عملی:

import threading
import time

def task():
# حالا واقعاً موازی اجرا می‌شود!
pass

# اجرای همزمان روی چندین هسته
threads = []
for i in range(4):
t = threading.Thread(target=task)
threads.append(t)
t.start()

💡 مزایای کلیدی:

· سرعت بالاتر برای محاسبات سنگین
· رقابت بهتر با Rust, Go, C++
· امکان پردازش موازی واقعی در Data Science

#Python #GIL #Multithreading #Performance #DataScience

🆔@code_pedia
👍4
📊 Quarto CLI: ابزار یکپارچه برای محتوای علمی و تکنیکی

یک فریمورک اوپن‌سورس برای ایجاد مستندات، گزارش‌ها و ارائه‌های حرفه‌ای:

قابلیت‌های اصلی:

• چندزبانه - پشتیبانی از Python, R, Julia, Observable
•فرمت‌های متنوع - PDF, HTML, Word, PowerPoint, eBook
•تعاملی - نمودارها و ویجت‌های interactive

🛠️ نمونه استفاده:

# نصب
quarto install

# ایجاد پروژه جدید
quarto create project my-report

# رندر کردن سند
quarto render document.qmd

🎯 کاربردها:

· گزارش‌های علمی و تحقیقاتی
· مستندات فنی
· ارائه‌های آکادمیک
· کتاب‌های آموزشی

مزایا:

· یکپارچگی کامل با Jupyter
· reproducible research
· قالب‌های حرفه‌ای آماده
· خروجی با کیفیت انتشاراتی

#Quarto #DataScience #مستندسازی #تحقیق #پایتون #آر

🆔@code_pedia
👍4