🧑‍💻OT Sentinel🧑‍💻
634 subscribers
219 photos
15 videos
22 files
151 links
ICS/OT Security • Critical Infrastructure • Cyber Defense

Python tips & OT tricks
The Good, the Bad & the Industrial Ugly

👨‍💻 بلاگ شخصی درباره امنیت سیستم‌های کنترل صنعتی،
تجربه‌های چند سال کار توی پروژه‌های واقعی،
و نکاتی برای علاقه‌مندان و تازه‌کاره
Download Telegram
در اینجا دو مثال ساده برای استخراج اطلاعات از یک وب سایت با استفاده از پایتون و کتابخانه beautifulsoup رو برای شما آوردم:

مثال 1: استخراج عنوان های خبرها از یک سایت خبری

import requests
from bs4 import BeautifulSoup

# ارسال درخواست به صفحه وب و دریافت پاسخ
response = requests.get('https://example.com/news')

# بررسی وضعیت درخواست
if response.status_code == 200:
# پارس کردن محتوای صفحه وب
soup = BeautifulSoup(response.text, 'html.parser')

# استخراج عنوان های خبرها
news_titles = soup.find_all('h2', class_='title')

# چاپ عنوان های خبرها
for title in news_titles:
print(title.text)
else:
print('درخواست موفقیت‌آمیز نبود.')


مثال 2 : استخراج قیمت ارزها از یک سایت ارزی

import requests
from bs4 import BeautifulSoup

# ارسال درخواست به صفحه وب و دریافت پاسخ
response = requests.get('https://example.com/currency')

# بررسی وضعیت درخواست
if response.status_code == 200:
# پارس کردن محتوای صفحه وب
soup = BeautifulSoup(response.text, 'html.parser')

# استخراج قیمت ارزها
currency_prices = soup.find_all('span', class_='price')

# چاپ قیمت ارزها
for price in currency_prices:
print(price.text)
else:
print('درخواست موفقیت‌آمیز نبود.')


لطفاً توجه داشته باشید که شما باید آدرس وب سایت مورد نظر خودتونو در توابع requests.get() قرار بدید و الگوهای HTML مورد استخراج رو براساس وب سایت خود تنظیم کنید.
همچنین، ممکنه برای استخراج اطلاعات از وب سایت خاصی نیاز به استفاده از تکنیک‌ها و قوانین خاص داشته باشید که برای هر مورد باید اونهارو بررسی کنید. 🕵️‍♀️


#FXL
#Web_scraping
#پایتون_پیشرفته
#استخراج