Dataphile
2.98K subscribers
66 photos
7 videos
36 files
116 links
در این کانال مطالبی که دوست دارم رو قرار میدم و موضوع خاصی نداره. هر مطلبی دلم بخواد میذارم


https://twitter.com/vahidbaghi95
https://vahidbaghi.ir/blog
@VahidBaghi
Download Telegram
🔹 همین prompt بالا رو دادم به ChatGPT گفتم بهتر بنویسش که خروجی به صورت زیر شد اما راستش من با همین پرامپت بالا جواب گرفتم و از قدیم گفتم کدی که کار میکنه رو انگول نکن :)
Translate the following subtitle into Persian while maintaining the SRT file structure. Use Persian equivalents for English terms instead of literal translation. Ensure sentence integrity is preserved in the subtitles.


🔹من یه کد نوشته بودم که زیرنویس رو به چندین تکه تقسیم میکرد و تکه تکه میداد به Gemeni و در نهایت نتیجه رو با هم ادغام میکرد. اما نکته‌ای که داره اینه که همه chunk ها جملاتشون باید کامل باشه. یعنی من توی کد چک میکردم که اگر آخرین دیالوگ زیرنویس به نقطه (.) ختم نشده بود، انقدر ادامه بده و سگمنت اضافه کنه که به نقطه ختم بشه. اینجوری میدونی تو هر تکه تمام جملات کامل هستند و ترجمه درست انجام میشه.


🔹 چه جوری با Gemeni رایگان ترجمه کنیم؟
۱-از طریق سایت زیر که کلا رایگانه ولی ممکنه با بعضی VPN ها نتونید ازش استفاده کنید. من سایفون رو تست کردم اوکی بوده
https://aistudio.google.com/

۲-تو سایت زیر هم یکسری از مدل های گوگل رایگان در دسترسه :
https://openrouter.ai
1👍17💯1
Dataphile
نمی‌دونم برنامه Shark Tank رو دیدید یا نه. شارک تنک یک برنامه تلویزیونی واقع‌نمایی است که از ماه اوت ۲۰۰۹ از شبکه ABC آمریکا پخش می‌شود. در این برنامه، افرادی که قصد دارند کسب‌وکار خود را راه‌اندازی کنند، ایده‌های خود را در مقابل پنج سرمایه‌دار موفق (شارک‌ها)…
تا الان ۱۵ فصلش رو قرار دادم. فقط فصل ۱۶ مونده که به زودی قرار میگیره. بعد از اون میخوام برم سراغ برنامه Entrepreneur Elevator Pitch که مشابه همین برنامه‌ست. من ۱۲۰ قسمتش رو دانلود کردم که به زودی زیرنویس میکنم. اینم زیرنویس نداره. البته در یوتیوب پخش میشه ولی زیرنویس خودکار یوتیوب رو خودتون در جریانید چقدر کیفیتش پایینه.
👍274💯2🔥1
به نظرم هر برنامه‌ پایتونی که نوشته میشه باید با py-spy پروفایل بشه که bottleneck های کد پیدا بشه. خروجیش رو هم ببرید روی speedscope.app که راحت تر بررسیش کنید.

گاهی تو کد هایی که پیچیدگی زیاد داره آدم یادش میره یه جاهایی رو بهینه‌سازی کنه. من هر موقع گزارش های py-spy رو میخونم، از اینکه بدم AI برام برای بهبود عملکرد، code review کنه نتیجه بهتری میگیرم.


پ.ن. تصویر تزئینی است.
👍205
تو این پست میخوام سوالات پرتکراری که ازم میپرسن رو جواب بدم که کسی دوباره پرسید، لینک همین پست رو بدم.

🔰 سوالات مربوط به گرایش الگوریتم و محاسبات

💠 گرایش الگوریتم و محاسبات که خوندی چطور بوده؟
🔹 در این لینک در مورد گرایش الگوریتم و محاسبات دانشگاه تهران (چون شریف هم داره و من خبر ندارم چیکار میکنن)
🔹 یه سری voice هم هست که تو این کانال قرار دادم. این voice ها پراکنده بودن و از pv افراد مختلف که براشون فرستادم تجمیع کردم.


💠 بازار کار گرایش الگوریتم و محاسبات چیه؟
🔹 همون بازار کاری که برای Data science وجود داره.

💠 فقط با خوندن درس های دانشگاه میشه وارد بازار کار شد؟
🔹 مثل بقیه رشته ها صرفا پاس کردن چند تا واحد شما رو متخصص اون رشته نمیکنه، این گرایش هم شما رو data scientist نمیکنه. صرفا سرنخ بهتون میده و خودتون باید برید یاد بگیرید



🔰 موضوع web scraping
💠 از کجا شروع کنیم؟
🔹 میتونید از این کتاب شروع کنید و مطالب این سایت رو هم شخم بزنید و بعدش فقط تمرین کنید و در عمل با چالش های سایت ها آشنا بشید.



🔰 موضوع Road map
🔹از این سایت میتونید Road map برای همه تخصص ها رو ببینید
🔹 ویدئو های این کانال یوتیوب و به خصوص مصاحبه هایی که با افراد در تخصص های مختلف انجام دادن میتونه شروع خوبی باشه که مسیرتون رو پیدا کنید.


دیگه کمک خاصی نمیتونم به کسی بکنم. ببینید چه حوزه‌ای علاقه دارید. همون رو شروع کنید. ممکنه این پست رو آپدیت کنم.
9👍20❤‍🔥72🔥1
یکی از مخاطبین کانالم، یه تحلیل دیتای جالب آماده کرده که در اون سلیقه فیلم و سریال ایرانی‌ها رو با کاربران جهانی IMDb مقایسه کرده. این پست رو از لینک زیر میتونید مشاهده کنید.
https://virgool.io/@reza.mzk/%D8%AE%DB%8C%D9%84%DB%8C-%D8%AF%D9%88%D8%B1-%D8%AE%DB%8C%D9%84%DB%8C-%D9%86%D8%B2%D8%AF%DB%8C%DA%A9-uelusjoynfzc
👏71👍1🥰1💯1
نقشه ارتفاع ساختمان های تهران. هر چی از سبز به سمت قرمز میریم، ارتفاع ساختمون ها بیشتر میشه. داخل Legend رنج ارتفاع رو نوشته.

نکته هم اینه که تخمین نیست! یعنی با آنالیز نقشه های ماهواره‌ای نیست.

شعاع رو هم ۵۰ متر گرفتم. یعنی میانگین ارتفاع ساختمون ها در یک شعاع ۵۰ متری، رنگ رو مشخص میکنه.

برای اینکه بهتر نقشه رو درک کنید، ارتفاع ساختمون ۴ طبقه ۱۵ متر در نظر گرفته شده.


———
دیتایی به اشتراک نمیذارم. بنابراین درخواست دیتاش رو نکنید

———
آپدیت دوم : با سایت https://kepler.gl نقشه رو رسم کردم. دیتا رو آماده کردم و import کردم
👍206🔥31👌1
میدونستید ساختمون هایی داریم که تا ۹ طبقه زیر زمین ساختن؟
عددی که توی Legend نوشته شده در واقع طبقات زیر زمین ساختمون هاست!
👍163🔥21🎉1
گزارش جامع ثروتمندان امریکا.pdf
421.5 KB
گزارش جامع ثروتمندان امریکا!

تهیه شده توسط آلومینیوم دیتاست!


ثروتمندان امریکا چجوری پولدار شدن؟
چقدر ارث موثر بوده توی پولدار شدنشون؟

چقدر طول میکشه تا توی امریکا پولدار شن ادما؟

چن نفر تو امریکا پولدارن؟

این گزارش رو از دست ندید!


همراه با لینک به سورس ها و منابع معتبر !


@AluminumDataset
👍9
یکی از مخاطبین کانال یه محصولی توسعه دادن به نام @Hayula_Monster که ویس کلاس ها رو می‌تونید بهش بدید و جزوه تمیز و خلاصه‌شده تحویل میده. من یه تست گرفتم و خوشم اومد و گفتم معرفیش میکنم.

تو دوران لیسانس یه درسی داشتیم به نام مهندسی‌نرم‌افزار که من ویس تمام کلاس هاش رو ضبط کرده بودم و چون این درس رو خیلی دوست داشتم، نشسته بودم ویس ها رو ثانیه به ثانیه گوش داده بودم و یه جزوه برای خودم نوشته بودم که جزوه رو داشته باشم. چون درس خیلی مهمیه. البته الان خیلی سال گذشته و جزوه رو گم کردم. کیفیت ویس ها پایین بود. الان یه کات ۴ دقیقه‌ای از یکی از ویس ها انتخاب کردم و دادم به این سرویس بالا و به نظرم خروجی قابل قبولی داره. به خصوص از نقشه‌ذهنی من خیلی خوشم اومد. البته ما کلا در پردازش زبان فارسی (هم TTS و هم STT) ضعف داریم و کتابخونه هایی که وجود دارن هیچ کدومشون عالی نیستن. با این حال خروجی کارشون خوب بود.
18👍8👌2
UML Applied.pdf
1.5 MB
کتابی که برای مهندسی‌نرم‌افزار ۲ میخوندیم این بود. یه سایت محشر هم در مورد RUP وجود داره که من قبلا میخواستم ترجمه‌ش کنم ولی بیخیال شدم. البته بعید میدونم الان شرکت های ایرانی خیلی سمت RUP برن. بیشتر بساز بندازه :))


https://sceweb.sce.uhcl.edu/helm/RUP_Folder/RationalUnifiedProcess/index.htm
👍81
Forwarded from VPN CLUB
منبع اصلی هر تصویر را پیدا کنید
هر تصویر توسط کی و چه زمانی منتشر شده


وب‌سایت VisualOrigins Detector ابزاری است که به شما کمک می‌کند نخستین زمان انتشار یک تصویر در اینترنت را بیابید. این ابزار با جستجوی خودکار در پلتفرم‌های مختلف، از جمله Google Fact Check Explorer و جستجوی معکوس تصویر، تاریخچه‌ای از تحقیقات تصویری شما ایجاد می‌کند تا بتوانید به راحتی به بررسی‌های قبلی خود دسترسی داشته باشید. همچنین، یک بوکمارکلت مفید ارائه شده که به شما امکان می‌دهد با یک کلیک، منبع اصلی هر تصویری را مستقیماً از مرورگر خود بررسی کنید.

https://visualorigins.digitaldigging.org/

#OSINT
👍62
VPN CLUB
منبع اصلی هر تصویر را پیدا کنید هر تصویر توسط کی و چه زمانی منتشر شده وب‌سایت VisualOrigins Detector ابزاری است که به شما کمک می‌کند نخستین زمان انتشار یک تصویر در اینترنت را بیابید. این ابزار با جستجوی خودکار در پلتفرم‌های مختلف، از جمله Google Fact Check…
این پست رو دیدم و اسم Henk Van Ess رو که دیدم یاد یه چیزی افتادم. این یه OSINT کار معروف هلندیه. یکی از افرادی بود که باهام در مورد داستان اسکریپ کلاب‌هاوس مصاحبه کرد. در واقع این بود که اکانت اصلی من رو پیدا کرد. تا چندین روز کسی نمیدونست دیتا رو کی گذاشته و خود کلاب‌هاوس هم نمیدونست از کجا خورده. یکی دیگه هم این مصاحبه بود.

بعد این هلندیه با نشریه nrc هلند مصاحبه کرده در مورد این قضیه که تو این لینک هست.
یه قسمت از متن به من گفته naive :) خب naive پدرته مرتیکه 😂😂
🔥17👍8💯2
Scrapen_is_het_nieuwe_hacken,_blijkt_uit_het_nieuwste_lek_op_Clubhouse.htm
74.5 KB
پستش رو هم پشت paywall گذاشته :)
6👍1
نقشه توزیع مدارس ایران
29
یه موضوعی رو یه دفعه توی توییتر گفتم اما تکنیکش رو توضیح ندادم.

گفتم روی یه سروری، دیتا رو رمزنگاری میکنم و بعد توی دیتابیس ذخیره میکنم بدون اینکه کلید رمزنگاری روی سرور وجود داشته باشه.

به عبارت دیگه، حتی اگر هکر دسترسی root به سرور بگیره و دیتابیس رو کامل بگیره دستش، به هیچ طریقی نمیتونه رمزگشایی کنه. چون اصلا کلید روی سرور نیست که بتونه رمزگشایی کنه. اینکه میگم نیست یعنی واقعا نیست :)

حالا روشش چیه؟ خیلی ساده است. یه worker توی cloudflare نوشتم که کل کاری که میکنه اینه که دیتا رو میگیره، رمزنگاری میکنه و برمیگردونه.

یعنی هکری که دسترسی root گرفته چی میبینه؟ فقط یه endpoint که دیتا خام میگیره، رمزنگاری شده پس میده.

اینجا نکته‌ای که مطرح میشه اینه که امنیت سرور شما بیشتره یا cloudflare؟ پاسخ مشخصه. نیست؟
شما فقط کافیه اکانت cloudflare رو شش قفله کنی. کلید ها امن میمونه.

این ترفند use case خاص خودش رو داره اما مثلا این worker میتونه هش هم بکنه. یه salt هم توی worker تعریف میکنید که با اون هش کنه.

دیگه نمیخوام خیلی عمیق بشم ولی میتونید چندین salt داشته باشید و id اون رو از روی سرور بفرستید برای worker. اینجوری هکر حتی salt هم نداره.


حالا سوال پیش میاد مثلا شماره تلفن یوزر رو اینجوری هش کنی، فردا خودت چه جوری میخوای دسترسی پیدا کنی که مثلا پیامک بفرستی؟ خب اینم روش داره. از دیتابیس kv خود cloudflare میشه استفاده کرد و شماره تلفن و هش معادلش رو ذخیره کرد. روی سرور شماره هش شده رو میدی به یه worker دیگه. اون خودش پیامک میده.

بازم اینجا کلی فرآیند کنترلی میشه تعریف کرد. خلاصه گفتم ایده رو بندازم اینجا، شاید به درد کسی بخوره
🔥33👍117
با سرویس laso میتونید یه کارت اعتباری prepaid داشته باشید.

۱-کافیه مثلا اکستنشن کروم Trust Wallet رو نصب کنید :
https://trustwallet.com/browser-extension
یه اکانت بسازید یا اکانت فعلیتون رو import کنید.

۲-بعد توی laso ثبت نام کنید :
https://laso.finance?ref=ET2cgjcSYCIJHH4JEexi

و وصلش کنید به Trust Wallet و بعد با crypto شارژ کنید و از سایت مورد نظرتون خرید کنید.

تو لینک زیر هم لیست سایت هایی که میتونید داخلشون از کارت اعتباری prepaid این استفاده کنید رو قرار داده :
https://laso.finance/merchants
1221👍7👌3
DB.Rohani.Beta.v8.pdf
22.7 MB
این جزوه درس دیتابیسه که در دوران لیسانس میخوندیم. من این جزوه رو خیلی دوست داشتم.
👍123
کتابی که استاد از روش درس میداد کتاب زیر بود :
Database Systems handbook - Paul J. Fortier

هیچ نسخه دیجیتالی از این کتاب وجود نداشت. فقط ۴۰ صفحه ازش اسکن شده بود و دست به دست بین دانشجو ها می‌چرخید. افراد خیلی زیادی تلاش کردند که کتاب رو پیدا کنن. هیچ کسی موفق نشده بود کتاب رو ‌پیدا کنه. این کتاب برای انتشارات McGraw Hill بود ولی حتی خود McGraw Hill هم دیگه کتابش رو نداشت😂 من چندین بار نمایشگاه کتاب تهران تو غرفه ‌McGraw Hill (البته نمی‌دونم نماینده رسمی بودن یا نه!) اما چنین کتابی نداشتند. اینکه میگم خودشون هم نداشتن یعنی واقعا تو سایتشون اون کتاب وجود نداشت. اصلا هیچ جا نبود!

بعد از دو سال گشتن، متوجه شدم کتابخونه دانشگاهمون یه نسخه داره. یادم نیست کجا سرچ کردم ولی یادمه یه سایت جامعی بود که داخلش می‌تونستی کتاب مورد نظرت رو سرچ کنی و میگفت کتابخونه کدوم دانشگاه اون کتاب رو داره. با خوشحالی رفتم که امانت بگیرم، گفت کتاب مرجعه و کلا امانت نمی‌دیم. کلی پیگیری کردم، از رئیس دانشگاه و سرپرست گرایش مجوز گرفتم که با سفته کتاب رو به من امانت بدن. رفتم سراغ مسئول کتابخونه، بیشرف بازم گفت امانت نمیدیم.

زنگ زدم سرپرست گرایش و گفتم آقا این امانت نمیده. زنگ ‌زد به مسئول کتابخونه که آقا کتاب رو بده بره. گفت نمیدم. یه دعوای مفصل اونجا کردم، چند روز بعد اومدم گفتم مگه نمیگی مرجعه؟ همینجا میشینم میخونم. من حق دارم از این کتاب استفاده کنم. اونم دید دیگه این رو نمیتونه بپیچونه مرحله بعدی با رئیس دانشگاه میام بالا سرش، گفت باشه ولی فقط فلان ساعت تا فلان ساعت.

به نویسنده کتاب هم ایمیل زدم که آقا تو ایران از کتاب شما فقط چند تا نسخه وجود داره و توانایی خریدش رو هم ندارم اجازه دارم کتاب رو کپی کنم؟ گفت آره اشکال نداره. (جدی، خودش هم نداشت که بفرسته 😂😂)

هر روز میرفتم یواشکی چند صفحه از کتاب رو عکس می‌گرفتم و موفق شدم ۳۰۰ صفحه‌ش رو عکس بگیرم ولی کیفیتش خوب نشد و دیگه بیخیال بقیه‌ش شدم. چند سال بعد یکی از دانشجو ها که اون ترم دیتابیس داشت بهم پیام داد که آقا شما این کتاب رو نداری؟ من یه پست توی وبلاگم نوشته بودم و همون نسخه ۴۰ صفحه‌ای رو برای دانلود گذاشته بودم. ظاهرا اونا هم کلی سرچ کرده بودن و نتونسته بودن جایی پیداش کنن. بهش گفتم کتابخونه دانشگاه داره و داستان رو براش تعریف کردم. بعد که رفته بود کتابخونه متوجه شده بود که کتاب مفقود شده. یعنی همون یه نسخه هم به دود رفته بود 😂

اما همین، جرقه ای شد که برن کتابخونه های دانشگاه های دیگه رو بگردن. یه نسخه دیگه تو دانشگاه امیرکبیر پیدا کردن و بالاخره اسکنش کردن و قضیه تموم شد. این ایمیل رو تابستون سال ۱۳۹۷ به من زدن و منم مهر ۱۳۹۷ دانشگاه تهران قبول شدم. فکر می‌کنید اولین کاری که کردم چی بود؟ رفتم ببینم کتابخونه دانشگاه تهران این کتاب رو داره یا نه 😂 یعنی دغدغه جدی شده بود ها!

دیدم آره داره و خیلی راحت رفتم امانت گرفتم و بردم خونه! حالا چالش بعدی این بود که الان چه جوری اسکن کنم؟ از چند جا پرسیدم و گفتن برای اینکه بهترین کیفیت رو بگیری باید شیرازه کتاب باز بشه و اسکن بشه. منم چون امانت گرفته بودم، نمیتونستم چنین کاری کنم. یه جایی رو پیدا کردم که با یه دستگاه مخصوصی، بدون اینکه شیرازه کتاب رو باز کنن، اسکن میکنن اما دو تا مشکل داشت، یکی قیمتش بالا بود و یکی هم تکی انجام نمیدادن.

آخرش خودم یه تخته و چراغ آماده کردم و گوشی رو تنظیم کردم و با کیفیت خوبی عکس گرفتم. اینجوری چالش به پایان رسید. سال ۹۹ همون شخصی که بهم ایمیل زده بود در مورد کتاب بپرسه، گفت ما بالاخره کتاب رو اسکن کردیم و تو کانال زیر قرار دادیم.
👍35🔥148👏3