Melanee AI ‌& Physics
948 subscribers
324 photos
14 videos
72 files
148 links
AI, Physics and Chemistry

GitHub: https://github.com/Melanee-Melanee

Email: [email protected]

Mentor Bot: @MelaneeMentorbot
Download Telegram
Melanee AI ‌& Physics
تو روزهای سخت زندگیم به سر میبرم، ساختن یه الگوریتم ocr واسه خط میخی فارسی باستان (Old Persian) شده آرزوم ولی خب با همه سختی هاش خیلی شیرینه برام🥺. بلخره روزی میرسه به خودم میگم ارزششو داشت! کار کردن روی این پروژه ها خیلی سخته چون برای این خط منابع کافی…
دوستان این پروژه AI من واسه رمزگشایی خط میخی زبان فارسی باستان به نظرم یه پروژه ی ملی هست چون اثر مثبتش رو کل مردم کشور عزیزمون ایران میبینند و از لحاظ فرهنگی تاثیر زیادی رو آدم ها داره، نه تنها ایرانی ها بلکه مردم کل دنیا.

به نظرم احتمال داره در آینده، مثلا صد سال دیگه کسی (مغز انسانی) وجود نداشته باشه که بتونه این خط های میخی رو ترجمه کنه ولی این پروژه های AI ما تو دنیا میمونه و آدم ها میتوننند متن کتیبه های باستانی رو به راحتی ترجمه کنند، این خیلی اتفاق بزرگیه.

(تو پرانتز بگم هنوز کلی اسناد تاریخی کشف نشده تو دنیا وجود داره که در آینده ممکنه کشف بشن، کلی کتیبه های باستانی الان زیرخاکه که محتواهای ارزشمندی دارند.)

خلاصه خواستم اهمیت کار رو متوجه بشید و همکاری کنید تا من زنده هستم یه متخصص OCR پیدا کنم و این پروژه رو انجامش بدم🥰🙏💖🌸🕊.


#پروژه_ملی
19👍3🥰1👏1
این مدت واسه پروژه ی رمزگشایی کتییه های باستانی به چند تا متخصص تو کل دنیا ایمیل زدم، همه جوابمو دادن به جز ایرانی ها! حتی یکی وسط جنگ کشورشون هم جواب ایمیلمو داد ولی هم وطن های خودم جواب ندادند.

واقعا چرا ایمیل هارو جدی نمیگیرید؟! رسمی ترین راه ارتباطی آدم ها همین ایمیله به نظرم، جواب بدید. باید فرهنگ سازی کنیم.


#فرهنگ_سازی
👍24😢3❤‍🔥1
به نام وطن🕊

تو خیالاتم آرزو میکنم از خودم هزارتا تکثیر کنم بعد هرکدوم خودمو بزارم تو یه لوکیشن تاریخی و باستانی ایران و از اون لوکیشن محافظت کنم!🥺

کاش خونمون تو تخت جمشید بود، هر روز می اومدم سنگ هاشو بوس میکردم، زمینشو آب و جارو میکردم!🥺

این عشق چی کار میکنه با آدم!

لوکیشن: موزه ملی ایران

الواح زرین و سیمین داریوش بزرگ که به سه زبان میخی فارسی باستان، بابِلی و ایلامی نوشتنش.

بحمد خدا مدل OCR زبان میخی فارسی باستان رو مینویسم یه روز.
21❤‍🔥1👍1🥰1👏1🤩1😍1
ساعت ۵ صبح بوقت ۳۰ خرداد ۱۴۰۳ هجری خورشیدی، من همچنان در حال تلاش برای ساختن مدل OCR برای خط میخی فارسی باستان هستم🥰.
لحظه های قشنگیه...

من دارم این مدل رو مینویسم برای روزگاری که ممکنه در آینده شخصیت های بزرگ و باسوادی مثل پروفسور عبدالمجید ارفعی دیگه تو این دنیا نباشند که بتونند خط میخی رو ترجمه کنند.

لااقل مدل من تو این دنیا میمونه و آدم ها به کمک هوش مصنوعی میتونند همچنان خط میخی رو ترجمه کنند و پرده از اسرار تاریخ بردارند.


پ.ن: تصویر۲: ماکت منشور آزادی ملل کوروش(خطش میخی اکدی هست) که اولین بار توسط پروفسور عبدالمجید ارفعی به زبان فارسی مدرن ترجمه شد‌.


فکر کنم من جزو اولین ایرانی هایی هستم که دارم روی خط میخی فارسی باستان(Old Persian Cuneiform) با الگوریتم های AI کار میکنم🕊.


#خط_فارسی_باستان

#هوش_مصنوعی

لینک گیت هاب پروژه ام:


https://github.com/Melanee-Melanee/Old-Persian-Cuneiform-OCR
26👍4👏2🕊2❤‍🔥1
در زبان فارسی باستان هر کلمه با یک میخ کج از کلمه ی بعدی جدا میشه.
اگه جایی کتیبه میخی فارسی باستان دیدید، به این نکته توجه کنید.

در فاز بعدی پروژه ام (بعد از OCR) برای ترجمه زبان فارسی باستان، باید یه world list درست کنم، یه جورهایی مثل یه فرهنگ لغت که معنی هر کلمه رو نوشته باشه. احتمالا یه چند سالی از عمرم میره تا من این لیست رو بتونم جمع آوری و تدوین کنم🤭.
سپس در فاز بعدی پروژه وارد مرحله NLP میشم.

#زبان_فارسی_باستان
17👏2
راجب خودِ زبان فارسی باستان دوست دارید بهتون آموزش بدم؟
Anonymous Poll
91%
آره جالبه🥰
9%
نه خوشم نمیاد😒
یک کتاب خیلی جالب و با ارزش پیدا کردم، یعنی عاشق تک تک صفحاتش شدم🥰.
11
Melanee AI ‌& Physics
Photo
نمیدونم تو کشورمون چند هزار کتیبه یا لوح باستانی شکسته و خورد شده داریم که دارند در انبار موزه ها خاک میخورند و اداره میراث فرهنگی هیچ حرکت مثبتی براشون انجام نمیده!
قطعا این کتیبه ها محتوای با ارزشی دارند.‌

مهمترین هدف پروژه ی همکارم پروفسور انریکه جیمنز (پروژه eBL) این هست که بتونند به کمک الگوریتم های AI تمام بیست هزارتا کتیبه شکسته و خورد شده موزه بریتانیا رو شناسایی کنند و عین قطعات پازل کنار هم بچینند که بعد بتونند متن کامل کتیبه هارو بخونند که البته هم موفق شدند.

مسلما چشم انسان همچین قدرتی نداره که بتونه در کسری از ثانیه بیست هزارتا قطعه کتیبه های شکسته شده رو ببینه و تشخیص بده کدوم قطعه ها متعلق به هم بودند!

این که دارم الان یه مدل OCR مینویسم به خاطر اینکه بتونم به کمک الگوریتم های بینایی ماشین، متن موجود در این لوح ها رو استخراج کنم و در فاز بعدی پروژه، اون متن هارو (text) وارد مرحله ی NLP کنم. خب حتما میدونید که مدل های NLP میتونند بفهمند که کدوم متن ها دارند راجب یک موضوع یکسان صحبت میکنند و بهم پیوستگی قطعات خورد شده به این صورت شناسایی و قطعات با هم match میشوند.
👍113🔥1
Melanee AI ‌& Physics
Photo
چون حجم پروژه زبان فارسی باستان زیاده و در آینده قراره وسیع تر بشه و خب مسلما در یک ریپازیتوری گیتهاب جا نمیشه؛ به همین علت براش یک اورگانیزیشن (organization) ساختم.

اگه کسی علاقه داشته باشه میتونه روی این پروژه کار کنه؛ بهم ایمیل بزنید تا من در آینده شما رو عضو لیست People کنم، خیلی هم خوشحال میشم🥰.


کارهای غیر فنی و غیر کدی هم زیاد دارم؛ مثلا پیدا کردن کتاب های خوب، مقاله، ساختن world list برای این زبان، جمع آوری دیتای عکس از کتیبه ها یا دیتای متنی از زبان فارسی باستان و ....


فکر کنم این اورگانیزیشن قراره با ارزش ترین دستاورد زندگیم باشه.

الهی به امید تو🙏

آدرس ایمیلم:
[email protected]

لینک گیتهاب این اورگانیزیشن:


https://github.com/Electronic-Old-Persian-Library
16👍2😎1
برای این پروژه جدیدم میخوام بزرگترین و کاملترین دیتاست زبانِ فارسی باستان رو درست کنم؛ این مرحله هست که خیلی زمان بره.

یکی از دوستان بهم گفت کارتون خیلی ارزشمنده، مثل شاهنامه فردوسی!

منم احتمالا بعد سی سال این شعر رو با خودم زمزمه میکنم:

بسی رنج بردم در این سال سی
عجم زنده کردم بدین باستان پارسی😄



https://github.com/Electronic-Old-Persian-Library/Old-Persian-Dataset
21👍2
Melanee AI ‌& Physics
برای این پروژه جدیدم میخوام بزرگترین و کاملترین دیتاست زبانِ فارسی باستان رو درست کنم؛ این مرحله هست که خیلی زمان بره. یکی از دوستان بهم گفت کارتون خیلی ارزشمنده، مثل شاهنامه فردوسی! منم احتمالا بعد سی سال این شعر رو با خودم زمزمه میکنم: بسی رنج بردم…
سلام دوستان عزیزم🥰

من دارم یک دیتاست کامل از کتیبه های باستانی به زبان فارسی باستان (Old Persian) جمع آوری میکنم، هم دیتای Image و هم دیتای Text.

خیلی خوشحال میشم همکاری کنید تصاویر و متون کتیبه های فارسی باستان رو سرچ کنید و برام ایمیل شون کنید با ذکر مشخصات و جزییات؛ یا مستقیما در ریپازیتوری Dataset پروژه در گیت هاب بزاریدشون.

خیلی ممنونم🙏💚🤍❤️

لینک گیت هاب پروژه مربوط به دیتاست:

https://github.com/Electronic-Old-Persian-Library/Old-Persian-Dataset


آدرس ایمیلم:
[email protected]

#EOPL
#Datagathing
11👍6👏1