Melanee AI ‌& Physics – Telegram
Melanee AI ‌& Physics
946 subscribers
324 photos
14 videos
72 files
148 links
AI, Physics and Chemistry

GitHub: https://github.com/Melanee-Melanee

Email: melaneepython@gmail.com

Mentor Bot: @MelaneeMentorbot
Download Telegram
Melanee AI ‌& Physics
Photo
معرفی زنده یاد خانم دکتر بدرالزمان قریب، از اساطیر زبان شناسی ایران و استاد زبان های باستانی دانشگاه تهران از زبانِ دکتر مجتبایی استاد دانشگاه تهران:

آشنایی من با بدرالزمان قریب به پیش از فرهنگستان زبان و ادب فارسی و به سال‌ ۱۳۲۹ برمی‌گردد، زمانی که با هم در دانشکده ادبیات هم دوره بودیم. خاطرم هست زمانی هم که در دانشگاه هاروارد مشغول تحصیل بودم، وی که در دانشگاه پنسیلوانیا تحصیل می‌کرد به شهر کمبریج آمد تا با دکتر ریچارد فرای زبان خوارزمی کار کند. وی تخصص‌اش زبان سُغدی بود که در این حوزه فرهنگ‌نامه ارزشمندی هم منتشر کرده است.

دکتر مجتبایی در توضیح دلایل پرداختن بدرالزمان قریب به زبان سُغدی اظهار کرد: پیشرفت علم زمانی اتفاق می‌افتد که یک پژوهشگر به سمت موضوعی می‌رود که کسی اطلاعی از آن ندارد. محقق واقعی کسی است که به سراغ سوژه‌های جدید می‌رود؛ به نظر من رفتن به سمت موضوعی که همه می‌دانند و صحبت کردن درباره آن که دیگر هنر نیست.
مجتبایی در پایان گفت: محقق واقعی به دنبال مجهولات فرهنگ و تاریخ می‌رود و به علت این که آن موضوع طرفدار ندارد و کسی به سمت او نرفته به سمت آن می‌رود و درباره آن می‌نویسد و عمرش را سر آن می‌گذارد تا نقطه تاریک را روشن کند.

پ.ن: زبان سُغدی یکی از زبان های باستانی ایران هست که کمتر کسی در طول تاریخ بهش پرداخته.

از زندگی دکتر بدرالزمان قریب مستندی به نام "با زبان خاموش" ساخته و در فیلیمو منتشر شده.
تصاویر رو از این مستند گرفتم.


منبع
10
تا حالا دو تا درس مهم ازین پروژه جدیدم (EOPL) گرفتم:
اولیش اینکه وقتی برنامه ای مینویسم حتما شماره ورژن کتابخونه ها و ابزارهایی که استفاده میکنم رو مکتوب کنم به طوری که افراد دیگه چند سال بعد از من بتونند برنامه ی من رو اجرا کنند.


دوم اینکه دیتاهایی که با ارزش هستند رو حتما براشون یه فایل metadata تهیه کنم. مثلا تصویر کتیبه های زبان فارسی باستان رو که من دارم از کل دنیا جمع آوری میکنم برای هر دایرکتوریش یه فایل metadata درست کردم و اطلاعات اون عکس هارو داخل یه فایل متادیتا با فرمت CSV ذخیره کردم.  برای دیتای text هم همین کارو کردم که مثلا ترجمه این کتیبه رو از کجا آوردم و کی ترجمه اش کرده و کلی مشخصات دیگه.
این فایل متادیتارو با فرمت JSON هم میتونستم درست کنم ولی خب CSV به چشمم راحت تره.
این دیتاها چون با ارزش هستند و هر کدومشون جزو اسناد هویتی کشورمون محسوب میشن من مجبور بودم فایل های متادیتا هم براشون درست کنم که البته کار بسیار سخت و وقت گیری هست چون باید دیتارو با دقت زیاد، ویرگول به ویرگول، سل به سل وارد این فایل متادیتا کنم! و اینکه وقتی دیتاست من به مرور زمان بزرگ تر میشه؛ کار پردازش دیتای من راحت تر میشه.

برای مثال متادیتای دیتاهایی که تا الان من از موزه بریتانیا جمع آوری کردم رو ببینید:

https://github.com/Electronic-Old-Persian-Library/Old-Persian-Dataset/tree/main/imagedata/british_museum/metadata



کلا تمام کارهایی که انجام میدیم رو باید دقیق براش داکیومنت بنویسیم و مکتوبش کنیم. به نظر من کدنویسیِ دقیق یه هنره که هر برنامه نویسی اول کارش بلد نیست و باید یادش بگیره؛ دقیقا مثل نویسندگی یه کار ادبیه!
👍153
𐎠𐎢𐎼𐎶𐏀𐎡𐎠 (اهورامزدا) (Ahuramazda)

اولین کلمه ای که از زبان فارسی باستان یاد گرفتم، کلمه ی "اهورامزدا" بود🥰.



اگر داریوش بزرگ میدونست قراره خطی که اختراع کرده، ۲۵۰۰ سال بعد توسط دخترخانمی به اسم مِلانی، با یه وسیله ای به اسم کامپیوتر ترجمه و رمزگشایی بشه قطعا از تعجب شاخ درمی آورد🤭.


این عکس ها هم خواستگاه اولین جایی هست که در جهان مدل های AI روی خط میخی فارسی باستان اجرا شد (اینجا میز کارمه)😅.


وقتی این پروژه رو شروع کردم خیلی نگران بودم که نتونم انجامش بدم ولی "نمیتونم" و "نمیشه" و "نداریم" واسه من معنی نداره! من چیزی که بخوام قطعا انجام میشه!


اهورامزدا مرا بپاید.


گیت هاب OCR پروژه:


https://github.com/Melanee-Melanee/Old-Persian-Cuneiform-OCR



#اهورامزدا
#خط_میخی_فارسی_باستان
#هوش_مصنوعی
👍18🔥8👏5😍5
خطای نصب پکیج های pip رو شاید این روزها زیاد ببینیم که میگه Timeout شدید؛ این خطا به علت مشکلات connection شما و احتمالا تحریم ها ایجاد میشه.
اگر میخواید بدون استفاده از VPN و تغییر DNS بتونید این پکیج هارو نصب کنید چند تا نکته بهتون میگم. توجه کنید نکته ها رو برای سیستم عامل GNU/Linux و توزیع Ubuntu دارم میگم:

۱. پکیج منیجر apt رو همیشه آپدیت نگه دارید و  mirror هاشو جایی تنظیم کنید که بتونه آپدیت هارو بگیره چون پکیج منیجر pip خودش توسط پکیج منیجر apt مدیریت میشه!
تنظیم میرورهای apt واسه توزیع ابونتو در این مسیره:

etc/apt/sources.list

۲. خود pip رو ورژنش رو کنترل کنید که آخرین ورژن باشه، یعنی آپدیت باشه.

۳. تمام آپدیت های روزانه سیستم عامل لینوکس که مربوط به security update میشن رو انجام بدید، به خصوص آپدیت های مربوط به system components

۴. از میرور های ایرانی pip، مستقیم در کامندش استفاده کنید، ساختار کامندش اینطوری میشه:

pip install اسم پکیج --index-url آدرس میرور

برای مثال میتونید از کامند زیر که حاوی آدرس میرور aliyun هست برای نصب پکیج pandas استفاده کنید:

pip install pandas --index-url https://mirrors.aliyun.com/pypi/simple/



آدرس میرورهای دیگه ای که میتونید استفاده کنید:

https://pypi.mirrors.ustc.edu.cn/simple/



https://repo.huaweicloud.com/repository/pypi/simple/


توجه: موقع کامند زدن دقت کنید پکیج منیجر شما با دستور pip کار میکنه یا pip3.


کلا لینوکس یه سیستم عاملی هست که باید با آپدیت ها زنده نگهش داریم و نرم افزارهاش همه به صورت تو در تو به هم پیوسته هستند. اگر معماری لینوکس رو ندونیم، علت خطاهاشو متوجه نمیشیم و نمیتونیم برطرفشون کنیم. ولی وقتی بلدش باشیم دیگه معما چو حل گشت آسان شود... 🥰.

موفق باشید

مِلانی
👍111
چه قاب قشنگی🥰🕊...



https://github.com/Electronic-Old-Persian-Library
18👏2
تا الان سه تا مدل OCR واسه زبان فارسی باستان نوشتم که دو تا مدلِ
easyocr_old_persian
و
tessercat_old_persian
کار میکنند. اگر بخواید میتونید الان تست شون کنید.
توجه کنید الان فقط مدل هارو نوشتم ولی چون برای شروع دیتای کمی بهش دادم، فعلا پرفورمنسش کمه ولی در آینده با دیتای بهتر و بیشتری مدلم رو train میکنم تا به نتایج بهتری برسم. در حال حاضر، طبق نتایجی که در عکس ها ملاحضه میکنید؛
confidence score
مدلم حدود 0.5 هست.
تصویر خط میخی ای که ملاحضه میکنید مربوط به ۱۲ خطِ آخر کتیبه ی داریوش بزرگ در تخت جمشید (کتیبه DPd) هست.

لینک گیت هاب پروژه OCR:

https://github.com/Melanee-Melanee/Old-Persian-Cuneiform-OCR


#نتایج
#زبان_فارسی_باستان
👍15🔥3😍2
بند اول و ابتدای بند دوم از کتیبه ی داریوش بزرگ در نقش رستم، کتیبه DNa:



بند ۱ - خدای بزرگ (است) اهورامزدا، که این زمین را آفرید، که آن آسمان را آفرید، که مردم را آفرید، که شادی را برای مردم آفرید...


منبع ویدئو
👍85😍1
انویدیا (Nvidia) دیروز ایمیل زدند و گفتند جدیدا سرویس های خوبی رو برای برنامه نویس های هوش مصنوعی به صورت رایگان ایجاد کرده اند.


لینک خبر


پ.ن: با این همه امکانات و پیشرفت تکنولوژی اگر محصولی خلق نکنیم که به مردم خدمت کند واقعا تحصیل کرده های بی حاصل هستیم!

به قول سعدی:
گر همه عِلم عالِمَت باشد
بی عمل، مدعی و کذابی!
👍16👏2
امروز میخواهم ترجمه ی کتیبه سنگی پی بنای کاخ آپادانای شوش (استان خوزستان) به خط میخی اکدی رو برای شما بازگو کنم.

وقتی اولین بار ترجمه ی این سند تاریخی با ارزش را در موزه ایران باستان خواندم، اشک ذوق در چشمانم جمع شدند و افسوس خوردم که چرا تا به حال متن این کتیبه زیبا رو جایی ندیده بودم.
با خواندن این اسناد تاریخی معتبر، به مهارت و هنر مردم ایران باستان پی میبریم؛ اینکه کشور ما در چنان شکوه و عظمتی بوده واقعا احساس غرور و افتخار رو در نگاه جهانی برای ما ایجاد میکند.
14🔥1🕊1
Melanee AI ‌& Physics
امروز میخواهم ترجمه ی کتیبه سنگی پی بنای کاخ آپادانای شوش (استان خوزستان) به خط میخی اکدی رو برای شما بازگو کنم. وقتی اولین بار ترجمه ی این سند تاریخی با ارزش را در موزه ایران باستان خواندم، اشک ذوق در چشمانم جمع شدند و افسوس خوردم که چرا تا به حال متن این…
ترجمه:

۱. من داریوش هستم، شاه بزرگ، شاه شاهان، شاه مردمان، شاه روی این زمین، پسر ویشتاسپه هخامنشی

۲. و داریوش شاه میگوید اهوره مزدا بزرگترین خدایان مرا آفرید. این شهریاری را برای من ساخت. این شهریاری را به من داد، بزرگ، زیبا، با مردان و با اسبان

۳. و به خواست اهوره مزدا پدرم ویشتاسپه و ارشامه پدربزرگم هر دو زنده بوده اند هنگامی که اهوره مزدا مرا روی زمین شاه کرد.

۴. اهوره مزدا چنین خواست: در تمام گستره این زمین، او مرا همچون مرد برگزید. او مرا روی این زمین شاه کرد.

۵. من این قدیه را به اهوره مزدا دادم؛ اهوره مزدا یاریش را به من داد؛ آنچه من میخواستم بکنم، مرا در آن کار کامیاب گرداند؛ آنچه من کردم به خواست اهوره مزدا آن را کردم.

۶. کاخی که من در شوش ساختم از دور دست موادش آورده شدند و در عمق زمین کنده شد تا جایی که به سنگ برسد؛ وقتی که کاملاً کنده شد، روی شن پایه هایش ساخته شدند. ۲۰ ارش، روی این شن کاخی ساخته شد.


۷. این کار که زمین تا عمق برداشته شود و اینکه روی شفته پایه ها ساخته شوند و اینکه آجرها قالب ریزی شوند، مردمان بابل این کار را کردند.


۸. و چوب سدر از کوهی به نام لبنان آورده شده؛ مردمان آشور آن را تا بابل آوردند و از بابل، کاریها و یونانیان تا شوش آوردند و چوب یکا از گنداره و کرمان آورده شد.

۹. و طلا از لیدیا و باختر (بلخ) آورده شد؛ آن در اینجا کار گذاشته شده و سنگ لاجورد و عقیق که در اینجا کار گذاشته شدند از سغدیانه آورده شدند. فیروزه ای که از خوارزم آورده شد، در اینجا کار گذاشته شد.


۱۰. و نقره و آبنوس از مصر آورده شدند؛ تزئیناتی که با آن دیوارها تزئین شده اند از ایونیه آورده شد؛ و عاجی که در اینجا کار گذاشته شد از حبشه ،هند و ارخوزیا (رخج) آورده شد.

۱۱.‌و ستونهای سنگی که در اینجا کار گذاشته شدند از روستایی به نام آبیرادو در عیلام آورده شدند. تراشکارانی که سنگ را کار گذاشتند از یونانیان و از لیدیای ها بودند.

۱۲. و زرگرانی که زرگری کردند از مادها و از مصری ها بوده اند و مردانی که چوب کار کردند از لیدیایی ها و مصریان بوده اند و مردانی که خشت زدند از بابلی ها بودند و مردانی که دیوارها را تزئین کردند از مادها و مصریان بوده اند.

۱۳. و داریوش شاه میگوید: به خواست اهوره مزدا در شوش بسیاری از کارهای زیبا کرده شد، بسیاری از کارهای زیبا کرده شد.
اهوره مزدا من و مردمم را بپایاد.
32🕊3😭3❤‍🔥1
چگونه برای اولین بار در جهان، خط میخی فارسی باستان توسط خاور شناس انگلیسی، هنرلی راولینسون (Henry Rawlinson) در سال ۱۸۴۵ میلادی، ترجمه و رمز گشایی شد؟
مجموعه مقالات تحت عنوان "تاریخ خط میخی فارسی باستان" نوشته ی دکتر پرویز رجبی در مجله چیستا در دهه شصت هجری خورشیدی، این موضوع را شفاف سازی کرده اند. پی دی اف مقالات را در گیت هابم منتشر کرده ام:


لینک مقالات



خیلی خلاصه اش را بخواهم بگویم، رمز گشایی به روش
comparative linguistics
یا زبان شناسی مقایسه ای انجام شده چون عین محتوای مشابه خط میخی فارسی باستان در بیستون، در کتیبه هایی با زبان یونان باستان و سانسکریت هم وجود داشته و چون خط یونان باستان (Ancient Greek) قبلا رمزگشایی و آوانویسی شده بوده، متعاقبا متن های مشابه آن با خط میخی فارسی باستان نیز رمزگشایی شد. غیر از این مورد، آزمایش های بسیار پیچیده ای در طی سال های طولانی در موزه بریتانیا نیز انجام شد که منجر به رمزگشایی خط میخی فارسی باستان شد.

البته قبل از هنری راولینسون، گئورک فردریش گروتفند، نخستین واژگان خط فارسی باستان را رمز گشایی کرده بود.



#رمز_گشایی_خط_میخی_فارسی_باستان
👍83
2005.14165v4.pdf
6.5 MB
مقاله اصلی ChatGPT که توسط شرکت Openai در سال ۲۰۲۰ منتشر شد.
4