چون حجم پروژه زبان فارسی باستان زیاده و در آینده قراره وسیع تر بشه و خب مسلما در یک ریپازیتوری گیتهاب جا نمیشه؛ به همین علت براش یک اورگانیزیشن (organization) ساختم.
اگه کسی علاقه داشته باشه میتونه روی این پروژه کار کنه؛ بهم ایمیل بزنید تا من در آینده شما رو عضو لیست People کنم، خیلی هم خوشحال میشم🥰.
کارهای غیر فنی و غیر کدی هم زیاد دارم؛ مثلا پیدا کردن کتاب های خوب، مقاله، ساختن world list برای این زبان، جمع آوری دیتای عکس از کتیبه ها یا دیتای متنی از زبان فارسی باستان و ....
https://github.com/Electronic-Persian-Old-Library
اگه کسی علاقه داشته باشه میتونه روی این پروژه کار کنه؛ بهم ایمیل بزنید تا من در آینده شما رو عضو لیست People کنم، خیلی هم خوشحال میشم🥰.
کارهای غیر فنی و غیر کدی هم زیاد دارم؛ مثلا پیدا کردن کتاب های خوب، مقاله، ساختن world list برای این زبان، جمع آوری دیتای عکس از کتیبه ها یا دیتای متنی از زبان فارسی باستان و ....
https://github.com/Electronic-Persian-Old-Library
👍9
آیا به تجزیه و تحلیل موسیقی علاقه دارید؟ این پروژه گیتهاب برای شماست! 🎶
پروژه Music Analyzer به شما امکان میدهد تا به تجزیه و تحلیل و پردازش دادههای موسیقی بپردازید. این ابزار میتواند ویژگیهای مختلف موسیقی را استخراج کرده و اطلاعات مفیدی را در اختیار شما قرار دهد. از این پروژه میتوانید در پژوهشهای خود، توسعه اپلیکیشنهای موسیقی 🎵، یا حتی در پروژههای یادگیری ماشین 🤖 استفاده کنید.
برای دسترسی به این ابزار کارآمد، از لینک زیر استفاده کنید:
📱 GitHub Repo
پروژه Music Analyzer به شما امکان میدهد تا به تجزیه و تحلیل و پردازش دادههای موسیقی بپردازید. این ابزار میتواند ویژگیهای مختلف موسیقی را استخراج کرده و اطلاعات مفیدی را در اختیار شما قرار دهد. از این پروژه میتوانید در پژوهشهای خود، توسعه اپلیکیشنهای موسیقی 🎵، یا حتی در پروژههای یادگیری ماشین 🤖 استفاده کنید.
برای دسترسی به این ابزار کارآمد، از لینک زیر استفاده کنید:
📱 GitHub Repo
GitHub
GitHub - Hasti-Jalali/Music-Analyzer: This project focuses on classifying Persian music genres using data preprocessing, visualizations…
This project focuses on classifying Persian music genres using data preprocessing, visualizations, and machine learning techniques. - Hasti-Jalali/Music-Analyzer
👍8
اگر به حوزه پردازش زبان طبیعی (NLP) و مدلهای زبانی هوش مصنوعی علاقهمندید، این مجموعه داده برای شماست! این پروژه با هدف ارزیابی عملکرد ChatGPT برای زبان فارسی ایجاد شده است. شامل مجموعهای متنوع از سوالات و پاسخها به زبان فارسی میباشد که میتواند در پروژههای مرتبط با توسعه مدلهای AI و NLP بسیار کاربردی باشد. میتوانید از این دیتاست برای ارزیابی و بهبود مدلهای زبان فارسی در اپلیکیشنهای چتبوت، ترجمه ماشینی و سایر کاربردهای مشابه استفاده کنید.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - Ipouyall/Benchmarking_ChatGPT_for_Persian: Benchmarking ChatGPT for Persian: A Preliminary Study
Benchmarking ChatGPT for Persian: A Preliminary Study - Ipouyall/Benchmarking_ChatGPT_for_Persian
👍8
مجموعهای جامع از کلمات در تمامی زبانها! این ریپازیتوری شامل یک دیتاست بزرگ و کلیه کلمات موجود در زبانهای مختلف است. برای محققین و علاقهمندان به پردازش زبان طبیعی (NLP) و مطالعات زبانشناسی میتواند بسیار مفید واقع شود. از این دیتاست در پروژههای ترجمه خودکار، تشخیص زبان، و تحلیل متنی میتوانید استفاده کنید.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - eymenefealtun/all-words-in-all-languages: This repository contains all the words from every language that exists in the…
This repository contains all the words from every language that exists in the universe. - eymenefealtun/all-words-in-all-languages
👍3
مجموعه تصاویری از جملات فارسی، شامل 2000 تصویر با کیفیت بالا که حاوی متون فارسی در سبکها و فونتهای مختلف هستند. این دیتاست برای پروژههای پردازش تصویر، OCR و تحلیل متون بسیار مفید است. هدف از ایجاد این مجموعه، ارائه منبعی غنی برای تحقیق و توسعه الگوریتمهای تشخیص و خواندن متون فارسی در تصاویر است.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - Nigje/persian-sentences-image-dataset: The dataset comprises 264 Persian sentences presented in 11 distinct fonts. Each…
The dataset comprises 264 Persian sentences presented in 11 distinct fonts. Each sentence is transformed into an individual image aligned in a single line. Subsequently, these images underwent a co...
👍7
PHate is a Persian multi-label hate speech dataset curated for hate speech detection tasks. It includes annotations with annotator rationales, providing valuable insights into the annotators' decision-making process. The dataset comprises 7K data.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - Zahra-D/Phate: Repo for "Spanning the Spectrum of Hatred Detection: A Persian Multi-Label Hate Speech Dataset with Annotator…
Repo for "Spanning the Spectrum of Hatred Detection: A Persian Multi-Label Hate Speech Dataset with Annotator Rationales" paper - Zahra-D/Phate
👍2
این دیتاست شامل مجموعهای از دادههای فینگلیش (فارسی با الفبای لاتین) میباشد که برای استفاده در پروژههای تحلیل متن و پردازش زبان طبیعی بسیار مفید است. دیتاست شامل ۲۰۰۰ جمله و بیش از ۵۰۰۰ کلمه مختلف است که از منابع مختلف جمعآوری شدهاند. از این مجموعه داده میتوان در پروژههای تبدیل فینگلیش به فارسی، ساخت مدلهای زبانی، و حتی بهبود سیستمهای پیشنهاد دهنده کلمات استفاده کرد.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - mmahdibarghi/finglish-dataset: Persian to Finglish dataset with all the sentences voice for TTS dataset used to train…
Persian to Finglish dataset with all the sentences voice for TTS dataset used to train tacotron2 - mmahdibarghi/finglish-dataset
👍7
ترجمه سایت محبوب w3schools
این مخزن شامل مجموعهای جامع از نکات و دستورالعملهای پایهای پایتون به زبان فارسی است. مناسب برای کسانی که تازه وارد دنیای برنامهنویسی شدهاند یا به دنبال تمرین و تقویت مهارتهای اولیه خود در پایتون هستند. با این مخزن میتوانید مباحث مختلف شامل متغیرها، توابع، حلقهها و استثناها را به طریقی ساده و روان یاد بگیرید. مناسب برای دانشآموزان، دانشجویان و هر کسی که میخواهد پایتون را از صفر تا صد بیاموزد و در پروژههای ساده خود استفاده کند.
📱 GitHub Repo
این مخزن شامل مجموعهای جامع از نکات و دستورالعملهای پایهای پایتون به زبان فارسی است. مناسب برای کسانی که تازه وارد دنیای برنامهنویسی شدهاند یا به دنبال تمرین و تقویت مهارتهای اولیه خود در پایتون هستند. با این مخزن میتوانید مباحث مختلف شامل متغیرها، توابع، حلقهها و استثناها را به طریقی ساده و روان یاد بگیرید. مناسب برای دانشآموزان، دانشجویان و هر کسی که میخواهد پایتون را از صفر تا صد بیاموزد و در پروژههای ساده خود استفاده کند.
📱 GitHub Repo
GitHub
GitHub - imsalione/PythonFundamentals-Farsi: This repository was created using w3schools training methods for my personal practice…
This repository was created using w3schools training methods for my personal practice as well as general use for learning in the JupyterNotebook environment. - imsalione/PythonFundamentals-Farsi
👍5
The data was meticulously collected from Telegram, focusing on public channels. These channels were identified and curated by our team of agents, dedicated to exploring and discovering relevant content.
Dataset Statistics:
Largest Available Corpus to Date
Average Length of Document: 46 tokens
Number of Documents: 188,874,296
Number of Channels Scraped: 58,000
Uncompressed Size: 123 GB
Channels List: Available in channels.json
📱 GitHub Repo
Dataset Statistics:
Largest Available Corpus to Date
Average Length of Document: 46 tokens
Number of Documents: 188,874,296
Number of Channels Scraped: 58,000
Uncompressed Size: 123 GB
Channels List: Available in channels.json
📱 GitHub Repo
GitHub
GitHub - rezhv/Persian_text_corpus
Contribute to rezhv/Persian_text_corpus development by creating an account on GitHub.
👍6
یه دیتاست جامع و متنوع شامل متون فارسی تحت عنوان «جام جم کورپوس»،
این مجموعه داده حاوی متون فارسی از سایت جام جم هست. این دیتاست میتواند برای پروژههای پردازش زبان طبیعی (NLP) و ساخت مدلهای یادگیری ماشین مورد استفاده قرار گیرد. اگر در حوزههایی مثل تشخیص احساسات، خلاصهسازی متون یا ترجمه ماشینی فعالیت میکنید، این دیتاست میتونه بسیار کاربردی باشه.
📱 GitHub Repo
این مجموعه داده حاوی متون فارسی از سایت جام جم هست. این دیتاست میتواند برای پروژههای پردازش زبان طبیعی (NLP) و ساخت مدلهای یادگیری ماشین مورد استفاده قرار گیرد. اگر در حوزههایی مثل تشخیص احساسات، خلاصهسازی متون یا ترجمه ماشینی فعالیت میکنید، این دیتاست میتونه بسیار کاربردی باشه.
📱 GitHub Repo
GitHub
GitHub - MohammadrezaAmani/JameJamCorpus: Official repository of Jam-e Jam News Dataset and NLP Model.
Official repository of Jam-e Jam News Dataset and NLP Model. - GitHub - MohammadrezaAmani/JameJamCorpus: Official repository of Jam-e Jam News Dataset and NLP Model.
👍5
این مجموعه داده شامل بیش از 5800 توییت فارسی است که با دقت برچسبگذاری شدهاند (برای تشخیص کنایه) تا موضع کاربران در مورد موضوعات خاص را مشخص کند. این دیتاست به ویژه برای پژوهشهای مرتبط با پردازش زبان طبیعی (NLP) و تحلیل احساسات کاربرد دارد. از این دیتاست میتوان در پروژههای مختلفی از جمله خلق مدلهای یادگیری ماشینی برای تشخیص موضع و تحلیل احساسات متون فارسی استفاده کرد.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - vkiani/stance: Persian Stance Detection
Persian Stance Detection. Contribute to vkiani/stance development by creating an account on GitHub.
👍13❤1
این پروژه یک مجموعه ابزارهای پردازش متن فارسی پایه رو در اختیار شما قرار میده. با استفاده از این ابزارها میتونید کارهایی مثل توکنسازی، نرمالسازی، استمینگ و حذف توقفکلمات رو برای متون فارسی انجام بدید. این ابزارها برای پروژههای مرتبط با پردازش زبان طبیعی (NLP) و تحلیل متن بسیار کاربردی هستن. همراه با توضیح و مستندات کامل، این پروژه مناسب برای محققان، توسعهدهندگان و علاقهمندان به حوزه پردازش زبان فارسی است.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - SajadKazemi/parsimatn: A Persian font for scientific and formal writings
A Persian font for scientific and formal writings. Contribute to SajadKazemi/parsimatn development by creating an account on GitHub.
👍8
نرمافزاری ساده و کاربردی برای تولید کد ملی ایرانی با پایتون! این ابزار به شما امکان میدهد تا با استفاده از دستورات CMD و زبان برنامهنویسی پایتون، بهراحتی کد ملیهای معتبر و صحیح بسازید. این پروژه میتواند برای تست واحد (Unit Testing) و تولید دادههای تصادفی در پروژههای مختلف مورد استفاده قرار گیرد. لینک گیتهاب را برای اطلاعات بیشتر مشاهده کنید.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - Rmanamr/CMD-generate-Iraninan-national-code-Python: Python CMD program for generating valid Iranian national codes and…
Python CMD program for generating valid Iranian national codes and saving them into a .txt file. - Rmanamr/CMD-generate-Iraninan-national-code-Python
👍4
Danial Ebrat
سلام! امیدوارم حال دلتون خوب باشه 😊
بالاخره بعد از این همه مدت گفتم این رو براتون آمادش کنم!
یه نرم افزار ساده نوشتم که میتونه به صورت خودکار از لیست اساتید مورد نظر، متناسب با فیلد تحقیقاتی هر استاد، متن ایمیل و رزومه ی مربوط به اون فیلد رو انتخاب کنه، اسم استاد، دانشگاه و گروهش رو در متن ایمیل جایگذاری کنه، رزومه، و در صورت نیاز دانشنامه رو هم ضمیمه کنه و با عنوانی مشخص، ایمیل رو برای استاد ارسال کنه.
💥
برای دانیال های بعدی در مسیر مهاجرت تحصیلی، اینجوری دیگه تمرکزتون میتونه تنها روی پیدا کردن استاد مناسب با فیلدتون باشه به جای وقت گذاشتن برای ایمیل زدن.
.
من با استفاده از این نرم افزار حدود حدود 30-40 تا مصاحبه گرفتم که در نهایت منجر شد به ۶ پذیرش برای پوزیشن های دکترا.
.
، البته، از کیفیت ایمیل هم غافل نشید! مثل تکه های پازل، سعی کنید هر تکه رو به بهترین شکل ممکن در بیارید.
.
تمام اطلاعات رو میتونید از صفحه ی گیتهاب پروژه بخونید، و در این ویدیو میتونین طریقه ی استفاده از این نرم افزار رو ببینید
.
امیدوارم این نرم افزار مسیرتون رو هموار تر کنه.
اگر وقت کنم (که اصلا معلوم نیست کی) بهتون هم یاد میدم اصلا این ایمیل ها رو از کجا پیدا کنید. روش هایی که تجربی یاد گرفتم و احتمالا تا حالا نشنیدین.
کم و کاستی ها رو ببخشید، سعی کردم با کمال گرایی مبارزه کنم و در ویدیو یوتیوب
مشکلات مشخص هست. 😄
با تشکر از احسان برای ایده ی قشنگش که پایه گذار اصلی به وجود آمدن این پروژه بود ❤️
Ehsan Barkhordar
لینک ویدئو
سلام! امیدوارم حال دلتون خوب باشه 😊
بالاخره بعد از این همه مدت گفتم این رو براتون آمادش کنم!
یه نرم افزار ساده نوشتم که میتونه به صورت خودکار از لیست اساتید مورد نظر، متناسب با فیلد تحقیقاتی هر استاد، متن ایمیل و رزومه ی مربوط به اون فیلد رو انتخاب کنه، اسم استاد، دانشگاه و گروهش رو در متن ایمیل جایگذاری کنه، رزومه، و در صورت نیاز دانشنامه رو هم ضمیمه کنه و با عنوانی مشخص، ایمیل رو برای استاد ارسال کنه.
💥
برای دانیال های بعدی در مسیر مهاجرت تحصیلی، اینجوری دیگه تمرکزتون میتونه تنها روی پیدا کردن استاد مناسب با فیلدتون باشه به جای وقت گذاشتن برای ایمیل زدن.
.
من با استفاده از این نرم افزار حدود حدود 30-40 تا مصاحبه گرفتم که در نهایت منجر شد به ۶ پذیرش برای پوزیشن های دکترا.
.
، البته، از کیفیت ایمیل هم غافل نشید! مثل تکه های پازل، سعی کنید هر تکه رو به بهترین شکل ممکن در بیارید.
.
تمام اطلاعات رو میتونید از صفحه ی گیتهاب پروژه بخونید، و در این ویدیو میتونین طریقه ی استفاده از این نرم افزار رو ببینید
.
امیدوارم این نرم افزار مسیرتون رو هموار تر کنه.
اگر وقت کنم (که اصلا معلوم نیست کی) بهتون هم یاد میدم اصلا این ایمیل ها رو از کجا پیدا کنید. روش هایی که تجربی یاد گرفتم و احتمالا تا حالا نشنیدین.
کم و کاستی ها رو ببخشید، سعی کردم با کمال گرایی مبارزه کنم و در ویدیو یوتیوب
مشکلات مشخص هست. 😄
با تشکر از احسان برای ایده ی قشنگش که پایه گذار اصلی به وجود آمدن این پروژه بود ❤️
Ehsan Barkhordar
لینک ویدئو
YouTube
Profmailer: Send Automatic Emails to find Graduate Positions
.
سلام! امیدوارم حال دلتون خوب باشه 😊
تو این ویدیو بهتون آموزش دادم چطور از نرم افزار profmailer برای تسریع فرایند ایمیل زدن به اساتید استفاده کنید تا بتونید راحت تر پوزیشن های تحصیلی مورد نظرتون رو پیدا کنید. نرم افزاری که میتونه به صورت خودکار از لیست اساتید،…
سلام! امیدوارم حال دلتون خوب باشه 😊
تو این ویدیو بهتون آموزش دادم چطور از نرم افزار profmailer برای تسریع فرایند ایمیل زدن به اساتید استفاده کنید تا بتونید راحت تر پوزیشن های تحصیلی مورد نظرتون رو پیدا کنید. نرم افزاری که میتونه به صورت خودکار از لیست اساتید،…
👍13
سلام دوستان
من یه پکیج پایتون نوشتم برای تبدیل pdf به word فارسی
این پکیج کاملا از زبان فارسی پشتیبانی میکنه.
این پکیح رو تویpypi منتشر کردم
https://pypi.org/project/persian-pdf-converter/2.3.1
اگر براتون مقدوره به ریپازیتوری گیت هاب پکیج ستاره بدین
https://github.com/mahdiramezanii/persian_pdf_converter
من یه پکیج پایتون نوشتم برای تبدیل pdf به word فارسی
این پکیج کاملا از زبان فارسی پشتیبانی میکنه.
این پکیح رو تویpypi منتشر کردم
https://pypi.org/project/persian-pdf-converter/2.3.1
اگر براتون مقدوره به ریپازیتوری گیت هاب پکیج ستاره بدین
https://github.com/mahdiramezanii/persian_pdf_converter
👍29
این پروژه به خلاصهسازی خودکار گفتار پرداخته است. با استفاده از الگوریتمهای پردازش زبان طبیعی و تکنیکهای یادگیری ماشین، این سیستم قادر است گفتار را به متن تبدیل کرده و خلاصهای از آن را ارائه دهد. این پروژه میتواند در برنامههای متنوعی مانند تولید محتوا، استنطاق خودکار جلسات و استخراج اطلاعات کلیدی از فایلهای صوتی مفید باشد.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - ZahraArshia/Speech-Summarization: Persian Speech Summarization Dataset and Test Bench Model
Persian Speech Summarization Dataset and Test Bench Model - ZahraArshia/Speech-Summarization
👍4
این دیتاست پزشکی مناسب برای پروژههای پرسش و پاسخ (QA) با هدف بهبود سیستمهای هوش مصنوعی در زمینه تشخیص و پاسخ به سوالات پزشکی تهیه شده است. این مجموعه شامل نمونههای سوال و جواب مرتبط با موضوعات پزشکی است که از منابع معتبر جمعآوری شدهاند. از این دیتاست میتوان در پروژههای پردازش زبان طبیعی (NLP) و سیستمهای هوشمند پزشکی استفاده کرد.
📱 GitHub Repo
📱 GitHub Repo
GitHub
GitHub - LeilaDarabi/QA-medical: Persian Medical Question Answering
Persian Medical Question Answering. Contribute to LeilaDarabi/QA-medical development by creating an account on GitHub.
👍8
اگر شما هم مثل من مشکل دارید که وقتی میرید توی سایت medium.com و مقالات اکثرا پریمیوم هست و نمیتونید بخونید، باید بگم که خدا شما رو دوست داشته که این پست رو دیدید.😁
خب حالا راه حل چیه؟🤔
فقط کافیه لینک مقاله رو توی این سایت بزارید | readmedium.com | و تمام🪄.
Amirreza Heydari
خب حالا راه حل چیه؟🤔
فقط کافیه لینک مقاله رو توی این سایت بزارید | readmedium.com | و تمام🪄.
Amirreza Heydari
👍31