مجموعه اشعار مختلف فارسی
🗃 نوع: #متن
📖 توضیحات:
شامل متن اشعار، ایست واژه ها و کد کرالر. این داده ها برای ایجاد مدل زبانی و nlg توصیه می شود.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amnghd/Persian_Literature_DataBase
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
شامل متن اشعار، ایست واژه ها و کد کرالر. این داده ها برای ایجاد مدل زبانی و nlg توصیه می شود.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amnghd/Persian_Literature_DataBase
لطفا به اشتراک بگذارید👈🏻 @persian_data
Some datasets for ML and Datascience
🗃 نوع: #متن
📖 توضیحات:
یک ریپ از مجموعه دیتاستهای فارسی که یکم بهم ریختس ولی میشه بین فایلها، دیتا خوب پیدا کرد کی دو تا تحلیل فارسی هم هست که دید خوبی به خواننده میده
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/skorani/persian-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
یک ریپ از مجموعه دیتاستهای فارسی که یکم بهم ریختس ولی میشه بین فایلها، دیتا خوب پیدا کرد کی دو تا تحلیل فارسی هم هست که دید خوبی به خواننده میده
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/skorani/persian-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - skorani/persian-dataset
Contribute to skorani/persian-dataset development by creating an account on GitHub.
یک دیتاست جالب برای استخراج کلمات کلیدی
🗃 نوع: #متن
📖 توضیحات:
This repository contains two proposed annotated datasets for automatic keyphrase extraction task. Every dataset contains a document (. txt) and its corresponding text body and text gold-standard keywords list
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/HamidHabibzadeh/KeyphraseExtractionDataset/blob/master/PersianNewsDataset.txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
This repository contains two proposed annotated datasets for automatic keyphrase extraction task. Every dataset contains a document (. txt) and its corresponding text body and text gold-standard keywords list
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/HamidHabibzadeh/KeyphraseExtractionDataset/blob/master/PersianNewsDataset.txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
KeyphraseExtractionDataset/PersianNewsDataset.txt at master · HamidHabibzadeh/KeyphraseExtractionDataset
Persian keyphrase extraction dataset . Contribute to HamidHabibzadeh/KeyphraseExtractionDataset development by creating an account on GitHub.
یک ابزار رایگان کاربردی
🗃 نوع: #سورس_کد
📖 توضیحات:
بارها شده دلمون بخواد فایل pdf فارسی تبدیل کنیم ولی امکانش نبوده . این ابزار رایگان یک کدی هست که به پایتون نوشته شده و هدفش تبدیل pdf هست(حتی pdfهایی که از نوع تصویر هستند)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mmahdibarghi/pdf2txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #سورس_کد
📖 توضیحات:
بارها شده دلمون بخواد فایل pdf فارسی تبدیل کنیم ولی امکانش نبوده . این ابزار رایگان یک کدی هست که به پایتون نوشته شده و هدفش تبدیل pdf هست(حتی pdfهایی که از نوع تصویر هستند)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mmahdibarghi/pdf2txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mmahdibarghi/pdf2txt: python program which could change Persian pdfs with any format (absolutely pdfs which created by…
python program which could change Persian pdfs with any format (absolutely pdfs which created by images) to text file - mmahdibarghi/pdf2txt
اگر هدفتون یادگیری پایتون هست و دنبال یک سری تمرین ساده تا پیچیده هستین توصیه می کنم این ریپ از دست ندین
توضیحات دوستمون در مورد ریپ خوبش:
این مخزن شامل تمرین های من در هنگام یادگیری زبان پایتون می شود . همچنین ترجمه فارسی مسائل سایت پروجکت اویلر هم قرار داده شده است.
https://github.com/siniorone/Project-Euler
@persian_data
توضیحات دوستمون در مورد ریپ خوبش:
این مخزن شامل تمرین های من در هنگام یادگیری زبان پایتون می شود . همچنین ترجمه فارسی مسائل سایت پروجکت اویلر هم قرار داده شده است.
https://github.com/siniorone/Project-Euler
@persian_data
GitHub
GitHub - siniorone/Project-Euler: This repository contains my exercises while learning Python! it's also include the persian translation…
This repository contains my exercises while learning Python! it's also include the persian translation of Project Euler problems! - GitHub - siniorone/Project-Euler: This repository contai...
من اين ديتاست رو با جمع اوري اطلاعت سايت شيپور ساختم. با كمك selenium و beautifulsoap . داده ها كاملا واقعي هستن ويژگي هاي مثل متراژ، ادرس به انگليسي، تعداد اتاق خواب، اسانسور، انباري، پاركينگ ودر نهايت قيمت به تومان و دلار رو شامل ميشه. اميدوارم براتون مفيد باشه. ميتونه تمرين خيلي خوبي براي regression باشه و حس خوبي بهتون بده چون داده ها اشنا به نظر ميان ( همگي مربوط به شهر تهران هستن)
https://www.kaggle.com/mokar2001/house-price-tehran-iran
لطفا به اشتراک بگذارید👈🏻 @persian_data
https://www.kaggle.com/mokar2001/house-price-tehran-iran
لطفا به اشتراک بگذارید👈🏻 @persian_data
Kaggle
House Price (Tehran, Iran)
About 3500 Houses with thier complete information (Price in Dollor & Toman)
دیتاست PersainTelegramData شامل داده های حدودا 500 کانال تلگرامی هست که در یک بازه زمانی دو هفته ایی جمع آوری شده است و مناسب تسک هایی مثل تحلیل داده های یک کانال خاص و یا پیش بینی هشتگ ها و کلمات کلیدی یک متن و یا پیش بینی زمان بعدی ارسال پست توسط یک کانال (مسئله سری زمانی) می باشد
@persian_data
https://github.com/rominaoji/PersianTelegramData
@persian_data
https://github.com/rominaoji/PersianTelegramData
GitHub
GitHub - rominaoji/PersianTelegramData: Persian Telegram Data gathered from 8 July 2021 to 22 July 2021
Persian Telegram Data gathered from 8 July 2021 to 22 July 2021 - rominaoji/PersianTelegramData
اين ديتاست بومی و جالب در زمینه ریسک سکته قلبی هست و برای انجام کارهای بین رشته ای هوش مصنوعی و پزشکی مناسب هست.
https://www.kaggle.com/mokar2001/ascvd-heart-risk
لطفا به اشتراک بگذارید👈🏻 @persian_data
https://www.kaggle.com/mokar2001/ascvd-heart-risk
لطفا به اشتراک بگذارید👈🏻 @persian_data
Kaggle
ASCVD (Heart) Risk
1000 generated samples with many kinds of health condition.
دیتاست جدید، دیتاست کافه بازار که شامل توضیحات و دسته بندی برنامه هست. به درد ایجاد سیستم توصیه گر یا خوشه بندی میخوره.
https://github.com/rastadayon/Persian-App-Denoscription-Classification-using-Transformers
لطفا به اشتراک بگذارید👈🏻 @persian_data
https://github.com/rastadayon/Persian-App-Denoscription-Classification-using-Transformers
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - rastadayon/Persian-App-Denoscription-Classification-using-Transformers: Persian text classification - Classification of…
Persian text classification - Classification of app denoscriptions in their categoriess using X-LMRoberta - rastadayon/Persian-App-Denoscription-Classification-using-Transformers
یک پروژه جالب از تشیخص جنسیت بر اساس متن هستش. این مدل کارها خلاقانه و ترکیبی هستند و خیلی مناسب برای کارهای پژوهشی هست. در ضمن کد و دیتاست این کار
موجود است
https://github.com/mirzanahal/Persian-Gender-Recognition
لطفا به اشتراک بگذارید👈🏻 @persian_data
موجود است
https://github.com/mirzanahal/Persian-Gender-Recognition
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mirzanahal/Persian-Gender-Recognition
Contribute to mirzanahal/Persian-Gender-Recognition development by creating an account on GitHub.
👍1
یک کد و دیتاست فارسی باحال در زمینه تشخیص شایعه
از هر نظر کامل بود و هم روش های مختلف تست شدند و هم دیتاست موجوده و هم شیوه نامه تگ زنی معرفی شده.
https://github.com/Zarharan/PersianStanceDetection
لطفا به اشتراک بگذارید👈🏻 @persian_data
از هر نظر کامل بود و هم روش های مختلف تست شدند و هم دیتاست موجوده و هم شیوه نامه تگ زنی معرفی شده.
https://github.com/Zarharan/PersianStanceDetection
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - Zarharan/PersianStanceDetection: The first Persian stance detection dataset and model
The first Persian stance detection dataset and model - Zarharan/PersianStanceDetection
یک کار ساده و سرگرم کننده
تشخیص موضوع آهنگ های فارسی به کمک lda و topic modeling
کد و دیتاست و توضیحات وجود داره
https://github.com/mohammadaminabbasi/Darkflow-NLP-Persian-Music-Recommendation-on-Lyrics
لطفا به اشتراک بگذارید👈🏻 @persian_data
تشخیص موضوع آهنگ های فارسی به کمک lda و topic modeling
کد و دیتاست و توضیحات وجود داره
https://github.com/mohammadaminabbasi/Darkflow-NLP-Persian-Music-Recommendation-on-Lyrics
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mohammadaminabbasi/Darkflow-NLP-Persian-Music-Recommendation-on-Lyrics: unsupervised process of identifying topics in…
unsupervised process of identifying topics in a set of persian songs by LDA method of topic modelling - mohammadaminabbasi/Darkflow-NLP-Persian-Music-Recommendation-on-Lyrics
👍2
یک پروژه تکست کلسیفیکیشن که پروژه ارشد بوده
دیتاست از توییتر فارسی جمع اوری شده و به صورت خودکار و براساس هشتگ برچسب خورده
هم دیتاست وجود داره و هم کل پیاده سازیها
https://github.com/elirn98/classification-of-persian-tweets-using-neural-networks
لطفا به اشتراک بگذارید👈🏻 @persian_data
دیتاست از توییتر فارسی جمع اوری شده و به صورت خودکار و براساس هشتگ برچسب خورده
هم دیتاست وجود داره و هم کل پیاده سازیها
https://github.com/elirn98/classification-of-persian-tweets-using-neural-networks
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - elirn98/classification-of-persian-tweets-using-neural-networks
Contribute to elirn98/classification-of-persian-tweets-using-neural-networks development by creating an account on GitHub.
یک دیتابیس از حدود 700 هزار کلمه فارسی
یکی از مهم ترین کاربردهاش توی مدلهای زبانی هست. و البته یک کار خوبی که میشه باهاش کرد حذف کلمات بی معنی که توسط توکنایزر تشخیص داده میشه...
https://github.com/shahind/Persian-Words-Database
لطفا به اشتراک بگذارید👈🏻 @persian_data
یکی از مهم ترین کاربردهاش توی مدلهای زبانی هست. و البته یک کار خوبی که میشه باهاش کرد حذف کلمات بی معنی که توسط توکنایزر تشخیص داده میشه...
https://github.com/shahind/Persian-Words-Database
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - shahind/Persian-Words-Database: About 700,000 Persian(Farsi) Words
About 700,000 Persian(Farsi) Words. Contribute to shahind/Persian-Words-Database development by creating an account on GitHub.
پروژه باحال
تشخیص پلاک خودروهای ایرانی
خوشبختانه دیتاستش هم موجوده
https://github.com/Ali-Fartout/Persian-Vehicle-License-Plate-Recognition
لطفا به اشتراک بگذارید👈🏻 @persian_data
تشخیص پلاک خودروهای ایرانی
خوشبختانه دیتاستش هم موجوده
https://github.com/Ali-Fartout/Persian-Vehicle-License-Plate-Recognition
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - Ali-Fartout/Persian-Vehicle-License-Plate-Recognition: Persian Vehicle License Plate Recognition
Persian Vehicle License Plate Recognition. Contribute to Ali-Fartout/Persian-Vehicle-License-Plate-Recognition development by creating an account on GitHub.
سلام دوستان روزتون بخیر.
من روی تسک کلاسیفیکیشن بر روی یک دیتاستی کار می کنم و احساس کردم کار به نقطه ای رسیده که نواقص کار به لطف شما برطرف بشه و اگر جای بهبود داره، بهبودش بدین.
https://github.com/mohsenMahmoodzadeh/Image-Caption-classification-with-tensorflow-Keras
لینک دیتاست در بخش readme ریپازیتوری قرار داده شده.
ممنون میشم اگر احساس کردین محتوای ریپازیتوری براتون مفید بوده، با star دادن ازش حمایت کنید و یا با ایجاد issue یا fork کردن، به تکمیل کار کنید تا بنده هم از تجربه و تخصص تون استفاده کنم.
پیشاپیش خیلی ممنونم.🙏
@persian_data
من روی تسک کلاسیفیکیشن بر روی یک دیتاستی کار می کنم و احساس کردم کار به نقطه ای رسیده که نواقص کار به لطف شما برطرف بشه و اگر جای بهبود داره، بهبودش بدین.
https://github.com/mohsenMahmoodzadeh/Image-Caption-classification-with-tensorflow-Keras
لینک دیتاست در بخش readme ریپازیتوری قرار داده شده.
ممنون میشم اگر احساس کردین محتوای ریپازیتوری براتون مفید بوده، با star دادن ازش حمایت کنید و یا با ایجاد issue یا fork کردن، به تکمیل کار کنید تا بنده هم از تجربه و تخصص تون استفاده کنم.
پیشاپیش خیلی ممنونم.🙏
@persian_data
GitHub
GitHub - mohsenMahmoodzadeh/Image-and-Text-Classifier: Deep learning models(CNN, LSTM, BERT) for image and text classification…
Deep learning models(CNN, LSTM, BERT) for image and text classification task with Tensorflow and Keras - GitHub - mohsenMahmoodzadeh/Image-and-Text-Classifier: Deep learning models(CNN, LSTM, BERT)...
Sentiment analysis on telegram channels news for predicting bearish or bullish stocks
داستان از این قراره که خیلی وقته برای تشخیص و تحلیل قیمت دلار و طلا و ارز سعی می کنن از nlp استفاده کنند. این یک نمونه دست به نقدش روی زبان فارسیه
دیتاست هم موجود است
https://github.com/mirzanahal/Persian-Stock-Prediction
لطفا به اشتراک بگذارید👈🏻 @persian_data
داستان از این قراره که خیلی وقته برای تشخیص و تحلیل قیمت دلار و طلا و ارز سعی می کنن از nlp استفاده کنند. این یک نمونه دست به نقدش روی زبان فارسیه
دیتاست هم موجود است
https://github.com/mirzanahal/Persian-Stock-Prediction
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mirzanahal/Persian-Stock-Prediction: Sentiment analysis on telegram channels news for predicting bearish or bullish stocks.
Sentiment analysis on telegram channels news for predicting bearish or bullish stocks. - mirzanahal/Persian-Stock-Prediction
دیتاست فارسی 30 هزارتایی توییتر برای تحلیل احساسات
برخلاف دیتاست های رایج 6 کلاسه هست و مناسب برای تست مدل های شما
لطفا به اشتراک بگذارید👈🏻 @persian_data
https://github.com/nazaninsbr/Persian-Emotion-Detection
برخلاف دیتاست های رایج 6 کلاسه هست و مناسب برای تست مدل های شما
لطفا به اشتراک بگذارید👈🏻 @persian_data
https://github.com/nazaninsbr/Persian-Emotion-Detection
GitHub
GitHub - nazaninsbr/Persian-Emotion-Detection
Contribute to nazaninsbr/Persian-Emotion-Detection development by creating an account on GitHub.
👍1
یادتون هست بچگی ازمون می خواستم فعل های فارسی صرف کنیم
این ریپ برامون این کار خودکار انجام میده
در پیش پردازش متن ها به خصوص خیلی به درد میخوره و باعث میشه pos بهتری داشته باشیم
https://github.com/asdoost/CPVI
لطفا به اشتراک بگذارید👈🏻 @persian_data
این ریپ برامون این کار خودکار انجام میده
در پیش پردازش متن ها به خصوص خیلی به درد میخوره و باعث میشه pos بهتری داشته باشیم
https://github.com/asdoost/CPVI
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - asdoost/CPVI: CPVI (Comprehensive Persian Verb Inflector) is a Persian Verb Inflector. PVI uses Dual Mechanism theory…
CPVI (Comprehensive Persian Verb Inflector) is a Persian Verb Inflector. PVI uses Dual Mechanism theory (Words & Rules theory) to inflect Persian verbs. - GitHub - asdoost/CPVI: CPVI (C...
دانشگاه شریف یک کورس آمار و احتمالات گذاشته که کدهای مربوط به جلسات هم موجوده.
یک بخشی به به زبان r و بخشی با پایتون
ترکیب مفاهیم اماری و کدنویسی باعث یادگیری سریع تر و ماندگارتر میشه پس از دستش ندین.
https://github.com/asharifiz/Probability_Statistics
لطفا به اشتراک بگذارید👈🏻 @persian_data
یک بخشی به به زبان r و بخشی با پایتون
ترکیب مفاهیم اماری و کدنویسی باعث یادگیری سریع تر و ماندگارتر میشه پس از دستش ندین.
https://github.com/asharifiz/Probability_Statistics
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - SharifiZarchi/Probability_Statistics: دورهی آمار و احتمال مهندسی، برای دانشجویان
دورهی آمار و احتمال مهندسی، برای دانشجویان. Contribute to SharifiZarchi/Probability_Statistics development by creating an account on GitHub.