مجموعه داده اطلاعات 179301 اپلیکیشن کافه بازار
🗃نوع: tabular
📖 توضیحات:
مجموعه داده کافه بازار شامل اطلاعات 179301 اپلیکیشن در این مارکت هست که تا تاریخ 30 اسفند 99 منتشر شدن. این اطلاعات با خزش صفحات وب کافه بازار به دست اومدن که شامل این ویژگی هاست: اسم اپلیکیشن، دسته بندی، امتیاز، تعداد نظرات ثبت شده، حجم، دسته بندی بر اساس تعداد نصب، نوع اپلیکیشن (پولی یا رایگان یا پرداخت درون برنامه ای)، قیمت، نام توسعه دهنده، لینک صفحه توسعه دهنده، اسم پکیج، گونه (برنامه/ بازی)، تعداد تخمینی نصب، شماره نسخه، حجم جریان ترافیک (برحسب تعداد نصب)، میزان فروش و نسبت تعداد نظر به ازای تعداد نصب.
لینک دریافت داده ها:
https://github.com/arshin1989/CafeBazaar
لطفا به اشتراک بگذارید👈
@persian_data
🗃نوع: tabular
📖 توضیحات:
مجموعه داده کافه بازار شامل اطلاعات 179301 اپلیکیشن در این مارکت هست که تا تاریخ 30 اسفند 99 منتشر شدن. این اطلاعات با خزش صفحات وب کافه بازار به دست اومدن که شامل این ویژگی هاست: اسم اپلیکیشن، دسته بندی، امتیاز، تعداد نظرات ثبت شده، حجم، دسته بندی بر اساس تعداد نصب، نوع اپلیکیشن (پولی یا رایگان یا پرداخت درون برنامه ای)، قیمت، نام توسعه دهنده، لینک صفحه توسعه دهنده، اسم پکیج، گونه (برنامه/ بازی)، تعداد تخمینی نصب، شماره نسخه، حجم جریان ترافیک (برحسب تعداد نصب)، میزان فروش و نسبت تعداد نظر به ازای تعداد نصب.
لینک دریافت داده ها:
https://github.com/arshin1989/CafeBazaar
لطفا به اشتراک بگذارید👈
@persian_data
GitHub
GitHub - arshin1989/CafeBazaar: Dataset of CafeBazaar applications and simple EDA
Dataset of CafeBazaar applications and simple EDA. Contribute to arshin1989/CafeBazaar development by creating an account on GitHub.
مجموعه تصاویر محصولات دیجیکالا
🗃نوع: #تصویر
📖 توضیحات:
یکسری تصویر از محصولات دیجیکالا که بر اساس رنگبندی در پوشههای مختلف قرار گرفتند. که توی پروژههای تشخیص رنگ کمک کننده است.
لینک دریافت داده ها:
https://www.kaggle.com/masouduut94/digikala-color-classification
لطفا به اشتراک بگذارید👈
@persian_data
🗃نوع: #تصویر
📖 توضیحات:
یکسری تصویر از محصولات دیجیکالا که بر اساس رنگبندی در پوشههای مختلف قرار گرفتند. که توی پروژههای تشخیص رنگ کمک کننده است.
لینک دریافت داده ها:
https://www.kaggle.com/masouduut94/digikala-color-classification
لطفا به اشتراک بگذارید👈
@persian_data
Kaggle
Digikala Products Color Classification
Digikala fashion dataset for color classification task
دیتاست کوید19
🗃نوع: #متن
📖 توضیحات:
مقاله COPER شامل دو دیتاست COVID-19 Articles و PerSICK بوده که مناسب تسک های Information Retrieval و Semantic Textual Similarity هستند. دیتاست اول شامل 3,500 مقاله مربوط به کرونا بوده (هر مقاله شامل عنوان و متن) و دیتاست دوم نیز شامل 3,000 جفت جملات فارسی بوده که هر جفت از نظر میزان شباهت معنایی از 1 تا 5 امتیازدهی شده است.
لینک دریافت داده ها:
https://github.com/Ledengary/COPER
لطفا به اشتراک بگذارید👈
@persian_data
🗃نوع: #متن
📖 توضیحات:
مقاله COPER شامل دو دیتاست COVID-19 Articles و PerSICK بوده که مناسب تسک های Information Retrieval و Semantic Textual Similarity هستند. دیتاست اول شامل 3,500 مقاله مربوط به کرونا بوده (هر مقاله شامل عنوان و متن) و دیتاست دوم نیز شامل 3,000 جفت جملات فارسی بوده که هر جفت از نظر میزان شباهت معنایی از 1 تا 5 امتیازدهی شده است.
لینک دریافت داده ها:
https://github.com/Ledengary/COPER
لطفا به اشتراک بگذارید👈
@persian_data
GitHub
GitHub - Ledengary/COPER: COPER: a query-adaptable Semantics-based Search Engine for Persian COVID-19 Articles
COPER: a query-adaptable Semantics-based Search Engine for Persian COVID-19 Articles - Ledengary/COPER
A collection of Farsi (Persian) datasets
🗃 نوع: #متن
📖 توضیحات:
اخبار و ویکی پدیا فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sci2lab/Farsi-datasets
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
اخبار و ویکی پدیا فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sci2lab/Farsi-datasets
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mallahyari/Farsi-datasets: A collection of Farsi (Persian) datasets
A collection of Farsi (Persian) datasets. Contribute to mallahyari/Farsi-datasets development by creating an account on GitHub.
Iranian politicians twitter dataset persian
🗃 نوع: #متن
📖 توضیحات:
دیتاست کامل توییتهای سیاسیون ایرانی در توییتر برای کارهای پردازش متن یا پردازش زبانهای طبیعی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/miladfa7/Iranian-politicians-twitter-dataset-persian
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
دیتاست کامل توییتهای سیاسیون ایرانی در توییتر برای کارهای پردازش متن یا پردازش زبانهای طبیعی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/miladfa7/Iranian-politicians-twitter-dataset-persian
لطفا به اشتراک بگذارید👈🏻 @persian_data
دیتاست های فارسی اینستاگرام
🗃 نوع: #متن
📖 توضیحات:
دیتاستهای فارسی اینستاگرام جهت تمرین و تحقیقات
۱ - دیتاست پیچ نماوا (کامنتها و کپشنهای پیچ نماوا)
۲ - دیتاست پیچ فیلیمو (کامنتها و کپشنهای پیچ فیلیمو)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/socialonet/iran-instagram-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
دیتاستهای فارسی اینستاگرام جهت تمرین و تحقیقات
۱ - دیتاست پیچ نماوا (کامنتها و کپشنهای پیچ نماوا)
۲ - دیتاست پیچ فیلیمو (کامنتها و کپشنهای پیچ فیلیمو)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/socialonet/iran-instagram-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - socialonet/iran-instagram-dataset: دیتاست های فارسی اینستاگرام جهت تحقیق و تمرین persian instagram dataset
دیتاست های فارسی اینستاگرام جهت تحقیق و تمرین persian instagram dataset - socialonet/iran-instagram-dataset
متن خام فارسی
🗃 نوع: #متن
📖 توضیحات:
Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/persiannlp/persian-raw-text
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/persiannlp/persian-raw-text
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - persiannlp/persian-raw-text: Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی
Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی. Contribute to persiannlp/persian-raw-text development by creating an account on GitHub.
اسامی فارسی
🗃 نوع: #متن
📖 توضیحات:
اسامی اماکن و اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mrahimygk/persian-data
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
اسامی اماکن و اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mrahimygk/persian-data
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mrahimygk/persian-data: List of names to be used in data-oriented apps and games.
List of names to be used in data-oriented apps and games. - mrahimygk/persian-data
مجموعه اشعار مختلف فارسی
🗃 نوع: #متن
📖 توضیحات:
شامل متن اشعار، ایست واژه ها و کد کرالر. این داده ها برای ایجاد مدل زبانی و nlg توصیه می شود.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amnghd/Persian_Literature_DataBase
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
شامل متن اشعار، ایست واژه ها و کد کرالر. این داده ها برای ایجاد مدل زبانی و nlg توصیه می شود.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amnghd/Persian_Literature_DataBase
لطفا به اشتراک بگذارید👈🏻 @persian_data
Some datasets for ML and Datascience
🗃 نوع: #متن
📖 توضیحات:
یک ریپ از مجموعه دیتاستهای فارسی که یکم بهم ریختس ولی میشه بین فایلها، دیتا خوب پیدا کرد کی دو تا تحلیل فارسی هم هست که دید خوبی به خواننده میده
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/skorani/persian-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
یک ریپ از مجموعه دیتاستهای فارسی که یکم بهم ریختس ولی میشه بین فایلها، دیتا خوب پیدا کرد کی دو تا تحلیل فارسی هم هست که دید خوبی به خواننده میده
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/skorani/persian-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - skorani/persian-dataset
Contribute to skorani/persian-dataset development by creating an account on GitHub.
یک دیتاست جالب برای استخراج کلمات کلیدی
🗃 نوع: #متن
📖 توضیحات:
This repository contains two proposed annotated datasets for automatic keyphrase extraction task. Every dataset contains a document (. txt) and its corresponding text body and text gold-standard keywords list
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/HamidHabibzadeh/KeyphraseExtractionDataset/blob/master/PersianNewsDataset.txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
This repository contains two proposed annotated datasets for automatic keyphrase extraction task. Every dataset contains a document (. txt) and its corresponding text body and text gold-standard keywords list
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/HamidHabibzadeh/KeyphraseExtractionDataset/blob/master/PersianNewsDataset.txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
KeyphraseExtractionDataset/PersianNewsDataset.txt at master · HamidHabibzadeh/KeyphraseExtractionDataset
Persian keyphrase extraction dataset . Contribute to HamidHabibzadeh/KeyphraseExtractionDataset development by creating an account on GitHub.
یک ابزار رایگان کاربردی
🗃 نوع: #سورس_کد
📖 توضیحات:
بارها شده دلمون بخواد فایل pdf فارسی تبدیل کنیم ولی امکانش نبوده . این ابزار رایگان یک کدی هست که به پایتون نوشته شده و هدفش تبدیل pdf هست(حتی pdfهایی که از نوع تصویر هستند)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mmahdibarghi/pdf2txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #سورس_کد
📖 توضیحات:
بارها شده دلمون بخواد فایل pdf فارسی تبدیل کنیم ولی امکانش نبوده . این ابزار رایگان یک کدی هست که به پایتون نوشته شده و هدفش تبدیل pdf هست(حتی pdfهایی که از نوع تصویر هستند)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mmahdibarghi/pdf2txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mmahdibarghi/pdf2txt: python program which could change Persian pdfs with any format (absolutely pdfs which created by…
python program which could change Persian pdfs with any format (absolutely pdfs which created by images) to text file - mmahdibarghi/pdf2txt
اگر هدفتون یادگیری پایتون هست و دنبال یک سری تمرین ساده تا پیچیده هستین توصیه می کنم این ریپ از دست ندین
توضیحات دوستمون در مورد ریپ خوبش:
این مخزن شامل تمرین های من در هنگام یادگیری زبان پایتون می شود . همچنین ترجمه فارسی مسائل سایت پروجکت اویلر هم قرار داده شده است.
https://github.com/siniorone/Project-Euler
@persian_data
توضیحات دوستمون در مورد ریپ خوبش:
این مخزن شامل تمرین های من در هنگام یادگیری زبان پایتون می شود . همچنین ترجمه فارسی مسائل سایت پروجکت اویلر هم قرار داده شده است.
https://github.com/siniorone/Project-Euler
@persian_data
GitHub
GitHub - siniorone/Project-Euler: This repository contains my exercises while learning Python! it's also include the persian translation…
This repository contains my exercises while learning Python! it's also include the persian translation of Project Euler problems! - GitHub - siniorone/Project-Euler: This repository contai...
من اين ديتاست رو با جمع اوري اطلاعت سايت شيپور ساختم. با كمك selenium و beautifulsoap . داده ها كاملا واقعي هستن ويژگي هاي مثل متراژ، ادرس به انگليسي، تعداد اتاق خواب، اسانسور، انباري، پاركينگ ودر نهايت قيمت به تومان و دلار رو شامل ميشه. اميدوارم براتون مفيد باشه. ميتونه تمرين خيلي خوبي براي regression باشه و حس خوبي بهتون بده چون داده ها اشنا به نظر ميان ( همگي مربوط به شهر تهران هستن)
https://www.kaggle.com/mokar2001/house-price-tehran-iran
لطفا به اشتراک بگذارید👈🏻 @persian_data
https://www.kaggle.com/mokar2001/house-price-tehran-iran
لطفا به اشتراک بگذارید👈🏻 @persian_data
Kaggle
House Price (Tehran, Iran)
About 3500 Houses with thier complete information (Price in Dollor & Toman)
دیتاست PersainTelegramData شامل داده های حدودا 500 کانال تلگرامی هست که در یک بازه زمانی دو هفته ایی جمع آوری شده است و مناسب تسک هایی مثل تحلیل داده های یک کانال خاص و یا پیش بینی هشتگ ها و کلمات کلیدی یک متن و یا پیش بینی زمان بعدی ارسال پست توسط یک کانال (مسئله سری زمانی) می باشد
@persian_data
https://github.com/rominaoji/PersianTelegramData
@persian_data
https://github.com/rominaoji/PersianTelegramData
GitHub
GitHub - rominaoji/PersianTelegramData: Persian Telegram Data gathered from 8 July 2021 to 22 July 2021
Persian Telegram Data gathered from 8 July 2021 to 22 July 2021 - rominaoji/PersianTelegramData
اين ديتاست بومی و جالب در زمینه ریسک سکته قلبی هست و برای انجام کارهای بین رشته ای هوش مصنوعی و پزشکی مناسب هست.
https://www.kaggle.com/mokar2001/ascvd-heart-risk
لطفا به اشتراک بگذارید👈🏻 @persian_data
https://www.kaggle.com/mokar2001/ascvd-heart-risk
لطفا به اشتراک بگذارید👈🏻 @persian_data
Kaggle
ASCVD (Heart) Risk
1000 generated samples with many kinds of health condition.
دیتاست جدید، دیتاست کافه بازار که شامل توضیحات و دسته بندی برنامه هست. به درد ایجاد سیستم توصیه گر یا خوشه بندی میخوره.
https://github.com/rastadayon/Persian-App-Denoscription-Classification-using-Transformers
لطفا به اشتراک بگذارید👈🏻 @persian_data
https://github.com/rastadayon/Persian-App-Denoscription-Classification-using-Transformers
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - rastadayon/Persian-App-Denoscription-Classification-using-Transformers: Persian text classification - Classification of…
Persian text classification - Classification of app denoscriptions in their categoriess using X-LMRoberta - rastadayon/Persian-App-Denoscription-Classification-using-Transformers
یک پروژه جالب از تشیخص جنسیت بر اساس متن هستش. این مدل کارها خلاقانه و ترکیبی هستند و خیلی مناسب برای کارهای پژوهشی هست. در ضمن کد و دیتاست این کار
موجود است
https://github.com/mirzanahal/Persian-Gender-Recognition
لطفا به اشتراک بگذارید👈🏻 @persian_data
موجود است
https://github.com/mirzanahal/Persian-Gender-Recognition
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mirzanahal/Persian-Gender-Recognition
Contribute to mirzanahal/Persian-Gender-Recognition development by creating an account on GitHub.
👍1
یک کد و دیتاست فارسی باحال در زمینه تشخیص شایعه
از هر نظر کامل بود و هم روش های مختلف تست شدند و هم دیتاست موجوده و هم شیوه نامه تگ زنی معرفی شده.
https://github.com/Zarharan/PersianStanceDetection
لطفا به اشتراک بگذارید👈🏻 @persian_data
از هر نظر کامل بود و هم روش های مختلف تست شدند و هم دیتاست موجوده و هم شیوه نامه تگ زنی معرفی شده.
https://github.com/Zarharan/PersianStanceDetection
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - Zarharan/PersianStanceDetection: The first Persian stance detection dataset and model
The first Persian stance detection dataset and model - Zarharan/PersianStanceDetection
یک کار ساده و سرگرم کننده
تشخیص موضوع آهنگ های فارسی به کمک lda و topic modeling
کد و دیتاست و توضیحات وجود داره
https://github.com/mohammadaminabbasi/Darkflow-NLP-Persian-Music-Recommendation-on-Lyrics
لطفا به اشتراک بگذارید👈🏻 @persian_data
تشخیص موضوع آهنگ های فارسی به کمک lda و topic modeling
کد و دیتاست و توضیحات وجود داره
https://github.com/mohammadaminabbasi/Darkflow-NLP-Persian-Music-Recommendation-on-Lyrics
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mohammadaminabbasi/Darkflow-NLP-Persian-Music-Recommendation-on-Lyrics: unsupervised process of identifying topics in…
unsupervised process of identifying topics in a set of persian songs by LDA method of topic modelling - mohammadaminabbasi/Darkflow-NLP-Persian-Music-Recommendation-on-Lyrics
👍2