english-2-persian-dataset
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست دیگه واسه ترجمه ماشینی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/ce-fum/english-2-persian-dataset
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست دیگه واسه ترجمه ماشینی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/ce-fum/english-2-persian-dataset
لطفا به اشتراک بگذارید👈🏻@persian_data
یک دیتاست فارسی برای پروژه های مربوط به اینترنت اشیا و smart home
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست جالب مناسب برای تسکهای مربوط به اینترنت اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sepehrhashtroudi/persian-dataset-for-smarthome
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست جالب مناسب برای تسکهای مربوط به اینترنت اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sepehrhashtroudi/persian-dataset-for-smarthome
لطفا به اشتراک بگذارید👈🏻@persian_data
GitHub
GitHub - sepehrhashtroudi/persian-dataset-for-smarthome: persian dataset for smart home applications
persian dataset for smart home applications. Contribute to sepehrhashtroudi/persian-dataset-for-smarthome development by creating an account on GitHub.
داده های گرداوری شده فارسی از توئیتر
🗃 نوع: #متن
📖 توضیحات:
این دیتای خام که پیش پردازش نشده برای تسک هایی مثل مدل زبانی مناسب است.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/00989125864520/raw-data
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📖 توضیحات:
این دیتای خام که پیش پردازش نشده برای تسک هایی مثل مدل زبانی مناسب است.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/00989125864520/raw-data
لطفا به اشتراک بگذارید👈🏻@persian_data
GitHub
GitHub - 00989125864520/raw-data: Raw data collected from Persian Twitter.
Raw data collected from Persian Twitter. Contribute to 00989125864520/raw-data development by creating an account on GitHub.
تاریخچه قیمت شرکت های بورسی ایران
نوع : #mat.
📖 توضیحات :
دیتاست مربوط به سهام شرکت های بورسی داخل ایران هست مثل فملی و ...
در مجموع دیتا ۴۳ شرکت گردآوری شده
این دیتاست در مجموع شامل ۶۰۰۱۵۸ سطر با ۳۸ ستون
برای تحلیل و پیش بینی قیمت سهام شرکت ها مناسب است.
لطفا به اشتراک بگذارید👈🏻 @persian_data
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/hocohelper/securities-and-exchange-iran
نوع : #mat.
📖 توضیحات :
دیتاست مربوط به سهام شرکت های بورسی داخل ایران هست مثل فملی و ...
در مجموع دیتا ۴۳ شرکت گردآوری شده
این دیتاست در مجموع شامل ۶۰۰۱۵۸ سطر با ۳۸ ستون
برای تحلیل و پیش بینی قیمت سهام شرکت ها مناسب است.
لطفا به اشتراک بگذارید👈🏻 @persian_data
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/hocohelper/securities-and-exchange-iran
Kaggle
Securities and Exchange IRAN
History of 41 Iranian companies equities up to date 2021-06-09
دیتاست بیماران مبتلا به کرونا
🗃 نوع: #متن
📖 توضیحات:
Covid-patient-datasets
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amirshnll/Covid-patient-datasets/
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
Covid-patient-datasets
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amirshnll/Covid-patient-datasets/
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - semnan-university-ai/Covid-patient-datasets: The Covid patient datasets dataset is collected by randomly sampling
The Covid patient datasets dataset is collected by randomly sampling - semnan-university-ai/Covid-patient-datasets
دیتاست 105هزار کتاب چاپی ایران
🗃 نوع: #متن
📖 توضیحات:
دیتاست ۱۰۵هزار کتاب چاپی ایران مناسب برای تسک هایی مثل مدل زبانی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mahmoud-eskandari/PersianBooksDataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
دیتاست ۱۰۵هزار کتاب چاپی ایران مناسب برای تسک هایی مثل مدل زبانی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mahmoud-eskandari/PersianBooksDataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mahmoud-eskandari/PersianBooksDataset: دیتاست 105هزار کتاب چاپی ایران + بهمراه جزئیات برای داده کاوی
دیتاست 105هزار کتاب چاپی ایران + بهمراه جزئیات برای داده کاوی - mahmoud-eskandari/PersianBooksDataset
مجموعه داده اطلاعات 179301 اپلیکیشن کافه بازار
🗃نوع: tabular
📖 توضیحات:
مجموعه داده کافه بازار شامل اطلاعات 179301 اپلیکیشن در این مارکت هست که تا تاریخ 30 اسفند 99 منتشر شدن. این اطلاعات با خزش صفحات وب کافه بازار به دست اومدن که شامل این ویژگی هاست: اسم اپلیکیشن، دسته بندی، امتیاز، تعداد نظرات ثبت شده، حجم، دسته بندی بر اساس تعداد نصب، نوع اپلیکیشن (پولی یا رایگان یا پرداخت درون برنامه ای)، قیمت، نام توسعه دهنده، لینک صفحه توسعه دهنده، اسم پکیج، گونه (برنامه/ بازی)، تعداد تخمینی نصب، شماره نسخه، حجم جریان ترافیک (برحسب تعداد نصب)، میزان فروش و نسبت تعداد نظر به ازای تعداد نصب.
لینک دریافت داده ها:
https://github.com/arshin1989/CafeBazaar
لطفا به اشتراک بگذارید👈
@persian_data
🗃نوع: tabular
📖 توضیحات:
مجموعه داده کافه بازار شامل اطلاعات 179301 اپلیکیشن در این مارکت هست که تا تاریخ 30 اسفند 99 منتشر شدن. این اطلاعات با خزش صفحات وب کافه بازار به دست اومدن که شامل این ویژگی هاست: اسم اپلیکیشن، دسته بندی، امتیاز، تعداد نظرات ثبت شده، حجم، دسته بندی بر اساس تعداد نصب، نوع اپلیکیشن (پولی یا رایگان یا پرداخت درون برنامه ای)، قیمت، نام توسعه دهنده، لینک صفحه توسعه دهنده، اسم پکیج، گونه (برنامه/ بازی)، تعداد تخمینی نصب، شماره نسخه، حجم جریان ترافیک (برحسب تعداد نصب)، میزان فروش و نسبت تعداد نظر به ازای تعداد نصب.
لینک دریافت داده ها:
https://github.com/arshin1989/CafeBazaar
لطفا به اشتراک بگذارید👈
@persian_data
GitHub
GitHub - arshin1989/CafeBazaar: Dataset of CafeBazaar applications and simple EDA
Dataset of CafeBazaar applications and simple EDA. Contribute to arshin1989/CafeBazaar development by creating an account on GitHub.
مجموعه تصاویر محصولات دیجیکالا
🗃نوع: #تصویر
📖 توضیحات:
یکسری تصویر از محصولات دیجیکالا که بر اساس رنگبندی در پوشههای مختلف قرار گرفتند. که توی پروژههای تشخیص رنگ کمک کننده است.
لینک دریافت داده ها:
https://www.kaggle.com/masouduut94/digikala-color-classification
لطفا به اشتراک بگذارید👈
@persian_data
🗃نوع: #تصویر
📖 توضیحات:
یکسری تصویر از محصولات دیجیکالا که بر اساس رنگبندی در پوشههای مختلف قرار گرفتند. که توی پروژههای تشخیص رنگ کمک کننده است.
لینک دریافت داده ها:
https://www.kaggle.com/masouduut94/digikala-color-classification
لطفا به اشتراک بگذارید👈
@persian_data
Kaggle
Digikala Products Color Classification
Digikala fashion dataset for color classification task
دیتاست کوید19
🗃نوع: #متن
📖 توضیحات:
مقاله COPER شامل دو دیتاست COVID-19 Articles و PerSICK بوده که مناسب تسک های Information Retrieval و Semantic Textual Similarity هستند. دیتاست اول شامل 3,500 مقاله مربوط به کرونا بوده (هر مقاله شامل عنوان و متن) و دیتاست دوم نیز شامل 3,000 جفت جملات فارسی بوده که هر جفت از نظر میزان شباهت معنایی از 1 تا 5 امتیازدهی شده است.
لینک دریافت داده ها:
https://github.com/Ledengary/COPER
لطفا به اشتراک بگذارید👈
@persian_data
🗃نوع: #متن
📖 توضیحات:
مقاله COPER شامل دو دیتاست COVID-19 Articles و PerSICK بوده که مناسب تسک های Information Retrieval و Semantic Textual Similarity هستند. دیتاست اول شامل 3,500 مقاله مربوط به کرونا بوده (هر مقاله شامل عنوان و متن) و دیتاست دوم نیز شامل 3,000 جفت جملات فارسی بوده که هر جفت از نظر میزان شباهت معنایی از 1 تا 5 امتیازدهی شده است.
لینک دریافت داده ها:
https://github.com/Ledengary/COPER
لطفا به اشتراک بگذارید👈
@persian_data
GitHub
GitHub - Ledengary/COPER: COPER: a query-adaptable Semantics-based Search Engine for Persian COVID-19 Articles
COPER: a query-adaptable Semantics-based Search Engine for Persian COVID-19 Articles - Ledengary/COPER
A collection of Farsi (Persian) datasets
🗃 نوع: #متن
📖 توضیحات:
اخبار و ویکی پدیا فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sci2lab/Farsi-datasets
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
اخبار و ویکی پدیا فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sci2lab/Farsi-datasets
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mallahyari/Farsi-datasets: A collection of Farsi (Persian) datasets
A collection of Farsi (Persian) datasets. Contribute to mallahyari/Farsi-datasets development by creating an account on GitHub.
Iranian politicians twitter dataset persian
🗃 نوع: #متن
📖 توضیحات:
دیتاست کامل توییتهای سیاسیون ایرانی در توییتر برای کارهای پردازش متن یا پردازش زبانهای طبیعی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/miladfa7/Iranian-politicians-twitter-dataset-persian
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
دیتاست کامل توییتهای سیاسیون ایرانی در توییتر برای کارهای پردازش متن یا پردازش زبانهای طبیعی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/miladfa7/Iranian-politicians-twitter-dataset-persian
لطفا به اشتراک بگذارید👈🏻 @persian_data
دیتاست های فارسی اینستاگرام
🗃 نوع: #متن
📖 توضیحات:
دیتاستهای فارسی اینستاگرام جهت تمرین و تحقیقات
۱ - دیتاست پیچ نماوا (کامنتها و کپشنهای پیچ نماوا)
۲ - دیتاست پیچ فیلیمو (کامنتها و کپشنهای پیچ فیلیمو)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/socialonet/iran-instagram-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
دیتاستهای فارسی اینستاگرام جهت تمرین و تحقیقات
۱ - دیتاست پیچ نماوا (کامنتها و کپشنهای پیچ نماوا)
۲ - دیتاست پیچ فیلیمو (کامنتها و کپشنهای پیچ فیلیمو)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/socialonet/iran-instagram-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - socialonet/iran-instagram-dataset: دیتاست های فارسی اینستاگرام جهت تحقیق و تمرین persian instagram dataset
دیتاست های فارسی اینستاگرام جهت تحقیق و تمرین persian instagram dataset - socialonet/iran-instagram-dataset
متن خام فارسی
🗃 نوع: #متن
📖 توضیحات:
Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/persiannlp/persian-raw-text
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/persiannlp/persian-raw-text
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - persiannlp/persian-raw-text: Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی
Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی. Contribute to persiannlp/persian-raw-text development by creating an account on GitHub.
اسامی فارسی
🗃 نوع: #متن
📖 توضیحات:
اسامی اماکن و اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mrahimygk/persian-data
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
اسامی اماکن و اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mrahimygk/persian-data
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mrahimygk/persian-data: List of names to be used in data-oriented apps and games.
List of names to be used in data-oriented apps and games. - mrahimygk/persian-data
مجموعه اشعار مختلف فارسی
🗃 نوع: #متن
📖 توضیحات:
شامل متن اشعار، ایست واژه ها و کد کرالر. این داده ها برای ایجاد مدل زبانی و nlg توصیه می شود.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amnghd/Persian_Literature_DataBase
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
شامل متن اشعار، ایست واژه ها و کد کرالر. این داده ها برای ایجاد مدل زبانی و nlg توصیه می شود.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amnghd/Persian_Literature_DataBase
لطفا به اشتراک بگذارید👈🏻 @persian_data
Some datasets for ML and Datascience
🗃 نوع: #متن
📖 توضیحات:
یک ریپ از مجموعه دیتاستهای فارسی که یکم بهم ریختس ولی میشه بین فایلها، دیتا خوب پیدا کرد کی دو تا تحلیل فارسی هم هست که دید خوبی به خواننده میده
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/skorani/persian-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
یک ریپ از مجموعه دیتاستهای فارسی که یکم بهم ریختس ولی میشه بین فایلها، دیتا خوب پیدا کرد کی دو تا تحلیل فارسی هم هست که دید خوبی به خواننده میده
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/skorani/persian-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - skorani/persian-dataset
Contribute to skorani/persian-dataset development by creating an account on GitHub.
یک دیتاست جالب برای استخراج کلمات کلیدی
🗃 نوع: #متن
📖 توضیحات:
This repository contains two proposed annotated datasets for automatic keyphrase extraction task. Every dataset contains a document (. txt) and its corresponding text body and text gold-standard keywords list
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/HamidHabibzadeh/KeyphraseExtractionDataset/blob/master/PersianNewsDataset.txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
This repository contains two proposed annotated datasets for automatic keyphrase extraction task. Every dataset contains a document (. txt) and its corresponding text body and text gold-standard keywords list
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/HamidHabibzadeh/KeyphraseExtractionDataset/blob/master/PersianNewsDataset.txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
KeyphraseExtractionDataset/PersianNewsDataset.txt at master · HamidHabibzadeh/KeyphraseExtractionDataset
Persian keyphrase extraction dataset . Contribute to HamidHabibzadeh/KeyphraseExtractionDataset development by creating an account on GitHub.
یک ابزار رایگان کاربردی
🗃 نوع: #سورس_کد
📖 توضیحات:
بارها شده دلمون بخواد فایل pdf فارسی تبدیل کنیم ولی امکانش نبوده . این ابزار رایگان یک کدی هست که به پایتون نوشته شده و هدفش تبدیل pdf هست(حتی pdfهایی که از نوع تصویر هستند)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mmahdibarghi/pdf2txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #سورس_کد
📖 توضیحات:
بارها شده دلمون بخواد فایل pdf فارسی تبدیل کنیم ولی امکانش نبوده . این ابزار رایگان یک کدی هست که به پایتون نوشته شده و هدفش تبدیل pdf هست(حتی pdfهایی که از نوع تصویر هستند)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mmahdibarghi/pdf2txt
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mmahdibarghi/pdf2txt: python program which could change Persian pdfs with any format (absolutely pdfs which created by…
python program which could change Persian pdfs with any format (absolutely pdfs which created by images) to text file - mmahdibarghi/pdf2txt
اگر هدفتون یادگیری پایتون هست و دنبال یک سری تمرین ساده تا پیچیده هستین توصیه می کنم این ریپ از دست ندین
توضیحات دوستمون در مورد ریپ خوبش:
این مخزن شامل تمرین های من در هنگام یادگیری زبان پایتون می شود . همچنین ترجمه فارسی مسائل سایت پروجکت اویلر هم قرار داده شده است.
https://github.com/siniorone/Project-Euler
@persian_data
توضیحات دوستمون در مورد ریپ خوبش:
این مخزن شامل تمرین های من در هنگام یادگیری زبان پایتون می شود . همچنین ترجمه فارسی مسائل سایت پروجکت اویلر هم قرار داده شده است.
https://github.com/siniorone/Project-Euler
@persian_data
GitHub
GitHub - siniorone/Project-Euler: This repository contains my exercises while learning Python! it's also include the persian translation…
This repository contains my exercises while learning Python! it's also include the persian translation of Project Euler problems! - GitHub - siniorone/Project-Euler: This repository contai...
من اين ديتاست رو با جمع اوري اطلاعت سايت شيپور ساختم. با كمك selenium و beautifulsoap . داده ها كاملا واقعي هستن ويژگي هاي مثل متراژ، ادرس به انگليسي، تعداد اتاق خواب، اسانسور، انباري، پاركينگ ودر نهايت قيمت به تومان و دلار رو شامل ميشه. اميدوارم براتون مفيد باشه. ميتونه تمرين خيلي خوبي براي regression باشه و حس خوبي بهتون بده چون داده ها اشنا به نظر ميان ( همگي مربوط به شهر تهران هستن)
https://www.kaggle.com/mokar2001/house-price-tehran-iran
لطفا به اشتراک بگذارید👈🏻 @persian_data
https://www.kaggle.com/mokar2001/house-price-tehran-iran
لطفا به اشتراک بگذارید👈🏻 @persian_data
Kaggle
House Price (Tehran, Iran)
About 3500 Houses with thier complete information (Price in Dollor & Toman)