قیمت خانه های تهران
نوع: #جدولی
📖 توضیحات:
این دیتاست شامل 12383 سطر با 9 ستون هست که از سایت دیوار گرداوری شده است. این دیتای برای پیش بینی قیمت خانه و اجاره مناسب است.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/amiralimadadi/tehran-housing
لطفا به اشتراک بگذارید👈🏻 @persian_data
نوع: #جدولی
📖 توضیحات:
این دیتاست شامل 12383 سطر با 9 ستون هست که از سایت دیوار گرداوری شده است. این دیتای برای پیش بینی قیمت خانه و اجاره مناسب است.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/amiralimadadi/tehran-housing
لطفا به اشتراک بگذارید👈🏻 @persian_data
Kaggle
Tehran_Housing
The price of renting a house in Tehran at the end of 1399.
مرجع دیتاست فارسی
قیمت خانه های تهران نوع: #جدولی 📖 توضیحات: این دیتاست شامل 12383 سطر با 9 ستون هست که از سایت دیوار گرداوری شده است. این دیتای برای پیش بینی قیمت خانه و اجاره مناسب است. 📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇 https://www.k…
این هم لینک پروژه اسکرپ و نوت بوک رگرسیون روی همین دیتاست
https://github.com/amiralimadadi/Divar_WebScrap
https://github.com/amiralimadadi/Regression_TheranHousing
https://github.com/amiralimadadi/Divar_WebScrap
https://github.com/amiralimadadi/Regression_TheranHousing
GitHub
GitHub - amiralimadadi/Divar_WebScrap: Web scrap on divar website (Tehran) to generate a dataset on housing price in Tehran.
Web scrap on divar website (Tehran) to generate a dataset on housing price in Tehran. - amiralimadadi/Divar_WebScrap
Forwarded from پست دیتاست
Persian word embedding
🗃 نوع: #متن
📖 توضیحات:
Persian word embedding (نشاننده واژهها فارسی | تعبیه سازی کلمات فارسی)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/ashalogic/Persian-Word-Embedding
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📖 توضیحات:
Persian word embedding (نشاننده واژهها فارسی | تعبیه سازی کلمات فارسی)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/ashalogic/Persian-Word-Embedding
لطفا به اشتراک بگذارید👈🏻@persian_data
GitHub
GitHub - ashalogic/Persian-Word-Embedding: Persian word embedding ( نشاننده واژه ها فارسی | تعبیه سازی کلمات فارسی )
Persian word embedding ( نشاننده واژه ها فارسی | تعبیه سازی کلمات فارسی ) - ashalogic/Persian-Word-Embedding
Informal Persian Question Answer Dataset
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست جذاب واسه تسک پرسخ و پاسخ
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/SadeghiHamid/Informal-Persian-Question-Answer-Dataset
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست جذاب واسه تسک پرسخ و پاسخ
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/SadeghiHamid/Informal-Persian-Question-Answer-Dataset
لطفا به اشتراک بگذارید👈🏻@persian_data
GitHub
SadeghiHamid/Informal-Persian-Question-Answer-Dataset
Contribute to SadeghiHamid/Informal-Persian-Question-Answer-Dataset development by creating an account on GitHub.
دیتابیس لغات و اصطلاحات فارسی
🗃 نوع: #متن
📖 توضیحات:
مجموعه نزدیک به ۷۰۰ هزار کلمه فارسی متشکل از فرهنگ لغت معین، کلمات فارسی ویکی پدیا، اشعار فارسی و سایر منابع برای کاربردهای پردازش داده و زبان هر کلمه در یک خط قرار گرفته است
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/shahind/Persian-Words-Database
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
مجموعه نزدیک به ۷۰۰ هزار کلمه فارسی متشکل از فرهنگ لغت معین، کلمات فارسی ویکی پدیا، اشعار فارسی و سایر منابع برای کاربردهای پردازش داده و زبان هر کلمه در یک خط قرار گرفته است
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/shahind/Persian-Words-Database
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - shahind/Persian-Words-Database: About 700,000 Persian(Farsi) Words
About 700,000 Persian(Farsi) Words. Contribute to shahind/Persian-Words-Database development by creating an account on GitHub.
persian_pdf_books
🗃 نوع: #متن
📖 توضیحات:
در فایل اکسل مجموعهای از اطلاعات کتابهای یکی از سایتهای دانلود کتاب آنلاین فارسی موجود است. مجموعا ۲۸۲۴ کتاب با ۶ ویژگی که شامل نام کتاب، تاریخ درج کتاب در سایت، خلاصهای از محتوا کتاب، دسته بندی کتاب، نام نویسنده و تعداد کامنت هایی که برای کتاب در سایت درج شده است
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mohamad-dehghani/persian_datasets
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📖 توضیحات:
در فایل اکسل مجموعهای از اطلاعات کتابهای یکی از سایتهای دانلود کتاب آنلاین فارسی موجود است. مجموعا ۲۸۲۴ کتاب با ۶ ویژگی که شامل نام کتاب، تاریخ درج کتاب در سایت، خلاصهای از محتوا کتاب، دسته بندی کتاب، نام نویسنده و تعداد کامنت هایی که برای کتاب در سایت درج شده است
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mohamad-dehghani/persian_datasets
لطفا به اشتراک بگذارید👈🏻@persian_data
GitHub
GitHub - mohamad-dehghani/persian-pdf-books-dataset: This dataset contains information on Persian pdf books.
This dataset contains information on Persian pdf books. - mohamad-dehghani/persian-pdf-books-dataset
english-2-persian-dataset
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست دیگه واسه ترجمه ماشینی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/ce-fum/english-2-persian-dataset
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست دیگه واسه ترجمه ماشینی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/ce-fum/english-2-persian-dataset
لطفا به اشتراک بگذارید👈🏻@persian_data
یک دیتاست فارسی برای پروژه های مربوط به اینترنت اشیا و smart home
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست جالب مناسب برای تسکهای مربوط به اینترنت اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sepehrhashtroudi/persian-dataset-for-smarthome
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📖 توضیحات:
یک دیتاست جالب مناسب برای تسکهای مربوط به اینترنت اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sepehrhashtroudi/persian-dataset-for-smarthome
لطفا به اشتراک بگذارید👈🏻@persian_data
GitHub
GitHub - sepehrhashtroudi/persian-dataset-for-smarthome: persian dataset for smart home applications
persian dataset for smart home applications. Contribute to sepehrhashtroudi/persian-dataset-for-smarthome development by creating an account on GitHub.
داده های گرداوری شده فارسی از توئیتر
🗃 نوع: #متن
📖 توضیحات:
این دیتای خام که پیش پردازش نشده برای تسک هایی مثل مدل زبانی مناسب است.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/00989125864520/raw-data
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📖 توضیحات:
این دیتای خام که پیش پردازش نشده برای تسک هایی مثل مدل زبانی مناسب است.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/00989125864520/raw-data
لطفا به اشتراک بگذارید👈🏻@persian_data
GitHub
GitHub - 00989125864520/raw-data: Raw data collected from Persian Twitter.
Raw data collected from Persian Twitter. Contribute to 00989125864520/raw-data development by creating an account on GitHub.
تاریخچه قیمت شرکت های بورسی ایران
نوع : #mat.
📖 توضیحات :
دیتاست مربوط به سهام شرکت های بورسی داخل ایران هست مثل فملی و ...
در مجموع دیتا ۴۳ شرکت گردآوری شده
این دیتاست در مجموع شامل ۶۰۰۱۵۸ سطر با ۳۸ ستون
برای تحلیل و پیش بینی قیمت سهام شرکت ها مناسب است.
لطفا به اشتراک بگذارید👈🏻 @persian_data
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/hocohelper/securities-and-exchange-iran
نوع : #mat.
📖 توضیحات :
دیتاست مربوط به سهام شرکت های بورسی داخل ایران هست مثل فملی و ...
در مجموع دیتا ۴۳ شرکت گردآوری شده
این دیتاست در مجموع شامل ۶۰۰۱۵۸ سطر با ۳۸ ستون
برای تحلیل و پیش بینی قیمت سهام شرکت ها مناسب است.
لطفا به اشتراک بگذارید👈🏻 @persian_data
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/hocohelper/securities-and-exchange-iran
Kaggle
Securities and Exchange IRAN
History of 41 Iranian companies equities up to date 2021-06-09
دیتاست بیماران مبتلا به کرونا
🗃 نوع: #متن
📖 توضیحات:
Covid-patient-datasets
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amirshnll/Covid-patient-datasets/
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
Covid-patient-datasets
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amirshnll/Covid-patient-datasets/
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - semnan-university-ai/Covid-patient-datasets: The Covid patient datasets dataset is collected by randomly sampling
The Covid patient datasets dataset is collected by randomly sampling - semnan-university-ai/Covid-patient-datasets
دیتاست 105هزار کتاب چاپی ایران
🗃 نوع: #متن
📖 توضیحات:
دیتاست ۱۰۵هزار کتاب چاپی ایران مناسب برای تسک هایی مثل مدل زبانی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mahmoud-eskandari/PersianBooksDataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
دیتاست ۱۰۵هزار کتاب چاپی ایران مناسب برای تسک هایی مثل مدل زبانی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mahmoud-eskandari/PersianBooksDataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mahmoud-eskandari/PersianBooksDataset: دیتاست 105هزار کتاب چاپی ایران + بهمراه جزئیات برای داده کاوی
دیتاست 105هزار کتاب چاپی ایران + بهمراه جزئیات برای داده کاوی - mahmoud-eskandari/PersianBooksDataset
مجموعه داده اطلاعات 179301 اپلیکیشن کافه بازار
🗃نوع: tabular
📖 توضیحات:
مجموعه داده کافه بازار شامل اطلاعات 179301 اپلیکیشن در این مارکت هست که تا تاریخ 30 اسفند 99 منتشر شدن. این اطلاعات با خزش صفحات وب کافه بازار به دست اومدن که شامل این ویژگی هاست: اسم اپلیکیشن، دسته بندی، امتیاز، تعداد نظرات ثبت شده، حجم، دسته بندی بر اساس تعداد نصب، نوع اپلیکیشن (پولی یا رایگان یا پرداخت درون برنامه ای)، قیمت، نام توسعه دهنده، لینک صفحه توسعه دهنده، اسم پکیج، گونه (برنامه/ بازی)، تعداد تخمینی نصب، شماره نسخه، حجم جریان ترافیک (برحسب تعداد نصب)، میزان فروش و نسبت تعداد نظر به ازای تعداد نصب.
لینک دریافت داده ها:
https://github.com/arshin1989/CafeBazaar
لطفا به اشتراک بگذارید👈
@persian_data
🗃نوع: tabular
📖 توضیحات:
مجموعه داده کافه بازار شامل اطلاعات 179301 اپلیکیشن در این مارکت هست که تا تاریخ 30 اسفند 99 منتشر شدن. این اطلاعات با خزش صفحات وب کافه بازار به دست اومدن که شامل این ویژگی هاست: اسم اپلیکیشن، دسته بندی، امتیاز، تعداد نظرات ثبت شده، حجم، دسته بندی بر اساس تعداد نصب، نوع اپلیکیشن (پولی یا رایگان یا پرداخت درون برنامه ای)، قیمت، نام توسعه دهنده، لینک صفحه توسعه دهنده، اسم پکیج، گونه (برنامه/ بازی)، تعداد تخمینی نصب، شماره نسخه، حجم جریان ترافیک (برحسب تعداد نصب)، میزان فروش و نسبت تعداد نظر به ازای تعداد نصب.
لینک دریافت داده ها:
https://github.com/arshin1989/CafeBazaar
لطفا به اشتراک بگذارید👈
@persian_data
GitHub
GitHub - arshin1989/CafeBazaar: Dataset of CafeBazaar applications and simple EDA
Dataset of CafeBazaar applications and simple EDA. Contribute to arshin1989/CafeBazaar development by creating an account on GitHub.
مجموعه تصاویر محصولات دیجیکالا
🗃نوع: #تصویر
📖 توضیحات:
یکسری تصویر از محصولات دیجیکالا که بر اساس رنگبندی در پوشههای مختلف قرار گرفتند. که توی پروژههای تشخیص رنگ کمک کننده است.
لینک دریافت داده ها:
https://www.kaggle.com/masouduut94/digikala-color-classification
لطفا به اشتراک بگذارید👈
@persian_data
🗃نوع: #تصویر
📖 توضیحات:
یکسری تصویر از محصولات دیجیکالا که بر اساس رنگبندی در پوشههای مختلف قرار گرفتند. که توی پروژههای تشخیص رنگ کمک کننده است.
لینک دریافت داده ها:
https://www.kaggle.com/masouduut94/digikala-color-classification
لطفا به اشتراک بگذارید👈
@persian_data
Kaggle
Digikala Products Color Classification
Digikala fashion dataset for color classification task
دیتاست کوید19
🗃نوع: #متن
📖 توضیحات:
مقاله COPER شامل دو دیتاست COVID-19 Articles و PerSICK بوده که مناسب تسک های Information Retrieval و Semantic Textual Similarity هستند. دیتاست اول شامل 3,500 مقاله مربوط به کرونا بوده (هر مقاله شامل عنوان و متن) و دیتاست دوم نیز شامل 3,000 جفت جملات فارسی بوده که هر جفت از نظر میزان شباهت معنایی از 1 تا 5 امتیازدهی شده است.
لینک دریافت داده ها:
https://github.com/Ledengary/COPER
لطفا به اشتراک بگذارید👈
@persian_data
🗃نوع: #متن
📖 توضیحات:
مقاله COPER شامل دو دیتاست COVID-19 Articles و PerSICK بوده که مناسب تسک های Information Retrieval و Semantic Textual Similarity هستند. دیتاست اول شامل 3,500 مقاله مربوط به کرونا بوده (هر مقاله شامل عنوان و متن) و دیتاست دوم نیز شامل 3,000 جفت جملات فارسی بوده که هر جفت از نظر میزان شباهت معنایی از 1 تا 5 امتیازدهی شده است.
لینک دریافت داده ها:
https://github.com/Ledengary/COPER
لطفا به اشتراک بگذارید👈
@persian_data
GitHub
GitHub - Ledengary/COPER: COPER: a query-adaptable Semantics-based Search Engine for Persian COVID-19 Articles
COPER: a query-adaptable Semantics-based Search Engine for Persian COVID-19 Articles - Ledengary/COPER
A collection of Farsi (Persian) datasets
🗃 نوع: #متن
📖 توضیحات:
اخبار و ویکی پدیا فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sci2lab/Farsi-datasets
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
اخبار و ویکی پدیا فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/sci2lab/Farsi-datasets
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mallahyari/Farsi-datasets: A collection of Farsi (Persian) datasets
A collection of Farsi (Persian) datasets. Contribute to mallahyari/Farsi-datasets development by creating an account on GitHub.
Iranian politicians twitter dataset persian
🗃 نوع: #متن
📖 توضیحات:
دیتاست کامل توییتهای سیاسیون ایرانی در توییتر برای کارهای پردازش متن یا پردازش زبانهای طبیعی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/miladfa7/Iranian-politicians-twitter-dataset-persian
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
دیتاست کامل توییتهای سیاسیون ایرانی در توییتر برای کارهای پردازش متن یا پردازش زبانهای طبیعی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/miladfa7/Iranian-politicians-twitter-dataset-persian
لطفا به اشتراک بگذارید👈🏻 @persian_data
دیتاست های فارسی اینستاگرام
🗃 نوع: #متن
📖 توضیحات:
دیتاستهای فارسی اینستاگرام جهت تمرین و تحقیقات
۱ - دیتاست پیچ نماوا (کامنتها و کپشنهای پیچ نماوا)
۲ - دیتاست پیچ فیلیمو (کامنتها و کپشنهای پیچ فیلیمو)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/socialonet/iran-instagram-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
دیتاستهای فارسی اینستاگرام جهت تمرین و تحقیقات
۱ - دیتاست پیچ نماوا (کامنتها و کپشنهای پیچ نماوا)
۲ - دیتاست پیچ فیلیمو (کامنتها و کپشنهای پیچ فیلیمو)
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/socialonet/iran-instagram-dataset
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - socialonet/iran-instagram-dataset: دیتاست های فارسی اینستاگرام جهت تحقیق و تمرین persian instagram dataset
دیتاست های فارسی اینستاگرام جهت تحقیق و تمرین persian instagram dataset - socialonet/iran-instagram-dataset
متن خام فارسی
🗃 نوع: #متن
📖 توضیحات:
Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/persiannlp/persian-raw-text
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/persiannlp/persian-raw-text
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - persiannlp/persian-raw-text: Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی
Persian raw text - حدود ۸۰ گیگابایت متن خام فارسی. Contribute to persiannlp/persian-raw-text development by creating an account on GitHub.
اسامی فارسی
🗃 نوع: #متن
📖 توضیحات:
اسامی اماکن و اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mrahimygk/persian-data
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
اسامی اماکن و اشیا
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/mrahimygk/persian-data
لطفا به اشتراک بگذارید👈🏻 @persian_data
GitHub
GitHub - mrahimygk/persian-data: List of names to be used in data-oriented apps and games.
List of names to be used in data-oriented apps and games. - mrahimygk/persian-data
مجموعه اشعار مختلف فارسی
🗃 نوع: #متن
📖 توضیحات:
شامل متن اشعار، ایست واژه ها و کد کرالر. این داده ها برای ایجاد مدل زبانی و nlg توصیه می شود.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amnghd/Persian_Literature_DataBase
لطفا به اشتراک بگذارید👈🏻 @persian_data
🗃 نوع: #متن
📖 توضیحات:
شامل متن اشعار، ایست واژه ها و کد کرالر. این داده ها برای ایجاد مدل زبانی و nlg توصیه می شود.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://github.com/amnghd/Persian_Literature_DataBase
لطفا به اشتراک بگذارید👈🏻 @persian_data