مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.19K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
مجموع اشعار فارسی

🗃 نوع: #متن

📮 اندازه: 61.49 MB

📖 توضیحات:
اشعار ۴۸ شاعر ایرانی که مناسب برای تسک هایی مثل سات مدل زبانی و text generator است.

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://www.kaggle.com/aminghd/large-corpus-of-farsi-poems

لطفا به اشتراک بگذارید👈🏻@persian_data
اگر شما هم به حوزه‌هایی مثل تحلیل داده، مهندسی داده و هوش تجاری علاقه‌مند هستید پس احتمالاً دنبال یک فرصت شغلی مناسب در یکی از این حوزه‌ها هستید. بررسی فرصت‌های شغلی باتوجه‌به تعداد زیاد سایت‌ها کاری زمان‌بر و گاهی کسل‌کننده هست. ما در دیتاجابز به‌صورت مداوم، جدیدترین آگهی‌های شغلی مربوط به حوزه داده را از سایت‌هایی مثل جاباینجا و جاب‌ویژن گردآوری می‌کنیم. هدف ما ساده‌تر کردن کار شما و صرفه‌جویی در زمان شماست.

👉 @data_jobs

افراد مختلف به‌راحتی و مستقیماً می‌توانند آگهی‌های شغلی مربوط به کسب‌وکار خودشان را در دیتاجابز درج کنند مثل نمونه فرصت های شغلی مربوط به شرکت هایی مثل اسنپ و شیپور که مستقیما توسط کارکنان این شرکت ها درج شده است.

👉 @data_jobs

همچنین برای افراد نوورود حوزه داده هم فکری شده و فرصت‌های کارآموزی پوشش داده می‌شود.

👉 @data_jobs
اعداد فارسی

🗃 نوع: #تصویر

📮 اندازه: 10.61 MB

📖 توضیحات:
Introducing a very large dataset of handwritten Farsi digits and a study on their varieties.
HODA dataset is the first dataset of handwritten Farsi digits that has been developed during an MSc. project in Tarbiat Modarres University ennoscriptd: Recognizing Farsi Digits and Characters in SANJESH Registration Forms. This project has been carried out in cooperation with Hoda System Corporation.

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://www.kaggle.com/hamedetezadi/persian-numbers

لطفا به اشتراک بگذارید👈🏻 @persian_data
اطلاعات مربوط به زلزله در ایران

🗃 نوع: #جدولی

📮 اندازه: 913 KB

📖 توضیحات:
Earthquakes, happened in Persian empire, throughout history. It will be helpful for whom searching the patterns of tectonic movements.

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://www.kaggle.com/mehrdat/irans-earthquakes

لطفا به اشتراک بگذارید👈🏻@persian_data
Persian Consonant Vowel Combination

🗃 نوع: #صوت

📮 اندازه: 258.41 MB

📖 توضیحات:
This dataset is the first phoneme based speech dataset in the entire world and also the first free Persian speech dataset to help Persian speech researchers. It is not only what you see.

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://www.kaggle.com/sabermalek/pcvcspeech

لطفا به اشتراک بگذارید👈🏻 @persian_data
تصاویر حروف فارسی

🗃 نوع: #تصویر

📮 اندازه: 634.92 KB

📖 توضیحات:
There's a story behind every dataset and here's your opportunity to share yours.
۵۰*۵۰ Images of Persian letters (without dots) with ۳۲ Different Fonts.

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://www.kaggle.com/sabermalek/plf50

لطفا به اشتراک بگذارید👈🏻@persian_data
متن فارسی کتاب هری پاتر

🗃 نوع: #متن

📮 اندازه: 771.71 KB

📖 توضیحات:
به کمک این دیتاست و تهیه نسخه اصلی کتاب می‌توان یک مجموعه داده مناسب برای ترجمه ماشینی تولید کرد.

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://www.kaggle.com/mchavoshi/harry-potter-book1-farsi

لطفا به اشتراک بگذارید👈🏻 @persian_data
قیمت خانه های تهران
نوع: #جدولی

📖 توضیحات:
این دیتاست شامل 12383 سطر با 9 ستون هست که از سایت دیوار گرداوری شده است. این دیتای برای پیش بینی قیمت خانه و اجاره مناسب است.

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇
https://www.kaggle.com/amiralimadadi/tehran-housing
لطفا به اشتراک بگذارید👈🏻 @persian_data
Forwarded from پست دیتاست
Persian word embedding

🗃 نوع: #متن

📖 توضیحات:
Persian word embedding (نشاننده واژه‌ها فارسی | تعبیه سازی کلمات فارسی)

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/ashalogic/Persian-Word-Embedding

لطفا به اشتراک بگذارید👈🏻@persian_data
Informal Persian Question Answer Dataset

🗃 نوع: #متن

📖 توضیحات:
یک دیتاست جذاب واسه تسک پرسخ و پاسخ

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/SadeghiHamid/Informal-Persian-Question-Answer-Dataset

لطفا به اشتراک بگذارید👈🏻@persian_data
دیتابیس لغات و اصطلاحات فارسی

🗃 نوع: #متن

📖 توضیحات:
مجموعه نزدیک به ۷۰۰ هزار کلمه فارسی متشکل از فرهنگ لغت معین، کلمات فارسی ویکی پدیا، اشعار فارسی و سایر منابع برای کاربردهای پردازش داده و زبان هر کلمه در یک خط قرار گرفته است

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/shahind/Persian-Words-Database

لطفا به اشتراک بگذارید👈🏻 @persian_data
persian_pdf_books

🗃 نوع: #متن

📖 توضیحات:
در فایل اکسل مجموعه‌ای از اطلاعات کتاب‌های یکی از سایت‌های دانلود کتاب آنلاین فارسی موجود است. مجموعا ۲۸۲۴ کتاب با ۶ ویژگی که شامل نام کتاب، تاریخ درج کتاب در سایت، خلاصه‌ای از محتوا کتاب، دسته بندی کتاب، نام نویسنده و تعداد کامنت هایی که برای کتاب در سایت درج شده است

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/mohamad-dehghani/persian_datasets

لطفا به اشتراک بگذارید👈🏻@persian_data
english-2-persian-dataset

🗃 نوع: #متن

📖 توضیحات:
یک دیتاست دیگه واسه ترجمه ماشینی

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/ce-fum/english-2-persian-dataset

لطفا به اشتراک بگذارید👈🏻@persian_data
یک دیتاست فارسی برای پروژه های مربوط به اینترنت اشیا و smart home

🗃 نوع: #متن

📖 توضیحات:
یک دیتاست جالب مناسب برای تسک‌های مربوط به اینترنت اشیا

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/sepehrhashtroudi/persian-dataset-for-smarthome

لطفا به اشتراک بگذارید👈🏻@persian_data
داده های گرداوری شده فارسی از توئیتر
🗃 نوع: #متن

📖 توضیحات:
این دیتای خام که پیش پردازش نشده برای تسک هایی مثل مدل زبانی مناسب است.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/00989125864520/raw-data

لطفا به اشتراک بگذارید👈🏻@persian_data
تاریخچه قیمت شرکت های بورسی ایران
نوع : #mat.
📖 توضیحات :
دیتاست مربوط به سهام شرکت های بورسی داخل ایران هست مثل فملی و ...
در مجموع دیتا ۴۳ شرکت گردآوری شده
این دیتاست در مجموع شامل ۶۰۰۱۵۸ سطر با ۳۸ ستون
برای تحلیل و پیش بینی قیمت سهام شرکت ها مناسب است.

لطفا به اشتراک بگذارید👈🏻 @persian_data

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇
https://www.kaggle.com/hocohelper/securities-and-exchange-iran
دیتاست بیماران مبتلا به کرونا

🗃 نوع: #متن

📖 توضیحات:
Covid-patient-datasets

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/amirshnll/Covid-patient-datasets/

لطفا به اشتراک بگذارید👈🏻 @persian_data
دیتاست 105هزار کتاب چاپی ایران

🗃 نوع: #متن

📖 توضیحات:
دیتاست ۱۰۵هزار کتاب چاپی ایران مناسب برای تسک هایی مثل مدل زبانی

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/mahmoud-eskandari/PersianBooksDataset

لطفا به اشتراک بگذارید👈🏻 @persian_data
مجموعه داده اطلاعات 179301 اپلیکیشن کافه بازار
🗃نوع: tabular
📖 توضیحات:
مجموعه داده کافه بازار شامل اطلاعات 179301 اپلیکیشن در این مارکت هست که تا تاریخ 30 اسفند 99 منتشر شدن. این اطلاعات با خزش صفحات وب کافه بازار به دست اومدن که شامل این ویژگی هاست: اسم اپلیکیشن، دسته بندی، امتیاز، تعداد نظرات ثبت شده، حجم، دسته بندی بر اساس تعداد نصب، نوع اپلیکیشن (پولی یا رایگان یا پرداخت درون برنامه ای)، قیمت، نام توسعه دهنده، لینک صفحه توسعه دهنده، اسم پکیج، گونه (برنامه/ بازی)، تعداد تخمینی نصب، شماره نسخه، حجم جریان ترافیک (برحسب تعداد نصب)، میزان فروش و نسبت تعداد نظر به ازای تعداد نصب.
لینک دریافت داده ها:
https://github.com/arshin1989/CafeBazaar

لطفا به اشتراک بگذارید👈
@persian_data
مجموعه تصاویر محصولات دیجی‌کالا
🗃نوع: #تصویر
📖 توضیحات:
یکسری تصویر از محصولات دیجی‌کالا که بر اساس رنگ‌بندی در پوشه‌های مختلف قرار گرفتند. که توی پروژه‌های تشخیص رنگ کمک کننده است.

لینک دریافت داده ها:
https://www.kaggle.com/masouduut94/digikala-color-classification

لطفا به اشتراک بگذارید👈
@persian_data