مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.19K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
یک ابزار رایگان کاربردی

🗃 نوع: #سورس_کد

📖 توضیحات:
بارها شده دلمون بخواد فایل pdf فارسی تبدیل کنیم ولی امکانش نبوده . این ابزار رایگان یک کدی هست که به پایتون نوشته شده و هدفش تبدیل pdf هست(حتی pdfهایی که از نوع تصویر هستند)

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/mmahdibarghi/pdf2txt

لطفا به اشتراک بگذارید👈🏻 @persian_data
این اوج بی اخلاقیه(یک نوع دزدی)!
پست کانال خط به خط کپی کنند
و اسم ناشر حذف کنند.

پ.ن: چون قبلا هم این کار انجام داده بودند مجبور شدم الان تذکر بدم.
👍1
اگر هدفتون یادگیری پایتون هست و دنبال یک سری تمرین ساده تا پیچیده هستین توصیه می کنم این ریپ از دست ندین
توضیحات دوستمون در مورد ریپ خوبش:
این مخزن شامل تمرین های من در هنگام یادگیری زبان پایتون می شود . همچنین ترجمه فارسی مسائل سایت پروجکت اویلر هم قرار داده شده است.
https://github.com/siniorone/Project-Euler

@persian_data
من اين ديتاست رو با جمع اوري اطلاعت سايت شيپور ساختم. با كمك selenium و beautifulsoap . داده ها كاملا واقعي هستن ويژگي هاي مثل متراژ، ادرس به انگليسي، تعداد اتاق خواب، اسانسور، انباري، پاركينگ ودر نهايت قيمت به تومان و دلار رو شامل ميشه. اميدوارم براتون مفيد باشه. ميتونه تمرين خيلي خوبي براي regression باشه و حس خوبي بهتون بده چون داده ها اشنا به نظر ميان ( همگي مربوط به شهر تهران هستن)
https://www.kaggle.com/mokar2001/house-price-tehran-iran
لطفا به اشتراک بگذارید👈🏻 @persian_data
دیتاست PersainTelegramData شامل داده های حدودا 500 کانال تلگرامی هست که در یک بازه زمانی دو هفته ایی جمع آوری شده است و مناسب تسک هایی مثل تحلیل داده های یک کانال خاص و یا پیش بینی هشتگ ها و کلمات کلیدی یک متن و یا پیش بینی زمان بعدی ارسال پست توسط یک کانال (مسئله سری زمانی) می باشد

@persian_data

https://github.com/rominaoji/PersianTelegramData
اين ديتاست بومی و جالب در زمینه ریسک سکته قلبی هست و برای انجام کارهای بین رشته ای هوش مصنوعی و پزشکی مناسب هست.

https://www.kaggle.com/mokar2001/ascvd-heart-risk

لطفا به اشتراک بگذارید👈🏻 @persian_data
یک پروژه جالب از تشیخص جنسیت بر اساس متن هستش. این مدل کارها خلاقانه و ترکیبی هستند و خیلی مناسب برای کارهای پژوهشی هست. در ضمن کد و دیتاست این کار
موجود است

https://github.com/mirzanahal/Persian-Gender-Recognition


لطفا به اشتراک بگذارید👈🏻 @persian_data
👍1
یک کد و دیتاست فارسی باحال در زمینه تشخیص شایعه
از هر نظر کامل بود و هم روش های مختلف تست شدند و هم دیتاست موجوده و هم شیوه نامه تگ زنی معرفی شده.
https://github.com/Zarharan/PersianStanceDetection

لطفا به اشتراک بگذارید👈🏻 @persian_data
یک پروژه تکست کلسیفیکیشن که پروژه ارشد بوده
دیتاست از توییتر فارسی جمع اوری شده و به صورت خودکار و براساس هشتگ برچسب خورده
هم دیتاست وجود داره و هم کل پیاده سازی‌ها

https://github.com/elirn98/classification-of-persian-tweets-using-neural-networks

لطفا به اشتراک بگذارید👈🏻 @persian_data
یک دیتابیس از حدود 700 هزار کلمه فارسی
یکی از مهم ترین کاربردهاش توی مدل‌های زبانی هست. و البته یک کار خوبی که میشه باهاش کرد حذف کلمات بی معنی که توسط توکنایزر تشخیص داده میشه...
https://github.com/shahind/Persian-Words-Database
لطفا به اشتراک بگذارید👈🏻 @persian_data
سلام دوستان روزتون بخیر.
من روی تسک کلاسیفیکیشن بر روی یک دیتاستی کار می کنم و احساس کردم کار به نقطه ای رسیده که نواقص کار به لطف شما برطرف بشه و اگر جای بهبود داره، بهبودش بدین.
https://github.com/mohsenMahmoodzadeh/Image-Caption-classification-with-tensorflow-Keras
لینک دیتاست در بخش readme ریپازیتوری قرار داده شده.
ممنون میشم اگر احساس کردین محتوای ریپازیتوری براتون مفید بوده، با star دادن ازش حمایت کنید و یا با ایجاد issue یا fork کردن، به تکمیل کار کنید تا بنده هم از تجربه و تخصص تون استفاده کنم.
پیشاپیش خیلی ممنونم.🙏

@persian_data
Sentiment analysis on telegram channels news for predicting bearish or bullish stocks
داستان از این قراره که خیلی وقته برای تشخیص و تحلیل قیمت دلار و طلا و ارز سعی می کنن از nlp استفاده کنند. این یک نمونه دست به نقدش روی زبان فارسیه
دیتاست هم موجود است

https://github.com/mirzanahal/Persian-Stock-Prediction

لطفا به اشتراک بگذارید👈🏻 @persian_data
دیتاست فارسی 30 هزارتایی توییتر برای تحلیل احساسات
برخلاف دیتاست های رایج 6 کلاسه هست و مناسب برای تست مدل های شما

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/nazaninsbr/Persian-Emotion-Detection
👍1
یادتون هست بچگی ازمون می خواستم فعل های فارسی صرف کنیم
این ریپ برامون این کار خودکار انجام میده
در پیش پردازش متن ها به خصوص خیلی به درد میخوره و باعث میشه pos بهتری داشته باشیم
https://github.com/asdoost/CPVI

لطفا به اشتراک بگذارید👈🏻 @persian_data
دانشگاه شریف یک کورس آمار و احتمالات گذاشته که کدهای مربوط به جلسات هم موجوده.
یک بخشی به به زبان r و بخشی با پایتون
ترکیب مفاهیم اماری و کدنویسی باعث یادگیری سریع تر و ماندگارتر میشه پس از دستش ندین.

https://github.com/asharifiz/Probability_Statistics
لطفا به اشتراک بگذارید👈🏻 @persian_data
Forwarded from دیتاهاب
درود، همینطور که در جریان هستین تازگی کورسرا سخت گیرتر شده و برای دریافت سرتیفیکت باید باهاشون مکاتبه بشه
یک متنی آماده کردم مخصوص وقتی هست که میخوایم به کورسرا درخواست کمک مالی بدیم
@data_hub_ir

Part 1:

It is my intention to inform you of my limitations with regard to money transfers. As you know, the US sanctions on Iran have caused our currency to fall by 1000 percent and the cost of the course is high for the Iranian people and we are not able to send or receive money. And while we don't have access to international payment systems like Paypal, MasterCard, and Visa Card, that's actually the main problem, because I believe the value of this training is far greater than they were intended. Of course, if there was a way to pay for that amount, I would definitely pay and start the period sooner.
Based on my study of the course syllabus, I came to the conclusion that this overview provides a comprehensive overview of the basic concepts of (مبحث یا مهارت مدنظر). Also, users' comments indicate that this is a practical and useful course that will enhance practical skills.
Let me join this course with your kind help if you would kindly assist me and I will pass this course with flying colors without a doubt.

Part 2:
My goal is to learn (اسم دوره یا مهارت مدنظر) in order to improve my general skills and then follow my academic tracks in order to gain admission to top universities in Europe or the United States.
As a student, I need you to know that I have paved the way for immigration and that learning (اسم مهارت مدنظر) is my first step.
Compared to the in-person courses available in my country, I think Coursera offers the best courses.
The choice of this course as well as other courses was not only obvious to me but it was also recommended to me by my academic adviser.
In the following weeks, I have several interviews ahead of me, so this course would help me be able to speak professionally.
Specifically, if you consider me a highly qualified pupil and a well-deserved one, I would appreciate your kindness.

Finally, I would like to say:
In the current situation, due to the heavy cost of the university and the dormitory, I cannot afford to pay.

@data_hub_ir
اگر شمام گاهی از هضم و پارسی ور شاکی بودین که کاش اپدیت می دادین پس همچنان حرص بخورین چون اپدیتی در کار نیست عوضش یک تیم دیگه یک ابزار دیگه معرفی کردند(دمشون گرم واقعا، تا باشه از این ابزارها)
نصبش که آسونه:
pip install dadmatools

ولی شاید در آینده کار باهاش تست کردیم فعلا خودتون یک تستی بزنین و نتیجشو به بقیه هم بگین.
https://github.com/Dadmatech/DadmaTools

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍1
یک دیتاست مناسب
اعداد دست نویس فارسی و انگلیسی، که نقطه قوتش اینه که حالت نرمال ندارن و به اصطلاح تمیز نیستن و خیلی به دنیای واقعی نزدیک ترن. هر چقدر دیتا کثیف تر باشه شانس اجرای موفق در دنیای واقعیش بیشتر میشه(رنه دکارت)

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/IzkSensei/HDDS