مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.19K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
اين ديتاست بومی و جالب در زمینه ریسک سکته قلبی هست و برای انجام کارهای بین رشته ای هوش مصنوعی و پزشکی مناسب هست.

https://www.kaggle.com/mokar2001/ascvd-heart-risk

لطفا به اشتراک بگذارید👈🏻 @persian_data
یک پروژه جالب از تشیخص جنسیت بر اساس متن هستش. این مدل کارها خلاقانه و ترکیبی هستند و خیلی مناسب برای کارهای پژوهشی هست. در ضمن کد و دیتاست این کار
موجود است

https://github.com/mirzanahal/Persian-Gender-Recognition


لطفا به اشتراک بگذارید👈🏻 @persian_data
👍1
یک کد و دیتاست فارسی باحال در زمینه تشخیص شایعه
از هر نظر کامل بود و هم روش های مختلف تست شدند و هم دیتاست موجوده و هم شیوه نامه تگ زنی معرفی شده.
https://github.com/Zarharan/PersianStanceDetection

لطفا به اشتراک بگذارید👈🏻 @persian_data
یک پروژه تکست کلسیفیکیشن که پروژه ارشد بوده
دیتاست از توییتر فارسی جمع اوری شده و به صورت خودکار و براساس هشتگ برچسب خورده
هم دیتاست وجود داره و هم کل پیاده سازی‌ها

https://github.com/elirn98/classification-of-persian-tweets-using-neural-networks

لطفا به اشتراک بگذارید👈🏻 @persian_data
یک دیتابیس از حدود 700 هزار کلمه فارسی
یکی از مهم ترین کاربردهاش توی مدل‌های زبانی هست. و البته یک کار خوبی که میشه باهاش کرد حذف کلمات بی معنی که توسط توکنایزر تشخیص داده میشه...
https://github.com/shahind/Persian-Words-Database
لطفا به اشتراک بگذارید👈🏻 @persian_data
سلام دوستان روزتون بخیر.
من روی تسک کلاسیفیکیشن بر روی یک دیتاستی کار می کنم و احساس کردم کار به نقطه ای رسیده که نواقص کار به لطف شما برطرف بشه و اگر جای بهبود داره، بهبودش بدین.
https://github.com/mohsenMahmoodzadeh/Image-Caption-classification-with-tensorflow-Keras
لینک دیتاست در بخش readme ریپازیتوری قرار داده شده.
ممنون میشم اگر احساس کردین محتوای ریپازیتوری براتون مفید بوده، با star دادن ازش حمایت کنید و یا با ایجاد issue یا fork کردن، به تکمیل کار کنید تا بنده هم از تجربه و تخصص تون استفاده کنم.
پیشاپیش خیلی ممنونم.🙏

@persian_data
Sentiment analysis on telegram channels news for predicting bearish or bullish stocks
داستان از این قراره که خیلی وقته برای تشخیص و تحلیل قیمت دلار و طلا و ارز سعی می کنن از nlp استفاده کنند. این یک نمونه دست به نقدش روی زبان فارسیه
دیتاست هم موجود است

https://github.com/mirzanahal/Persian-Stock-Prediction

لطفا به اشتراک بگذارید👈🏻 @persian_data
دیتاست فارسی 30 هزارتایی توییتر برای تحلیل احساسات
برخلاف دیتاست های رایج 6 کلاسه هست و مناسب برای تست مدل های شما

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/nazaninsbr/Persian-Emotion-Detection
👍1
یادتون هست بچگی ازمون می خواستم فعل های فارسی صرف کنیم
این ریپ برامون این کار خودکار انجام میده
در پیش پردازش متن ها به خصوص خیلی به درد میخوره و باعث میشه pos بهتری داشته باشیم
https://github.com/asdoost/CPVI

لطفا به اشتراک بگذارید👈🏻 @persian_data
دانشگاه شریف یک کورس آمار و احتمالات گذاشته که کدهای مربوط به جلسات هم موجوده.
یک بخشی به به زبان r و بخشی با پایتون
ترکیب مفاهیم اماری و کدنویسی باعث یادگیری سریع تر و ماندگارتر میشه پس از دستش ندین.

https://github.com/asharifiz/Probability_Statistics
لطفا به اشتراک بگذارید👈🏻 @persian_data
Forwarded from دیتاهاب
درود، همینطور که در جریان هستین تازگی کورسرا سخت گیرتر شده و برای دریافت سرتیفیکت باید باهاشون مکاتبه بشه
یک متنی آماده کردم مخصوص وقتی هست که میخوایم به کورسرا درخواست کمک مالی بدیم
@data_hub_ir

Part 1:

It is my intention to inform you of my limitations with regard to money transfers. As you know, the US sanctions on Iran have caused our currency to fall by 1000 percent and the cost of the course is high for the Iranian people and we are not able to send or receive money. And while we don't have access to international payment systems like Paypal, MasterCard, and Visa Card, that's actually the main problem, because I believe the value of this training is far greater than they were intended. Of course, if there was a way to pay for that amount, I would definitely pay and start the period sooner.
Based on my study of the course syllabus, I came to the conclusion that this overview provides a comprehensive overview of the basic concepts of (مبحث یا مهارت مدنظر). Also, users' comments indicate that this is a practical and useful course that will enhance practical skills.
Let me join this course with your kind help if you would kindly assist me and I will pass this course with flying colors without a doubt.

Part 2:
My goal is to learn (اسم دوره یا مهارت مدنظر) in order to improve my general skills and then follow my academic tracks in order to gain admission to top universities in Europe or the United States.
As a student, I need you to know that I have paved the way for immigration and that learning (اسم مهارت مدنظر) is my first step.
Compared to the in-person courses available in my country, I think Coursera offers the best courses.
The choice of this course as well as other courses was not only obvious to me but it was also recommended to me by my academic adviser.
In the following weeks, I have several interviews ahead of me, so this course would help me be able to speak professionally.
Specifically, if you consider me a highly qualified pupil and a well-deserved one, I would appreciate your kindness.

Finally, I would like to say:
In the current situation, due to the heavy cost of the university and the dormitory, I cannot afford to pay.

@data_hub_ir
اگر شمام گاهی از هضم و پارسی ور شاکی بودین که کاش اپدیت می دادین پس همچنان حرص بخورین چون اپدیتی در کار نیست عوضش یک تیم دیگه یک ابزار دیگه معرفی کردند(دمشون گرم واقعا، تا باشه از این ابزارها)
نصبش که آسونه:
pip install dadmatools

ولی شاید در آینده کار باهاش تست کردیم فعلا خودتون یک تستی بزنین و نتیجشو به بقیه هم بگین.
https://github.com/Dadmatech/DadmaTools

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍1
یک دیتاست مناسب
اعداد دست نویس فارسی و انگلیسی، که نقطه قوتش اینه که حالت نرمال ندارن و به اصطلاح تمیز نیستن و خیلی به دنیای واقعی نزدیک ترن. هر چقدر دیتا کثیف تر باشه شانس اجرای موفق در دنیای واقعیش بیشتر میشه(رنه دکارت)

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/IzkSensei/HDDS
یک پروژه یکم عجیب
تا حالا شده به این فکر کنین هوش مصنوعی نژادپرستی یا جرم و جنایت یا ... تقویت کنه. البته در این زمینه کار زیاد شده و مقالات زیادی در این رابطه هست. (حتی یک وقتی اندیشمندان وطنی توی گوگل ترنسلیت تست می کردین که بین مرد و زن تفاوت قائل هستند یا نه) به هر حال این پروزه یک کار مشابه و ساده انجام داده و دیدنش خالی از لطف نیست. هدف تشخیص این بوده که آیا مدل های زبانی نژادپرستی ترویج می دهند یا خیر.

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/TahaVahedi/Sociology_wordEmbedding_persian_lang
Text2Code for Jupyter notebook
تازگی بحث تولید خودکار کد خیلی ترند شده
شاید خیلی ها احساس خطر کنند که در آینده نزدیک یک بخشی از صنعت مهندسی نرم افزار خودکار بشه
اره حق داریم چون قضیه جدیه
خیلی هامون با Jupyter notebook آشنا هستیم
یک ابزار برای Jupyter notebook معرفی می کنیم که شما انگلیسی کوئری می نویسی و کد پایتونش برات تولید می کنه(یا اکثر امامزاده ها)
https://github.com/deepklarity/jupyter-text2code

لطفا به اشتراک بگذارید👈🏻 @persian_data
شیوه‌نامه نگارش پایتون
تا حالا شده یک کد پایتونی از همکارتون بگیرین و روی مختون بره و حالتون بد بشه از بس نامرتب نوشته
حتما این داکیومنت بهش معرفی کنین، رایگان و ترجمه شده هستش
تا با خوندنش، کیفیت کدهای نوشته خودمون با زبان پایتون، چندبرابر کنیم.

https://pep8.ir

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍1