مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.19K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
Forwarded from دیتاهاب (دیتاهابر)
به قول یکی از دوستان الان وقت ناراحتی نیست باید قوی تر بود✌🏻
و یک خبر خوب، مقاله معروف جناب Jay Alammar (قسمت ورد2وک) که هممون با شکل های سایتش خاطره داریم به فارسی ترجمه کردیم.
حتما بخونید و به دوستاتتون هم معرفی کنید. (کجا محتوا پیدا میشه واسه هر جمله یک شکل جذاب و رنگی بزاره تا محتوا به خوبی منتقل بشه☺️)

لینک مطلب:👇🏻
word2vec چیست؟ صفر تا صد آموزش word2vec همراه با مثال
1👍1
کتاب فارسی آموزش git

http://git.codecast.ir/en/latest

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍3
Forwarded from دیتاهاب (محمد)
درود رفقا
این لینک آخرین مقاله من هست (فایل کامل مقاله)👇🏻
https://doi.org/10.1016/j.imu.2022.101144
دوست داشتید یک نگاهی بهش بندازید

نکته: اگر فردی در زمینه مقاله نویسی نیاز به مشاوره داشت یا دوست داشت کار پژوهشی انجام بدیم
به این ای دی پیام بده.
✌🏻@mohammad_dehghani1
2👍2
Git.pdf
485.1 KB
کتابی که قطعا قبلا جایی ندیدید
آموزش فارسی Git

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍6
قالب فارسی برای کتاب

این قالب تحت Xelatex 2020 آماده شده است اما Xelatex 2019 نیز به خوبی با آن هماهنگ است.

https://github.com/OpenBookshelf/PersianTextbookTemplate

لطفا به اشتراک بگذارید👈🏻 @persian_data
1
اینم سورس کد تبدیل pdfهای فارسی به فایل های قابل ادیت به کمک ocr

https://github.com/Pouyaexe/Farsi_PDF/blob/main/PDF_OCR.ipynb

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍61
تا حالا شده کارتون گیر کنه و به یک متخصص نیاز داشته باشید؟ مثلا برنامه نویس هستین و یهویی گرافیست لازم میشین
یک ریپ گیتهاب هست که یک لیست از فریلنسرهای ایرانی توی حوزه های مختلف گذاشته (با معرفی مختصر و راه های ارتباطی ازشون)

https://github.com/nekofar/awesome-freelancers

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍7
🎉 توضیح ساده دیزاین پترن‌ها ! 🎉
فهمیدن دیزاین پترن‌ها از اون موضوع‌هاست که ذهن رو به چالش میکشه. اینجا سعی می‌کنم با مثال‌های ساده از دنیای واقعی و دنیای کد، اونو راحت وارد ذهنتون کنم.
در ترجمه، تعاریف و مثال‌ها از منابع مختلف فارسی و انگلیسی استفاده شده تا بهترین نتیجه حاصل بشه :)
https://github.com/3lf/design-patterns-for-humans
👍1
گاهی در به در دنبال یک نفر هستیم ازش سوال کنیم و از خدامونه به تجربیاتش گوش بدیم که راه غلطو نریم خصوصا واسه بحث مهم مهاجرت که یک اشتباه ممکنه یک سال مارو از برنامه عقب بندازه. یک رپو معرفی می کنم که
بچه های فارسی زبون تجربیاتشون را در مورد مراحل درخواست بورس تحصیلی Ph.D و تحصیل در خارج از کشور به اشتراک میزارن.
https://github.com/Fatemeh-J/Putting-in-for-a-PhD-and-moving-abroad

لطفا به اشتراک بگذارید👈🏻 @persian_data
2👍2👎1
هر محیط و مکانی آداب خاص خودش داره تا آسیبی بهمون وارد نشه پس
در اینترنت، ایمن باشیم به کمک
چک لیست افزایش امنیت و حریم خصوصی آنلاین
https://amn.hamed.blog
👍2
Persian Visual Question Answering
بلاخره پس از مدت ها یک دیتاست تر و تمیز به دستمون رسید
توی پردازش زبان طبیعی یکی از تسک های نسبتا سخت سیستم های پرسش و پاسخ هستند تازه از اون سخت تر وقتی میشه که پای تصویر هم وسط بیاد
ولی کار با این دیتاست شروع خوبی هست (با توجه به اینکه روی زبان فارسی در این تسک هنوز خیلی کاری انجام نشده و فضای نسبتا خوبی است)
https://github.com/naeim-md93/PVQA
👍5
رفقا سال نو مبارک💐، امیدوارم امسال همون سالی باشه که خدا صدامون بشنوه🤲🏻
اول سالی با قدرت شروع کنیم با یک دیتاست پرسش و پاسخ پزشکی (QA) فارسی✌🏻

اینقدر که میشه روی این موضوع مانور داد و ازش مقاله چاپ کرد که حد و حساب نداره
حوزه پزشکی تشنه ورود پردازش زبان طبیعی و خصوصا سیستم پرسش و پاسخ هست

https://github.com/DSP-UT/Persian-Medical-Question-Answering-
7👎1
سلام مطلب تون مفید بود. منم یه دیتاست در خصوص حروف و اعداد الفبای فارسی ساختم تا بتونید هم برای تشخیص الفبای فارسی ازش استفاده کنید هم برای تشخیص پلاک خودرو های ایرانی امیدوارم ازش استفاده کنید و بدردتون بخوره

kaggle link:
https://www.kaggle.com/datasets/mehdisahraei/persian-alpha?resource=download

دوست داشتید رای بدید
👍8
چند وقتی بود کد معرفی نکرده بودیم. یک دوستی اومدن و روی یک دیتاست فارسی در زمینه query paraphrasing دو مدل ParsBERT و M-BERT را فاین تیون کردن، هم کد و هم دیتاست موجوده.
فرهنگ به اشتراک گذاری کد و دیتاست خیلی خوبه و کمک کنندس، یعنی اگر هر تیم یا فردی یک دیتاست معرفی کنه با یک مجموعه بزرگ روبرو خواهیم شد. ولی متاسفانه گاهی طرف کد میزاره ولی دیتا نمیزاره و کد بدون دیتا خیلی به درد نمی خوره.
https://www.kaggle.com/code/vafaknm/persian-query-paraphrasing-classification
👍71
یک سورس کد باحال و واسه دریافت نظرات کاربران یوتیوب
اگه دقت کرده باشید اکثر پروژه هایی که روی تحلیل نظرات کاربران تمرکز دارن به سمت توییتر و اینستا میرن ولی خیلی سمت یوتیوب نمیرن. و دست نخورده حساب میشه (خصوصا واسه کارهای پژوهشی و مقاله)
https://github.com/ZutrixPog/youtube-comments-extractor
2👍1
سلام دوستان

یک بات تلگرام نوشتم که بر پایه ChatGPT به عنوان Examiner برای writing task آیلتس عمل میکنه و از یوزر topic و answer رو میگیره و ارزیابی میکنه و توی هر ۴ تا criteria رایتینگ آیلتس یک Band score میده و یک فیدبک و همچنین یک Overall Band score. در نهایت هم یک Model Answer میده. هدف از نوشتن این بات جدای علاقه ای که داشتم این بود که شاید بتونم کمک کوچیکی کرده باشم به افرادی که دارن خودشون رو برای آزمون آیلتس اماده می کنن و به هر دلیلی دسترسی به ChatGPT ندارن که بتونن باهاش بهتر خودشون رو برای آزمون ارزیابی کنن, خودم زمانی که برای آیلتس میخوندم ChatGPT وجود نداشت و یکی از بزرگترین مشکلاتم این بود که فیدبک برای writing هایی که مینوشتم نداشتم.
خوشحال میشم اگر این بات رو چک کنید و اگر افرادی میشناسید که می تونه بهشون کمک کنه براشون به اشتراک بزارید تا استفاده کنن.
در ضمن پروژه رو هم open source کردم و روی github ام قرار دادم, اگر دوست داشتید ممنون میشم star کنید و همچنین contribute که بهترش کنیم و باگی اگر مشاهده شد رفعش کنیم.

لینک پروژه:

https://github.com/MahdiAbbasi95/chatgpt-ielts-examiner-bot
لینک بات:

https://news.1rj.ru/str/ielts_examiner_bot
👍165
یک پروژه تعریف شده، دیتاست و کد و ریپورت هم آمادس (یک چالش بوده)
این می تونه خیلی کمک کنه به کسایی که میخوان پروژه آزمایشی انجام بدن و بیشتر و بهتر یاد بگیرن
هدف پروژه هم تشخیص میزان مصرف اینترنت کاربران است.
https://github.com/SLR-96/AAIC2022
👍2