مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.18K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
سلام روزتون بخیر
این دیتاست رو دیروز جمع آوری کردم.
مرتبط با آگهی‌های استخدامی توی سایت جابینجاست، چیزی حدود 26 هزار داده و 16 ستون داره.

لینک گیتهاب به همراه اسکریپت و نوتبوک‌ها:
https://github.com/Hexanol777/Jobinja-Crawler
لینک کگل:
https://www.kaggle.com/datasets/maminkheneifar/jobinja-job-listings-26k
👍4
خوشحالیم که بعد از مدت‌ها، نسخه جدید هضم آماده شد. در این نسخه:

• مشکل سازگاری با ویندوز را حل کردیم.
• مستندات پروژه را کامل‌تر کردیم.
• بازنمایی‌های واژه‌ای و جمله‌ای را روی انبوه نوشته‌ها آموزش دادیم.
• نرمال‌سازی نوشته‌ها را دقیق‌تر کردیم.
• دقت تحلیل صرفی و تجزیه سطحی را افزایش دادیم.
• از برچسب‌های صرفی و نحوی یونیورسال استفاده کردیم.
• کدها را با آخرین نسخه پایتون سازگار کردیم.

🔸 توضیحات کامل‌تر در مورد نسخه جدید هضم

🔸 می‌توانید پروژه متن‌باز هضم را در GitHub تعقیب کنید:
https://github.com/roshan-research/hazm
👍7
https://github.com/GolaraRFI/persian-tokenizers

یک کار درست حسابی و مفید واسه پردازش زبان طبیعی فارسی. یک فردی اومده 4تا توکنایزر معروف واسه فارسی با هم مقایسه کرده. پس اگر براتون سواله ک واسه توکنایزر فارسی هضم بهتره یا پارسی ور یا حتی Nltk. حتما نتایجش بخونین.
👍9
https://github.com/professormahi/awesome-services-4-iranian-developers


یک لیست خفن از ابزارهای مناسب واسه دولوپرهای ایرانی
👍2
https://github.com/Amirrezahmi/Mathematica-Wolfram-notebooks

این مخزن شامل نوت بوک هایی است که در آن دستورات مباحث مختلف ریاضی چون جبرخطی، حسابان و ترسیم نمودار ها آورده شده. توضیحات هر دستور به زبان فارسی در پوشه denoscriptions آورده شده.
👍2
Forwarded from دیتاهاب
جبر خطی بهمون کمک میکنه خیلی از مفاهیمی که هر روز توی پروژه‌های هوش مصنوعی استفاده می‌کنیم رو بهتر درک کنیم.

دوره جبر خطی دیتاهاب هم توی کانال یوتیوب و هم توی سایت قرار گرفته و خیلی ساده نکات کاربردی جبر خطی رو توضیح میدیم.

کافیه 3 ساعت وقت بذاری و بعد از اون قطعا دیدت نسبت به کدهایی که هر روز میزنی تغییر میکنه.

قراره چی یاد بگیریم؟
ماتریس‌ها که پایه و اساس کار هستن، پس بیشتر دربارشون حرف میزنیم.
بعدش میریم سراغ کاربرد جبر خطی توی شبکه عصبی و پروژه‌های هوش مصنوعی

🌐 جبر خطی در کانال یوتیوب
🌐 جبرخطی در سایت دیتاهاب

🆔 @data_hub_ir
👍4
https://github.com/amirroox/Persian-Developer-Roadmap

نقشه راه برای توسعه دهندگان برای پیشرفت بهتر

یکی از سوالات رایج برنامه نویسان این است که برنامه نویسی را از کجا شروع کنیم؟ و چگونه پیشرفت کنیم؟

از آنجایی که اکثر دوستان برای ورود به دنیای کامپیوتر و برنامه نویسی با مشکلات زیادی مواجه بودند و با سوالات زیادی مواجه می شدند، تصمیم گرفتیم برای افرادی که نمی دانند از کجا شروع کنند یا افرادی که به سطح قابل قبولی از دانش رسیده اند اما برای پیشرفت نمی داند چه چیزی را شروع کنند، یک انجمن راه‌اندازی کنیم.
یک دوست خوش ذوقی یک کرالر واسه سایت ایران داک نوشته و بعد از استخراج داده ها، به کمک شبکه پیچیده گراف همکاری بین رشته ای ترسیم کرده، این مدل کدها بابه مقاله نوشتنه...


https://github.com/tekboart/SNA-thesis
👍6
واسه نرمالسازی متون فارسی یکی از سخت ترین چالشها، اصلاح غلطهای گرامری هست
حالا یک دیتاست واسه این چالش معرفی می کنیم که میتونه کمک زیادی به بهبود سیستم های جاری کنه


https://github.com/leilaakbari/PVGED--Persian-Verb-related-Grammatical-Errors-Dataset
👍4
https://github.com/MrTaravat/technical-analysis-burse-iran
پروژه پایانی کارشناسی تحلیل تکنیکال نمودار سهام و پیش بینی از طریق روش های ماشین لرنینگ
که هم کد و هم گزارش داره

پ.ن: طبق این کد، معامله کردید و ضرری حاصل شد مسئولیتش با خودتون.☺️
👍3
دیتاست فارسی اطلاعات موبایل از وب سایت تکنولایف
این مدل دیتاست ها به درد کارهایی مثل سیستم توصیه گر می خوره

https://github.com/mamadgeek/mobile_farsi_datasets_1401-2-5