مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.19K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
یک پروژه تعریف شده، دیتاست و کد و ریپورت هم آمادس (یک چالش بوده)
این می تونه خیلی کمک کنه به کسایی که میخوان پروژه آزمایشی انجام بدن و بیشتر و بهتر یاد بگیرن
هدف پروژه هم تشخیص میزان مصرف اینترنت کاربران است.
https://github.com/SLR-96/AAIC2022
👍2
یک دیتاست در زبان فارسی با محوریت دنباله ای از پرسش و پاسخ های محاوره زبان فارسی جمع آوری شده است که در لینک گیت هاب قرار داده شده است. این مقاله در سال 2022 در یک کنفرانس منابع زبانی به نام LREC2022 پذیرفته شد. از این دیتاست در انواع تسکهای NLP در زبان فارسی میتوان استفاده کرد.

https://aclanthology.org/2022.lrec-1.654/
2👎2
یک دیتاست بومی از تمامی تابلوهای رانندگی که امیدواریم در سیستم خودران استفاده بشه که این مدل خودرو بشه داخل کشورمون هم استفاده بشه. (دست به دست کنید شاید به ایلان ماسک رسید)
https://github.com/seyedhamidsafavi/PRSM
👍6👎42😢1
دور زدن اینترنت ملی
بالاخره یک نفر به زبون خیلی ساده و جامع روش راه اندازی v2ray گفتش
https://github.com/pouramin/Iran-vpn
👍6👎3
وقتی میخواهی داخل پایتون به فارسی چیزی رو به نمایش بذاری با چند مشکل روبرو هستی که راه حل آن ها استفاده از arabic_reshaper و bidi.algorithm است ولی برای تایپ چند خطی این مشکل پا برجاست و متن از پایین به بالا نمایش داده میشود.
در اینجا تابعی قرار میدهم که میتواند این مشکل را حل کند.
https://github.com/mhdemd/python_persian_text
👍1
Forwarded from دیتاهاب (Zahra Yp)
اول یادگیری هر چیزی، یک سردرگمی وجود داره و نمیدونیم از کجا شروع کنیم😩 بشر برای حل این مشکل رودمپ اختراح کرد😎
توی دیتاهاب برامون مهم بود یک نقشه راه جامع برای کسایی که دوست دارن هوش مصنوعی یاد بگیرن داشته باشیم✌🏻

🎯 پس قدیم ترا😂 کانال یوتیوب دیتاهاب رو ساختیم و دوره‌های کاربردی از پایتون و جبر خطی تا یادگیری ماشین و وب اسکرپینگ براتون به زبان فارسی آماده کردیم.

برای دسترسی به این آموزشا کافیه روی لینک زیر کلیک کنین و مطالب رو تضمینی یاد بگیرین. حتما سابسکرایب کنین که انگیزه بشه آموزش جدید بزاریم 🥳 ⬇️

💢 کانال یوتیوب دیتاهاب 💢

❇️ دیتاهاب: مشاوره، آموزش و انجام پروژه‌های هوش مصنوعی
📍اینجا کانال پرشین دیتا هست که دیتاست‌های مختلف رو میتونین برای پروژه‌هاتون پیدا کنین:
🆔 @persian_data

توی کانال دیتاهاب درباره موضوعات مختلف هوش مصنوعی حرف می‌زنیم و آموزش و ابزارهای کاربردی رو معرفی می‌کنیم:
🆔 @data_hub_ir

برای اینکه از موقعیت‌های شغلی شرکت‌های مختلف باخبر بشین، توی گروه دیتاجابز عضو بشین:
🆔 @data_jobs
Forwarded from دیتاهاب (Zahra Yp)
اولین قدم برای شروع هوش مصنوعی اینه که پایتون یاد بگیریم. ولی پایتون یک زبان چندمنظوره هست و ما همه قسمتاش رو لازم نداریم.
کافیه کتابخونه‌های مهمش که برای هوش مصنوعی هستن رو بلد باشیم که میشن:
🔸 کتابخونه Numpy
🔸 کتابخونه Pandas
🔸 کتابخونه Matplotlib

از کجا یاد بگیریم؟
💯 کافیه دوره آموزش پایتون برای هوش مصنوعی رو از کانال یوتیوب دیتاهاب ببینی👇🏻
🌐 آموزش پایتون ویژه هوش مصنوعی

🆔 @data_hub_ir
1👎1
کد و دیتاست از یک مقاله که توی acl2023 چاپ شده

حروف اضافه همیشه واسه ما فارسی زبونها داستان داره، با جایگشت های متفاوتشون معنی جمله از زمین تا اسمون متفاوت میشه
این کد و دیتاست می تونه به کتابخانه هایی مثل هضم و پارسی ور اضافه بشه
https://github.com/AramKarimi/punctuation-ambiguity-in-persian
👍1
ورودی مدل‌های یادگیری ماشین داده هست و دیتاست هم توی اینترنت زیاده. ولی بعضی وقتا میخایم روی داده خاصی کار کنیم و لازمه دیتاست رو خودمون بسازیم.

🔸 یک منبع عالی برای این کار سایت‌ها هستن که انواع داده‌ها درباره موضوعات مختلف رو دارن. با وب اسکرپینگ میتونیم این داده‌ها رو جمع کنیم.

توی دوره وب اسکرپینگ که میتونی از کانال یوتیوب دیتاهاب ببینی، با پروژه های عملی داده‌های چندتا سایت رو جمع می‌کنیم. بعد از اون، دیگه فوت و فن کار رو بلدی.

💢 آموزش پروژه محور وب اسکرپینگ 💢

🆔 @persian_data
🆔 @data_hub_ir
🆔 @data_jobs
👍6
انتشار مجموعه داده "Dollar_Rial_Price_Dataset"

در این مجموعه داده، تغییرات قیمت دلار آمریکا به ریال ایران با استفاده از خزنده ما از سال 2011 تا 2023 (در تقویم پارسی 1390 تا 1402) خزش و جمع آوری شده است. که در مجموع 3310 رکورد برای این 13 سال در مجموعه داده ثبت شده است و مناسب کارهای time series prediction برای پیش بینی قیمت دلار و پیش بینی بازارهای مالی ایران است.


نحوه دسترسی به مجموعه داده
این دیتاست در گیتهاب محمد تقی زاده بصورت کاملا رایگان برای علاقه مندان به هوش مصنوعی و بازارهای مالی جمع آوری، پیاده سازی و منتشر شده است که از 3 طریق قابل دسترسی است.
1. گیتهاب: فرمت CSV قابل دسترس است و از اینجا میتوانید دانلود کنید.
2. کگل
3. هاگینگ فیس


توضیحات خزنده و جمع آوری اطلاعات
ویژگی مهم این مجموعه داده این است که، خزنده استخراج کننده قیمت را نیز که با سلنیوم توسعه داده شده در این پروژه منتشر کردیم که می توانید در هر زمان که بخواهید برای به روز رسانی داده ها آن را اجرا کنید. منبع جمع آوری این مجموعه داده سایت https://tgju.org است.
👍6
درسته روشای هوش مصنوعی کلی پیشرفت کردن و مدلای خیلی قوی اومدن، ولی هنوزم با الگوریتمای یادگیری ماشین به راحتی میشه خیلی از مسائل رو حل کرد.

اصلا مگه میشه بگیم مهندس داده هستیم، ولی یادگیری ماشین رو بلد نباشیم 😐

با دوره یادگیری ماشین دیتاهاب میفهمی:
🔸 چطور داده‌ها رو پیش پردازش کنی
🔸 الگوریتم‌های یادگیری ماشین چی هستن و کجا استفاده کنی
🔸 از اول تا آخر یه پروژه چه کارهایی لازمه انجام بدی

روی لینک زیر کلیک کن و توی یک دوره جامع، فوت و فن یادگیری ماشین رو یاد بگیر👇🏻
آموزش یادگیری ماشین به زبان ساده با پایتون

🆔 @persian_data
🆔 @data_jobs
🆔 @data_hub_ir
1👎1
https://github.com/myeghaneh/PAMT
اولین دیتاست فارسی در زمینه Argumentation mining. حالا شاید براتون سوا ل پیش بیاد که یعنی چه؟ فرض کن در مورد یک موضوع مثل تفکیک زباله. که از چندتا زاویه دید مثبت یا منفی بهش نگاه بشه. مثلا 5تا جمله باشه که 3 تاش در جهت تشویق به تفکیک هست و 2تاش از معایبش مثل هزینه بری بگه. این مدل دیتاست کمک می کنه تا مدل تحلیل یاد بگیره
👍3
این یکی دو ماه آینده یک سری پست خفن آماده کردیم و قرار هست بیشتر فعالیت کنیم
👍8
Forwarded from دیتاهاب
🟢 پروژه هوش مصنوعی داری ولی خودت نمی‌تونی|نمی‌رسی انجام بدی؟
🟢 واسه انتخاب موضوع پایان‌نامه یا پروپوزال، نیاز به مشاوره و همفکری داری؟
🟢 می‌خوای مقاله بنویسی ولی ایده جدید به ذهنت نمی‌رسه؟

🎯 همین الان پروژه خودت رو ثبت کن تا سریع تر بتونی کارات رو تموم‌ کنی و خیالت راحت باشه.

📞 09938013176
🌐 ثبت سفارش از طریق سایت | 📲 ثبت سفارش از طریق تلگرام
👍3