مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.18K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
https://github.com/amirroox/Persian-Developer-Roadmap

نقشه راه برای توسعه دهندگان برای پیشرفت بهتر

یکی از سوالات رایج برنامه نویسان این است که برنامه نویسی را از کجا شروع کنیم؟ و چگونه پیشرفت کنیم؟

از آنجایی که اکثر دوستان برای ورود به دنیای کامپیوتر و برنامه نویسی با مشکلات زیادی مواجه بودند و با سوالات زیادی مواجه می شدند، تصمیم گرفتیم برای افرادی که نمی دانند از کجا شروع کنند یا افرادی که به سطح قابل قبولی از دانش رسیده اند اما برای پیشرفت نمی داند چه چیزی را شروع کنند، یک انجمن راه‌اندازی کنیم.
یک دوست خوش ذوقی یک کرالر واسه سایت ایران داک نوشته و بعد از استخراج داده ها، به کمک شبکه پیچیده گراف همکاری بین رشته ای ترسیم کرده، این مدل کدها بابه مقاله نوشتنه...


https://github.com/tekboart/SNA-thesis
👍6
واسه نرمالسازی متون فارسی یکی از سخت ترین چالشها، اصلاح غلطهای گرامری هست
حالا یک دیتاست واسه این چالش معرفی می کنیم که میتونه کمک زیادی به بهبود سیستم های جاری کنه


https://github.com/leilaakbari/PVGED--Persian-Verb-related-Grammatical-Errors-Dataset
👍4
https://github.com/MrTaravat/technical-analysis-burse-iran
پروژه پایانی کارشناسی تحلیل تکنیکال نمودار سهام و پیش بینی از طریق روش های ماشین لرنینگ
که هم کد و هم گزارش داره

پ.ن: طبق این کد، معامله کردید و ضرری حاصل شد مسئولیتش با خودتون.☺️
👍3
دیتاست فارسی اطلاعات موبایل از وب سایت تکنولایف
این مدل دیتاست ها به درد کارهایی مثل سیستم توصیه گر می خوره

https://github.com/mamadgeek/mobile_farsi_datasets_1401-2-5
یک ریپ جامع و کامل در زمینه استخراج کلمات کلیدی فارسی
تقریبا اکثر روش ها توی این پکیج هست و کار راه بندازه...

https://github.com/AlirezaTheH/perke
👍3
یک پروژه جالب و همراه با دیتاستش معرفی می کنم که هدفش تشخیص فونت های فارسی هست. طبیعتا با یک مساله دسته بندی روبرو هستیم که از شبکه های عصبی استفاده شده.

https://github.com/MehdiSadeghi1994/PersianFontRecognition
یک کتاب آموزش به زبان فارسی واسه پایتون
خیلی مفصل گفته و مخصوص کسایی هست که قصد دارن از جونیور به سینیور حرکت کنن

https://github.com/salinourian/Python-Tutorial
سیگنال‌های گفتاری 286 کودک (141 دختر، 145 پسر)، در سنین 6 تا 9 سال. این داده های ثبت شده به صورت دستی بررسی و برچسب گذاری شدند. این دیتاست شامل 162395 نمونه با مدت زمان 33 ساعت و 44 دقیقه است. مجموعه گفتار آماده شده به ویژه برای بازشناسی گفتار و مطالعات زبانشناسی کاربرد دارد. به طور جامع شامل تمامی 29 واج فارسی، 118 هجا، 56 زیر کلمه و 711 کلمه می باشد.

https://github.com/DSP-UT/Persian-Kids-Speech-Data-Set
👍11