دیتاهاب – Telegram
دیتاهاب
2.13K subscribers
184 photos
35 videos
127 files
327 links
موضوعات کانال:

Data Science
Machine Learning
Deep Learning
NLP

گروه تلگرامی ⬅️ @data_jobs
دیتاست ⬅️ @persian_data
ادمین ⬅️ @data_hub
Download Telegram
#یادگیری_با_مثال

مفهوم overfitting: overfitting مثل این میمونه که یک نفر کل شب رو بیدار بوده ، جزوه کلاسیش رو حفظ کرده و کامل بلده ولی وقتی میره سر جلسه میبینه که استاد خارج از جزوه سوال داده!!! پس نمیتونه که حل کنه و امتحان رو میفته:)

یه مثال بامزه دیگه ای از overfitting رو میتونید تو عکس ببینید.

❇️ @data_hub_it
#overfitting
یک ابزار رایگان کاربردی

🗃 نوع: #سورس_کد

📖 توضیحات:
بارها شده دلمون بخواد فایل pdf فارسی تبدیل کنیم ولی امکانش نبوده . این ابزار رایگان یک کدی هست که به پایتون نوشته شده و هدفش تبدیل pdf هست(حتی pdfهایی که از نوع تصویر هستند)

📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید‌. 👇👇

https://github.com/mmahdibarghi/pdf2txt

لطفا به اشتراک بگذارید👈🏻 @persian_data
seaborn.pdf
1.6 MB
درود
❇️ تو این مقاله درباره seaborn که یه کتابخونه خیلی مفید برای مصورسازی داده ها و رسم نمودارها هست توضیحات خیلی مفیدی به همراه کدهاش قرار گرفته.
❇️@data_hub_ir
#یادگیری_ماشین
#هوش_مصنوعی
#تحلیل_داده
#یادگیری_عمیق
درود
فردا صبح با یک ارائه کاملا متفاوت در خدمتتون هستم...
قصد دارم از یک بعد جدید به علم داده نگاه کنیم.

https://vwork.sku.ac.ir/TD-566/

@data_hub_ir
#یادگیری_با_مثال

مفهوم underfitting: underfitting مثل این میمونه که یک نفر نه جزوه نداره ، نه از کسی جزوه میگیره و حتی اگرم جزوه داشته باشه اصلا حتی سعی نمیکنه که جزوه رو ورق بزنه. حالا میره سر جلسه امتحان. پس چون هیچ دانشی نداره، دوتا انتخاب بیشتر نداره: یا اینکه شانسی و با کمک نیروهای غیبی به سوالا جواب میده و یا اینکه برگه رو سفید میده. در هر دو صورت، عملکردش یک عملکرد ضعیفیه، که این میشه underfitting.


❇️ @data_hub_it
#underfitting
❇️ وبینار
موضوع: AI and BigData Online Day 2021

ارائه دهنده: Lemberg Tech Business School

تاریخ: روز شنبه 1 آبان 1400

ساعت : 10:30 الی 17:30

لینک ثبت نام:
Http://aiconf.com.ua/

❇️@data_hub_ir

#وبینار
1629810603777.jpg
36.4 KB
چه می کنه GAN...
گذشته را با کیفیت بالا مرور کنید
https://github.com/TencentARC/GFPGAN

@data_hub_ir
git.jpg
148.1 KB
درود
❇️ حتمن تو شرکتهای مختلف اسم گیت رو شنیدین. گیت یه نوع سیستم کنترل نسخه های مختلف پروژه هست که با کمک اون می تونید تغییراتی که توی فایل هاتون اعمال شده رو پیگیری کنید. مثلاً اگه یه فایلی رو ویرایش کنید گیت می تونه بهتون بگه که چی تغییر کرده، کی اون تغییرات رو اعمال کرده و علتش چی بوده. از خوبیاشم اینه که برای هماهنگی وظایف بین افراد مختلف که روی یه پروژه کار می کنند خیلی مفیده. تو این فایل خیلی خلاصه دستورات مهم گیت توضیح داده شده.
❇️@data_hub_ir
#گیت_هاب
#گیت
#یادگیری_با_مثال
مفهوم False Negative: False Negative مثل این میمونه که یک نفر انواع و اقسام علائم کرونا مثل تب، بدن درد، خستگی، ضعف و ... دالع و میره که تست pcr بده. باوجود همه این علائم، جواب pcr منفی میشه. قطعا هممون میدونیم که این جواب منفی چه عواقبی داره و تا چه حد میتونه که خطرناک باشه. با استناد به این جواب منفی، این شخص سرکار و دورهمی و مهمونی میره و سایرین رو هم مبتلا میکنه. بنابراین خیلی مهمه که False Negative رو کاهش بدیم.


مفهوم False Positive: False Positive مثل این میمونه که یک نفر هیچ ‌کدوم از علائم کرونا رو نداره اما بنا به دلایلی تست pcr میده و در کمال تعجب، جواب تست مثبت میشه. False Positive هم بدی خودش رو داره. اما در مورد موضوعی مثل کرونا، ترجیح جامعه به اینه که False Negative ها رو کاهش بده حتی اگر درکنارش False Positive ها افزایش پیدا کنه.


❇️ @data_hub_it
#false_negative
#false_positive
Study guide: Data Retrieval with SQL.pdf
332.7 KB
درود
❇️ همه اونایی که تو حوزه تحلیل داده کار میکنند میدونن که پایگاه داده چه قدر اهمیت داره و حتمن حتمن حداقل باید با یه پایگاه داده برای این موقعیت شغلی آشنایی داشت. تو این مقاله دستورای مهم یکی از مهم ترینا یعنی اس کیوال سرور توضیح داده شده.
❇️@data_hub_ir
#تحلیل_داده
#پایگاه_داده
❇️ وبینار
موضوع: How to Grow your Career as an ML Practitioner

ارائه دهنده: DeepLearning.AI

تاریخ: روز چهارشنبه 7 مهر 1400

ساعت : 20:30 الی 21:30

لینک ثبت نام:
https://www.eventbrite.com/e/grow-your-career-in-the-industry-as-an-ml-practitioner-tickets-169208819133

❇️@data_hub_ir

#وبینار
درود
اگر مفاهیم scale ، standardize و normalize کردن براتون ابهام داره و یا اینکه با همدیگه اشتباه میگیریدشون، خوندن این مقاله رو از دست ندید‌.

لینک مقاله 👇🏻
https://towardsdatascience.com/scale-standardize-or-normalize-with-scikit-learn-6ccc7d176a02

@data_hub_ir
#مقاله
#مقاله_آموزشی‌
درود
یه مطلب بی‌نظیر از نحوه فاین تیون کردن برت واسه انواع تسک‌ها. اینقدر مطلب ساده و روون هست که قطعا لذت می‌برین. این سایت از دست ندین.

https://d2l.ai/chapter_natural-language-processing-applications/finetuning-bert.html

@data_hub_ir
numpyExample.pdf
259.9 KB
درود
❇️ تو این مقاله صد تا مساله قرار گرفته که فقط و فقط با کمک کتابخونه نامپای می تونید همه رو حل کنید. پیشنهاد می کنم خوندن این مقاله کاربردی رو از دست ندین.
❇️@data_hub_ir
#یادگیری_ماشین
#هوش_مصنوعی
#تحلیل_داده
#یادگیری_عمیق
اگر دغدغه جمع آوری دیتاست دارین کافیه این اسکریپت اجرا کنین تا تمام زیرنویس های سایت worldsubnoscript.info دانلود کنه. این مدل دیتاها در درجه اول به درد ترجمه میخوره و همینطور q&a


https://github.com/nimiology/persian_subdl


❇️@data_hub_ir
درود
یکی از مهم ترین اقداماتی که در مرحله پیش پردازش داده باید انجام داد، هندل کردن missing value هاست. مقاله پایین در این راستا، ۷ روش مختلف رو توضیح داده.

لینک مقاله 👇🏻
https://towardsdatascience.com/7-ways-to-handle-missing-values-in-machine-learning-1a6326adf79e

@data_hub_ir
#مقاله
#مقاله_آموزشی‌
یک نکته بسیار کاربردی و مفید
تا حالا شده توی matplotlib یا seabornبخوای محورها را فارسی نام گذاری کنی ولی نشه...
خب یک راه حل باحال و ساده تقدیم به شما!!!
https://github.com/TheAlbatrossCodes/plotfa

❇️ @data_hub_ir
Plotly & Plotly Express tutorial.pdf
3 MB
درود
❇️ کتابخونه plotly برای رسم نمودارهای تعاملی استفاده میشه و یه کتابخونه متن باز از پایتون هست. تو مقاله امروز به بررسی و کارایی این کتابخونه تو رسم نمودارهای مختلف پرداخته شده.
❇️@data_hub_ir
#یادگیری_ماشین
#هوش_مصنوعی
#تحلیل_داده
Data Visualization With Seaborn
13.3 MB
درود
❇️ یک داکیومنت کامل از data visualization با استفاده از کتابخونه seaborn که میتونه خیلی کمک کننده باشه.

اینم آدرس گیت‌هاب نوت‌بوک ها و دیتاست هایی که استفاده شده:

https://github.com/datasciencescoop/Data-Visualization/tree/master/Seaborn

❇️@data_hub_ir
#یادگیری_ماشین
#هوش_مصنوعی
#تحلیل_داده
#یادگیری_عمیق
excel.pdf
1.3 MB
درود
❇️ فکر نمی کنم کسی تو حوزه داده کار کنه و گذرش به اکسل نخورده باشه. اکسل نرم افزار خیلی مشهور برای کار با داده هاست و تو این مقاله کاربردی ترین فرمولها و بخش های مختلفش خیلی کوتاه توضیح داده میشه.
❇️@data_hub_ir
#یادگیری_ماشین
#هوش_مصنوعی
#تحلیل_داده
#هوش_تجاری