Data Hobbies – Telegram
Data Hobbies
830 subscribers
21 photos
1 video
12 files
76 links
It's a community to providing training roadmaps for data career paths, announcing job positions, providing training videos, conducting online and face-to-face events.
Our discussions group is:
https://news.1rj.ru/str/DataHobbies_Discussions

Admin: @Torkamani_Marya
Download Telegram
آزمون های آماری
آمار استنباطی (Inferential)
آزمایش فرضیه (Hypothesis Testing)
برازش مدل (Model Fitting)

آزمایش فرضیه/ آزمون فرض:
همونطور که می دونیم آزمون فرض یه ادعایی درباره پارامترهای توزیع یک/چند جمعیت یا نوع متغیر تصادفیه که ممکن درست یا غلط باشه. حالا از بین کلی آزمون فرضیه آماری که وجود داره اینایی که لیست می کنم بیشترین کاربرد رو برای یه دیتاساینس داره:
آزمون های نرمالیتی ((Normality Tests
آزمون های همبستگی (Correlation Tests)
آزمون های ایستایی (Stationary Tests)
آزمون های پارامتری (Parametric Statistical Hypothesis Tests)
آزمون های ناپارامتری (Non-Parametric Statistical Hypothesis Tests)

برازش مدل:
Model Fitting یا برازش مدل نشون میده یه دیتاساینس توی مدلی که طراحی کرده چقدر میتونه پشتیبانی از داده های واقعیش بگیره، در واقع به نوعی تطابق یا سازگاری مدل نظری و تجربی رو میسنجه، سه تا شاخص اصلی داره که هر کدوم ازین شاخص ها چند تا روش دارن:
شاخصهای برازش مقتصد
شاخصهای برازش تطبیقی
شاخصهای برازش مطلق
یه تعریف دیگه هم که جا داره حواسمون بهش باشه بحث روندی که انجام میشه تا یه تابع ریاضی یا منحنی به وجود بیاد که بیشترین شباهت با داده هارو داشته باشه که به اینم برازش منحنی یا (Curve Fitting) میگن.
اکسل! Excel
اکسل برای داده‌های با حجم کم ابزار کاربردیه ولی قطعا یکی از مهم‌ترین ابزارها برای تحلیل دیتا نیست!
ممکن به فراخور بیزینس و شرکتی که باهاش کار میکنیم قسمتی از دیتاهاشون تو اکسل باشه و ما به اجبار باید کار کردن با اکسل رو بلد باشیم
از طرفی خیلی از اوقات خبره‌های (expert) بیزینسی ک داریم باهاشون همکاری میکنیم اکثر فرمول‌هاشون تو اکسل زدن و ما گاها باید بر اساس اون فرمول‌ها و پیاده‌سازی که تو اکسل داشتن بفهمیم تو اون بیزینس چخبره.

filters, functions, formulas, Charts - plots, Pivot table, vlookup
و شاید VBA macros
مسائل مهم اکسل باشه که بشه تو یه هفته آموزششو گذروند.
به عنوان یه فرد که تو زمینه تحلیل دیتا کار میکنه باید ریاضیاتی مثل جبر خطی (Linear algebra) بلد باشیم، به طور مثال وقتی میخوایم مولفه های اصلیمون پیدا کنیم و کاهش بعد بدیم، از PCA استفاده می کنیم. خب مسلما باید بدونیم که PCA یک روش تبدیل خطیه! یا وقتی میخوایم با انواع رگرسیون کار کنیم باید مفاهیم ماتریس بدونیم، پس اگه میخوایم به طور اصولی تو زمینه یادگیری ماشین و یادگیری عمیق و... رشد کنیم نباید از مرور جبر خطی فرار کنیم 😌
مباحث زیر به طور کلی تو جبر خطی برامون مهم اند:
عدد (Scalar)، بردار (Vectors)، ماتریس (Matrix) و تنسور (Tensor)
انواع ماتریس، نرم(Norm) بردار یا ماتریس، بردار ویژه (Eigen Vector) و مقدار ویژه (Eigen Value) ماتریس، SVD در ماتریس، ماتریس کواریانس (Covariance) و ماتریس همبستگی (Correlation)
و آنالیز مولفه اصلی PCA (Principal Component Analysis)
کتابای رفرنس جبر خطی معمولا این ها هستن که هم ترجمه شون هست، هم pdf هاشون راحت گیر میاد
• کتاب جبرخطی هافمن/کنزی
• کتاب جبر خطی شلدون اکسلر
• کتاب جبر خطی استرنگ

#ریاضیات
@DataHobbies
1
یکی از سایت هایی که جبر خطی رو خوب و سریع گفته، خان آکادمیه:
https://www.khanacademy.org/math/linear-algebra
ویدیوهای 3-1 الی 3-6 ماشین لرنینگ اندرو ان جی، ریاضیات جبر خطی رو در حد کلیات مرور میکنه، برای بچه هایی که قبلا خوندن و میخوان فقط یه مرور شه خوبه یکی دو ساعت زمان بذارن نگاه کنن

https://www.youtube.com/watch?v=Dft1cqjwlXE&list=PLLssT5z_DsK-h9vYZkQkYNWcItqhlRJLN&index=12
matrixcookbook.pdf
676.5 KB
اینم یه کتاب خوب برای ماتریس هاست
Practical Linear Algebra for DS.pdf
16 MB
اینم یه کتاب خوب که تمرینات کاربردی جبر خطی رو برای دیتاساینس ها با پایتون پیاده کرده👌
خب بریم سراغ اصول اولیه برنامه نویسی
به نظرم پایتون اکثر نیازهای افرادی که با داده کار میکنن رو تامین میکنه (اکثر نه همه، مصارف خاصی هست که احتیاج به زبون های دیگه پیدا میشه)
برای شروع برنامه نویسی و آموزش پایتون مقدماتی به این قسمت ها احتیاج داریم:
آموزش اصول برنامه نویسی با پایتون
حلقه های تکرار و توابع، آشنایی با انواع ساختارهای داده در پایتون
کار با کتابخانه ها و فایل ها در پایتون

#پایتون_مقدماتی
@DataHobbies
👍3
افراد تازه کار برای انتخاب IDE میتونن یه سری به این مقاله سایت مدیوم برای آشنایی کلی jupyter بزن https://towardsdatascience.com/interactive-spreadsheets-in-jupyter-32ab6ec0f4ff

#IDE #Python #Jupyter