Data Hobbies – Telegram
Data Hobbies
830 subscribers
21 photos
1 video
12 files
76 links
It's a community to providing training roadmaps for data career paths, announcing job positions, providing training videos, conducting online and face-to-face events.
Our discussions group is:
https://news.1rj.ru/str/DataHobbies_Discussions

Admin: @Torkamani_Marya
Download Telegram
اکسل! Excel
اکسل برای داده‌های با حجم کم ابزار کاربردیه ولی قطعا یکی از مهم‌ترین ابزارها برای تحلیل دیتا نیست!
ممکن به فراخور بیزینس و شرکتی که باهاش کار میکنیم قسمتی از دیتاهاشون تو اکسل باشه و ما به اجبار باید کار کردن با اکسل رو بلد باشیم
از طرفی خیلی از اوقات خبره‌های (expert) بیزینسی ک داریم باهاشون همکاری میکنیم اکثر فرمول‌هاشون تو اکسل زدن و ما گاها باید بر اساس اون فرمول‌ها و پیاده‌سازی که تو اکسل داشتن بفهمیم تو اون بیزینس چخبره.

filters, functions, formulas, Charts - plots, Pivot table, vlookup
و شاید VBA macros
مسائل مهم اکسل باشه که بشه تو یه هفته آموزششو گذروند.
به عنوان یه فرد که تو زمینه تحلیل دیتا کار میکنه باید ریاضیاتی مثل جبر خطی (Linear algebra) بلد باشیم، به طور مثال وقتی میخوایم مولفه های اصلیمون پیدا کنیم و کاهش بعد بدیم، از PCA استفاده می کنیم. خب مسلما باید بدونیم که PCA یک روش تبدیل خطیه! یا وقتی میخوایم با انواع رگرسیون کار کنیم باید مفاهیم ماتریس بدونیم، پس اگه میخوایم به طور اصولی تو زمینه یادگیری ماشین و یادگیری عمیق و... رشد کنیم نباید از مرور جبر خطی فرار کنیم 😌
مباحث زیر به طور کلی تو جبر خطی برامون مهم اند:
عدد (Scalar)، بردار (Vectors)، ماتریس (Matrix) و تنسور (Tensor)
انواع ماتریس، نرم(Norm) بردار یا ماتریس، بردار ویژه (Eigen Vector) و مقدار ویژه (Eigen Value) ماتریس، SVD در ماتریس، ماتریس کواریانس (Covariance) و ماتریس همبستگی (Correlation)
و آنالیز مولفه اصلی PCA (Principal Component Analysis)
کتابای رفرنس جبر خطی معمولا این ها هستن که هم ترجمه شون هست، هم pdf هاشون راحت گیر میاد
• کتاب جبرخطی هافمن/کنزی
• کتاب جبر خطی شلدون اکسلر
• کتاب جبر خطی استرنگ

#ریاضیات
@DataHobbies
1
یکی از سایت هایی که جبر خطی رو خوب و سریع گفته، خان آکادمیه:
https://www.khanacademy.org/math/linear-algebra
ویدیوهای 3-1 الی 3-6 ماشین لرنینگ اندرو ان جی، ریاضیات جبر خطی رو در حد کلیات مرور میکنه، برای بچه هایی که قبلا خوندن و میخوان فقط یه مرور شه خوبه یکی دو ساعت زمان بذارن نگاه کنن

https://www.youtube.com/watch?v=Dft1cqjwlXE&list=PLLssT5z_DsK-h9vYZkQkYNWcItqhlRJLN&index=12
matrixcookbook.pdf
676.5 KB
اینم یه کتاب خوب برای ماتریس هاست
Practical Linear Algebra for DS.pdf
16 MB
اینم یه کتاب خوب که تمرینات کاربردی جبر خطی رو برای دیتاساینس ها با پایتون پیاده کرده👌
خب بریم سراغ اصول اولیه برنامه نویسی
به نظرم پایتون اکثر نیازهای افرادی که با داده کار میکنن رو تامین میکنه (اکثر نه همه، مصارف خاصی هست که احتیاج به زبون های دیگه پیدا میشه)
برای شروع برنامه نویسی و آموزش پایتون مقدماتی به این قسمت ها احتیاج داریم:
آموزش اصول برنامه نویسی با پایتون
حلقه های تکرار و توابع، آشنایی با انواع ساختارهای داده در پایتون
کار با کتابخانه ها و فایل ها در پایتون

#پایتون_مقدماتی
@DataHobbies
👍3
افراد تازه کار برای انتخاب IDE میتونن یه سری به این مقاله سایت مدیوم برای آشنایی کلی jupyter بزن https://towardsdatascience.com/interactive-spreadsheets-in-jupyter-32ab6ec0f4ff

#IDE #Python #Jupyter
پایتون متوسط

برای ادامه نیاز به دانش بیشتری تو زمینه پایتون هست، نکاتی که به طور متوسط بهش احیاج داریم رو نوشتم:

شروع کار با pandas، کارهای اولیه دستکاری داده و data frameها، بارگذاری اولیه داده ها، بحث های اولیه آماری
نمایش داده ها در چارت های مختلف با Mathplotlib و Plotly
کار با کتابخانه Seaborn برای نمایش
انجام انواع تست های فرضیه (Hypothesis Test) با pandas مثل [t-tests, proportion tests, chi-square tests , . . .]
#Python #پایتون #پایتون_متوسط
@DataHobbies
Pandas_Cheat_Sheet.pdf
387.2 KB
یه خلاصه تمییز و مرتب از pandas برای مرور سریع

#پایتون
#Python #Pandas
@DataHobbies
و انواع سورس های آموزشی پایتون که برای دیتاساینس ها تهیه شده میتونه مفید باشه