DataMastermind – Telegram
DataMastermind
3.04K subscribers
43 photos
10 videos
2 files
35 links
مجموعه‌ای از منابع و آموزش‌های رایگان برای پایتون، علوم داده و یادگیری ماشین. وارد دنیای برنامه‌نویسی شوید، رازهای تحلیل داده را کشف کنید ویادگیری ماشین را یاد بگیرید 🥄📊🤖

Github:
https://github.com/SaM-92/DataScience-ML-LearningHub

Twitter Saeedam92
Download Telegram
🔥 📝 پایتون برای علم داده، کتابی جدید از آرتور تورل است که بر تطبیق‌های اصلی علم داده با استفاده از پایتون تمرکز دارد. این کتاب الهام گرفته شده از کتاب R برای علم داده نوشته هدلی ویکهام و گرت گرولموند است و ساختار مشابهی دنبال می‌کند. این کتاب مباحثی از قبیل:
تنظیم و تبدیل داده
رسم داده
کار با spreadsheet، پایگاه‌های داده، web scraping و API
مباحث برنامه‌نویسی مانند توابع و iteration

این کتاب به صورت آزاد و آنلاین در دسترس است…

🔗 https://aeturrell.github.io/python4DS/welcome.html
10👍3
📊📈👨‍🏫بریم سراغ یک سری منبع برای یادگیری داستان سرایی و رسم نمودار با داده. یکی از مهم ترین مهارت های یک آنالیست داده، این هست که بتونه داده ها را بعد از بررسی، به زبان ساده تر برای افراد توضیح بده.
🔥🎥 ✏️این زیر میتونید یه سری منبع رو معرفی کردم. اما، لینک کتاب ها رو به نسخه ی اصلیشون گذاشتم چون به دلیل قوانین حق کپی رایت من اجازه ی به اشتراک گذاری نسخه ی رایگانشون رو ندارم. ولی اگر بگردید مطمئنم پیدا میکنید نسخه های رایگانش رو..

💻 تماشا کنید - Data Analyst Portfolio Project | Tableau Visualization
لینک:
https://youtu.be/QILNlRvJlfQ?si=NMIBi01ZIIeQnTI6

💻 تماشا کنید – How To Create a Dashboard - Tableau Tutorial P.9
لینک:
https://youtu.be/7Sdzs3fF5kw?si=MVDJgeL4YdwIjnVs

📖 بخوانید - Storytelling with Data
لینک:
https://www.amazon.co.uk/Storytelling-Data-Visualization-Business-Professionals/dp/1119002257
📖 بخوانید – The Big Book of Dashboards
لینک:
https://onlinelibrary.wiley.com/doi/book/10.1002/9781119283089
👍91
🔥📝📈🔥یه نگاهی دوباره هم به این شکل بندازیم که نشون میده برای چه داده هایی از چه نمودارهایی بهتره استفاده کنیم...
1
Forwarded from DataMastermind (S)
📊برای داده هام از چه نموداری استفاده کنم بهتره؟

💡 کدوم کمک میکنه که رفتار داده م رو بهتر بفهمم؟

🎯🔍 فرقی نمیکنه از چه ابزاری استفاده میکنی، این شکل بت ایده میده چه نموداری مناسب تره!
👍144🔥2👏1👌1
- تشویق به مشارکت فعال از سوی دو جامعه علوم کامپیوتر و تحقیقات باتری 🤝🔬
- دسترسی آسان به مجموعه‌ای گسترده از داده‌های عمومی باتری 📊💾
- تسهیل فرآیند آماده‌سازی مجموعه داده برای یادگیری ماشین 🧹📈
- تنظیم BatteryML برای نیازهای تحقیقاتی خود با رابط‌های قابل تنظیم 🛠️🔍


لینک:
https://github.com/microsoft/BatteryML/tree/main
👍41
📝✏️بایاس و واریانس مفاهیم اساسی در مدل‌های یادگیری ماشین هستند. بایاس نمایانگر خطاست که در اثر تقریب یک مسئله واقعی، که ممکن است پیچیده باشد، با یک مدل ساده‌تر ایجاد می‌شود. بایاس بالا می‌تواند به آندر-فیتینگ منجر شود، جایی که مدل بیش از حد ساده است و نمی‌تواند الگوهای اساسی در داده‌ها را پیدا کند. از طرف دیگر، واریانس نمایانگر حساسیت مدل به نوسانات کوچک در داده‌های آموزش است. واریانس بالا می‌تواند به اور-فیتینگ منجر شود، جایی که مدل به داده‌های آموزش بیش از حد متمایل می‌شود و نمی‌تواند به درستی به داده‌های جدید اعمال شود. این مشکلات زمانی پیش می‌آیند که تعادل نادرستی بین بایاس و واریانس در مدل وجود داشته باشد؛ آندر-فیتینگ از بایاس بیش از حد ناشی می‌شود (یک مدل بیش از حد ساده)، در حالی که اور-فیتینگ از واریانس بیش از حد ناشی می‌شود (یک مدل بیش از حد پیچیده). دستیابی به تعادل مناسب برای ساخت مدل‌های یادگیری ماشین قوی و دقیق بسیار حائز اهمیت است.

👇 اطلاعات بیشتر👇
👏9👍5🙏31
👨‍🏫 👩‍💻اگر در درک مفهوم آندر-فیتینگ و او-فیتینگ مشکل دارید :

آندر-فیتینگ یعنی وقتی مدل یادگیری ماشین خیلی ساده و ابتدایی باشد و نتواند الگوهای داده‌ها را بیابد، مثلاً یک مدل خطی برای پیش‌بینی قیمت خودروها که همه مشخصات را نادیده بگیرد و همه را به یک ارزش ثابت تخمین بزند.
اور-فیتینگ وقتی رخ می‌دهد که مدل به داده‌های آموزش بیش از حد منطبق شود و جزئیات کوچک را نیز در بر بگیرد، مثلاً یک مدل پیچیده‌تر که برای پیش‌بینی قیمت خودروها همه جزئیات ممکن را در نظر بگیرد، اما نتواند به درستی به سایر خودروها خارج از داده‌های آموزش پاسخ دهد.


محض اطلاع چون فینگیلیش نوشتم بالا:
Underfitting = آندر-فیتینگ
Overfitting = اورفیتینگ
Variance= واریانس
Bias= بایاس
👍12🔥2🙏1
📝 دوره ی ماشین لرنینگ دانشگاه هاروارد:

1-مبانی ماشین لرنینگ
2- آموزش روش cross-validation
3- کار با تعدادی از الگوریتم های محبوب ماشین لرنینگ
4- آموزش ساخت سیستم توصیه کننده (Recommendation system)
5-تنظیم مدل (رگولاریزیشن) چیست و چرا از آن استفاده می‌شود

👨‍🏫 مدرس:
پروفسور رافائل ایریزاری (Rafael Irizarry)، استاد و محقق برجسته در زمینه آمار و علوم داده است. او در حال حاضر به عنوان استاد آمار و بیوانفورماتیک در دانشکده علوم عصبی و پزشکی هاروارد (Harvard T.H. Chan School of Public Health) فعالیت می‌کند.

💡توضیحات:
دوره رایگان هست ولی اگر دنبال مدرک هستید باید مبلغ 101 یورو پرداخت کنید.
دیدم نوشته که برای ایرانی ها امکان ثبت نام و ... وجود نداره (به دلیل تحریم ها) اما، توصیه ی ما این هست که با استفاده از VPN و آدرس های خارج از ایران ثبت نام را انجام بدین... متاسفم که برای یادگیری علم هم باید هم داخل را دور بزنیم و هم خارج را... اما همین را بهانه کنید که بیشتر یاد بگیرید، برای یادگیری نباید دیواری باشد.. چه در داخل و چه در خارج💚🙏

لینک دوره:
https://shorturl.at/mMW38
22👍3🙏3
📝بیاین نظر بدین ببینم چند نفر موضوع بایاس و واریانسِ پست دیروز رو فهمیدن :)

👇این پایین گزینه ها رو میذارم انتخاب کنید، بعد فردا پاسخ رو با توضیح میذارم 🤗
🙏2👍1
فرض کنید یک مدل ماشین لرنینگ مبتنی بر Decision Tree Algorithm دارید، مد را آموزش دادید و عمق درخت (tree depth) را معادل 10 گذاشتین که منجر به بهترین عملکرد شده. حالا اگر عمق درخت را من به 5 کاهش بدم، Bias و Variance در مدل من چگونه خواهد شد؟
Anonymous Poll
11%
بایاس زیاد و واریانس زیاد
10%
بایاس کم و واریانس کم
64%
بایاس زیاد و واریانس کم
18%
بایاس کم و واریانس زیاد
👍5👏2
DataMastermind
فرض کنید یک مدل ماشین لرنینگ مبتنی بر Decision Tree Algorithm دارید، مد را آموزش دادید و عمق درخت (tree depth) را معادل 10 گذاشتین که منجر به بهترین عملکرد شده. حالا اگر عمق درخت را من به 5 کاهش بدم، Bias و Variance در مدل من چگونه خواهد شد؟
پاسخ رو 67 درصد درست گفتن.. آفرین واقعا ..

در درخت‌های تصمیم، عمق درخت واریانس را مشخص می‌کند. یک مدل پیچیده (به عنوان مثال عمیق) دارای بایاس پایین و واریانس بالا است. افزایش بایاس، واریانس را کاهش می‌دهد و افزایش واریانس، بایاس را کاهش می‌دهد.

پس وقتی عمق درخت را از 10 به 5 کاهش می دهیم، یعنی عمق را کم کردیم، به عبارتی واریانس را کم و بایاس زیاد میشود..
👍93
👩‍🏫ربات معلم که به شما پایتون، آنالیز داده، ماشین لرنینگ، دیپ لرنینگ و ... یاد میده

📝 بیش از 125 هزار منبع رایگان برای یادگیری


🤭 رباط نه اقا، ربات😅


🔗 لینک:
https://aigents.co/learn
👍158
📝 دوره ی تئوری احتمال دانشگاه هاروارد:

1. مفاهیم مهم در نظریه احتمال شامل متغیرهای تصادفی
2. نحوه انجام شبیه‌سازی Monte Carlo
3. معنای Expected value، خطای استاندارد و نحوه محاسبه آنها در R, ...


👨‍🏫 مدرس:
پروفسور رافائل ایریزاری (Rafael Irizarry)، استاد و محقق برجسته در زمینه آمار و علوم داده است. او در حال حاضر به عنوان استاد آمار و بیوانفورماتیک در دانشکده علوم عصبی و پزشکی هاروارد (Harvard T.H. Chan School of Public Health) فعالیت می‌کند.

💡توضیحات:
دوره رایگان هست ولی اگر دنبال مدرک هستید باید مبلغ 101 یورو پرداخت کنید.
دیدم نوشته که برای ایرانی ها امکان ثبت نام و ... وجود نداره (به دلیل تحریم ها) اما، توصیه ی ما این هست که با استفاده از VPN و آدرس های خارج از ایران ثبت نام را انجام بدین... متاسفم که برای یادگیری علم هم باید هم داخل را دور بزنیم و هم خارج را... اما همین را بهانه کنید که بیشتر یاد بگیرید، برای یادگیری نباید دیواری باشد.. چه در داخل و چه در خارج💚🙏

لینک دوره:
https://www.edx.org/learn/probability/harvard-university-data-science-probability
👍7
📝جنبش اطلاعات باز به معنای واقعی کانون طلایی برای دیتا ساینتیست ها بوده‌، و با افتتاح پرتال های اطلاعات باز در شهرهای اروپایی، بهشتی از داده‌ها در اختیار کاربران قرار میگیره!

🌏داده ها، مناطق شهری/جغرافیایی، مرزهای شهری، اطلاعات محیطی و اقلیمی، آمار جمعیت، متغیرهای اجتماعی-اقتصادی، حمل و نقل و ترابری، خدمات عمومی، مناطق سبز، نقاط جذاب، ابعاد ساختمان‌ها، شبکه‌های جاده‌ای و بسیاری موارد دیگر را پوشش دهند! 💡

👇در زیر لیست کاملی از پرتال شهرهای اروپایی رو قرار دادم! 📊
👍63
🌏لیست داده ها بر اساس شهرهای اروپایی🌏:



🇳🇱 Amsterdam - https://ow.ly/StH550PJzVc

🇦🇩 Andorra la Vella - https://ow.ly/msIu50PJzVj

🇬🇷 Athens - https://ow.ly/RglH50PJzVh

🇪🇸 Barcelona - https://ow.ly/kbA050PJzVx

🇷🇸 Belgrade - https://ow.ly/txiC50PJzVb

🇩🇪 Berlin - https://ow.ly/Ri2x50PJzVF

🇷🇴 Bucharest - https://ow.ly/wkze50PJzVr

🇭🇺 Budapest - https://ow.ly/uKfq50PJzVH

🇸🇰 Bratislava - https://ow.ly/VZNK50PJzVp

🇧🇪 Brussels - https://ow.ly/zH1j50PJzVu

🇩🇰 Copenhagen - https://ow.ly/PuO450PJzVi

🇮🇪 Dublin - https://ow.ly/8o2x50PJzVy

🇫🇮 Helsinki - https://ow.ly/ZlXi50PJzVE

🇵🇹 Lisbon - https://ow.ly/pl4g50PJzVm

🇸🇮 Ljubljana - https://ow.ly/sC7z50PJzVk

🇪🇸 Madrid - https://ow.ly/jAcz50PJzVn

🇨🇾  Nicosia - https://lnkd.in/dP6WCKew

🇳🇴 Oslo - https://ow.ly/FSik50PJzVv

🇫🇷 Paris - https://ow.ly/bEio50PJzVq

🇨🇿 Prague - https://ow.ly/CKrM50PJzVw

🇮🇸 Reykjavik - https://ow.ly/78Ci50PJzVA

🇮🇹 Rome - https://ow.ly/Ohk950PJzVl

🇸🇪 Stockholm - https://ow.ly/I8Mt50PJzVe

🇪🇪 Tallinn - https://ow.ly/U92j50PJzV9

🇦🇱 Tirana - https://ow.ly/4RYT50PJzVs

🇦🇹 Vienna - https://ow.ly/kAGG50PJzVt

🇱🇹 Vilnius - https://ow.ly/ryYT50PJzVI

🇵🇱 Warsaw - https://ow.ly/FaRV50PJzVz

🇦🇲 Yerevan - https://ow.ly/8EPu50PJzVG

🇭🇷 Zagreb - https://ow.ly/yPK250PJzVg
5👏2🔥1
👨‍💻👩‍💻🔥امروز روز جهانی برنامه‌نویس هاست.. امیدوارم کد‌هاتون همیشه بدون باگ باشند، تست‌هاتون راحت پاس شن، و پروژه‌هاتون همیشه به موقع تحویل داده بشن... با انرژی و علاقه به کارتون ادامه بدید و دنیا رو جای بهتری کنید با کاراتون! 🚀💻

💚روزتون بدون باگ رفقا
🥰1710👍1😎1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥🤓🎤زبان، بزرگ‌ترین مانع رشد پادکست است. اما فرض کنید بتوان این مانع را شکست، چه اتفاقی می‌افتاد؟ به عبارتی در عین حفظ تجربه اصیل، تقریباً مثل اینکه پادکستر به تازگی یک زبان جدید یاد گرفته است و همان داستان را برای شما می گوید..

🎙️🎶اسپاتیفای ویژگی جدیدی را اخیراً معرفی کرده: ویژگیی ای که پادکست‌ها را به زبان‌های مختلف ترجمه می‌کند، همه با صدای پادکستر! اکنون مخاطبان در سراسر جهان قادر به کشف و الهام گرفتن از پادکسترهای جدید به یک شکل بسیار اصیل‌تر از همیشه خواهند بود...
👍205🔥5
دیتاکمپ حق عضویتش رو برای یک ماه به 1 یورو کاهش داده! برای کسایی که میخوان پایتون یاد بگیرن یا ماشین لرنینگ و ... خیلی خوبه.. مدرک هم میده که باز بهتر!

دوره های آنالیز دیتا، ماشین لرنینگ، مهندسی داده و ... رو همه داره...

https://www.datacamp.com/promo/october-monthly-sale-2023?utm_source=customerio&utm_medium=email&utm_campaign=231002_1-oct23odp-t1_2-b2c_3-all_4-na_5-na_6-na_7-le_8-emal-ci_9-na_10-oct23odp_11-email&utm_content=blast&dc_euid=11807598
👍92👎1
🤓💚🤗سلام بچه ها، ببخشید من خیلی فعال نبودم، چون کارا زیادن و نشد خلاصه که بشه..

👨‍💻سعی میکنم یکم به روتین قبل برگردم ولی نمیخوام الکی فقط کانتنت بذارم اینجا، مگر اینکه واقعا چیز بدرد بخوری ببینم..

👨‍🏫یه سری منبع هست که میتونید استفاده کنید برای تمرین کد نویسی و مصاحبه ی شرکت های Tech.

1- https://leetcode.com/
2- https://neetcode.io/
3-https://shorturl.at/iuQ49

🙏لینک کتاب رو گذاشتم برای خرید ولی ولی، شما بگردین PDF رایگانش هست من قانوناً اجازه اشتراک گذاریش رو ندارم ...

بخش دوم و سوم هم داره که بعد میذارم واستون...
👍115👏1
🔥بخش دوم

📝یادگیری طراحی سیستم (System Design)

💡اینم بگم که منابع زیادن، ما سه تاش رو میگیم که شما ایده بگیرین، ولی به این معنی نیست اگر دارید منابع دیگه ای میخونین، بده یا مثلا بدرد نمیخوره...

1- System Design Interview (https://shorturl.at/koA07)
2- Designing Data-intensive Applications (https://shorturl.at/iqwN8)
3- Grokking the System Design Interview (https://www.designgurus.io/course/grokking-the-system-design-interview)

👨‍🏫 بخش سوم و چهارمم میذارم...
👍43
🔥🌏👨‍💻👩‍💻تو سال انفجار AI زندگی میکنیم و هر روز یه ابزار جدید AI برامون رو میشه. حالا این وسط خود پیدا کردن ابزار مناسب یه جور چالش هست.

🤗💡 تو این وبسایت میتونین برید و لیست همه ابزار های AI رو ببینین. مثال: سرچ میکنین paper یا music و لیست همه ابزارهای مرتبط میاد!

🔗 https://theresanaiforthat.com

🙏🤗credit: از توییتر @sh_3789
👍104😍4🥰1