DataMastermind – Telegram
DataMastermind
3.04K subscribers
43 photos
10 videos
2 files
35 links
مجموعه‌ای از منابع و آموزش‌های رایگان برای پایتون، علوم داده و یادگیری ماشین. وارد دنیای برنامه‌نویسی شوید، رازهای تحلیل داده را کشف کنید ویادگیری ماشین را یاد بگیرید 🥄📊🤖

Github:
https://github.com/SaM-92/DataScience-ML-LearningHub

Twitter Saeedam92
Download Telegram
📝✏️بایاس و واریانس مفاهیم اساسی در مدل‌های یادگیری ماشین هستند. بایاس نمایانگر خطاست که در اثر تقریب یک مسئله واقعی، که ممکن است پیچیده باشد، با یک مدل ساده‌تر ایجاد می‌شود. بایاس بالا می‌تواند به آندر-فیتینگ منجر شود، جایی که مدل بیش از حد ساده است و نمی‌تواند الگوهای اساسی در داده‌ها را پیدا کند. از طرف دیگر، واریانس نمایانگر حساسیت مدل به نوسانات کوچک در داده‌های آموزش است. واریانس بالا می‌تواند به اور-فیتینگ منجر شود، جایی که مدل به داده‌های آموزش بیش از حد متمایل می‌شود و نمی‌تواند به درستی به داده‌های جدید اعمال شود. این مشکلات زمانی پیش می‌آیند که تعادل نادرستی بین بایاس و واریانس در مدل وجود داشته باشد؛ آندر-فیتینگ از بایاس بیش از حد ناشی می‌شود (یک مدل بیش از حد ساده)، در حالی که اور-فیتینگ از واریانس بیش از حد ناشی می‌شود (یک مدل بیش از حد پیچیده). دستیابی به تعادل مناسب برای ساخت مدل‌های یادگیری ماشین قوی و دقیق بسیار حائز اهمیت است.

👇 اطلاعات بیشتر👇
👏9👍5🙏31
👨‍🏫 👩‍💻اگر در درک مفهوم آندر-فیتینگ و او-فیتینگ مشکل دارید :

آندر-فیتینگ یعنی وقتی مدل یادگیری ماشین خیلی ساده و ابتدایی باشد و نتواند الگوهای داده‌ها را بیابد، مثلاً یک مدل خطی برای پیش‌بینی قیمت خودروها که همه مشخصات را نادیده بگیرد و همه را به یک ارزش ثابت تخمین بزند.
اور-فیتینگ وقتی رخ می‌دهد که مدل به داده‌های آموزش بیش از حد منطبق شود و جزئیات کوچک را نیز در بر بگیرد، مثلاً یک مدل پیچیده‌تر که برای پیش‌بینی قیمت خودروها همه جزئیات ممکن را در نظر بگیرد، اما نتواند به درستی به سایر خودروها خارج از داده‌های آموزش پاسخ دهد.


محض اطلاع چون فینگیلیش نوشتم بالا:
Underfitting = آندر-فیتینگ
Overfitting = اورفیتینگ
Variance= واریانس
Bias= بایاس
👍12🔥2🙏1
📝 دوره ی ماشین لرنینگ دانشگاه هاروارد:

1-مبانی ماشین لرنینگ
2- آموزش روش cross-validation
3- کار با تعدادی از الگوریتم های محبوب ماشین لرنینگ
4- آموزش ساخت سیستم توصیه کننده (Recommendation system)
5-تنظیم مدل (رگولاریزیشن) چیست و چرا از آن استفاده می‌شود

👨‍🏫 مدرس:
پروفسور رافائل ایریزاری (Rafael Irizarry)، استاد و محقق برجسته در زمینه آمار و علوم داده است. او در حال حاضر به عنوان استاد آمار و بیوانفورماتیک در دانشکده علوم عصبی و پزشکی هاروارد (Harvard T.H. Chan School of Public Health) فعالیت می‌کند.

💡توضیحات:
دوره رایگان هست ولی اگر دنبال مدرک هستید باید مبلغ 101 یورو پرداخت کنید.
دیدم نوشته که برای ایرانی ها امکان ثبت نام و ... وجود نداره (به دلیل تحریم ها) اما، توصیه ی ما این هست که با استفاده از VPN و آدرس های خارج از ایران ثبت نام را انجام بدین... متاسفم که برای یادگیری علم هم باید هم داخل را دور بزنیم و هم خارج را... اما همین را بهانه کنید که بیشتر یاد بگیرید، برای یادگیری نباید دیواری باشد.. چه در داخل و چه در خارج💚🙏

لینک دوره:
https://shorturl.at/mMW38
22👍3🙏3
📝بیاین نظر بدین ببینم چند نفر موضوع بایاس و واریانسِ پست دیروز رو فهمیدن :)

👇این پایین گزینه ها رو میذارم انتخاب کنید، بعد فردا پاسخ رو با توضیح میذارم 🤗
🙏2👍1
فرض کنید یک مدل ماشین لرنینگ مبتنی بر Decision Tree Algorithm دارید، مد را آموزش دادید و عمق درخت (tree depth) را معادل 10 گذاشتین که منجر به بهترین عملکرد شده. حالا اگر عمق درخت را من به 5 کاهش بدم، Bias و Variance در مدل من چگونه خواهد شد؟
Anonymous Poll
11%
بایاس زیاد و واریانس زیاد
10%
بایاس کم و واریانس کم
64%
بایاس زیاد و واریانس کم
18%
بایاس کم و واریانس زیاد
👍5👏2
DataMastermind
فرض کنید یک مدل ماشین لرنینگ مبتنی بر Decision Tree Algorithm دارید، مد را آموزش دادید و عمق درخت (tree depth) را معادل 10 گذاشتین که منجر به بهترین عملکرد شده. حالا اگر عمق درخت را من به 5 کاهش بدم، Bias و Variance در مدل من چگونه خواهد شد؟
پاسخ رو 67 درصد درست گفتن.. آفرین واقعا ..

در درخت‌های تصمیم، عمق درخت واریانس را مشخص می‌کند. یک مدل پیچیده (به عنوان مثال عمیق) دارای بایاس پایین و واریانس بالا است. افزایش بایاس، واریانس را کاهش می‌دهد و افزایش واریانس، بایاس را کاهش می‌دهد.

پس وقتی عمق درخت را از 10 به 5 کاهش می دهیم، یعنی عمق را کم کردیم، به عبارتی واریانس را کم و بایاس زیاد میشود..
👍93
👩‍🏫ربات معلم که به شما پایتون، آنالیز داده، ماشین لرنینگ، دیپ لرنینگ و ... یاد میده

📝 بیش از 125 هزار منبع رایگان برای یادگیری


🤭 رباط نه اقا، ربات😅


🔗 لینک:
https://aigents.co/learn
👍158
📝 دوره ی تئوری احتمال دانشگاه هاروارد:

1. مفاهیم مهم در نظریه احتمال شامل متغیرهای تصادفی
2. نحوه انجام شبیه‌سازی Monte Carlo
3. معنای Expected value، خطای استاندارد و نحوه محاسبه آنها در R, ...


👨‍🏫 مدرس:
پروفسور رافائل ایریزاری (Rafael Irizarry)، استاد و محقق برجسته در زمینه آمار و علوم داده است. او در حال حاضر به عنوان استاد آمار و بیوانفورماتیک در دانشکده علوم عصبی و پزشکی هاروارد (Harvard T.H. Chan School of Public Health) فعالیت می‌کند.

💡توضیحات:
دوره رایگان هست ولی اگر دنبال مدرک هستید باید مبلغ 101 یورو پرداخت کنید.
دیدم نوشته که برای ایرانی ها امکان ثبت نام و ... وجود نداره (به دلیل تحریم ها) اما، توصیه ی ما این هست که با استفاده از VPN و آدرس های خارج از ایران ثبت نام را انجام بدین... متاسفم که برای یادگیری علم هم باید هم داخل را دور بزنیم و هم خارج را... اما همین را بهانه کنید که بیشتر یاد بگیرید، برای یادگیری نباید دیواری باشد.. چه در داخل و چه در خارج💚🙏

لینک دوره:
https://www.edx.org/learn/probability/harvard-university-data-science-probability
👍7
📝جنبش اطلاعات باز به معنای واقعی کانون طلایی برای دیتا ساینتیست ها بوده‌، و با افتتاح پرتال های اطلاعات باز در شهرهای اروپایی، بهشتی از داده‌ها در اختیار کاربران قرار میگیره!

🌏داده ها، مناطق شهری/جغرافیایی، مرزهای شهری، اطلاعات محیطی و اقلیمی، آمار جمعیت، متغیرهای اجتماعی-اقتصادی، حمل و نقل و ترابری، خدمات عمومی، مناطق سبز، نقاط جذاب، ابعاد ساختمان‌ها، شبکه‌های جاده‌ای و بسیاری موارد دیگر را پوشش دهند! 💡

👇در زیر لیست کاملی از پرتال شهرهای اروپایی رو قرار دادم! 📊
👍63
🌏لیست داده ها بر اساس شهرهای اروپایی🌏:



🇳🇱 Amsterdam - https://ow.ly/StH550PJzVc

🇦🇩 Andorra la Vella - https://ow.ly/msIu50PJzVj

🇬🇷 Athens - https://ow.ly/RglH50PJzVh

🇪🇸 Barcelona - https://ow.ly/kbA050PJzVx

🇷🇸 Belgrade - https://ow.ly/txiC50PJzVb

🇩🇪 Berlin - https://ow.ly/Ri2x50PJzVF

🇷🇴 Bucharest - https://ow.ly/wkze50PJzVr

🇭🇺 Budapest - https://ow.ly/uKfq50PJzVH

🇸🇰 Bratislava - https://ow.ly/VZNK50PJzVp

🇧🇪 Brussels - https://ow.ly/zH1j50PJzVu

🇩🇰 Copenhagen - https://ow.ly/PuO450PJzVi

🇮🇪 Dublin - https://ow.ly/8o2x50PJzVy

🇫🇮 Helsinki - https://ow.ly/ZlXi50PJzVE

🇵🇹 Lisbon - https://ow.ly/pl4g50PJzVm

🇸🇮 Ljubljana - https://ow.ly/sC7z50PJzVk

🇪🇸 Madrid - https://ow.ly/jAcz50PJzVn

🇨🇾  Nicosia - https://lnkd.in/dP6WCKew

🇳🇴 Oslo - https://ow.ly/FSik50PJzVv

🇫🇷 Paris - https://ow.ly/bEio50PJzVq

🇨🇿 Prague - https://ow.ly/CKrM50PJzVw

🇮🇸 Reykjavik - https://ow.ly/78Ci50PJzVA

🇮🇹 Rome - https://ow.ly/Ohk950PJzVl

🇸🇪 Stockholm - https://ow.ly/I8Mt50PJzVe

🇪🇪 Tallinn - https://ow.ly/U92j50PJzV9

🇦🇱 Tirana - https://ow.ly/4RYT50PJzVs

🇦🇹 Vienna - https://ow.ly/kAGG50PJzVt

🇱🇹 Vilnius - https://ow.ly/ryYT50PJzVI

🇵🇱 Warsaw - https://ow.ly/FaRV50PJzVz

🇦🇲 Yerevan - https://ow.ly/8EPu50PJzVG

🇭🇷 Zagreb - https://ow.ly/yPK250PJzVg
5👏2🔥1
👨‍💻👩‍💻🔥امروز روز جهانی برنامه‌نویس هاست.. امیدوارم کد‌هاتون همیشه بدون باگ باشند، تست‌هاتون راحت پاس شن، و پروژه‌هاتون همیشه به موقع تحویل داده بشن... با انرژی و علاقه به کارتون ادامه بدید و دنیا رو جای بهتری کنید با کاراتون! 🚀💻

💚روزتون بدون باگ رفقا
🥰1710👍1😎1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥🤓🎤زبان، بزرگ‌ترین مانع رشد پادکست است. اما فرض کنید بتوان این مانع را شکست، چه اتفاقی می‌افتاد؟ به عبارتی در عین حفظ تجربه اصیل، تقریباً مثل اینکه پادکستر به تازگی یک زبان جدید یاد گرفته است و همان داستان را برای شما می گوید..

🎙️🎶اسپاتیفای ویژگی جدیدی را اخیراً معرفی کرده: ویژگیی ای که پادکست‌ها را به زبان‌های مختلف ترجمه می‌کند، همه با صدای پادکستر! اکنون مخاطبان در سراسر جهان قادر به کشف و الهام گرفتن از پادکسترهای جدید به یک شکل بسیار اصیل‌تر از همیشه خواهند بود...
👍205🔥5
دیتاکمپ حق عضویتش رو برای یک ماه به 1 یورو کاهش داده! برای کسایی که میخوان پایتون یاد بگیرن یا ماشین لرنینگ و ... خیلی خوبه.. مدرک هم میده که باز بهتر!

دوره های آنالیز دیتا، ماشین لرنینگ، مهندسی داده و ... رو همه داره...

https://www.datacamp.com/promo/october-monthly-sale-2023?utm_source=customerio&utm_medium=email&utm_campaign=231002_1-oct23odp-t1_2-b2c_3-all_4-na_5-na_6-na_7-le_8-emal-ci_9-na_10-oct23odp_11-email&utm_content=blast&dc_euid=11807598
👍92👎1
🤓💚🤗سلام بچه ها، ببخشید من خیلی فعال نبودم، چون کارا زیادن و نشد خلاصه که بشه..

👨‍💻سعی میکنم یکم به روتین قبل برگردم ولی نمیخوام الکی فقط کانتنت بذارم اینجا، مگر اینکه واقعا چیز بدرد بخوری ببینم..

👨‍🏫یه سری منبع هست که میتونید استفاده کنید برای تمرین کد نویسی و مصاحبه ی شرکت های Tech.

1- https://leetcode.com/
2- https://neetcode.io/
3-https://shorturl.at/iuQ49

🙏لینک کتاب رو گذاشتم برای خرید ولی ولی، شما بگردین PDF رایگانش هست من قانوناً اجازه اشتراک گذاریش رو ندارم ...

بخش دوم و سوم هم داره که بعد میذارم واستون...
👍115👏1
🔥بخش دوم

📝یادگیری طراحی سیستم (System Design)

💡اینم بگم که منابع زیادن، ما سه تاش رو میگیم که شما ایده بگیرین، ولی به این معنی نیست اگر دارید منابع دیگه ای میخونین، بده یا مثلا بدرد نمیخوره...

1- System Design Interview (https://shorturl.at/koA07)
2- Designing Data-intensive Applications (https://shorturl.at/iqwN8)
3- Grokking the System Design Interview (https://www.designgurus.io/course/grokking-the-system-design-interview)

👨‍🏫 بخش سوم و چهارمم میذارم...
👍43
🔥🌏👨‍💻👩‍💻تو سال انفجار AI زندگی میکنیم و هر روز یه ابزار جدید AI برامون رو میشه. حالا این وسط خود پیدا کردن ابزار مناسب یه جور چالش هست.

🤗💡 تو این وبسایت میتونین برید و لیست همه ابزار های AI رو ببینین. مثال: سرچ میکنین paper یا music و لیست همه ابزارهای مرتبط میاد!

🔗 https://theresanaiforthat.com

🙏🤗credit: از توییتر @sh_3789
👍104😍4🥰1
🔎💡 چرخه های نوآوری

📈این شکل چرخه های نوآوری رو در طول سالیان به ما نشون میده و به این نکته اشاره داره که عمر این چرخه ها کمتر شده ولی همچنان رو به جلو در حرکتن...

👨‍💻🤓برای موج فعلی (به گفته ی نویسنده) یا همان موج ششم، اینطور می توان گفت که این موج توسط هوش مصنوعی و دیجیتالی شدن در زمینه‌های اطلاعات اشیا (IoT)، رباتیک و پهپادها مشخص می‌شود، که احتمالاً تصویری کاملاً جدید خواهد کشید. به عبارت دیگر، اتوماسیون سیستم‌ها، تجزیه و تحلیل برای پیش بینی و پردازش داده ممکن است تأثیری داشته باشند. در نتیجه، کالاها و خدمات فیزیکی احتمالاً دیجیتالی خواهند شد. زمان انجام وظایف ممکن است از ساعت‌ها به حتی ثانیه‌ها تغییر کند.

🌏💥به طور همزمان، تکنولوژی های مربوط به دنیای پاک و تغییرات اقلیمی اهمیت ویژه ای پیدا می کنند. در واقع، در قلب هر فناوری نوآورانه، هدف فناوری حل مشکلات پیچیده است و نگرانی های مربوط به تغییرات اقلیمی به شدت رو به افزایشند. پیش بینی می شود که هزینه های کمتر در پنل های خورشیدی و توربین های بادی نقش قابل توجهی در آینده ای نزدیک بازی کنند.
👍19👏21