Python for Data Science – Telegram
Python for Data Science
301 subscribers
128 photos
16 videos
12 files
61 links
اطلاعات مفید جهت یادگیری پایتون برای علم داده
Download Telegram
Channel created
Channel name was changed to «Python for Data Science»
آیا مایل هستید در یک دوره‌ی تخصصی آموزش پایتون برای علم داده شرکت کنید؟

پیش‌نیاز دوره: پایتون مقدماتی
Anonymous Poll
76%
بله
24%
خیر
سرفصلهای دوره پایتون برای علم داده:

🔺معرفی توابع کاربردی در کتابخانه‌های استاندارد پایتون
🔺مباحث تکمیلی در معرفی توابع پایتون(دکوراتور، جنراتور و توابع بازگشتی)
🔺معرفی Numpy و کار با آرایه‌ها
🔺معرفی Scipy و مثالهای کاربردی در آن
🔺معرفی pandas و کار با داده‌های جدولی، ورودی و خروجی از منابع مختلف و تحلیل‌های آماری آن
🔺معرفی matplotlib , seaborn و ابزارهای بصری سازی داده
🔺معرفی پایگاههای داده (NoSQL از جمله Redis, MongoDB,InfluxDB و MySQL)
🔺معرفی کتابخانه‌های کار با وب در پایتون - وبکاوی و استخراج داده (web scraping , API)
🔺 معرفی کتابخانه‌های Tensorflow, scikit-learn و مقدمات یادگیری ماشین
🔺انجام پروژه پایانی با استفاده از موارد فوق

🔎 @py4ds
برای یادگیری دوره پایتون برای علم داده شما نیاز به دانستن پایتون مقدماتی دارید که شامل سرفصل‌های زیر است:

🔺 نصب و راه‌اندازی پایتون
🔺آشنایی با انواع داده‌های پایتونی شامل داده‌های عددی، رشته‌ای و دنباله‌ها مانند لیست، چندتایی، مجموعه و دیکشنری
🔺آشنایی با انواع دستورات کنترلی شامل شرط و حلقه
🔺آشنایی با ساختار مدیریت خطا در پایتون
🔺 آشنایی با توابع و آرگومان ورودی و خروجی آنها
🔺ورودی و خروجی در پایتون با استفاده از فایل
🔺آشنایی با ساختار شی‌گرایی در پایتون و مباحث عمومی مربوط به آن
🔺 کتابخانه‌های استاندارد پرکاربرد

🔎 @py4ds
برای برگزاری دوره پایتون برای علم داده چه زمانی را مناسب‌تر می‌دانید؟

انتخاب چند گزینه مجاز است
Anonymous Poll
35%
اواخر اسفندماه ۹۸
30%
هفته اول فروردین ۹۹
33%
هفته سوم فروردین ۹۹
24%
هفته چهارم فروردین ۹۹
37%
هفته اول اردیبهشت ۹۹
🚨روند افزایش مبتلایان به ویروس کرونا در ایران بر اساس داده‌های اعلامی تا تاریخ ۹۸/۱۲/۱۲ در تصویر فوق نشان داده شده است.

🔺روند ابتلا و بهبود در روزهای آینده نیز ترسیم شده است.

🎯نکته: پیش‌بینی ما با آمار اعلام شده در امروز ۹۸/۱۲/۱۳ تطابق زیادی دارد...

🔎 @py4ds
🚨بکارگیری روش پیش‌بینی قبلی برای تخمین روند افزایش مبتلایان به ویروس کرونا در چین بر اساس داده‌های رسمی تا تاریخ ۲ مارس ۲۰۲۰

🔺روند ابتلا و بهبود در روزهای آینده نیز ترسیم شده است.

🎯نکته: تشابه الگوی فوق با الگوی بدست آمده از آمار ایران مشهود است.
🔎 @py4ds
🚨 آمار اعلام شده در امروز 98/12/14 خبر از کاهش نسبتا شدید روند شیوع ویروس کرونا در ایران می‌دهد.

🔺نکته‌ی خیلی مهم: سرعت بهبود بیماران نسبت به شیوع بسیار کم است و این موضوع ممکن است قربانیان این بیماری را افزایش دهد.
توسعه‌ی امکانات و تجهیزات پزشکی در جهت تسریع بهبود بیماران امری ضروری به نظر می‌رسد.

🔎 @py4ds
🎯 #ایتالیا
🇮🇹کشور ایتالیا دارای جمعیتی معادل ۶۰ میلیون نفر و مساحتی حدود ۳۰۰هزار کیلومتر مربع یعنی یک پنجم مساحت کل ایران است.

۴ روز قبل در تاریخ ۱۷ اسفند ۹۸ آمار منتشر شده توسط مراجع رسمی این کشور وقوع یک فاجعه را نشان می‌داد.

👨🏻‍💻مدل ما با تخمین داده‌های رسمی تا آن تاریخ، جمعیت مبتلای حدود ۲۵ هزار نفر را پیشبینی کرده بود. در آن تخمین ایتالیا هنوز در ابتدای راه شیوع بیماری قرار داشت؛ اما داده‌های روزهای بعدی این فاجعه را عمیق‌تر و شدیدتر نشان داد.

🚨داده‌های منتشر شده تا تاریخ ۲۰ اسفند خبر از شیوع وحشتناک #کرونا در این کشور داده است بطوریکه در تخمین ما داده امروز ۱۲۱۴۶ نفر(یعنی حدود ۲هزار نفر ابتلای جدید نسبت به روز قبل) را نشان داده بود.

🦠 آمار ۲۱ اسفند شیوع nCov-19 در کشور ایتالیا ۱۲۴۶۲ نفر مبتلا را می‌دهد. این یعنی سرعت شیوع این بیماری نسبت به تخمین مدل ما کمی بیشتر بوده و آمار کل مبتلایان آن ممکن است به ۵۰هزار نفر هم برسد!

✴️ در تخمین ما از داده‌های رسمی تا تاریخ ۲۰ اسفند، آمار کلی مبتلایان به این بیماری تا مرز ۴۴هزار نفر محاسبه شده است.

🔎 @py4ds
🔺بروزرسانی شیوع کرونا در #ایتالیا

در تخمین قبلی پیش‌بینی مدل ما تعداد ۱۲۱۴۶ نفر را نشان داده بود و انتهای نمودار تا حدود ۴۴ هزار نفر مبتلا را نشان می‌داد.

👨🏻‍💻در پیش‌بینی جدید که با داده‌های دیروز انجام شده، تعداد مبتلایان ایتالیا در امروز حدود ۱۴۴۰۰ نفر پیش‌بینی شده است. همچنین تعداد مبتلایان کلی این کشور تا حدود ۵۴ هزار نفر پیش‌بینی می‌شود.

🔎 @py4ds
image_2020-03-13_17-35-41.png
96.6 KB
📊 نمره مدیریت کنترل شیوع
این محاسبات توسط دوست خوبم آقای حسنی انجام شده است.

📝نمره مدیریت کنترل شیوع یک پارامتر(خودساخته) تعریف شده بر اساس فرمول زیر است:
S1 = Population/Area
S2 = Recovered/Deaths
S3 = Confirmed
MSOC = S1 * S2^2 / S3

🔺در این رتبه بندی محور عمودی به صورت لگاریتمی در نظر گرفته شده است.

🔺از سمت چپ ۶ میله‌ی اول مربوط به استان‌های مهم منطقه‌ Mainland چین بجز استان Hubei و Shandong (که دارای بیشترین ابتلا در تمام دنیا بوده‌اند) رسم شده است.
🔺میله‌ی هفتم مربوط به کل کشور چین است که به دلیل شیوع گسترده در استان‌های مختلف امتیاز پایینی کسب کرده است. در میله‌ی هشتم و نهم و دهم به ترتیب امتیاز کشور خودمان، ایتالیا و کره جنوبی رسم شده که ضعیف بودن مدیریت در کشور خودمان و ایتالیا به خوبی در آن ملاحظه می‌گردد.

🔎 @py4ds