Data Mining 😍💻 – Telegram
بچه ها امتحان میانترمتون‌ تا آخر مبحث آزمون کای دو پیرسون در فصل ۵ هست.
و مهلت ارسال تمرین تا جمعه شب تمدید شد
3
WA_Fn-UseC_-Telco-Customer-Churn.csv
954.6 KB
سلام و وقت بخیر باتوجه به مشکلی که برای دیتاست کتاب وجود داشت از این دیتاست جایگزین اضافه کنید. سوال ها مطابق با این دیتاست آپدیت شدند و در ادامه میفرستم براتون
33. بررسی داده‌های گمشده

بررسی کنید آیا در هیچ‌کدام از ستون‌های داده مقادیر گمشده (Missing Values) وجود دارد یا خیر.
در صورت وجود، مشخص کنید مربوط به کدام ستون است و چه مقدار از داده‌ها را تشکیل می‌دهد.

34. مقایسه‌ی نوع سرویس اینترنت و نوع قرارداد

ستون‌های InternetService و Contract را مقایسه کنید.
آیا مواردی وجود دارد که کاربر اینترنت ندارد (No) اما نوع قرارداد مشخص دارد؟
در صورت مشاهده، این موارد را به‌عنوان ناهنجاری (Abnormality) گزارش کنید.

35. شناسایی Outlier با نمودار

با استفاده از نمودار (Boxplot یا Histogram) بررسی کنید آیا متغیر MonthlyCharges (هزینه ماهیانه) شامل مقدارهای پرت است یا خیر.


36. شناسایی محدوده‌ی داده‌های پرت

برای ستون MonthlyCharges، داده‌های پرت را با دو روش زیر پیدا کنید:
a. روش Z-Score
b. روش IQR (Interquartile Range)
در هر روش، مقدار آستانه را محاسبه کرده و ردیف‌هایی را که پرت هستند فهرست کنید.

37. نرمال‌سازی با Z-Score

ستون TotalCharges را با روش Z-score استانداردسازی کنید تا میانگین صفر و انحراف معیار یک داشته باشد.
میانگین و انحراف معیار مقدار جدید را محاسبه کرده و بررسی کنید آیا در محدوده‌ی نرمال (تقریباً ±3) قرار دارند یا نه.

38. تحلیل Skewness (عدم تقارن)

a. میزان skewness برای ستون TotalCharges را محاسبه کنید.
b. سپس skewness را پس از استانداردسازی Z-score نیز محاسبه کرده و مقایسه کنید.
c. بر اساس مقدار skewness، مشخص کنید آیا داده‌ها به‌طور قابل توجهی skewed هستند یا تقریباً متقارن.

39. بررسی نرمال بودن داده‌ها

برای ستون TotalCharges نمودار احتمال نرمال (Normal Probability Plot / Q–Q Plot) رسم کنید.
بررسی کنید آیا نقاط تقریباً روی خط نرمال قرار دارند یا خیر، و در مورد نرمال بودن داده توضیح دهید.

40. بررسی مقادیر صفر و توزیع داده

ستون TotalCharges شامل تعدادی مقدار صفر است.
a. نمودار نرمال بودن این ستون را رسم کنید.
b. توضیح دهید چرا توزیع داده نرمال نیست .
c. متغیری جدید به نام NonzeroCharges بسازید که فقط شامل مقادیر غیرصفر باشد.
d. نمودار نرمال بودن متغیر جدید را رسم کنید و درباره‌ی نرمال‌تر شدن آن توضیح دهید.

41. نرمال‌سازی ستون Tenure

ستون tenure (تعداد ماه‌های عضویت مشتری) را با روش Z-score استانداردسازی کنید.
نمودار توزیع مقادیر استانداردشده را رسم کرده و محدوده‌ی آن را (مثلاً از -3 تا +3) توصیف کنید.
این برای قسمت Hands on فصل 2 هست بچه ها
https://bcs.wiley.com/he-bcs/Books?action=index&bcsId=11704&itemId=0470908742&utm_source=chatgpt.com این هم لینک داده های کتاب هست که یکی از بچه ها پیدا کردند لطف کردند فرستادند ترجیحا با همین دیتای کتاب پیاده سازی کنید اما اگر براتون مشکل داشت دیتای جایگزین
1
data_sets.zip
980.1 KB
دیتاست های کتاب
سلام بچه‌ها شبتون بخیر
امتحانتون فردا کلاس ۱۰۹ برگزار میشه
موفق باشین
1
سلام بچه‌ها وقتتون بخیر نظرسنجی مجدد میانترمتون رو شرکت کنید لطفا همگی زودتر که تاریخ مشخص بشه🌸
Data Mining 😍💻
تاریخ میانترم دوم
با قبل بیست و چهارم موافقین؟ نظرسنجی کنیم؟
چون برای بعد سی ام باید از استادتون بپرسم که امکانش هست یا نه.
👎8👍3
باشه بچه‌ها پس اجازه بدید با استادتون هماهنگ کنم خبر میدم بهتون🌸
🙏3
سلام بچه‌ها وقتتون بخیر
کلاس خانم دکتر فردا به صورت آنلاین در ایلرن ساعت ۸ صبح برگزار خواهد شد

لطفا خانم تات و آقای عباسپور هم به من پیغام بدند‌.

متشکرم.
تاریخ میانترم دوم
Anonymous Poll
35%
۳۰ آذر
65%
۲ دی
سلام بچه‌ها وقتتون بخیر
پس تایم امتحانتون ۲ دی به استادان گزارش میشه
راجع به ددلاین تمرین ها هم قبلا گفتم اینجا، بچه ها نگران نباشید من توی ذهنم ددلاین و عقب تر از استاد درنظر میگرم و بعد از اون هم نمره کمی کسر میشه
و در آخرهم کار امتیازی برای جبران اگر نمره ای کم داشتین خواهیم داشت

سوالاتی که تازه پرسیدین رو باز از استادتون میپرسم و خبرتون میکنم

عذر میخوام پیامی رو این چند روز اگر جواب ندادم دچارکسالت و استراحت مطلق بودم.

نگران نمرتون نباشیدد، موفق باشید🌸
10
سلام بچه‌ها وقتتون بخیر
تغییر ددلاین تمرین‌ها در سامانه به صورت زیر انجام شد:

تکالیف فصل ۴ و ۵ قسمت اول تا فرداشب( دوشنبه شب) ددلاینش تمدید شد و همچنین قسمت دومش که تعداد کمتری از شما تحویل داده بودید تا پس فردا شب (سه‌شنبه شب) تمدید شد.

موفق باشید 🌸
5
بچه‌ها حتما حواستون باشه برای تمرین‌های کدتون خروجی بزارید تو گزارش تون و همراه تحلیل ، بعضی‌هاتون فقط کد گذاشتید این باعث میشه نمره از دست بدید.

برای تمرین‌های قبلی هم اون‌هایی که فقط کد گذاشتند از الان تا آخر هفته، همون کدهایی که روی سایت گذاشتند و ران کنند و خروجی‌هاش رو برای من اسکرین بگیرند و با توضیح توی پی وی بفرستند که نمره‌اشون کامل بشه.🌸
خانم آیدا رنجی به من پیغام بدند‌ لطفا
بچه‌ها سلام کلاس فرداتون آنلاین در ایلرن برگزار میشه 🌸
👍3
سلام بچه ها شب بخیر امتحان فردا در کلاس ۱۰۹ برگذار میشه موفق باشین🌸
3