Data Mining 😍💻 – Telegram
Data Mining 😍💻
میانترم اول - آبان ماه
بچه‌هایی که قبلاً رای دادین، کامنت دوستتون و هم اگه ندیدید ببینید.

و اینکه شنبه ساعت یازده و نیم تا دوازده و نیم هستین اولین جلسمون و داشته باشیم؟
( جلسه‌هامون ماکسیمم یک ساعته هستن)
👍5
سلام بچه‌ها امیدوارم خوب باشین
کسایی که شرکت نکردن تو نظرسنجی تاریخ میانترم‌‌ها، شرکت کنند لطفا تا امروز تاریخ‌های نهایی مشخص شده باشند.
میانترم آذرتاریخ دوم و سی ام یکسان شده؛
الان با توجه به اینکه میانترم اول و اکثرا با بیست ام موافق بودین برای میانترم دوم اگه نظرتون عوض شده بزنید
سلام بچه‌ها
دوشنبه ساعت ۱۱.۳۰ اولین جلسمون خواهد بود

تاریخ میانترم ها هم ۲۰ آبان و ۳۰ آذر به استادتون گزارش میشن🌸
🤩21
سلام بچه ها امیدوارم خوب باشین
کلاس ۳۰۴ خالی هستش لطفارسیدین بیاین اونجا
Data Mining - EX1.pdf
66 KB
سری اول تمرین ها/ مهلت تحویل تا شنبه شب هستش اگه به سامانه دسترسی ندارین برای من ارسال کنین پاسخ هاتون رو
TA1.R
3.7 KB
کدهای جلسه اول
7
Audio
ویس جلسه اول
6
سلام بچه‌ها وقتتون بخیر
نمرات تمرین اولتون‌ روسامانه بارگذاری شدند.

من یه نکاتی رو توضیح بدم بهتون:

لطفا حتما سوال رو با دقت بخونید که جواب لازم رو یادداشت کنید.
نکته بعدی اینکه بعضی دوستان عیناً مثل هم نوشتند لطفا دیگه تکرار نشه هدف از این تمرینات یادگیری مفهومی درسه و واقعا ازتون وقت زیادی نمیگیره لطفا رعایت کنید اینبار نادیده گرفته شده.
حتما سعی کنید تو بازه ددلاین بارگذاری کنید تمرینتون روکه برای تاخیر نمره از دست ندید، بازم هم چون تمرین اول بود خیلی از موارد لحاظ نشد ولی از تمرین‌های بعد هیچ موردی برای تاخیر پذیرفتنی نیست.

موفق باشید🌸
2
تکالیف فصل دوم و سوم
2😱2💘1
سلام بچه‌ها وقتتون بخیر
فردا ساعت ۱۱:۳۰ جلسه دوممون کلاس ۳۰۴ 🌸
کدهای مربوط به فصل دوم و تاجایی که برسیم فصل سوم رو میگم بهتون
2
سلام بچه‌ها
برنامه کلاس هامون دو هفته یک بار هست من هفته گذشته درگیر کار اداری بودم متاسفانه نتونستم کلاس تشکیل بدم، متاسفانه فردا هم خبردار شدم باید برم بالا،
فردا کلاس نخواهیم داشت،
خیلی معذرت می‌خوام و توی اولین فرصت برای جلسه بعد هماهنگ میکنم باهاتون.
خیلی ممنون ازتون 🌸🤍
6
سلام بچه ها امیدوارم خوب باشین راجع به سوالاتی که پرسیدین من پرسیدم از استادتون نتیجه رو میگم بهتون
3
بچه ها امتحان میانترمتون‌ تا آخر مبحث آزمون کای دو پیرسون در فصل ۵ هست.
و مهلت ارسال تمرین تا جمعه شب تمدید شد
3
WA_Fn-UseC_-Telco-Customer-Churn.csv
954.6 KB
سلام و وقت بخیر باتوجه به مشکلی که برای دیتاست کتاب وجود داشت از این دیتاست جایگزین اضافه کنید. سوال ها مطابق با این دیتاست آپدیت شدند و در ادامه میفرستم براتون
33. بررسی داده‌های گمشده

بررسی کنید آیا در هیچ‌کدام از ستون‌های داده مقادیر گمشده (Missing Values) وجود دارد یا خیر.
در صورت وجود، مشخص کنید مربوط به کدام ستون است و چه مقدار از داده‌ها را تشکیل می‌دهد.

34. مقایسه‌ی نوع سرویس اینترنت و نوع قرارداد

ستون‌های InternetService و Contract را مقایسه کنید.
آیا مواردی وجود دارد که کاربر اینترنت ندارد (No) اما نوع قرارداد مشخص دارد؟
در صورت مشاهده، این موارد را به‌عنوان ناهنجاری (Abnormality) گزارش کنید.

35. شناسایی Outlier با نمودار

با استفاده از نمودار (Boxplot یا Histogram) بررسی کنید آیا متغیر MonthlyCharges (هزینه ماهیانه) شامل مقدارهای پرت است یا خیر.


36. شناسایی محدوده‌ی داده‌های پرت

برای ستون MonthlyCharges، داده‌های پرت را با دو روش زیر پیدا کنید:
a. روش Z-Score
b. روش IQR (Interquartile Range)
در هر روش، مقدار آستانه را محاسبه کرده و ردیف‌هایی را که پرت هستند فهرست کنید.

37. نرمال‌سازی با Z-Score

ستون TotalCharges را با روش Z-score استانداردسازی کنید تا میانگین صفر و انحراف معیار یک داشته باشد.
میانگین و انحراف معیار مقدار جدید را محاسبه کرده و بررسی کنید آیا در محدوده‌ی نرمال (تقریباً ±3) قرار دارند یا نه.

38. تحلیل Skewness (عدم تقارن)

a. میزان skewness برای ستون TotalCharges را محاسبه کنید.
b. سپس skewness را پس از استانداردسازی Z-score نیز محاسبه کرده و مقایسه کنید.
c. بر اساس مقدار skewness، مشخص کنید آیا داده‌ها به‌طور قابل توجهی skewed هستند یا تقریباً متقارن.

39. بررسی نرمال بودن داده‌ها

برای ستون TotalCharges نمودار احتمال نرمال (Normal Probability Plot / Q–Q Plot) رسم کنید.
بررسی کنید آیا نقاط تقریباً روی خط نرمال قرار دارند یا خیر، و در مورد نرمال بودن داده توضیح دهید.

40. بررسی مقادیر صفر و توزیع داده

ستون TotalCharges شامل تعدادی مقدار صفر است.
a. نمودار نرمال بودن این ستون را رسم کنید.
b. توضیح دهید چرا توزیع داده نرمال نیست .
c. متغیری جدید به نام NonzeroCharges بسازید که فقط شامل مقادیر غیرصفر باشد.
d. نمودار نرمال بودن متغیر جدید را رسم کنید و درباره‌ی نرمال‌تر شدن آن توضیح دهید.

41. نرمال‌سازی ستون Tenure

ستون tenure (تعداد ماه‌های عضویت مشتری) را با روش Z-score استانداردسازی کنید.
نمودار توزیع مقادیر استانداردشده را رسم کرده و محدوده‌ی آن را (مثلاً از -3 تا +3) توصیف کنید.
این برای قسمت Hands on فصل 2 هست بچه ها
https://bcs.wiley.com/he-bcs/Books?action=index&bcsId=11704&itemId=0470908742&utm_source=chatgpt.com این هم لینک داده های کتاب هست که یکی از بچه ها پیدا کردند لطف کردند فرستادند ترجیحا با همین دیتای کتاب پیاده سازی کنید اما اگر براتون مشکل داشت دیتای جایگزین
1
data_sets.zip
980.1 KB
دیتاست های کتاب
سلام بچه‌ها شبتون بخیر
امتحانتون فردا کلاس ۱۰۹ برگزار میشه
موفق باشین
1