Data Mining 😍💻
دوست دارین چندتا میانترم داشته باشین؟
بچهها پرسیده بودید :
اگه دوتا میانترم داشته باشین هرکدوم ۵ نمره و پایانترم ۷ نمره هست. مباحث هم براساس تقسیم نمرات لحاظ میشن.
اگه دوتا میانترم داشته باشین هرکدوم ۵ نمره و پایانترم ۷ نمره هست. مباحث هم براساس تقسیم نمرات لحاظ میشن.
❤1
Data Mining 😍💻
میانترم اول - آبان ماه
بچههایی که قبلاً رای دادین، کامنت دوستتون و هم اگه ندیدید ببینید.
و اینکه شنبه ساعت یازده و نیم تا دوازده و نیم هستین اولین جلسمون و داشته باشیم؟
( جلسههامون ماکسیمم یک ساعته هستن)
و اینکه شنبه ساعت یازده و نیم تا دوازده و نیم هستین اولین جلسمون و داشته باشیم؟
( جلسههامون ماکسیمم یک ساعته هستن)
👍5
سلام بچهها امیدوارم خوب باشین
کسایی که شرکت نکردن تو نظرسنجی تاریخ میانترمها، شرکت کنند لطفا تا امروز تاریخهای نهایی مشخص شده باشند.
میانترم آذرتاریخ دوم و سی ام یکسان شده؛
الان با توجه به اینکه میانترم اول و اکثرا با بیست ام موافق بودین برای میانترم دوم اگه نظرتون عوض شده بزنید
کسایی که شرکت نکردن تو نظرسنجی تاریخ میانترمها، شرکت کنند لطفا تا امروز تاریخهای نهایی مشخص شده باشند.
میانترم آذرتاریخ دوم و سی ام یکسان شده؛
الان با توجه به اینکه میانترم اول و اکثرا با بیست ام موافق بودین برای میانترم دوم اگه نظرتون عوض شده بزنید
سلام بچهها
دوشنبه ساعت ۱۱.۳۰ اولین جلسمون خواهد بود
تاریخ میانترم ها هم ۲۰ آبان و ۳۰ آذر به استادتون گزارش میشن🌸
دوشنبه ساعت ۱۱.۳۰ اولین جلسمون خواهد بود
تاریخ میانترم ها هم ۲۰ آبان و ۳۰ آذر به استادتون گزارش میشن🌸
🤩2❤1
Data Mining - EX1.pdf
66 KB
سری اول تمرین ها/ مهلت تحویل تا شنبه شب هستش اگه به سامانه دسترسی ندارین برای من ارسال کنین پاسخ هاتون رو
سلام بچهها وقتتون بخیر
نمرات تمرین اولتون روسامانه بارگذاری شدند.
من یه نکاتی رو توضیح بدم بهتون:
لطفا حتما سوال رو با دقت بخونید که جواب لازم رو یادداشت کنید.
نکته بعدی اینکه بعضی دوستان عیناً مثل هم نوشتند لطفا دیگه تکرار نشه هدف از این تمرینات یادگیری مفهومی درسه و واقعا ازتون وقت زیادی نمیگیره لطفا رعایت کنید اینبار نادیده گرفته شده.
حتما سعی کنید تو بازه ددلاین بارگذاری کنید تمرینتون روکه برای تاخیر نمره از دست ندید، بازم هم چون تمرین اول بود خیلی از موارد لحاظ نشد ولی از تمرینهای بعد هیچ موردی برای تاخیر پذیرفتنی نیست.
موفق باشید🌸
نمرات تمرین اولتون روسامانه بارگذاری شدند.
من یه نکاتی رو توضیح بدم بهتون:
لطفا حتما سوال رو با دقت بخونید که جواب لازم رو یادداشت کنید.
نکته بعدی اینکه بعضی دوستان عیناً مثل هم نوشتند لطفا دیگه تکرار نشه هدف از این تمرینات یادگیری مفهومی درسه و واقعا ازتون وقت زیادی نمیگیره لطفا رعایت کنید اینبار نادیده گرفته شده.
حتما سعی کنید تو بازه ددلاین بارگذاری کنید تمرینتون روکه برای تاخیر نمره از دست ندید، بازم هم چون تمرین اول بود خیلی از موارد لحاظ نشد ولی از تمرینهای بعد هیچ موردی برای تاخیر پذیرفتنی نیست.
موفق باشید🌸
❤2
سلام بچهها وقتتون بخیر
فردا ساعت ۱۱:۳۰ جلسه دوممون کلاس ۳۰۴ 🌸
کدهای مربوط به فصل دوم و تاجایی که برسیم فصل سوم رو میگم بهتون
فردا ساعت ۱۱:۳۰ جلسه دوممون کلاس ۳۰۴ 🌸
کدهای مربوط به فصل دوم و تاجایی که برسیم فصل سوم رو میگم بهتون
❤2
سلام بچهها
برنامه کلاس هامون دو هفته یک بار هست من هفته گذشته درگیر کار اداری بودم متاسفانه نتونستم کلاس تشکیل بدم، متاسفانه فردا هم خبردار شدم باید برم بالا،
فردا کلاس نخواهیم داشت،
خیلی معذرت میخوام و توی اولین فرصت برای جلسه بعد هماهنگ میکنم باهاتون.
خیلی ممنون ازتون 🌸🤍
برنامه کلاس هامون دو هفته یک بار هست من هفته گذشته درگیر کار اداری بودم متاسفانه نتونستم کلاس تشکیل بدم، متاسفانه فردا هم خبردار شدم باید برم بالا،
فردا کلاس نخواهیم داشت،
خیلی معذرت میخوام و توی اولین فرصت برای جلسه بعد هماهنگ میکنم باهاتون.
خیلی ممنون ازتون 🌸🤍
❤6
سلام بچه ها امیدوارم خوب باشین راجع به سوالاتی که پرسیدین من پرسیدم از استادتون نتیجه رو میگم بهتون
❤3
بچه ها امتحان میانترمتون تا آخر مبحث آزمون کای دو پیرسون در فصل ۵ هست.
و مهلت ارسال تمرین تا جمعه شب تمدید شد
و مهلت ارسال تمرین تا جمعه شب تمدید شد
❤3
WA_Fn-UseC_-Telco-Customer-Churn.csv
954.6 KB
سلام و وقت بخیر باتوجه به مشکلی که برای دیتاست کتاب وجود داشت از این دیتاست جایگزین اضافه کنید. سوال ها مطابق با این دیتاست آپدیت شدند و در ادامه میفرستم براتون
33. بررسی دادههای گمشده
بررسی کنید آیا در هیچکدام از ستونهای داده مقادیر گمشده (Missing Values) وجود دارد یا خیر.
در صورت وجود، مشخص کنید مربوط به کدام ستون است و چه مقدار از دادهها را تشکیل میدهد.
34. مقایسهی نوع سرویس اینترنت و نوع قرارداد
ستونهای InternetService و Contract را مقایسه کنید.
آیا مواردی وجود دارد که کاربر اینترنت ندارد (No) اما نوع قرارداد مشخص دارد؟
در صورت مشاهده، این موارد را بهعنوان ناهنجاری (Abnormality) گزارش کنید.
35. شناسایی Outlier با نمودار
با استفاده از نمودار (Boxplot یا Histogram) بررسی کنید آیا متغیر MonthlyCharges (هزینه ماهیانه) شامل مقدارهای پرت است یا خیر.
36. شناسایی محدودهی دادههای پرت
برای ستون MonthlyCharges، دادههای پرت را با دو روش زیر پیدا کنید:
a. روش Z-Score
b. روش IQR (Interquartile Range)
در هر روش، مقدار آستانه را محاسبه کرده و ردیفهایی را که پرت هستند فهرست کنید.
37. نرمالسازی با Z-Score
ستون TotalCharges را با روش Z-score استانداردسازی کنید تا میانگین صفر و انحراف معیار یک داشته باشد.
میانگین و انحراف معیار مقدار جدید را محاسبه کرده و بررسی کنید آیا در محدودهی نرمال (تقریباً ±3) قرار دارند یا نه.
38. تحلیل Skewness (عدم تقارن)
a. میزان skewness برای ستون TotalCharges را محاسبه کنید.
b. سپس skewness را پس از استانداردسازی Z-score نیز محاسبه کرده و مقایسه کنید.
c. بر اساس مقدار skewness، مشخص کنید آیا دادهها بهطور قابل توجهی skewed هستند یا تقریباً متقارن.
39. بررسی نرمال بودن دادهها
برای ستون TotalCharges نمودار احتمال نرمال (Normal Probability Plot / Q–Q Plot) رسم کنید.
بررسی کنید آیا نقاط تقریباً روی خط نرمال قرار دارند یا خیر، و در مورد نرمال بودن داده توضیح دهید.
40. بررسی مقادیر صفر و توزیع داده
ستون TotalCharges شامل تعدادی مقدار صفر است.
a. نمودار نرمال بودن این ستون را رسم کنید.
b. توضیح دهید چرا توزیع داده نرمال نیست .
c. متغیری جدید به نام NonzeroCharges بسازید که فقط شامل مقادیر غیرصفر باشد.
d. نمودار نرمال بودن متغیر جدید را رسم کنید و دربارهی نرمالتر شدن آن توضیح دهید.
41. نرمالسازی ستون Tenure
ستون tenure (تعداد ماههای عضویت مشتری) را با روش Z-score استانداردسازی کنید.
نمودار توزیع مقادیر استانداردشده را رسم کرده و محدودهی آن را (مثلاً از -3 تا +3) توصیف کنید.
بررسی کنید آیا در هیچکدام از ستونهای داده مقادیر گمشده (Missing Values) وجود دارد یا خیر.
در صورت وجود، مشخص کنید مربوط به کدام ستون است و چه مقدار از دادهها را تشکیل میدهد.
34. مقایسهی نوع سرویس اینترنت و نوع قرارداد
ستونهای InternetService و Contract را مقایسه کنید.
آیا مواردی وجود دارد که کاربر اینترنت ندارد (No) اما نوع قرارداد مشخص دارد؟
در صورت مشاهده، این موارد را بهعنوان ناهنجاری (Abnormality) گزارش کنید.
35. شناسایی Outlier با نمودار
با استفاده از نمودار (Boxplot یا Histogram) بررسی کنید آیا متغیر MonthlyCharges (هزینه ماهیانه) شامل مقدارهای پرت است یا خیر.
36. شناسایی محدودهی دادههای پرت
برای ستون MonthlyCharges، دادههای پرت را با دو روش زیر پیدا کنید:
a. روش Z-Score
b. روش IQR (Interquartile Range)
در هر روش، مقدار آستانه را محاسبه کرده و ردیفهایی را که پرت هستند فهرست کنید.
37. نرمالسازی با Z-Score
ستون TotalCharges را با روش Z-score استانداردسازی کنید تا میانگین صفر و انحراف معیار یک داشته باشد.
میانگین و انحراف معیار مقدار جدید را محاسبه کرده و بررسی کنید آیا در محدودهی نرمال (تقریباً ±3) قرار دارند یا نه.
38. تحلیل Skewness (عدم تقارن)
a. میزان skewness برای ستون TotalCharges را محاسبه کنید.
b. سپس skewness را پس از استانداردسازی Z-score نیز محاسبه کرده و مقایسه کنید.
c. بر اساس مقدار skewness، مشخص کنید آیا دادهها بهطور قابل توجهی skewed هستند یا تقریباً متقارن.
39. بررسی نرمال بودن دادهها
برای ستون TotalCharges نمودار احتمال نرمال (Normal Probability Plot / Q–Q Plot) رسم کنید.
بررسی کنید آیا نقاط تقریباً روی خط نرمال قرار دارند یا خیر، و در مورد نرمال بودن داده توضیح دهید.
40. بررسی مقادیر صفر و توزیع داده
ستون TotalCharges شامل تعدادی مقدار صفر است.
a. نمودار نرمال بودن این ستون را رسم کنید.
b. توضیح دهید چرا توزیع داده نرمال نیست .
c. متغیری جدید به نام NonzeroCharges بسازید که فقط شامل مقادیر غیرصفر باشد.
d. نمودار نرمال بودن متغیر جدید را رسم کنید و دربارهی نرمالتر شدن آن توضیح دهید.
41. نرمالسازی ستون Tenure
ستون tenure (تعداد ماههای عضویت مشتری) را با روش Z-score استانداردسازی کنید.
نمودار توزیع مقادیر استانداردشده را رسم کرده و محدودهی آن را (مثلاً از -3 تا +3) توصیف کنید.
https://bcs.wiley.com/he-bcs/Books?action=index&bcsId=11704&itemId=0470908742&utm_source=chatgpt.com این هم لینک داده های کتاب هست که یکی از بچه ها پیدا کردند لطف کردند فرستادند ترجیحا با همین دیتای کتاب پیاده سازی کنید اما اگر براتون مشکل داشت دیتای جایگزین
❤1