سلام بچهها
برنامه کلاس هامون دو هفته یک بار هست من هفته گذشته درگیر کار اداری بودم متاسفانه نتونستم کلاس تشکیل بدم، متاسفانه فردا هم خبردار شدم باید برم بالا،
فردا کلاس نخواهیم داشت،
خیلی معذرت میخوام و توی اولین فرصت برای جلسه بعد هماهنگ میکنم باهاتون.
خیلی ممنون ازتون 🌸🤍
برنامه کلاس هامون دو هفته یک بار هست من هفته گذشته درگیر کار اداری بودم متاسفانه نتونستم کلاس تشکیل بدم، متاسفانه فردا هم خبردار شدم باید برم بالا،
فردا کلاس نخواهیم داشت،
خیلی معذرت میخوام و توی اولین فرصت برای جلسه بعد هماهنگ میکنم باهاتون.
خیلی ممنون ازتون 🌸🤍
❤6
سلام بچه ها امیدوارم خوب باشین راجع به سوالاتی که پرسیدین من پرسیدم از استادتون نتیجه رو میگم بهتون
❤3
بچه ها امتحان میانترمتون تا آخر مبحث آزمون کای دو پیرسون در فصل ۵ هست.
و مهلت ارسال تمرین تا جمعه شب تمدید شد
و مهلت ارسال تمرین تا جمعه شب تمدید شد
❤3
WA_Fn-UseC_-Telco-Customer-Churn.csv
954.6 KB
سلام و وقت بخیر باتوجه به مشکلی که برای دیتاست کتاب وجود داشت از این دیتاست جایگزین اضافه کنید. سوال ها مطابق با این دیتاست آپدیت شدند و در ادامه میفرستم براتون
33. بررسی دادههای گمشده
بررسی کنید آیا در هیچکدام از ستونهای داده مقادیر گمشده (Missing Values) وجود دارد یا خیر.
در صورت وجود، مشخص کنید مربوط به کدام ستون است و چه مقدار از دادهها را تشکیل میدهد.
34. مقایسهی نوع سرویس اینترنت و نوع قرارداد
ستونهای InternetService و Contract را مقایسه کنید.
آیا مواردی وجود دارد که کاربر اینترنت ندارد (No) اما نوع قرارداد مشخص دارد؟
در صورت مشاهده، این موارد را بهعنوان ناهنجاری (Abnormality) گزارش کنید.
35. شناسایی Outlier با نمودار
با استفاده از نمودار (Boxplot یا Histogram) بررسی کنید آیا متغیر MonthlyCharges (هزینه ماهیانه) شامل مقدارهای پرت است یا خیر.
36. شناسایی محدودهی دادههای پرت
برای ستون MonthlyCharges، دادههای پرت را با دو روش زیر پیدا کنید:
a. روش Z-Score
b. روش IQR (Interquartile Range)
در هر روش، مقدار آستانه را محاسبه کرده و ردیفهایی را که پرت هستند فهرست کنید.
37. نرمالسازی با Z-Score
ستون TotalCharges را با روش Z-score استانداردسازی کنید تا میانگین صفر و انحراف معیار یک داشته باشد.
میانگین و انحراف معیار مقدار جدید را محاسبه کرده و بررسی کنید آیا در محدودهی نرمال (تقریباً ±3) قرار دارند یا نه.
38. تحلیل Skewness (عدم تقارن)
a. میزان skewness برای ستون TotalCharges را محاسبه کنید.
b. سپس skewness را پس از استانداردسازی Z-score نیز محاسبه کرده و مقایسه کنید.
c. بر اساس مقدار skewness، مشخص کنید آیا دادهها بهطور قابل توجهی skewed هستند یا تقریباً متقارن.
39. بررسی نرمال بودن دادهها
برای ستون TotalCharges نمودار احتمال نرمال (Normal Probability Plot / Q–Q Plot) رسم کنید.
بررسی کنید آیا نقاط تقریباً روی خط نرمال قرار دارند یا خیر، و در مورد نرمال بودن داده توضیح دهید.
40. بررسی مقادیر صفر و توزیع داده
ستون TotalCharges شامل تعدادی مقدار صفر است.
a. نمودار نرمال بودن این ستون را رسم کنید.
b. توضیح دهید چرا توزیع داده نرمال نیست .
c. متغیری جدید به نام NonzeroCharges بسازید که فقط شامل مقادیر غیرصفر باشد.
d. نمودار نرمال بودن متغیر جدید را رسم کنید و دربارهی نرمالتر شدن آن توضیح دهید.
41. نرمالسازی ستون Tenure
ستون tenure (تعداد ماههای عضویت مشتری) را با روش Z-score استانداردسازی کنید.
نمودار توزیع مقادیر استانداردشده را رسم کرده و محدودهی آن را (مثلاً از -3 تا +3) توصیف کنید.
بررسی کنید آیا در هیچکدام از ستونهای داده مقادیر گمشده (Missing Values) وجود دارد یا خیر.
در صورت وجود، مشخص کنید مربوط به کدام ستون است و چه مقدار از دادهها را تشکیل میدهد.
34. مقایسهی نوع سرویس اینترنت و نوع قرارداد
ستونهای InternetService و Contract را مقایسه کنید.
آیا مواردی وجود دارد که کاربر اینترنت ندارد (No) اما نوع قرارداد مشخص دارد؟
در صورت مشاهده، این موارد را بهعنوان ناهنجاری (Abnormality) گزارش کنید.
35. شناسایی Outlier با نمودار
با استفاده از نمودار (Boxplot یا Histogram) بررسی کنید آیا متغیر MonthlyCharges (هزینه ماهیانه) شامل مقدارهای پرت است یا خیر.
36. شناسایی محدودهی دادههای پرت
برای ستون MonthlyCharges، دادههای پرت را با دو روش زیر پیدا کنید:
a. روش Z-Score
b. روش IQR (Interquartile Range)
در هر روش، مقدار آستانه را محاسبه کرده و ردیفهایی را که پرت هستند فهرست کنید.
37. نرمالسازی با Z-Score
ستون TotalCharges را با روش Z-score استانداردسازی کنید تا میانگین صفر و انحراف معیار یک داشته باشد.
میانگین و انحراف معیار مقدار جدید را محاسبه کرده و بررسی کنید آیا در محدودهی نرمال (تقریباً ±3) قرار دارند یا نه.
38. تحلیل Skewness (عدم تقارن)
a. میزان skewness برای ستون TotalCharges را محاسبه کنید.
b. سپس skewness را پس از استانداردسازی Z-score نیز محاسبه کرده و مقایسه کنید.
c. بر اساس مقدار skewness، مشخص کنید آیا دادهها بهطور قابل توجهی skewed هستند یا تقریباً متقارن.
39. بررسی نرمال بودن دادهها
برای ستون TotalCharges نمودار احتمال نرمال (Normal Probability Plot / Q–Q Plot) رسم کنید.
بررسی کنید آیا نقاط تقریباً روی خط نرمال قرار دارند یا خیر، و در مورد نرمال بودن داده توضیح دهید.
40. بررسی مقادیر صفر و توزیع داده
ستون TotalCharges شامل تعدادی مقدار صفر است.
a. نمودار نرمال بودن این ستون را رسم کنید.
b. توضیح دهید چرا توزیع داده نرمال نیست .
c. متغیری جدید به نام NonzeroCharges بسازید که فقط شامل مقادیر غیرصفر باشد.
d. نمودار نرمال بودن متغیر جدید را رسم کنید و دربارهی نرمالتر شدن آن توضیح دهید.
41. نرمالسازی ستون Tenure
ستون tenure (تعداد ماههای عضویت مشتری) را با روش Z-score استانداردسازی کنید.
نمودار توزیع مقادیر استانداردشده را رسم کرده و محدودهی آن را (مثلاً از -3 تا +3) توصیف کنید.
https://bcs.wiley.com/he-bcs/Books?action=index&bcsId=11704&itemId=0470908742&utm_source=chatgpt.com این هم لینک داده های کتاب هست که یکی از بچه ها پیدا کردند لطف کردند فرستادند ترجیحا با همین دیتای کتاب پیاده سازی کنید اما اگر براتون مشکل داشت دیتای جایگزین
❤1
سلام بچهها وقتتون بخیر نظرسنجی مجدد میانترمتون رو شرکت کنید لطفا همگی زودتر که تاریخ مشخص بشه🌸
Data Mining 😍💻
تاریخ میانترم دوم
با قبل بیست و چهارم موافقین؟ نظرسنجی کنیم؟
چون برای بعد سی ام باید از استادتون بپرسم که امکانش هست یا نه.
چون برای بعد سی ام باید از استادتون بپرسم که امکانش هست یا نه.
👎8👍3
سلام بچهها وقتتون بخیر
کلاس خانم دکتر فردا به صورت آنلاین در ایلرن ساعت ۸ صبح برگزار خواهد شد
لطفا خانم تات و آقای عباسپور هم به من پیغام بدند.
متشکرم.
کلاس خانم دکتر فردا به صورت آنلاین در ایلرن ساعت ۸ صبح برگزار خواهد شد
لطفا خانم تات و آقای عباسپور هم به من پیغام بدند.
متشکرم.
سلام بچهها وقتتون بخیر
پس تایم امتحانتون ۲ دی به استادان گزارش میشه
راجع به ددلاین تمرین ها هم قبلا گفتم اینجا، بچه ها نگران نباشید من توی ذهنم ددلاین و عقب تر از استاد درنظر میگرم و بعد از اون هم نمره کمی کسر میشه
و در آخرهم کار امتیازی برای جبران اگر نمره ای کم داشتین خواهیم داشت
سوالاتی که تازه پرسیدین رو باز از استادتون میپرسم و خبرتون میکنم
عذر میخوام پیامی رو این چند روز اگر جواب ندادم دچارکسالت و استراحت مطلق بودم.
نگران نمرتون نباشیدد، موفق باشید🌸
پس تایم امتحانتون ۲ دی به استادان گزارش میشه
راجع به ددلاین تمرین ها هم قبلا گفتم اینجا، بچه ها نگران نباشید من توی ذهنم ددلاین و عقب تر از استاد درنظر میگرم و بعد از اون هم نمره کمی کسر میشه
و در آخرهم کار امتیازی برای جبران اگر نمره ای کم داشتین خواهیم داشت
سوالاتی که تازه پرسیدین رو باز از استادتون میپرسم و خبرتون میکنم
عذر میخوام پیامی رو این چند روز اگر جواب ندادم دچارکسالت و استراحت مطلق بودم.
نگران نمرتون نباشیدد، موفق باشید🌸
❤10
سلام بچهها وقتتون بخیر
تغییر ددلاین تمرینها در سامانه به صورت زیر انجام شد:
تکالیف فصل ۴ و ۵ قسمت اول تا فرداشب( دوشنبه شب) ددلاینش تمدید شد و همچنین قسمت دومش که تعداد کمتری از شما تحویل داده بودید تا پس فردا شب (سهشنبه شب) تمدید شد.
موفق باشید 🌸
تغییر ددلاین تمرینها در سامانه به صورت زیر انجام شد:
تکالیف فصل ۴ و ۵ قسمت اول تا فرداشب( دوشنبه شب) ددلاینش تمدید شد و همچنین قسمت دومش که تعداد کمتری از شما تحویل داده بودید تا پس فردا شب (سهشنبه شب) تمدید شد.
موفق باشید 🌸
❤5
بچهها حتما حواستون باشه برای تمرینهای کدتون خروجی بزارید تو گزارش تون و همراه تحلیل ، بعضیهاتون فقط کد گذاشتید این باعث میشه نمره از دست بدید.
برای تمرینهای قبلی هم اونهایی که فقط کد گذاشتند از الان تا آخر هفته، همون کدهایی که روی سایت گذاشتند و ران کنند و خروجیهاش رو برای من اسکرین بگیرند و با توضیح توی پی وی بفرستند که نمرهاشون کامل بشه.🌸
برای تمرینهای قبلی هم اونهایی که فقط کد گذاشتند از الان تا آخر هفته، همون کدهایی که روی سایت گذاشتند و ران کنند و خروجیهاش رو برای من اسکرین بگیرند و با توضیح توی پی وی بفرستند که نمرهاشون کامل بشه.🌸