FaraData | فرا داده: علم داده و داده‌کاوی – Telegram
FaraData | فرا داده: علم داده و داده‌کاوی
1.32K subscribers
50 photos
11 videos
246 links
فرا داده — کانال تخصصی علم داده و داده کاوی

🔸کلان داده
🔸 داده کاوی
🔸 پردازش داده
🔸 یادگیری عمیق
🔸 یادگیری ماشین
🔸 کلان داده و Big Data
🔸 و صدها ساعت آموزش جذاب

🚀 برای مشاهده تمام آموزش‌های ویدیویی، روی لینک زیر بزنید:👇
fdrs.ir/tc/ds
Download Telegram

✳️ آموزش رایگان کار با دیتافریم‌ ها در پکیج Pandas‌


چکیده —
بعد از دیدن این آموزش قادر خواهید بود که با اصول اولیه تجزیه و تحلیل و آماده‌سازی داده‌ها با پایتون (Python) آشنا شوید، نحوه ورود داده از فایل‌هایی مانند: XML ,JSON و CSV را یاد بگیرید و همچنین از کتابخانه Pandas در پایتون برای تجزیه و تحلیل داده‌ها، گروه‌بندی و اتصال داده‌ها استفاده کنید، بتوانید داده‌ها را از وب استخراج کرده، نحوه شناسایی و پاک‌سازی داده‌ها را فراگرفته و از کتابخانه‌هایی مانند: Matplotlib برای مصورسازی داده‌ها استفاده نمایید.

کسب اطلاعات بیشتر 👇👇

🔗 آموزش رایگان کار با دیتافریم‌ ها در پکیج Pandas‌ — کلیک کنید [+]

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس

👍3

در کانال‌های موضوعی و تخصصیِ فرادرس، چه مطالبی به صورت رایگان ارائه می‌شود؟

🔹 جدیدترین و به‌روز ترین مقالات آموزشی
در رشته‌های مختلف تحصیلی و تخصصی
🔹
خلاصه دروس دانشگاهی
🔹 مطالب جذاب علمی و ویدئوهای آموزشی
🔹
آموزش مهارت‌های کاربردی

🌟 برای دسترسی سریع‌تر به مطالب و مقالات آموزشی رایگان فرادرس، عضو کانال مورد نظر خود شوید👇👇👇


📌کانال آموزشی برنامه‌نویسی:
@FaraProg

📌کانال آموزشی برنامه‌نویسی پایتون:
@FaraPython

📌کانال آموزشی برنامه‌نویسی اندروید:
@FaraAnd

📌کانال آموزشی برنامه‌نویسی جاوا:
@Fara_Java

📌کانال آموزشی طراحی و توسعه وب:
@FaraWebDev

📌کانال آموزشی متلب و سیمولینک:
@FaraMatlabSim

📌کانال آموزشی رباتیک:
@FaraRobotics

📌کانال آموزشی هوش مصنوعی:
@FaraAI

📌کانال آموزشی علم داده:
@Fara_DS

📌کانال آموزشی مهندسی:
@FaraEng

📌کانال آموزشی مهندسی مکانیک:
@FaraMechanical

📌کانال آموزشی مهندسی برق:
@FaraElectrical

📌کانال آموزشی مهندسی عمران:
@FaraCivil

📌کانال آموزشی معماری:
@FaraArch

📌کانال آموزشی شیمی:
@FaraChem

📌کانال آموزشی مهندسی و علوم کامپیوتر:
@FaraCompEng

📌کانال آموزشی طراحی گرافیک:
@FaraGraphDesign

📌کانال آموزشی زبان:
@FaraLang

📌کانال آموزشی زیست‌شناسی:
@FaraBio

📌کانال آموزشی فیزیک:
@FaraPhys

📌کانال آموزشی ریاضیات:
@FaraMathematic

📌کانال آموزشی آمار و احتمالات:
@FaraStatistics

📌کانال آموزشی آفیس:
@FaraOffice

📌کانال آموزشی بورس:
@FaraVest

📌کانال آموزشی بازاریابی دیجیتال:
@Kaprila


📚 فرادرس | دانش در دسترس همه؛ همیشه و همه جا

@FaraDars — فرادرس
👍1

✳️ آموزش رایگان گروه‌ بندی‌


چکیده —
بعد از دیدن این آموزش قادر خواهید بود که با اصول اولیه تجزیه و تحلیل و آماده‌سازی داده‌ها با پایتون (Python) آشنا شوید، نحوه ورود داده از فایل‌هایی مانند: XML ,JSON و CSV را یاد بگیرید و همچنین از کتابخانه Pandas در پایتون برای تجزیه و تحلیل داده‌ها، گروه‌بندی و اتصال داده‌ها استفاده کنید، بتوانید داده‌ها را از وب استخراج کرده، نحوه شناسایی و پاک‌سازی داده‌ها را فراگرفته و از کتابخانه‌هایی مانند: Matplotlib برای مصورسازی داده‌ها استفاده نمایید.

کسب اطلاعات بیشتر 👇👇

🔗 آموزش رایگان گروه‌ بندی‌ — کلیک کنید [+]

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس

👍2

🚀 آخرین بهبودها و تحولات فرادرسی

بخش «ادامه مسیر تا ورود به بازار کار»، به آموزش‌های فرادرس اضافه شد.

⭕️ گام بعدی چیست؟ این یکی از مهم ترین سوالاتی است که پس از اتمام یک آموزش، احتمالا در ذهن دانشجویان شکل می‌گیرد.

🔴 در پاسخ به این سوال، فرادرس به انتهای صفحه آموزش، یک بخش با عنوان «ادامه مسیر تا ورود به بازار کار» اضافه کرده است. در این قسمت، مسیری که بعد از دیدن آموزش برای توسعه مهارت‌های خود باید طی کنید، تشریح شده است تا بتوانید تصویر روشن تری از ادامه مسیر یادگیری داشته باشید.

📌 برای تکمیل و توسعه یادگیری و استفاده از این قابلیت جذاب، از قسمت حساب کاربری وارد آموزشی که تهیه کرده‌اید شوید و در انتهای قسمت سرفصل‌ها، گزینه ادامه مسیر تا ورود به بازار کار را مشاهده کنید. 👇

🔗 ورود به حساب کاربری — [کلیک کنید]

⚠️
گزینه "ادامه مسیر تا ورود به بازار کار" به اکثر آموزش‌های فرادرس اضافه شده است و به زودی برای همه آموزش‌ها قابل دسترسی خواهد شد.

📚 فرادرس | دانش در دسترس همه؛ همیشه و همه جا

@FaraDars — فرادرس
1👍1
✳️ ریکامندر چیست ؟ | مبانی سیستم پیشنهاد دهنده — به زبان ساده

‏در این مطلب، ضمن پاسخگویی به پرسش ریکامندر چیست به بررسی مبانی سیستم پیشنهاد دهنده به زبان ساده، به طور جامع و کامل و همراه با ارائه مثال پرداخته شده است. شایان توجه است که در سراسر این مطلب از کلمه قلم و اقلام برای اشاره به مفهوم «Item» و «Items» استفاده شده است.

══ فهرست مطالب ══

‏ ○ چکیده مطلب ریکامندر چیست ؟
‏ ○ مقدمه‌ای بر مبحث ریکامندر چیست ؟
‏ ○ ریکامندر معادل چه کلمه‌ای در فارسی و انگلیسی است؟
‏ ○ ریکامندر چیست ؟
‏ ○ دلیل استفاده از سیستم ریکامندر چیست ؟
‏ ○ کاربرد سیستم ریکامندر چیست ؟
‏ ○ چه زمانی کسب و کار باید ریکامندر سیستم پیاده‌سازی کند؟
‏ ○ پیش‌نیازهای لازم برای راه‌اندازی یک سیستم ریکامندر چیست ؟
‏ ○ ریکامندر سیستم چگونه کار می‌کند؟
‏ ○ منابع اطلاعاتی سیستم ریکامندر چیست ؟
‏ ○ روش فراهم کردن داده برای سیستم ریکامندر چیست ؟
‏ ○ رابطه و داده در ریکامندر سیستم ها
‏ ○ انواع سیستم‌های ریکامندر چه هستند؟
‏ ○ از چه روش‌هایی برای ساخت ریکامندر سیستم استفاده می‌شود؟
‏ ○ چطور می‌توان یک ریکامندر سیستم را ارزیابی کرد؟
‏ ○ مثال از ریکامندر سیستم: موتور پیشنهاد هوشمند با پالایش گروهی
‏ ○ مثال از ریکامندر سیستم: ریکامندر سیستم محتوا محور پیشنهاد مقالات
‏ ○ معرفی یک پروژه ریکامندر سیستم فعال و تجاری ایرانی: کاپریلا
‏ ○ پرسش‌های متداول پیرامون ریکامندر سیستم


🔸 چکیده مطلب ریکامندر چیست ؟

‏اینترنت به عنوان منبعی برای حجم انبوه داده‌ها و اطلاعات محسوب می‌شود. در عین حال، کالاها و خدمات متنوعی نیز از طریق اینترنت در دسترس عموم مردم هستند. در این اقیانوس، نیاز به ابزاری برای پالایش، اولویت‌بندی و تحویل موثر اطلاعات مورد نیاز و مرتبط به هر کاربر به او محسوس است. این کار به عنوان راهکاری مُسَکن‌وار برای مسئله وجود سرریز اطلاعات (Information Overload) در نظر گرفته شده است. امروزه، سرریز اطلاعات مشکلات متعددی را برای کاربران اینترنت به وجود آورده است. ریکامندر سیستم در صدد است تا این مشکل را با جستجو در میان حجم انبوهی از اطلاعاتی حل کند که همه روزه به صورت پویا تولید می‌شوند و محتوا و خدمات شخصی‌سازی شده برای هر کاربر را در اختیار او قرار دهد.

‏در مطلب ریکامندر چیست ابتدا مفهوم ریکامندر سیستم بیان و به پرسش ریکامندر چیست پاسخ داده شده است. سپس، به پرسش دلیل استفاده از سیستم ریکامندر چیست پاسخ داده شده و کاربرد ریکامندر سیستم مورد بررسی قرار گرفته است. در ادامه، پیش‌نیازهای لازم برای یک ریکامندر سیستم تشریح شده‌اند و به روش‌های تامین منابع اطلاعاتی برای ریکامندر سیستم پرداخته شده است. پس از آن، روش کار و روش ساخت ریکامندر سیستم مورد بررسی قرار گرفته و انواع ریکامندر سیستم تشریح شده است. سپس، مثال‌هایی از پیاده‌سازی ریکامندر سیستم همراه با ارائه کدهای لازم برای آن ارائه شده است تا مخاطب بتواند هر چه بهتر پاسخ پرسش ریکامندر چیست را دریافت کند. در نهایت، به پرسش‌های متداول پیرامون ریکامندر سیستم یا همان سیستم پیشنهاد دهنده پاسخ داده شده است.


🔸 مقدمه‌ای بر مبحث ریکامندر چیست ؟

‏رشد انفجاری اطلاعات دیجیتالی در دسترس و تعداد کاربران اینترنت، مشکل بالقوه سرریز اطلاعاتی را ایجاد می‌کند. این سرریز اطلاعاتی مانع دسترسی سریع و به موقع کاربران به اطلاعات مورد نظر خودشان در اینترنت می‌شود. سیستم‌های بازیابی اطلاعات (Information Retrieval Systems) مانند گوگل، آلتاویستا و دیگر موارد، تا اندازه‌ای این مشکل را حل کرده‌اند.



مطالعه ادامه مطلب 👇👇

🔗 ریکامندر چیست ؟ | مبانی سیستم پیشنهاد دهنده — به زبان ساده — کلیک کنید (+)



📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
1
✳️ آشنایی با شبکه‌های عصبی پیچشی (CNN)

‏«شبکه‌های عصبی پیچشی» (convolutional neural network) رده‌ای از شبکه‌های عصبی عمیق هستند که معمولاً برای انجام تحلیل‌های تصویری یا گفتاری در یادگیری ماشین استفاده می‌شوند. برای توضیح CNN کار خود را با اساسی‌ترین عنصر این شبکه عصبی یعنی «پرسپترون» (perceptron) آغاز می‌کنیم.

══ فهرست مطالب ══

‏ ○ پرسپترون
‏ ○ بردار ویژگی
‏ ○ کلاس‌بندی
‏ ○ الگوریتم تمرین
‏ ○ تمرین دادن پرسپترون
‏ ○ مبدأ (epoch)
‏ ○ تمرین دادن عملی پرسپترون


🔸 پرسپترون

‏پرسپترون جزء اساسی و پایه‌ای شبکه عصبی است که می‌تواند یادگیری نیز داشته باشد. توسعه این جزء درنتیجه الهام از یک عنصر زیست‌شناختی به نام نورون بوده است. چراکه پرسپترون مانند نورون یک سیگنال ورودی را دریافت می‌کند، آن را پردازش می‌کند و یک پاسخ را شبیه‌سازی می‌کند. پرسپترون سیگنال میتواند برای تمییز مسائل قابل جداسازی خطی مورداستفاده قرار گیرد.


🔸 بردار ویژگی

‏وظایف یادگیری ماشینی معمولاً بدین‌صورت تعریف می‌شوند که سیستم یادگیری ماشینی چگونه باید یک نمونه را پردازش کند. معمولاً این وظایف مجموعه‌ای از ویژگی‌ها هستند که از برخی از اشیا یا رویدادها به‌صورت کمی اندازه‌گیری می‌شوند و از سیستم یادگیری ماشینی می‌خواهیم که آن‌ها را برای ما پردازش کند. معمولاً این نمونه را به‌صورت بردار x ∈ Rn نمایش می‌دهیم که هر مؤلفه xi خود یک بردار ویژگی است.



مطالعه ادامه مطلب 👇👇

🔗 آشنایی با شبکه‌های عصبی پیچشی (CNN) — کلیک کنید (+)

📌کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [‎@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
✳️ زبان برنامه نویسی R — معرفی و کاربردها

‏امروزه، استفاده از رایانه‌ها برای انجام تحلیل داده‌ها، امری اجتناب ناپذیر است. در این بین زبان‌های برنامه‌نویسی برای انجام عملیات محاسباتی، توسعه یافته، به طوری که هر روز دارای امکانات بیشتری شده و روزآمد (Update) می‌شوند. در این بین زبان‌های برنامه‌نویسی محاسباتی مانند R و «پایتون» Python از محبوبیت زیادی برخوردارند. در این نوشتار از مجله فرادرس به زبان برنامه نویسی R پرداخته شده است و علاوه بر معرفی آن، کاربردهای آن در حوزه تحلیل داده مورد بررسی قرار می‌دهیم. در انتهای این متن، مزایا و معایب استفاده از این زبان برنامه‌نویسی نیز برای خوانندگان ارائه خواهد شد.

══ فهرست مطالب ══

‏ ○ زبان برنامه نویسی R
‏ ○ چرا از R استفاده کنیم؟
‏ ○ آیا باید زبان برنامه ‌نویسی R را برای کار انتخاب کرد؟
‏ ○ مزایا و معایب زبان برنامه نویسی R
‏ ○ نرم‌افزار RStudio
‏ ○ معرفی فیلم آموزشی برنامه نویسی R و نرم افزار RStudio – مقدماتی
‏ ○ خلاصه و جمع‌بندی


🔸 زبان برنامه نویسی R

‏R یک زبان برنامه‌نویسی و نرم افزار رایگان است که توسط «راس ایهاکا» (Ross Ihaka) و «رابرت جنتلمن» (Robert Gentleman) در سال ۱۹۹۳ تهیه شده است. R دارای کتابخانه‌های گسترده‌ای از انواع روش‌های آماری و شیوه‌های ترسیم نمودارها است. در این زبان برنامه نویسی، «الگوریتم‌های یادگیری ماشین» (Machine Learning Algorithm)، «رگرسیون خطی» (Linear Regression)، «سری‌های زمانی» (Time Series) و «استنباط آماری» (Statistical Inference)‌ قابل استفاده هستند.

‏بیشتر «کتابخانه‌های» (Library) یا «بسته‌های» (Package) قابل دسترس در R، با خود زبان برنامه نویسی R نوشته شده‌اند، اما برای کارهای محاسباتی سنگین، کدهایی به زبان‌های C++ ،C و Fortran نیز قابل دسترس بوده و کتابخانه‌هایی با این زبان‌ها، نوشته شده‌اند.

‏زبان برنامه‌نویسی R نه تنها در بین دانشگا‌هیان و محققین مورد اقبال قرار گرفته است، بلکه بسیاری از شرکت‌های بزرگ نیز از زبان برنامه نویسی R استفاده می‌کنند. در این بین می‌توان به شرکت‌هایی مانند Uber ،Google ،Airbnb و Facebook اشاره کرد.


🔸 چرا از R استفاده کنیم؟

‏علم داده در حال شکل دادن به نحوه فعالیت شرکت‌ها است. بدون شک استفاده نکردن از هوش مصنوعی و یادگیری ماشین باعث شکست شرکت‌ها در فعالیت‌های تجاری خواهد شد. سوال اصلی این است که از کدام ابزار یا زبان برای تحلیل داده‌ها استفاده کنیم؟

‏تعداد زیادی از ابزارهای تجاری برای اجرای تعاملات مالی و تجزیه و تحلیل آن‌ها وجود دارد. ولی متاسفانه اغلب آن‌ها پولی هستند. از طرفی ممکن است سازگاری لازم با نحوه کار شرکت شما یا روند داده‌هایتان را نداشته باشند. از جنبه دیگر، آموختن یک زبان برنامه‌نویسی جدید، کار طولانی و پیچیده‌ای است.

‏آیا واقعاً آموختن زبان برنامه‌نویسی R پیچیده است؟ توجه داشته باشید که باید یک توازن بین پیچیدگی و کارایی در نظر گرفت و بهترین زبان برنامه‌نویسی را برای امور شرکت انتخاب کرد. در تصویر ۴، نموداری را مشاهده می‌کنید که به مقایسه کارایی و سادگی در آموزش بین زبان‌ها و نرم‌افزارهای تحلیل مالی پرداخته است. اگر می‌خواهید بهترین اطلاعات را از داده‌ها کسب کرده و به نمایش بگذارید، باید مدتی را صرف یادگیری ابزار مناسب آن، یعنی زبان برنامه نویسی R کنید.



مطالعه ادامه مطلب 👇👇

🔗 زبان برنامه نویسی R — معرفی و کاربردها — کلیک کنید (+)


📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
✳️ علم داده چیست؟

‏سال‌های مدیدی است که جهان مملو از داده شده، حجم این داده‌ها و سرعت تولید آن‌ها با ظهور وب و البته شبکه‌های اجتماعی رشد فزاینده‌ای داشته. در واقع، حجم داده‌های دیجیتال با سرعت زیادی در حال رشد است. مطابق گزارش IBM، در سال ۲۰۱۲ هر روز بالغ بر ۲.۵ اگزابایت داده تولید می‌شده. بر اساس گزارش منتشر شده توسط DOMO، حجم تولید داده در سال ۲۰۱۸ نیز به همین منوال ادامه داشته است. در گزارش IBM آمده: «۷۵٪ داده‌های تولید شده، ساختار نیافته و منابعی مانند متن، صدا و ویدئو هستند». در ادامه به مبحث علم داده به عنوان راهکاری جهت مبدل ساختن این حجم از داده به اطلاعات و دانش پرداخته خواهد شد.

══ فهرست مطالب ══

‏ ○ حجم بالای داده‌ها چگونه ذخیره می‌شوند؟
‏ ○ چرا داده‌ها مهم هستند؟
‏ ○ علم داده چیست؟
‏ ○ مزایای علم داده
‏ ○ تاریخچه
‏ ○ ارتباط آمار و علم داده


🔸 حجم بالای داده‌ها چگونه ذخیره می‌شوند؟

‏اولین کامپیوترها دارای حافظه‌های چند کیلوبایتی بوده‌اند، اما در حال حاضر گوشی‌های هوشمند توانایی ذخیره‌سازی بالغ بر ۱۲۸ گیگابایت داده را دارند و لپ‌تاپ‌ها می‌توانند چندین ترابایت داده را در حافظه داخلی خود ذخیره کنند. با افزایش ظرفیت و کاهش قیمت و ابعاد حافظه‌های ذخیره‌سازی، این موضوع در جهان کنونی و برخلاف گذشته دیگر موضوع قابل توجهی محسوب نمی‌شود.


🔸 چرا داده‌ها مهم هستند؟

‏ژیاوی هان – دانشمند داده و نویسنده کتاب «داده‌کاوی: مفاهیم و روش‌ها»

‏داده‌ها به میزان هوشمندی که می‌توان از آن‌ها استخراج کرد مفید و حائز اهمیت هستند. استخراج دانش و هوشمندی از داده‌ها، مستلزم انجام تحلیل‌های موثر و قدرت پردازش کامپیوتری بالا برای مواجهه با افزایش حجم داده‌ها است. در گزارش منتشر شده توسط Bain & Co در سال ۲۰۱۴، اذعان شده بود که ۴۰۰ شرکت فعال در حوزه تحلیل داده‌ها جایگاه قابل توجهی در میان شرکت‌های پیشرو در جهان طی این سال کسب کرده‌اند.



مطالعه ادامه مطلب 👇👇

🔗 علم داده چیست؟ — کلیک کنید (+)


📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
✳️ مجموعه داده های رایگان و قابل دانلود برای علم داده و یادگیری ماشین

‏پرسشی که برای بسیاری از افراد مطرح می‌شود آن است که چه «مجموعه داده های» (Data Set) بازی (Open) برای «یادگیری ماشین» (Machine Learning) وجود دارند که به صورت رایگان و بدون هر گونه انحصار قابل دانلود باشند؟ در ادامه لیستی از مجموعه داده‌های یادگیری ماشین با کیفیت و متنوع در حوزه‌های گوناگون برای یادگیری ماشین آورده شده است.

══ فهرست مطالب ══

‏ ○ پیدا کردن مجموعه داده
‏ ○ مجموعه داده‌های عمومی
‏ ○ یادگیری ماشین


🔸 پیدا کردن مجموعه داده

‏در ادامه روش‌هایی برای پیدا کردن مجموعه داده‌های متنوع در زمینه‌های گوناگون بیان شده است.

‏Kaggle (+): یک سایت در حوزه «علم داده» (Data Science) و حاوی مجموعه داده‌های متنوع و جالب توجهی است که توسط مشارکت‌کنندگان گوناگون فراهم شده‌اند. می‌توان انواع مجموعه داده‌ها را از این قسمت (+) یافت. تنوع این مجموعه داده‌ها بسیار بالا است و حوزه‌های گوناگونی از داده‌های بسکتبال (+) گرفته تا گواهینامه حیوانات خانگی در سیاتل (+) و امتیازدهی به رامن (نوعی غذای ژاپنی) (+) را شامل می‌شود.

‏مخزن یادگیری ماشین UCI (+): یکی از قدیمی‌ترین منابع از مجموعه داده‌های روی وب است که می‌توان در آن به دنبال مجموعه داده‌های جالب توجه گشت. با توجه به اینکه مجموعه داده‌ها با مشارکت کاربران تهیه شده‌اند دارای سطوح گوناگونی از پاکیزگی هستند، ولیکن اغلب آن‌ها پاک‌سازی شده محسوب می‌شوند. امکان دانلود مجموعه داده‌ها از «UCI Machine Learning» به طور مستقیم و بدون ثبت‌نام وجود دارد.


🔸 مجموعه داده‌های عمومی

‏در ادامه برخی از مجموعه داده‌های عمومی در حوزه‌های گوناگون معرفی شده‌اند.

Data.gov (+): این سایت امکان دانلود داده از چندین سازمان دولتی آمریکا را فراهم می‌کند. این داده‌ها از بودجه دولتی گرفته تا امتیاز کارایی مدارس را شامل می‌شوند. اغلب این داده‌ها نیازمند انجام پژوهش‌های بیشتری هستند.

‏Food Environment Atlas (+): حاوی داده‌هایی پیرامون این محبث است که چگونه انتخاب غذاها به طور محلی، رژیم غذایی را در ایالات متحده آمریکا (USA) تحت تاثیر قرار می‌دهد.



مطالعه ادامه مطلب 👇👇

🔗 مجموعه داده های رایگان و قابل دانلود برای علم داده و یادگیری ماشین — کلیک کنید (+)


📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
👍3
✳️ آموزش درخت تصمیم در یادگیری ماشین (رایگان)


چکیده —
یادگیری ماشین (Machine Learning) یک حوزه مطالعاتی است که به ماشین ها توانایی یادگیری می دهد، بدون این که نیاز باشد این ماشین ها به طور صریح برنامه نویسی شوند. به عبارتی، یادگیری ماشین بررسی می کند که چگونه کامپیوترها می توانند براساس داده یاد بگیرند یا کارایی شان را بهبود بخشند. ما در این آموزش قصد داریم تا درخت تصمیم در یادگیری ماشین را مورد بحث و بررسی قرار دهیم.



کسب اطلاعات بیشتر 👇👇

🔗 آموزش درخت تصمیم در یادگیری ماشین (رایگان) — کلیک کنید [+]

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
👍1

✳️ تفسیر نتایج رگرسیون در SPSS | گام به گام و تشریحی

‏رگرسیون خطی چه در حالت تک متغیره (ساده)، یا چندگانه و چند متغیره، در نرم‌افزار SPSS قابل اجرا است. در اغلب موارد خروجی حاصل از این مدل‌ها در این نرم‌افزار، مشابه یکدیگر هستند. از آنجایی که تفسیر و توجیه مدل ارائه شده، در تحلیل و مدل‌سازی آماری، امری مهم تلقی می‌شود، در این نوشتار از مجله فرادرس، به بررسی خروجی و تفسیر نتایج رگرسیون در SPSS پرداخته‌ایم. البته در این متن، مبنا مدل رگرسیونی چندگانه است و مسیر اجرا و نتایج حاصل براساس این تکنیک مورد توجه قرار گرفته است.

══ فهرست مطالب ══

‏ ○ تفسیر نتایج رگرسیون در SPSS
‏ ○ معرفی فیلم آموزش آمار استنباطی برای مدیریت و علوم انسانی
‏ ○ خلاصه و جمع‌بندی


🔸 تفسیر نتایج رگرسیون در SPSS

‏همانطور که گفته شد، در این نوشتار قرار است با نتایج حاصل از اجرای رگرسیون خطی در SPSS آشنا شده و از آن‌ها، تفسیر درستی ارائه کنیم. در این بین از یک فایل داده آموزشی استفاده خواهیم کرد.

‏اطلاعات مربوط به نمرات ۲۰۰ دانش آموز دبیرستان در سه درس «ریاضیات» (Math)، «مطالعات اجتماعی» (Socst) و «خواندن» و … معرفی شده‌اند. جدول ۱، این متغیرها را مشخص و ویژگی‌های آن را معرفی کرده است.

‏جدول ۱: ویژگی‌های متغیرهای مورد تحلیل


🔸 معرفی فیلم آموزش آمار استنباطی برای مدیریت و علوم انسانی

‏آمار استنباطی، یکی از شیوه‌های تعمیم خصوصیات نمونه به جامعه آماری است. این مباحث شامل تخمین نقطه‌ای و تخمین فاصله‌ای، آزمون فرض و مدل‌سازی است. بر این اساس، در این آموزش فرادرس موضوعات استنباط آماری به زبان ساده و به کمک نرم‌افزارهای آماری مانند اکسل و SPSS مطرح شده و با ذکر مثال‌های کاربردی، اهمیت به کارگیری آن‌ها به کاربران آموخته می‌شود.

‏بحث تفسیر نتایج رگرسیون در SPSS از مواردی است که در این آموزش به طور مفصل مورد توجه قرار گرفته و رگرسیون چندگانه و غیرخطی نیز مطرح می‌شود. فهرست سرفصل ها و رئوس مطالب مطرح شده در این مجموعه آموزشی، در ادامه آمده است:

‏– درس یکم: جامعه و نمونه و ارتباط بین آن ها

‏– درس دوم: برآورد آماری

‏– درس سوم: آزمون فرضیه

‏– درس چهارم: آزمون تحلیل واریانس

‏– درس پنجم: رگرسیون و همبستگی

‏– درس ششم: رگرسیون چندگانه و غیر خطی

‏این آموزش مناسب برای سطوح تحصیلی، کارشناسی و کارشناسی ارشد برای رشته‌های مدیریت، آمار، اقتصاد، حسابداری و مهندسی صنایع است. نرم افزارهای مرتبط با آموزش Microsoft Excel و IBM SPSS ۱۹ هستند. در مجموع فیلم آموزشی شامل ۵ ساعت و ۲۷ دقیقه محتوایی ویدیویی است.



مطالعه ادامه مطلب 👇👇

🔗 تفسیر نتایج رگرسیون در SPSS | گام به گام و تشریحی — کلیک کنید (+)


📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس

‌‎
✳️ علم داده، تحلیل داده، داده‌کاوی و یادگیری ماشین ــ تفاوت‌ها و شباهت‌ها

«علم داده» (data science)، «تحلیل داده‌ها» (Data analytics)، «یادگیری ماشین» (machine learning) و «داده‌کاوی» (Data Mining) با نرخ نجومی در حال رشد و توسعه هستند. از این‌رو شرکت‌ها به‌دنبال کارشناسانی می‌گردند که با کیمیاگری داده‌ها به آن‌ها در اتخاذ تصمیم‌های چابک، اثرگذار و کارا در کسب‌و‌کار کمک کنند.

══ فهرست مطالب ══

○ علم داده چیست؟
○ چه مهارت‌هایی برای مبدل شدن به یک دانشمند داده مورد نیاز است؟
○ تحلیل‌گر داده کیست؟
○ چه مهارت‌هایی برای مبدل شدن به یک تحلیل‌گر داده مورد نیاز است؟
○ آیا بین علم داده و تحلیل داده هم‌پوشانی وجود دارد؟
○ یادگیری ماشین چیست؟
○ چه مهارت‌هایی برای تبدیل شدن به یک متخصص یادگیری ماشین مورد نیاز است؟
○ آیا بین یادگیری ماشین و علم داده هم‌پوشانی وجود دارد؟
○ داده‌کاوی چیست؟
○ چه مهارت‌هایی برای تبدیل شدن به یک داده‌کاو مورد نیاز است؟
○ آیا همپوشانی بین داده‌کاوی و علم داده وجود دارد؟


🔸 علم داده چیست؟

افراد زیادی برای بیش از یک دهه تلاش کرده‌اند تا علم داده را تعریف کنند. بهترین راه برای پاسخ به این پرسش استفاده از یک نمودار وِن است. این نمودار توسط «هوق کانوی» (Hugh Conway) در سال ۲۰۱۰ ترسیم شده و شامل سه دایره ریاضیات و آمار، دانش دامنه (دانشی درباره دامنه‌ای که محاسبات و خلاصه‌سازی در آن انجام می‌شود) و مهارت‌های هک می‌شود. اساسا اگر فرد بتواند همه این سه مجموعه فعالیت را انجام دهد، دانش خوبی در زمینه علم داده دارد.



مطالعه ادامه مطلب 👇👇

🔗 علم داده، تحلیل داده، داده‌کاوی و یادگیری ماشین ــ تفاوت‌ها و شباهت‌ها — کلیک کنید (+)

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس

✳️ ۱۵ مورد رایج خطا در تحلیل داده — راهنمای تصویری و کاربردی

داده‌ها در اقتصاد داده‌محور امروز نقش انکارناپذیری در کسب بینش‌های نوین، تصمیم‌گیری‌ها و ساخت محصولات جدید دارد. در واقع امروزه شاهد سیل فزاینده داده‌ها هستیم که حجم‌شان هر دو سال دو برابر می‌شود و تا سال ۲۰۲۵ به عدد حیرت‌انگیز ۱۷۵ هزار اگزابایت داده خواهیم رسید. این عدد بسیار بزرگ و تصور کردن آن کاری دشوار است. برای آن که تخمینی از این عدد در ذهن خود داشته باشید، باید اشاره کنیم که این مقدار داده معادل ۱,۰۰۰,۰۰۰,۰۰۰ گیگابایت داده است. پنج اگزابایت داده تقریباً معادل همه واژه‌هایی است که بشر در عمر خود صحبت کرده است. بدیهی است که وقتی صحبت از  این حجم داده و تحلیل آن‌ها می‌شود، بروز خطا نیز ناگزیر خواهد بود. با ما همراه باشید تا با انواع مختلف خطا در تحلیل داده و توضیح آن‌ها آشنا شوید.

══ فهرست مطالب ══

○ انواع رایج خطا در تحلیل داده
○ ۱۵ مورد رایج خطا در تحلیل داده
○ توضیح برخی از انواع خطای رایج در تحلیل داده
○ سخن پایانی


🔸 انواع رایج خطا در تحلیل داده

چنان که شاید متوجه شده باشید، بررسی همه این داده‌ها چالش بسیار بزرگی محسوب می‌شود. داده‌ها معمولاً شکل‌های بسیار مختلفی دارند و تحلیل همه آن‌ها آسان نیست. در نتیجه اغلب وسوسه می‌شویم که میانبرهایی روی داده‌ها به کار گیریم یا این که تلاش می‌کنیم داده‌های ورودی را با نمادهای از پیش مشخصی که با آن‌ها آشنا هستیم، تطبیق دهیم. در تصاویر زیر برخی از مغالطه‌های رایج را مشاهده می‌کنید که افراد در زمان تحلیل داده‌ها مرتکب می‌شوند.



مطالعه ادامه مطلب 👇👇

🔗 ۱۵ مورد رایج خطا در تحلیل داده — راهنمای تصویری و کاربردی — کلیک کنید (+)

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
👍1
✳️ دیتا ساینس چیست؟ – هر آنچه باید از Data Science بدانید

با گسترده شدن کاربرد اینترنت و شبکه‌های اجتماعی و سیستمی شدن فعالیت‌های سازمان‌ها و شرکت‌ها، روزانه حجم عظیمی از داده‌های جدید تولید می‌شوند که برای مدیریت و پردازش آن‌ها باید از روش‌ها و ابزارهای پیچیده‌ای استفاده کرد. همین امر، بستری را به وجود آورده است که امروزه حوزه «دیتا ساینس | علم داده» (Data Science) به عنوان یکی از داغ‌ترین موضوعات حوزه فناوری اطلاعات تبدیل شود. در مطلب حاضر، به این پرسش پاسخ خواهیم داد که علم داده یا دیتا ساینس چیست و افرادی که در این حوزه مشغول به کار هستند، چه وظایفی را انجام می‌دهند. به‌علاوه، کاربردها و مهارت‌های فنی مورد نیاز حوزه دیتا ساینس و همچنین منابع یادگیری آن نیز معرفی می‌شوند.

══ فهرست مطالب ══

○ دیتا ساینس چیست ؟
○ دلیل ظهور دیتا ساینس چیست ؟
○ مراحل دیتا ساینس
○ مهارت های مورد نیاز دیتا ساینس
○ مشاغل مرتبط با دیتا ساینس
○ کاربردهای دیتا ساینس چیست ؟
○ تفاوت دیتا ساینس و ماشین لرنینگ و هوش مصنوعی چیست ؟
○ منابع یادگیری دیتا ساینس
○ جمع‌بندی


🔸 دیتا ساینس چیست ؟

امروزه،‌ داده‌ها به عنوان یکی از اصلی‌ترین سرمایه‌های سازمان‌ها و شرکت‌ها محسوب می‌شوند که مدیران با کمک اطلاعات حاصل از آن‌ها می‌توانند تصمیمات بسیار مهمی را در افزایش میزان سوددهی کسب و کار اتخاذ کنند. چنین هدفی با استفاده از مفاهیم حیطه دیتا ساینس محقق می‌شود.



مطالعه ادامه مطلب 👇👇

🔗 دیتا ساینس چیست؟ – هر آنچه باید از Data Science بدانید — کلیک کنید (+)

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
✳️ کاربرد داده کاوی در مهندسی صنایع

داده کاوی (Data Mining) مجموعه‌ای از ابزارهای مهم و کاربردی است، که قطعاً در هر رشته و حوزه کاری، که داده و اطلاعات وجود دارد، می‌تواند کاربرد داشته باشد. اصولاً در داده کاوی، سعی می‌شود انبوه داده‌ها و اطلاعات در دسترس، به طریقی به نوعی از دانش تبدیل شود، که بیانی بسیار خلاصه و مفید از پدیده‌ها را ارائه می‌نماید.

══ فهرست مطالب ══

○ مفهوم داده کاوی (Data Mining)
○ مثال‌های کاربرد داده کاوی در مهندسی صنایع


🔸 مفهوم داده کاوی (Data Mining)

داده کاوی (Data Mining) مجموعه‌ای از ابزارهای مهم و کاربردی است، که قطعاً در هر رشته و حوزه کاری، که داده و اطلاعات وجود دارد، می‌تواند کاربرد داشته باشد. اصولاً در داده کاوی، سعی می‌شود انبوه داده‌ها و اطلاعات در دسترس، به طریقی به نوعی از دانش تبدیل شود، که بیانی بسیار خلاصه و مفید از پدیده‌ها را ارائه می‌نماید.

مقالات مروری بسیاری در زمینه کاربردهای داده کاوی در حوزه مهندسی صنایع، مدیریت تولید، تحقیق در عملیات و زمینه‌های مرتبط نوشته شده است. مطالعه این موارد، برای اطلاع جامع و کامل از کاربردهای داده کاوی در این حوزه‌ها، قطعاً مفید خواهد بود. اما قدر مسلم این است که، تقریباً همه روش‌های داده کاوی، تا کنون بر روی مسائل و کاربردهای مختلف مورد استفاده قرار گرفته‌اند.


🔸 مثال‌های کاربرد داده کاوی در مهندسی صنایع

به عنوان مثال، در زمینه مدیریت زنجیره تأمین (Supply Chain Management) یا SCM، روش‌های مختلف طبقه بندی (نظارت شده) و خوشه بندی (غیر نظارت شده) برای گروه بندی مشتریان، خدمات دهندگان و کالاها (یا خدمات) مورد استفاده واقع شده‌اند و هدف اصلی آن‌ها، ایجاد یک تصویر بیان خلاصه‌تر از زنجیره تأمین بوده است.



مطالعه ادامه مطلب 👇👇

🔗 کاربرد داده کاوی در مهندسی صنایع — کلیک کنید (+)

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
👍1

✳️ بیگ دیتا چیست و کلان داده چه کاربردی دارد؟ — به زبان ساده

در طول چند سال اخیر حوزه‌هایی مانند کلان داده (Big Data)، یادگیری ماشین (Machine Learning) و داده کاوی (Data Mining) به میزان قابل توجهی شهرت پیدا کرده و مطرح شده‌اند. با توجه به اینکه امروزه عبارت داده‌ها و به طور خاص، بیگ دیتا یا همان کلان داده به شدت بر سر زبان‌ها افتاده، ممکن است این سوال پیش بیاید که بیگ دیتا چیست یا کلان داده چه کاربردی دارد ؟ در این مقاله چیستی بیگ دیتا و کاربرد‌های آن به صورت جامع و در عین حال به زبان ساده شرح داده شده است. علاوه بر این، در بخش‌های دیگر این مقاله به مواردی مانند کاربرد بیگ دیتا در دیجیتال مارکتینگ، انواع تحلیل کلان داده، منابع مختلف دسترسی به کلان داده و بسیاری از مفاهیم پراهمیت این حوزه پرداخته خواهد شد. در بخش آغازین به شرح چیستی بیگ دیتا پرداخته شده است.

══ فهرست مطالب ══

○ بیگ دیتا چیست ؟
○ مشخصه‌های بیگ دیتا چه هستند؟
○ مزایای بیگ دیتا کدامند؟
○ معایب بیگ دیتا چه هستند؟
○  انواع تحلیل کلان داده
○ مدل ۳V بیگ دیتا چیست ؟
○ معرفی فیلم های آموزش داده کاوی و یادگیری ماشین فرادرس
○ کاربرد بیگ دیتا چیست ؟
○ کاربرد بیگ دیتا در دیجیتال مارکتینگ
○ چرا بیگ دیتا اهمیت دارد؟
○ عملکرد بیگ دیتا چگونه است؟
○ ابزارها و زبان‌های برنامه نویسی بیگ دیتا
○ چه سازمان‌هایی از کلان داده استفاده می‌کنند؟
○ منابع اصلی دسترسی به کلان داده‌
○ معرفی فیلم های آموزش کلان داده
○ جمع بندی


🔸 بیگ دیتا چیست ؟

کلان داده‌ (Big Data) به مجموعه‌ای از داده‌ها گفته می‌شود که خود حجم زیادی دارند و در عین حال حجم آن‌ها با گذشت زمان به طور تصاعدی بیش‌تر هم می‌شود. این داده‌ها بسیار حجیم و پیچیده هستند، به طوری که هیچ یک از ابزارهای سنتی مدیریت داده‌ها امکان ذخیره یا پردازش آن‌ها را به طور کارآمد ندارند. به طور کلی، مفهوم کلان داده به داده‌هایی اشاره دارد که تنوع بسیاری دارند و حجم آن‌ها با سرعت زیادی افزایش می‌یابد. دسته‌بندی‌های مختلفی برای انواع کلان داده وجود دارد.



مطالعه ادامه مطلب 👇👇

🔗 بیگ دیتا چیست و کلان داده چه کاربردی دارد؟ — به زبان ساده — کلیک کنید (+)

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس

✳️ آزمون رگرسیون خطی در SPSS — راهنمای کاربردی

رگرسیون یا به اصطلاح «معادله خط برگشت» (Regression Line Equation) یک تکنیک آماری است که در بسیاری از حوزه‌های علمی، بخصوص «یادگیری ماشین» (Machine Learning) و «داده‌کاوی» (Data Mining) کاربرد دارد. از آنجا که محاسبات برای اجرای رگرسیون خطی، زمان‌بر و طولانی است و باید دقیق باشد، در اغلب موارد از نر‌م‌افزارهای محاسبات آماری مانند SPSS‌ برای انجام این کار استفاده می‌کنند. به همین دلیل نیز در این نوشتار به تکنیک و آزمون رگرسیون خطی در SPSS پرداخته و با ذکر مثالی، مراحل انجام این کار را مرور خواهیم کرد.

══ فهرست مطالب ══

○ آزمون رگرسیون خطی ساده در SPSS
○ معرفی فیلم آموزش همبستگی و رگرسیون خطی در SPSS
○ خلاصه و جمع‌بندی


🔸 آزمون رگرسیون خطی ساده در SPSS

مدل سازی بخصوص مدل خطی که می‌تواند ساده‌ترین مدل برازش برای داده‌ها در حوزه علوم آماری باشد، در بیشتر شاخه‌های علوم دیگر مانند «هوش‌مصنوعی» و «داده‌کاوی» به کار می‌رود. یکی از ساده‌ترین و از طرفی، موثر‌ترین روش‌های ساخت مدل خطی، «رگرسیون» (Regression) یا «معادله خط برگشت» نام دارد. همانطور که از نام این تکنیک بر می‌آید، به دنبال ساخت مدلی هستیم که به واسطه معادله یک خط نوشته می‌شود. قرار است به کمک زوج داده‌های موجود، ضریب زاویه و همچنین عرض از مبدا چنین خطی را محاسبه کنیم.

این خط می‌توان بیانگر رابطه خطی بین «متغیرهای پاسخ» (Response Variable) و «متغیرهای توصیفی» (Exploratory Variables) باشد. شایان ذکر است که گاهی به متغیرهای پاسخ، «متغیرهای وابسته» (Dependent Variable) و به متغیرهای توصیفی نیز «متغیرهای مستقل» (Independent Variable) یا متغیرهای پیشگو می‌گویند.




مطالعه ادامه مطلب 👇👇

🔗 آزمون رگرسیون خطی در SPSS — راهنمای کاربردی — کلیک کنید (+)

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس

✳️ داده چیست؟ — به زبان ساده + توضیح اهمیت و کاربرد

به احتمال زیاد کلمه «داده» (دیتا | Data) را بارها شاید در مدرسه، دانشگاه، محل کار یا در اخبار شنیده‌اید؛ شاید هم در اینترنت با آن مواجه شده باشید. اگر دانشمند داده هستید یا قصد دارید در حوزه‌های مهم ریاضی و علوم کامپیوتر مثل رشته علم داده، داده کاوی، تحلیل داده، پایگاه داده و بسیاری از موارد دیگر فعالیت کنید، قطعاً تمام حرفه شما به داده ها بستگی دارد. داده منبعی نامحدود و بی‌کران است و در همه جای جهان یافت می‌شود. اما به هر حال، استفاده از اصطلاح «داده» گاهی می‌تواند سردرگمی ایجاد کند و تقریباً هر شخصی ممکن است در خصوص اینکه داده چیست نظر متفاوتی داشته باشد.

══ فهرست مطالب ══

○ داده چیست ؟
○ اهمیت داده در دنیای امروز و به ویژه در سازمان ها
○ معرفی فیلم های آموزش داده کاوی و یادگیری ماشین فرادرس
○ آناتومی داده چیست؟
○ انواع داده چیست و داده ها چه کاربردهایی دارند؟
○ داده چگونه ذخیره سازی می شود؟
○ چرخه پردازش داده چیست ؟
○ تحلیل داده چیست و چگونه داده را تجزیه و تحلیل می کنیم؟
○ داده کاوی چیست ؟
○ تفاوت داده کاوی با تحلیل داده چیست ؟
○ فراکافت داده چیست و چه تفاوتی با تحلیل داده دارد؟
○ علم داده چیست ؟
○ مشاغل مرتبط با داده چیست و برترین دلایل برای تبدیل شدن به دانشمند داده چه هستند؟
○ چالش وجود نام های مختلف برای مفاهیم یکسان در حوزه علم داده و برنامه نویسی
○ جمع‌بندی


🔸 داده چیست ؟

داده انواع مختلفی از اطلاعات خام است که معمولاً به شکل خاصی قالب‌بندی (فرمت‌بندی) می‌شود. گاهی به موارد جمع‌آوری شده‌ای که هنوز هیچ تغییری روی آن‌ها انجام نشده است داده می‌گویند و گاهی هم پس از انجام برخی تغییرات، سازمان‌دهی‌ها و ساختاردهی‌ها همچنان به آن‌ها داده گفته می‌شود. در اصل مفهوم «داده» و «اطلاعات» با هم تفاوت دارند، اما معمولاً این دو اصطلاح را به جای هم استفاده می‌کنند. تمام نرم‌افزارها به دو بخش اصلی «برنامه‌ها» (Program) و «داده» (Data) تقسیم می‌شوند. برنامه‌ها مجموعه‌هایی از دستورالعمل‌هایی هستند که از آن‌ها برای تغییر دادن و کار روی داده‌ها استفاده می‌شود.



مطالعه ادامه مطلب 👇👇

🔗 داده چیست؟ — به زبان ساده + توضیح اهمیت و کاربرد — کلیک کنید (+)

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
1

✳️ انتخاب دو وضعیتی و تحلیل آماری | پیاده سازی در R

اغلب لازم است بین دو وضعیت یا موقعیت، دست به انتخاب بزنیم. این که کدام انتخاب، صحیح و به واقعیت نزدیک‌تر است، یک امر عقلانی است. ولی اگر با پدیده‌های تصادفی سروکار داشته باشیم و لازم باشد احتمال قرارگیری هر شی را در گروه A یا در گروه B برآورد یا مورد آزمون قرار دهیم، احتیاج به یک بررسی آماری داریم. در این نوشتار از مجله فرادرس به بررسی انتخاب دو وضعیتی و تحلیل آماری آن خواهیم پرداخت. البته در این بین از کدهای نوشته شده به زبان R نیز  استفاده کرده و در محیط RStudio برنامه‌ها را ایجاد و پس از اجرا، نتایج را مشاهده خواهیم کرد.

══ فهرست مطالب ══

○ انتخاب دو وضعیتی و تحلیل آماری
○ خلاصه و جمع‌بندی


🔸 انتخاب دو وضعیتی و تحلیل آماری

هدف این مقاله ارائه راهنمایی در مورد چگونگی انجام تجزیه و تحلیل نتایج نمونه آزمایشی A / B با استفاده از R و همچنین ارزیابی نتایج و نتیجه‌گیری بر اساس تجزیه و تحلیل آماری است. قبل از شروع، بهتر است که مشخص کنیم، منظور از آزمایش A / B چیست و به طور معمول برای چه مواردی استفاده می‌شود و البته در انتها نیز به برخی از محدودیت‌های آن اشاره خواهیم کرد.

آزمون A / B که به عنوان «تست تفکیک» (Split Test) نیز شناخته می‌شود، یک روش کلی است که به کمک آن محصول یا ویژگی جدیدی را مورد آزمایش قرار می‌دهند. هدف این است که یک آزمایش قوی طراحی شود و نتایج قابل تکرار داشته باشد تا تصمیمی آگاهانه یا الگویی برای انتخاب یا رد فراهم شود.


🔸 خلاصه و جمع‌بندی

در این نوشتار به بررسی نحوه به کارگیری آزمون‌های آماری برای یک تست A / B پرداختیم و به این ترتیب به کدنویسی در محیط R، انتخاب دو وضعیتی و تحلیل آماری را به کار بردیم. البته در این بین استفاده از آزمون‌های آماری و تفسیر نتایج از محاسبات مربوطه، ما را در جهت اندازه‌گیری خطای انتخاب نیز یاری رساندند. رسم نمودار و همچنین مشخص کردن فاصله اطمینان برای پارامتر جامعه‌ها، در شناخت آزمون و همچنین نتیجه‌گیری در رد فرص صفر نیز موثر بوده و حاصل آزمون آماری را تایید کردند.



مطالعه ادامه مطلب 👇👇

🔗 انتخاب دو وضعیتی و تحلیل آماری | پیاده سازی در R — کلیک کنید (+)

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس

✳️ آنالیز کلان داده و ساختار شبکه اجتماعی — آشنایی با اصطلاحات و مثال عملی

با انفجار اطلاعات و افزایش داده‌هایی که روزانه از منابع مختلف تولید می‌شود، با پدیده جدیدی به نام «کلان داده» (Big Data) یا «مِه داده» مواجه شده‌ایم. لازم است که ابزارهای مناسب برای ثبت و نگهداری و همچنین تحلیل چنین حجم عظیمی از داده‌ها را داشته باشیم. پیشرفت دستگاه‌های محاسباتی و بوجود آمدن «رایانش ابری» (Cloud Computing) دسترسی به این داده‌ها و پردازش آن‌ها را در زمان کوتاه میسر ساخته است. بنابراین مسائلی مانند نمونه‌گیری که در آمار برای جلوگیری از بررسی همه جامعه آماری به وجود آمده، دیگر لزومی نداشته باشد. به همین جهت در این نوشتار از مجله فرادرس به بررسی روش آنالیز کلان داده و ساختار شبکه پرداخته‌ایم. در این بین به تکنیک شبکه‌ای کردن و ارتباط گره‌ها اشاره کرده و مثال‌های عینی نتایج را مورد بررسی قرار داده‌ایم.

══ فهرست مطالب ══

○ آنالیز کلان داده و ساختار شبکه اجتماعی
○ آنالیز کلان داده و تحلیل شبکه‌های اجتماعی
○ خلاصه و جمع‌بندی


🔸 آنالیز کلان داده و ساختار شبکه اجتماعی

داده های بزرگ یا «مِه داده» (Big data) زمینه‌ای است که روش‌های تجزیه و تحلیل، استخراج سیستماتیک اطلاعات و محاسبه روی حجم عظیمی از داده‌ها را میسر می‌کند. در اغلب موارد نمی‌توان با نرم افزارهای کاربردی پردازش داده سنتی کلان داده (Big Data) را پردازش کرد. این گونه داده‌ها اگر به ساختار جدولی ثبت شوند، دارای ستون‌ها (فیلدها) و سطرها (رکوردها) زیادی خواهند بود.

چالش‌های آنالیز کلان داده‌ شامل «دریافت داده‌ها» (capturing data)، «ذخیره داده ها» (data storage)، «تجزیه و تحلیل داده‌ها» (data analysis)، «جستجو» (search)، «به اشتراک گذاری» (sharing)، «انتقال» (transfer)، «مصورسازی» (Visualization)، «پرس و جو» (querying)، «به روزرسانی» (updating)، «حریم خصوصی اطلاعات و منبع داده» (information privacy) است.





مطالعه ادامه مطلب 👇👇

🔗 آنالیز کلان داده و ساختار شبکه اجتماعی — آشنایی با اصطلاحات و مثال عملی — کلیک کنید (+)

📌 کانال اختصاصی آموزشی علم داده

آخرین مطالب علمی، مقالات رایگان و ویدئوهای آموزشی علم داده را در کانال اختصاصی [@Fara_DS] دنبال کنید. 👇

@Fara_DS — مطالب و آموزش‌های علم داده فرادرس
👍21