#business_intelligence
#ETL
🔸گام دوم پیاده سازی BI در سازمان یعنی ETL در واقع فرایندی است که در آن داده ها:
🔺از منابع اطلاعاتی مختلف استخراج و جمع آوری می شوند.
🔺مطابق با قواعد کسب و کار پالایش می شوند.
در این مرحله از عملگرهای مختلفی مانند فیلتر (Filter)، مرتب سازی (Sorting)، تجمیع (Aggregation)، اتصال (Join/ Append)، پاکسازی داده ها (Data Cleansing)، حذف داده های یکسان (Remove Duplicate) و اعتبارسنجی داده ها (Data Validation) استفاده می کنیم.
🔺در نهایت در یک انبار داده ذخیره می شوند.
🔸برای نمونه اگر قصد داریم که یک پروژه مصورسازی را با PowerBI انجام دهیم، با استفاده از کامپوننت Power Query Editor، فرایند ETL به صورت کامل روی داده ها انجام می شود. سرویس یکپارچه سازی SQL Server (SSIS) و زبان TSQL نیز به ما در فرایند ETL کمک می کنند. همچنین از زبان های برنامه نویسی Python و R در فاز پالایش داده می توانیم استفاده کنیم.
📚@BigDataServe
#ETL
🔸گام دوم پیاده سازی BI در سازمان یعنی ETL در واقع فرایندی است که در آن داده ها:
🔺از منابع اطلاعاتی مختلف استخراج و جمع آوری می شوند.
🔺مطابق با قواعد کسب و کار پالایش می شوند.
در این مرحله از عملگرهای مختلفی مانند فیلتر (Filter)، مرتب سازی (Sorting)، تجمیع (Aggregation)، اتصال (Join/ Append)، پاکسازی داده ها (Data Cleansing)، حذف داده های یکسان (Remove Duplicate) و اعتبارسنجی داده ها (Data Validation) استفاده می کنیم.
🔺در نهایت در یک انبار داده ذخیره می شوند.
🔸برای نمونه اگر قصد داریم که یک پروژه مصورسازی را با PowerBI انجام دهیم، با استفاده از کامپوننت Power Query Editor، فرایند ETL به صورت کامل روی داده ها انجام می شود. سرویس یکپارچه سازی SQL Server (SSIS) و زبان TSQL نیز به ما در فرایند ETL کمک می کنند. همچنین از زبان های برنامه نویسی Python و R در فاز پالایش داده می توانیم استفاده کنیم.
📚@BigDataServe
Forwarded from آرمان بهنام (BigDataServe)
📣 دوره آنلاین جامع یادگیری عمیق و هوش تجاری جهاد دانشگاهی علم و صنعت
📌۸۵ ساعت آموزش به همراه رفع اشکال و پرسش و پاسخ با اساتید دوره
⏰کد ۱: پنجشنبه ها و جمعه ها ۹ تا ۱۲
⏰کد ۲: پنجشنبه ها و جمعه ها ۱۵ تا ۱۸
📅 ۱ آبان ماه لغایت ۱۰ بهمن ماه ۱۳۹۹
🚫 ۱۵ درصد تخفیف برای اعضای این کانال
🔐انجام پروژه های واقعی متناسب با بازار کار
📋مدرک معتبر و قابل ترجمه جهاد دانشگاهی جهت ادامه تحصیل در خارج از کشور
🎁 بازگشت شهریه نفر اول دوره
🔴برای کسب اطلاعات بیشتر پیرامون دوره، کدهای تخفیف، رزومه اساتید و ریز سرفصل ها میتوانید به لینک زیر مراجعه فرمایید:
http://www.armanbehnam.com/about-me/education/jd-dl-bi
🔴 لینک ثبت نام کد ۱ پنجشنبه ها و جمعه ها ۹ تا ۱۲
http://www.jdrouyesh.ir/reg?rgn=41&cls=343246
🔴 لینک ثبت نام کد ۲ پنجشنبه ها و جمعه ها ۱۵ تا ۱۸
http://www.jdrouyesh.ir/reg?rgn=41&cls=343247
📚@BigDataServe
📌۸۵ ساعت آموزش به همراه رفع اشکال و پرسش و پاسخ با اساتید دوره
⏰کد ۱: پنجشنبه ها و جمعه ها ۹ تا ۱۲
⏰کد ۲: پنجشنبه ها و جمعه ها ۱۵ تا ۱۸
📅 ۱ آبان ماه لغایت ۱۰ بهمن ماه ۱۳۹۹
🚫 ۱۵ درصد تخفیف برای اعضای این کانال
🔐انجام پروژه های واقعی متناسب با بازار کار
📋مدرک معتبر و قابل ترجمه جهاد دانشگاهی جهت ادامه تحصیل در خارج از کشور
🎁 بازگشت شهریه نفر اول دوره
🔴برای کسب اطلاعات بیشتر پیرامون دوره، کدهای تخفیف، رزومه اساتید و ریز سرفصل ها میتوانید به لینک زیر مراجعه فرمایید:
http://www.armanbehnam.com/about-me/education/jd-dl-bi
🔴 لینک ثبت نام کد ۱ پنجشنبه ها و جمعه ها ۹ تا ۱۲
http://www.jdrouyesh.ir/reg?rgn=41&cls=343246
🔴 لینک ثبت نام کد ۲ پنجشنبه ها و جمعه ها ۱۵ تا ۱۸
http://www.jdrouyesh.ir/reg?rgn=41&cls=343247
📚@BigDataServe
Forwarded from آرمان بهنام (آرمان بهنام)
#course #coursera #nlp
یکی از مهمترین و به روز ترین مباحث در هوش مصنوعی و علم داده، پردازش زبان طبیعی می باشد. برای همین یکی از معتبر ترین دوره های این زمینه را در لینک زیر تحلیل کرده ام که از دوره های سایت کورسرا و جزء مجموعه دوره های مهارت یادگیری ماشین پیشرفته می باشد.
تحلیل و بررسی محتوای دوره :
http://www.armanbehnam.com/about-me/education/nlp-hse/
📪محتوای این پست در لینکدین :
https://bit.ly/30EdtD9
🔊 اسلایدها و فایل های این دوره در گیت هاب
https://plink.ir/ph6cg
______
📚@BigDataServe
یکی از مهمترین و به روز ترین مباحث در هوش مصنوعی و علم داده، پردازش زبان طبیعی می باشد. برای همین یکی از معتبر ترین دوره های این زمینه را در لینک زیر تحلیل کرده ام که از دوره های سایت کورسرا و جزء مجموعه دوره های مهارت یادگیری ماشین پیشرفته می باشد.
تحلیل و بررسی محتوای دوره :
http://www.armanbehnam.com/about-me/education/nlp-hse/
📪محتوای این پست در لینکدین :
https://bit.ly/30EdtD9
🔊 اسلایدها و فایل های این دوره در گیت هاب
https://plink.ir/ph6cg
______
📚@BigDataServe
Media is too big
VIEW IN TELEGRAM
#machinelearning
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت چهاردهم - انتخاب رکوردها با تعریف شروطی خاص
📚@BigDataServe
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت چهاردهم - انتخاب رکوردها با تعریف شروطی خاص
📚@BigDataServe
#business_intelligence
#ETL
🔸در گام دوم از پیاده سازی هوش تجاری در سازمان هدف، پالایش داده ها قبل از استفاده آنها برای مدلسازی داده ها و ساخت داشبوردهای مدیریتی است.
بعد از آن که داده های مورد نیاز در مرحله Extract از منابع اطلاعاتی مختلف استخراج شدند، کل عملیات تبدیل و پالایش داده ها (Transform) در یک محیط واسط به نام محل استقرار (Staging Area) انجام می شود. در آخرین مرحله از ETL، باید داده های پالایش شده از منابع مختلف در انبارداده بارگذاری شوند.
📚@BigDataServe
#ETL
🔸در گام دوم از پیاده سازی هوش تجاری در سازمان هدف، پالایش داده ها قبل از استفاده آنها برای مدلسازی داده ها و ساخت داشبوردهای مدیریتی است.
بعد از آن که داده های مورد نیاز در مرحله Extract از منابع اطلاعاتی مختلف استخراج شدند، کل عملیات تبدیل و پالایش داده ها (Transform) در یک محیط واسط به نام محل استقرار (Staging Area) انجام می شود. در آخرین مرحله از ETL، باید داده های پالایش شده از منابع مختلف در انبارداده بارگذاری شوند.
📚@BigDataServe
#business_intelligence
#ETL
🔸تغییر و پالایش داده ها شامل موارد زیر است:
🔺بررسی کیفیت داده ها: کیفیت داده ها به وسیله پرسش هایی از قبیل سوالات زیر مورد بررسی قرار می گیرند.
۱) آیا داده های گمشده در داده وجود دارند؟ اگر اینگونه است آنها چگونه نمایش داده می شوند؟
۲) داده ها صحیح هستند یا اشتباهاتی دارند؟ اگر اشتباه هستند علت چیست؟
۳) آیا داده ها کامل هستند؟ موارد مورد نیاز ما را پوشش می دهند؟
🔺پاکسازی داده ها: بالا بردن کیفیت داده ها نیازمند انتخاب تکنیک آنالیز است. این انتخاب شامل پاک کردن زیر مجموعه ای از داده های نامناسب و درج پیش فرض های مناسب می باشد.
🔺شکل دادن داده ها: این قسمت شامل عملیات ویژه ای مانند ایجاد خصوصیات مشتق شده، ایجاد رکوردهای جدید و کامل یا مقادیر تبدیل شده از خصوصیات موجود می باشد.
🔺ادغام داده ها: روش هایی وجود دارد که به وسیله آن ها اطلاعات از چند جدول ترکیب شده و این ترکیب می تواند به صورت افقی (Join) یا عمودی (Append) باشد.
🔺قالب بندی داده ها: منظور از قالب بندی داده ها، تغییر و تبدیل قواعد اولیه داده مورد نیاز برای مدلسازی می باشد.
📚@BigDataServe
#ETL
🔸تغییر و پالایش داده ها شامل موارد زیر است:
🔺بررسی کیفیت داده ها: کیفیت داده ها به وسیله پرسش هایی از قبیل سوالات زیر مورد بررسی قرار می گیرند.
۱) آیا داده های گمشده در داده وجود دارند؟ اگر اینگونه است آنها چگونه نمایش داده می شوند؟
۲) داده ها صحیح هستند یا اشتباهاتی دارند؟ اگر اشتباه هستند علت چیست؟
۳) آیا داده ها کامل هستند؟ موارد مورد نیاز ما را پوشش می دهند؟
🔺پاکسازی داده ها: بالا بردن کیفیت داده ها نیازمند انتخاب تکنیک آنالیز است. این انتخاب شامل پاک کردن زیر مجموعه ای از داده های نامناسب و درج پیش فرض های مناسب می باشد.
🔺شکل دادن داده ها: این قسمت شامل عملیات ویژه ای مانند ایجاد خصوصیات مشتق شده، ایجاد رکوردهای جدید و کامل یا مقادیر تبدیل شده از خصوصیات موجود می باشد.
🔺ادغام داده ها: روش هایی وجود دارد که به وسیله آن ها اطلاعات از چند جدول ترکیب شده و این ترکیب می تواند به صورت افقی (Join) یا عمودی (Append) باشد.
🔺قالب بندی داده ها: منظور از قالب بندی داده ها، تغییر و تبدیل قواعد اولیه داده مورد نیاز برای مدلسازی می باشد.
📚@BigDataServe
Media is too big
VIEW IN TELEGRAM
#machinelearning
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت پانزدهم - انتخاب ستون های ویژگی و ستون هدف در دیتاست
📚@BigDataServe
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت پانزدهم - انتخاب ستون های ویژگی و ستون هدف در دیتاست
📚@BigDataServe
Forwarded from آرمان بهنام (Taha)
2018_Book_IntroductionToDeepLearning.pdf
2.5 MB
#deeplearning
📝یکی از انواع پرکاربرد شبکههای عصبی، شبکه عصبی پرسپترون میباشد. در این شبکه وزنها و بایاسها میتوانند برای تولید یک هدف مشخص، آموزش داده شوند.
📙قوانین یادگیری مورد استفاده در این راستا را قوانین آموزش پرسپترون مینامند. شبکههای پرسپترون از آن جهت که توانایی مناسبی برای تکامل بهوسیله بردارهای ورودی دارند، بسیار شایان توجه میباشند.
🔖این شبکهها مخصوصاً در حل مسائل ساده طبقهبندی بسیار مناسب میباشند. این نوع شبکه عصبی در حل مسائل، بسیار سریع و قابلاطمینان است.
🖍نورون پرسپترون در صورتی که مقدار ورودی به تابع انتقال آن بیشتر از صفر باشد، مقدار 1 و در صورتی که مقدار ورودی به تابع انتقال آن کمتر از صفر باشد، مقدار صفر را تولید مینماید. تابع انتقال hardlimit به پرسپترون این امکان را میدهد که بردارهای ورودی را به دو ناحیه در فضا تقسیم نماید. اگر ورودی n کمتر از صفر باشد، ناحیه به عدد صفر و در غیر این صورت به عدد 1، نگاشت میشود.
___________
📚@Bigdataserve
📝یکی از انواع پرکاربرد شبکههای عصبی، شبکه عصبی پرسپترون میباشد. در این شبکه وزنها و بایاسها میتوانند برای تولید یک هدف مشخص، آموزش داده شوند.
📙قوانین یادگیری مورد استفاده در این راستا را قوانین آموزش پرسپترون مینامند. شبکههای پرسپترون از آن جهت که توانایی مناسبی برای تکامل بهوسیله بردارهای ورودی دارند، بسیار شایان توجه میباشند.
🔖این شبکهها مخصوصاً در حل مسائل ساده طبقهبندی بسیار مناسب میباشند. این نوع شبکه عصبی در حل مسائل، بسیار سریع و قابلاطمینان است.
🖍نورون پرسپترون در صورتی که مقدار ورودی به تابع انتقال آن بیشتر از صفر باشد، مقدار 1 و در صورتی که مقدار ورودی به تابع انتقال آن کمتر از صفر باشد، مقدار صفر را تولید مینماید. تابع انتقال hardlimit به پرسپترون این امکان را میدهد که بردارهای ورودی را به دو ناحیه در فضا تقسیم نماید. اگر ورودی n کمتر از صفر باشد، ناحیه به عدد صفر و در غیر این صورت به عدد 1، نگاشت میشود.
___________
📚@Bigdataserve
Media is too big
VIEW IN TELEGRAM
#machinelearning
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت شانزدهم - ایجاد داده های آموزش و آزمایش و انتخاب مدل
📚@BigDataServe
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت شانزدهم - ایجاد داده های آموزش و آزمایش و انتخاب مدل
📚@BigDataServe
📣 دوره آنلاین جامع یادگیری عمیق و هوش تجاری جهاد دانشگاهی علم و صنعت
📌۸۵ ساعت آموزش به همراه رفع اشکال و پرسش و پاسخ با اساتید دوره
⏰کد ۱: پنجشنبه ها و جمعه ها ۹ تا ۱۲
⏰کد ۲: پنجشنبه ها و جمعه ها ۱۵ تا ۱۸
📅 ۸ آبان ماه لغایت ۱۶ بهمن ماه ۱۳۹۹
🔐انجام پروژه های واقعی متناسب با بازار کار
📋مدرک معتبر و قابل ترجمه جهاد دانشگاهی جهت ورود به بازار کار و ادامه تحصیل در خارج از کشور
🎁 بازگشت شهریه نفر اول دوره
🔴برای کسب اطلاعات بیشتر پیرامون دوره، کدهای تخفیف، رزومه اساتید و ریز سرفصل ها میتوانید به لینک زیر مراجعه فرمایید:
http://www.armanbehnam.com/about-me/education/jd-dl-bi
🔴 لینک ثبت نام کد ۱ پنجشنبه ها و جمعه ها ۹ تا ۱۲
http://www.jdrouyesh.ir/reg?rgn=41&cls=343246
🔴 لینک ثبت نام کد ۲ پنجشنبه ها و جمعه ها ۱۵ تا ۱۸
http://www.jdrouyesh.ir/reg?rgn=41&cls=343247
📚@BigDataServe
📌۸۵ ساعت آموزش به همراه رفع اشکال و پرسش و پاسخ با اساتید دوره
⏰کد ۱: پنجشنبه ها و جمعه ها ۹ تا ۱۲
⏰کد ۲: پنجشنبه ها و جمعه ها ۱۵ تا ۱۸
📅 ۸ آبان ماه لغایت ۱۶ بهمن ماه ۱۳۹۹
🔐انجام پروژه های واقعی متناسب با بازار کار
📋مدرک معتبر و قابل ترجمه جهاد دانشگاهی جهت ورود به بازار کار و ادامه تحصیل در خارج از کشور
🎁 بازگشت شهریه نفر اول دوره
🔴برای کسب اطلاعات بیشتر پیرامون دوره، کدهای تخفیف، رزومه اساتید و ریز سرفصل ها میتوانید به لینک زیر مراجعه فرمایید:
http://www.armanbehnam.com/about-me/education/jd-dl-bi
🔴 لینک ثبت نام کد ۱ پنجشنبه ها و جمعه ها ۹ تا ۱۲
http://www.jdrouyesh.ir/reg?rgn=41&cls=343246
🔴 لینک ثبت نام کد ۲ پنجشنبه ها و جمعه ها ۱۵ تا ۱۸
http://www.jdrouyesh.ir/reg?rgn=41&cls=343247
📚@BigDataServe
#course #coursera #deeplearning
📒اگر به دنبال آموختن یادگیری عمیق برای پردازش تصویر و کاربردهای آن شامل تشخیص و شناسایی صورت، شناسایی پلاک خودرو، تشخیص اشیا از هم و ... هستیم، به سراغ دوره مناسبی در این زمینه یعنی دوره شبکه های عصبی کانوولوشنی سایت کورسرا می رویم که مفاهیم و مراحل را به خوبی گفته و مقالات اخیر را هم بررسی کرده و آن ها را آموزش داده است.
برای شناخت بیشتر این دوره و این زمینه به صفحه زیر بروید.
http://www.armanbehnam.com/about-me/education/coursera-cnn/
📍محتوای این پست در لینکدین :
https://plink.ir/yj6PQ
🔎 اسلاید ها و کدها در گیت هاب :
https://plink.ir/IsD78
___________
📚@BigDataServe
📒اگر به دنبال آموختن یادگیری عمیق برای پردازش تصویر و کاربردهای آن شامل تشخیص و شناسایی صورت، شناسایی پلاک خودرو، تشخیص اشیا از هم و ... هستیم، به سراغ دوره مناسبی در این زمینه یعنی دوره شبکه های عصبی کانوولوشنی سایت کورسرا می رویم که مفاهیم و مراحل را به خوبی گفته و مقالات اخیر را هم بررسی کرده و آن ها را آموزش داده است.
برای شناخت بیشتر این دوره و این زمینه به صفحه زیر بروید.
http://www.armanbehnam.com/about-me/education/coursera-cnn/
📍محتوای این پست در لینکدین :
https://plink.ir/yj6PQ
🔎 اسلاید ها و کدها در گیت هاب :
https://plink.ir/IsD78
___________
📚@BigDataServe
Media is too big
VIEW IN TELEGRAM
#machinelearning
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت هفدهم - انتخاب ویژگی با استفاده از تکنیک Feature Importance
📚@BigDataServe
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت هفدهم - انتخاب ویژگی با استفاده از تکنیک Feature Importance
📚@BigDataServe
A Comprehensive Guide to Machine Learning.pdf
20 MB
#book
#machinelearning
📖کتاب راهنمای جامع یادگیری ماشین
🧷این کتاب که توسط سروش نصیریانی ، گرت توماس و ویلیام وانگ در سال ۲۰۱۸ چاپ شده است ، به شکل جامع در رابطه با انواع مدل های یادگیری ماشینی شامل رگرسیون، شبکه های عصبی، طبقه بندی، خوشه بندی، درخت تصمیم و یادگیری عمیق توضیح داده و تمامی مبانی ریاضی آن ها را مرور کرده است.
💡کسانی که علاقمند به یادگیری مفاهیم الگوریتم ها و مبانی ریاضی آن ها می باشند، این کتاب به شکل بسیار مفیدی این مطالب را ارائه کرده است.
📚@BigDataServe
#machinelearning
📖کتاب راهنمای جامع یادگیری ماشین
🧷این کتاب که توسط سروش نصیریانی ، گرت توماس و ویلیام وانگ در سال ۲۰۱۸ چاپ شده است ، به شکل جامع در رابطه با انواع مدل های یادگیری ماشینی شامل رگرسیون، شبکه های عصبی، طبقه بندی، خوشه بندی، درخت تصمیم و یادگیری عمیق توضیح داده و تمامی مبانی ریاضی آن ها را مرور کرده است.
💡کسانی که علاقمند به یادگیری مفاهیم الگوریتم ها و مبانی ریاضی آن ها می باشند، این کتاب به شکل بسیار مفیدی این مطالب را ارائه کرده است.
📚@BigDataServe
#business_intelligence
#ETL
همه ما کم و بیش با ETL به عنوان یکی از گام های معماری پیاده سازی هوش تجاری در سازمان و کسب و کار آشنا هستیم.
در فرایند ETL داده ها از منابع مختلف جمع آوری شده و پس از تغییرات و تبدیلات مورد نیاز، در انبار داده بارگذاری می شوند. مفهوم Extract و Transform و Load همین است. اما فرآیندی که با ترتیب استخراج، پالایش و بارگذاری انجام می شود ممکن است در مورد داده های حجیم (BigData) به مشکل برخورد کند. در فرایند ELT قسمت بارگذاری و پالایش جابجا شده است. در واقع داده ها از منابع مختلف ابتدا در انبار داده بارگذاری می شوند و سپس در آنجا اگر نیاز باشد عملیات پالایش روی آنها انجام می شود. داده هایی که به صورت NoSQL ذخیره شدند و حجم بالایی دارند، معمولا از روش ELT استفاده می کنند.
📚@BigDataServe
#ETL
همه ما کم و بیش با ETL به عنوان یکی از گام های معماری پیاده سازی هوش تجاری در سازمان و کسب و کار آشنا هستیم.
در فرایند ETL داده ها از منابع مختلف جمع آوری شده و پس از تغییرات و تبدیلات مورد نیاز، در انبار داده بارگذاری می شوند. مفهوم Extract و Transform و Load همین است. اما فرآیندی که با ترتیب استخراج، پالایش و بارگذاری انجام می شود ممکن است در مورد داده های حجیم (BigData) به مشکل برخورد کند. در فرایند ELT قسمت بارگذاری و پالایش جابجا شده است. در واقع داده ها از منابع مختلف ابتدا در انبار داده بارگذاری می شوند و سپس در آنجا اگر نیاز باشد عملیات پالایش روی آنها انجام می شود. داده هایی که به صورت NoSQL ذخیره شدند و حجم بالایی دارند، معمولا از روش ELT استفاده می کنند.
📚@BigDataServe
Media is too big
VIEW IN TELEGRAM
#machinelearning
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت هجدهم - تعریف نقاط برش در الگوریتم درخت تصمیم
📚@BigDataServe
#scikit_learn
🔸دوره آموزش یادگیری ماشین با کتابخانه Scikit-learn
قسمت هجدهم - تعریف نقاط برش در الگوریتم درخت تصمیم
📚@BigDataServe
Forwarded from آرمان بهنام (Taha)
R social network.pdf
34.7 MB
#book
#R
کتاب "داده کاوی با R به همراه تحلیل شبکه های اجتماعی و متن کاوی"
تالیف دکتر بابک تیمورپور
📚@BigDataServe
#R
کتاب "داده کاوی با R به همراه تحلیل شبکه های اجتماعی و متن کاوی"
تالیف دکتر بابک تیمورپور
📚@BigDataServe
#business_intelligence
#datawarehouse
🔸تفاوت پایگاه داده و انبار داده در چیست؟
🔺وظیفه اصلی سیستم های پایگاه داده، پشتیبانی از تراکنش های آنلاین و پردازش پرس و جو است. این سیستم ها، سیستم پردازش تراکنش آنلاین یا OLTP System نامیده می شوند و بیشتر عملیات روزمره یک سازمان را پوشش می دهند.
🔺از سوی دیگر انبار داده که به عنوان نوع خاصی از پایگاه داده معرفی می شود به کاربران خدماتی در نقش تحلیلگر داده و تصمیم گیرنده ارائه می دهد. چنین سیستمی قادر است داده ها را در قالب های گوناگون برای هماهنگی با نیازهای مختلف کاربران، سازماندهی کرده و ارائه دهد. این سیستم ها با نام سیستم های پردازش تحلیلی آنلاین یا OLAP System شناخته می شوند.
📚@BigDataServe
#datawarehouse
🔸تفاوت پایگاه داده و انبار داده در چیست؟
🔺وظیفه اصلی سیستم های پایگاه داده، پشتیبانی از تراکنش های آنلاین و پردازش پرس و جو است. این سیستم ها، سیستم پردازش تراکنش آنلاین یا OLTP System نامیده می شوند و بیشتر عملیات روزمره یک سازمان را پوشش می دهند.
🔺از سوی دیگر انبار داده که به عنوان نوع خاصی از پایگاه داده معرفی می شود به کاربران خدماتی در نقش تحلیلگر داده و تصمیم گیرنده ارائه می دهد. چنین سیستمی قادر است داده ها را در قالب های گوناگون برای هماهنگی با نیازهای مختلف کاربران، سازماندهی کرده و ارائه دهد. این سیستم ها با نام سیستم های پردازش تحلیلی آنلاین یا OLAP System شناخته می شوند.
📚@BigDataServe
#business_intelligence
#datawarehouse
🔸تفاوت بین پایگاه داده و انبار داده را می توان از جنبه های زیر مورد بررسی قرار داد:
🔺مدل داده: از لحاظ مدل های داده ای، پایگاه داده برای مدل OLTP بهینه سازی شده که بر اساس مدل های رابطه ای امکان پردازش تعداد زیادی تراکنش هم روند که اغلب حاوی رکوردهای اندکی هستند را دارد. اما در انبار داده که برای پردازش تحلیلی آنلاین طراحی شدند امکان پردازش تعداد کمی پرس و جو پیچیده بر روی تعداد بسیار زیادی رکورد داده فراهم می شود. سرورهای OLAP هم می توانند رابطه ای باشند (Relational OLAP) و هم چند بُعدی باشند (Multi Dimensional OLAP).
🔺کاربران: از لحاظ کاربران، کاربران پایگاه داده کارمندان دفتری و مسئولان هستند در حالیکه کاربران انبار داده مدیران و تصمیم گیرندگان سازمان هستند.
🔺عملیات قابل اجرا: از لحاظ عملیات قابل اجرا بر روی آنها، عملیاتی که بر روی پایگاه داده ها صورت می گیرد عموماً شامل عملیات به هنگام سازی است در حالیکه عمل خواندن از انبار داده، عمده عملیات قابل اجرا بر روی انبار داده را تشکیل می دهد.
🔺مقدار داده: از لحاظ مقدار داده، مقدار داده های یک پایگاه داده در حدود چند مگابایت تا چند گیگابایت است در حالیکه این مقدار در یک انبار داده در حدود چند گیگابایت تا چند ترابایت می باشد.
📚@BigDataServe
#datawarehouse
🔸تفاوت بین پایگاه داده و انبار داده را می توان از جنبه های زیر مورد بررسی قرار داد:
🔺مدل داده: از لحاظ مدل های داده ای، پایگاه داده برای مدل OLTP بهینه سازی شده که بر اساس مدل های رابطه ای امکان پردازش تعداد زیادی تراکنش هم روند که اغلب حاوی رکوردهای اندکی هستند را دارد. اما در انبار داده که برای پردازش تحلیلی آنلاین طراحی شدند امکان پردازش تعداد کمی پرس و جو پیچیده بر روی تعداد بسیار زیادی رکورد داده فراهم می شود. سرورهای OLAP هم می توانند رابطه ای باشند (Relational OLAP) و هم چند بُعدی باشند (Multi Dimensional OLAP).
🔺کاربران: از لحاظ کاربران، کاربران پایگاه داده کارمندان دفتری و مسئولان هستند در حالیکه کاربران انبار داده مدیران و تصمیم گیرندگان سازمان هستند.
🔺عملیات قابل اجرا: از لحاظ عملیات قابل اجرا بر روی آنها، عملیاتی که بر روی پایگاه داده ها صورت می گیرد عموماً شامل عملیات به هنگام سازی است در حالیکه عمل خواندن از انبار داده، عمده عملیات قابل اجرا بر روی انبار داده را تشکیل می دهد.
🔺مقدار داده: از لحاظ مقدار داده، مقدار داده های یک پایگاه داده در حدود چند مگابایت تا چند گیگابایت است در حالیکه این مقدار در یک انبار داده در حدود چند گیگابایت تا چند ترابایت می باشد.
📚@BigDataServe