۵. در نهایت به پوشه خروجی میرویم و نتیجه را مشاهده می کنیم. در این پوشه ۲ فایل وجود دارد که در تصویر زیر مشاهده می کنید.
نتیجه برنامه ما در فایل part-r-00000 قرار دارد. اگر این فایل را با یک برنامه ویرایشگر متنی باز میکنیم نتیجه را به این صورت مشاهده می کنیم:
1
2
3
4
5
6
Bye 1
Hello 1
Jahan 2
Khodahafez 1
Salam 1
World 2
این خروجی حاکی از اجرای درست برنامه MapReduce ما دارد. اجرای این برنامه بر روی یک کامپیوتر رزبری پای با پردازنده ۷۰۰ مگاهرتز و ۵۱۲ مگابایت حافظه رم ، به مدت 603 میلی ثانیه طول کشید.
منبع : مرجع هدوپ ایران
1
2
3
4
5
6
Bye 1
Hello 1
Jahan 2
Khodahafez 1
Salam 1
World 2
این خروجی حاکی از اجرای درست برنامه MapReduce ما دارد. اجرای این برنامه بر روی یک کامپیوتر رزبری پای با پردازنده ۷۰۰ مگاهرتز و ۵۱۲ مگابایت حافظه رم ، به مدت 603 میلی ثانیه طول کشید.
منبع : مرجع هدوپ ایران
دوستان عزیز پیشنهاد میکنم جهت آشنایی با تازه های رایانش ابری حتما ویژه نامه رصد را مطالعه بفرمایید☝️
برای جذب افراد جذاب، باید جذاب باشید.
برای جذب افراد قوی باید قوی باشید.
برای جذب افراد متعهد باید متعهد باشید.
به جای اینکه بخواهید روی انها تاثیر بگذارید، روی خودتان تاثیر بگذارید.
اگر شایسته باشید، می توانید جذب کنید.
با سلام و صبح بخیر خدمت سروران عزیز.🌞
امروز با یاد پروردگار مهربان با مطالب پیرامون معماری برای تحلیل کلان داده ها در خدمت شما هستم.
با تشکر از توجه شما 🌷
گلناز اردشیری
@BigDataTechnology
برای جذب افراد قوی باید قوی باشید.
برای جذب افراد متعهد باید متعهد باشید.
به جای اینکه بخواهید روی انها تاثیر بگذارید، روی خودتان تاثیر بگذارید.
اگر شایسته باشید، می توانید جذب کنید.
با سلام و صبح بخیر خدمت سروران عزیز.🌞
امروز با یاد پروردگار مهربان با مطالب پیرامون معماری برای تحلیل کلان داده ها در خدمت شما هستم.
با تشکر از توجه شما 🌷
گلناز اردشیری
@BigDataTechnology
معماری برای تحلیل کلان داده ها :
تحلیل Real-Time در مقابل تحلیل off-line
تحلیل در سطوح مختلف
تحلیل با پیچیدگی متفاوت
در ادامه هر کدام را با هم بررسی خواهیم کرد.
@BigDataTechnology
تحلیل Real-Time در مقابل تحلیل off-line
تحلیل در سطوح مختلف
تحلیل با پیچیدگی متفاوت
در ادامه هر کدام را با هم بررسی خواهیم کرد.
@BigDataTechnology
تحلیل Real-Time :
وقتی داده های پیوسته در حال تغییر هستند، تحلیل سریع داده نیاز است و نتیجه با تاخیر خیلی کوتاه باید برگردد.
انواع معماری موجود :
1- خوشه های پردازشی با استفاده از پایگاه داده رابطه سنتی
2- سکوی محاسباتی مبتنی بر حافظه
مورد استفاده : تجارت الکترونیک و امور مالی
مثال : Greenplum از EMC و hana از SAP
منبع : کتاب کلان داده ها ترجمه دکتر امیر مسعود رحمانی
وقتی داده های پیوسته در حال تغییر هستند، تحلیل سریع داده نیاز است و نتیجه با تاخیر خیلی کوتاه باید برگردد.
انواع معماری موجود :
1- خوشه های پردازشی با استفاده از پایگاه داده رابطه سنتی
2- سکوی محاسباتی مبتنی بر حافظه
مورد استفاده : تجارت الکترونیک و امور مالی
مثال : Greenplum از EMC و hana از SAP
منبع : کتاب کلان داده ها ترجمه دکتر امیر مسعود رحمانی
تحلیل off- line :
معمولا برای کاربردهایی که احتیاج به زمان پاسخ سریع ندارند استفاده میشود.
مثل :
تحلیل آماری
الگوریتم های توصیه گر
بسیاری از شرکت های اینترنتی از این معماری مبتنی بر هدوپ برای کاهش هزینه ی تبدیل قالب داده ها و بهبود کارایی اکتساب داده ها استفاده میکنند.
معمولا برای کاربردهایی که احتیاج به زمان پاسخ سریع ندارند استفاده میشود.
مثل :
تحلیل آماری
الگوریتم های توصیه گر
بسیاری از شرکت های اینترنتی از این معماری مبتنی بر هدوپ برای کاهش هزینه ی تبدیل قالب داده ها و بهبود کارایی اکتساب داده ها استفاده میکنند.
ذهن شما مانند چتر نجات است،
تنها هنگامی که باز شود ، عمل می کند.💡
سلام و درود فراوان بر همراهان عزیز بیگ دیتا🌷
امروز با یاد پروردگار مطالب معماری تحلیل کلان داده ها را ادامه خواهیم داد.🙏
با تشکر از توجه شما ⛄
گلناز اردشیری
@BigDataTechnology
تنها هنگامی که باز شود ، عمل می کند.💡
سلام و درود فراوان بر همراهان عزیز بیگ دیتا🌷
امروز با یاد پروردگار مطالب معماری تحلیل کلان داده ها را ادامه خواهیم داد.🙏
با تشکر از توجه شما ⛄
گلناز اردشیری
@BigDataTechnology
عرضه پلتفرم متنباز اینتل مخصوص تحلیل کلان دادهها
ایتنا - سیستم TAP انواع مختلف الگوریتمها، ابزارها و موتورهای هوشمند را برای تحلیل و یکپارچه سازی کلان دادهها در خود جا داده است.
شرکت اینتل نمونه اولیه سیستم جدیدی را با نام Trusted Analytics Platform ارائه کرد و توضیح داد این پلتفرم مجموعهای از ابزارهای متنباز محسوب میشود که برای پیادهسازی آسان پروژههای کلان داده در سازمانها ارائه شده است.
به گزارش ایتنا از رایورز به نقل از زد.دی.نت، سیستم Trusted Analytics Platform که با نام اختصاری TAP هم شناخته میشود، در ماه آگوست از سال جاری میلادی در «فروم توسعهدهندگان اینتل» معرفی شد. سپس «ران کاسابیان» مدیر مرکز کلان دادههای اینتل در کنفرانس Strata + Hadoop World که در نیویورک برگزار شده بود، جزئیات بیشتری از آن را ارائه کرد.
سیستم TAP انواع مختلف الگوریتمها، ابزارها و موتورهای هوشمند را برای تحلیل و یکپارچه سازی کلان دادهها در خود جا داده است. این نرمافزار که به صورت متن باز ساخته شده است، با معماری اینتل و سختافزارهای ساخته شده در این شرکت سازگاری دارد.
سیستم TAP بخشهای زیر را شامل میشود:
- یک لایه دادهای که سیستمهای Apache Hadoop و Spark را برای سختافزارهای اینتل در خود جا داده است
- یک لایه تحلیلی باز که میتواند از رابطهای برنامهنویسی نرمافزاری برای پیشبینیهای سازمانی پشتیبانی کند
- قابلیت ویژه برای پشتیبانی از ابزارهای مخصوص فضای پردازش ابری
کاسابیان در مصاحبه اخیر خود توضیح داد که اینتل سری مختلف ابزارهای مخصوص کلان داده را با سیستم TAP سازگار کرده است تا امکان استقرار آسان آن در سازمانهای مختلف فراهم شود.
اینتل که بزرگترین تولیدکننده تراشههای رایانهای در جهان محسوب میشود، سازگاری با اکوسیستم کلان دادهها و سیستمهای پردازش ابری را مهمترین اولویت خود برای حضور در بازارهای رقابتی میداند.
ایتنا - سیستم TAP انواع مختلف الگوریتمها، ابزارها و موتورهای هوشمند را برای تحلیل و یکپارچه سازی کلان دادهها در خود جا داده است.
شرکت اینتل نمونه اولیه سیستم جدیدی را با نام Trusted Analytics Platform ارائه کرد و توضیح داد این پلتفرم مجموعهای از ابزارهای متنباز محسوب میشود که برای پیادهسازی آسان پروژههای کلان داده در سازمانها ارائه شده است.
به گزارش ایتنا از رایورز به نقل از زد.دی.نت، سیستم Trusted Analytics Platform که با نام اختصاری TAP هم شناخته میشود، در ماه آگوست از سال جاری میلادی در «فروم توسعهدهندگان اینتل» معرفی شد. سپس «ران کاسابیان» مدیر مرکز کلان دادههای اینتل در کنفرانس Strata + Hadoop World که در نیویورک برگزار شده بود، جزئیات بیشتری از آن را ارائه کرد.
سیستم TAP انواع مختلف الگوریتمها، ابزارها و موتورهای هوشمند را برای تحلیل و یکپارچه سازی کلان دادهها در خود جا داده است. این نرمافزار که به صورت متن باز ساخته شده است، با معماری اینتل و سختافزارهای ساخته شده در این شرکت سازگاری دارد.
سیستم TAP بخشهای زیر را شامل میشود:
- یک لایه دادهای که سیستمهای Apache Hadoop و Spark را برای سختافزارهای اینتل در خود جا داده است
- یک لایه تحلیلی باز که میتواند از رابطهای برنامهنویسی نرمافزاری برای پیشبینیهای سازمانی پشتیبانی کند
- قابلیت ویژه برای پشتیبانی از ابزارهای مخصوص فضای پردازش ابری
کاسابیان در مصاحبه اخیر خود توضیح داد که اینتل سری مختلف ابزارهای مخصوص کلان داده را با سیستم TAP سازگار کرده است تا امکان استقرار آسان آن در سازمانهای مختلف فراهم شود.
اینتل که بزرگترین تولیدکننده تراشههای رایانهای در جهان محسوب میشود، سازگاری با اکوسیستم کلان دادهها و سیستمهای پردازش ابری را مهمترین اولویت خود برای حضور در بازارهای رقابتی میداند.