BigData – Telegram
427 subscribers
231 photos
7 videos
75 files
213 links
معرفی کلان داده ها و فناوری های مرتبط

📞ارتباط با ادمین :
فقط روز چهارشنبه ساعت ۲۲ الی ۲۳
@Golnazardeshiri
-
Download Telegram
۵. در نهایت به پوشه خروجی می‌رویم و نتیجه را مشاهده می کنیم. در این پوشه ۲ فایل وجود دارد که در تصویر زیر مشاهده می کنید.
نتیجه برنامه ما در فایل part-r-00000 قرار دارد. اگر این فایل را با یک برنامه ویرایشگر متنی باز میکنیم نتیجه را به این صورت مشاهده می کنیم:

1

2

3

4

5

6

Bye     1

Hello   1

Jahan   2

Khodahafez      1

Salam   1

World   2

این خروجی حاکی از اجرای درست برنامه MapReduce ما دارد. اجرای این برنامه بر روی یک کامپیوتر رزبری پای با پردازنده ۷۰۰ مگاهرتز و ۵۱۲ مگابایت حافظه رم ، به مدت 603 میلی ثانیه طول کشید.

منبع : مرجع هدوپ ایران
Forwarded from Morteza Javan
ویژه نامه رصد فناوری اطلاعات - شماره 5 منتشر شد:
http://press.occc.ir
دوستان عزیز پیشنهاد میکنم جهت آشنایی با تازه های رایانش ابری حتما ویژه نامه رصد را مطالعه بفرمایید☝️
برای جذب افراد جذاب، باید جذاب باشید.
برای جذب افراد قوی باید قوی باشید.
برای جذب افراد متعهد باید متعهد باشید.
به جای اینکه بخواهید روی انها تاثیر بگذارید، روی خودتان تاثیر بگذارید.
اگر شایسته باشید، می توانید جذب کنید.

با سلام و صبح بخیر خدمت سروران عزیز.🌞

امروز با یاد پروردگار مهربان با مطالب پیرامون معماری برای تحلیل کلان داده ها در خدمت شما هستم.

با تشکر از توجه شما 🌷

گلناز اردشیری

@BigDataTechnology
معماری برای تحلیل کلان داده ها :


تحلیل Real-Time در مقابل تحلیل off-line

تحلیل در سطوح مختلف

تحلیل با پیچیدگی متفاوت

در ادامه هر کدام را با هم بررسی خواهیم کرد.

@BigDataTechnology
تحلیل Real-Time :

وقتی داده های پیوسته در حال تغییر هستند، تحلیل سریع داده نیاز است و نتیجه با تاخیر خیلی کوتاه باید برگردد.

انواع معماری موجود :

1- خوشه های پردازشی با استفاده از پایگاه داده رابطه سنتی

2- سکوی محاسباتی مبتنی بر حافظه

مورد استفاده : تجارت الکترونیک و امور مالی

مثال : Greenplum از EMC و hana از SAP

منبع : کتاب کلان داده ها ترجمه دکتر امیر مسعود رحمانی
Greenplum
تحلیل off- line :

معمولا برای کاربردهایی که احتیاج به زمان پاسخ سریع ندارند استفاده میشود.

مثل :

تحلیل آماری
الگوریتم های توصیه گر

بسیاری از شرکت های اینترنتی از این معماری مبتنی بر هدوپ برای کاهش هزینه ی تبدیل قالب داده ها و بهبود کارایی اکتساب داده ها استفاده میکنند.
ذهن شما مانند چتر نجات است،
تنها هنگامی که باز شود ، عمل می کند.💡


سلام و درود فراوان بر همراهان عزیز بیگ دیتا🌷

امروز با یاد پروردگار مطالب معماری تحلیل کلان داده ها را ادامه خواهیم داد.🙏

با تشکر از توجه شما

گلناز اردشیری

@BigDataTechnology
Scribe

یکی از ابزارهای فیسبوک برای تحلیل
معماری مبتنی بر هدوپ
عرضه پلتفرم متن‌باز اینتل مخصوص تحلیل کلان داده‌ها👇👇👇
عرضه پلتفرم متن‌باز اینتل مخصوص تحلیل کلان داده‌ها

ایتنا - سیستم TAP انواع مختلف الگوریتم‌ها، ابزارها و موتورهای هوشمند را برای تحلیل و یکپارچه سازی کلان داده‌ها در خود جا داده است.



شرکت اینتل نمونه اولیه سیستم جدیدی را با نام Trusted Analytics Platform ارائه کرد و توضیح داد این پلتفرم مجموعه‌ای از ابزارهای متن‌باز محسوب می‌شود که برای پیاده‌سازی آسان پروژه‌های کلان داده در سازمان‌ها ارائه شده است.

به گزارش ایتنا از رایورز به نقل از زد.دی.نت، سیستم Trusted Analytics Platform که با نام اختصاری TAP هم شناخته می‌شود، در ماه آگوست از سال جاری میلادی در «فروم توسعه‌دهندگان اینتل» معرفی شد. سپس «ران کاسابیان» مدیر مرکز کلان داده‌های اینتل در کنفرانس Strata + Hadoop World که در نیویورک برگزار شده بود، جزئیات بیشتری از آن را ارائه کرد.

سیستم TAP انواع مختلف الگوریتم‌ها، ابزارها و موتورهای هوشمند را برای تحلیل و یکپارچه سازی کلان داده‌ها در خود جا داده است. این نرم‌افزار که به صورت متن باز ساخته شده است، با معماری اینتل و سخت‌افزارهای ساخته شده در این شرکت سازگاری دارد.

سیستم TAP بخش‌های زیر را شامل می‌شود: 
- یک لایه داده‌ای که سیستم‌های Apache Hadoop و Spark را برای سخت‌افزارهای اینتل در خود جا داده است
- یک لایه تحلیلی باز که می‌تواند از رابط‌های برنامه‌نویسی نرم‌افزاری برای پیش‌بینی‌های سازمانی پشتیبانی کند
- قابلیت ویژه برای پشتیبانی از ابزارهای مخصوص فضای پردازش ابری

کاسابیان در مصاحبه اخیر خود توضیح داد که اینتل سری مختلف ابزارهای مخصوص کلان داده را با سیستم TAP سازگار کرده است تا امکان استقرار آسان آن در سازما‌ن‌های مختلف فراهم شود.

اینتل که بزرگ‌ترین تولیدکننده تراشه‌های رایانه‌ای در جهان محسوب می‌شود، سازگاری با اکوسیستم کلان داده‌ها و سیستم‌های پردازش ابری را مهم‌ترین اولویت خود برای حضور در بازارهای رقابتی می‌داند.