متخصصان علم داده ها data scientists – Telegram
متخصصان علم داده ها data scientists
1.42K subscribers
924 photos
165 videos
167 files
381 links
ارتباط با ادمین @IDataScientist
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Download Telegram
آشنایی با مزایا و نحوه بکارگیری سیستم BI

هوش تجاری (Business intelligence یا همان BI) یک اصطلاح کلی است که به تعداد زیادی برنامه و نرم‌افزار مورد استفاده برای پردازش و تحلیل اطلاعات خام یک شرکت اطلاق می‌شود. هوش کسب و کار در واقع از نظام به هم پیوسته‌ی فعالیت‌های مرتبط با همی چون داده کاوی، پردازش تحلیلی آنلاین، تحقیق و گزارش تشکیل شده است. این مقاله را بخوانید تا بیشتر با این مفهوم آشنا شوید.
شرکت‌ها از BI برای بهبود تصمیم‌گیری‌ها، صرفه‌جویی در هزینه‌ها و کشف فرصت‌های تجاری جدید استفاده می‌کنند. BI چیزی فراتر از جمع‌آوری گزارشات و چیزی بیشتر از مجموعه‌ای از ابزارها برای به‌کارگیری هوشمندانه‌ی سیستم‌های تجاری است. مدیران فناوری شرکت‌ها از هوش کسب و کار برای شناسایی عملیات تجاریِ ناقصی که می‌توانند بستر خوبی برای باز‌مهندسی باشند استفاده می‌کنند.

با وجود ابزارهای امروزیِ هوش کسب‌‌ و‌ کار، بهتر است افرادی که در کار تجارت هستند خودشان دست به کار شده و داده‌ها را تحلیل کنند و منتظر گزارش‌های پیچیده‌ی سیستم‌های فناوری اطلاعات نمانند. آزادسازی اطلاعات این امکان را به کاربران می‌دهد که تصمیمات تجاری‌ِشان را با پشتوانه‌ی اعداد قطعی و مشخص بگیرند؛ که در غیر این صورت مجبور می‌شدند تصمیمات‌شان را تنها بر اساس احساس درونی و شایعات اتخاذ کنند.
هر چند هوش تجاری امکانات زیادی فراهم می‌کند اما این محاسبات ممکن است بر اثر چالش‌های تکنیکی یا فرهنگی منحرف شوند. مدیران اجرایی باید از صحیح و کامل بودن داده‌هایی که به برنامه‌های BI وارد می‌شوند اطمینان داشته باشند تا کاربران بتوانند به آن اعتماد کنند.


@aryavisions
هوش تجاری یا Business intelligence
@aryavisions
چه نوع شرکت‌هایی از سیستم‌های هوش کسب‌ و‌ کار استفاده می‌کنند؟

رستوران‌های زنجیره‌ای از مهم‌ترین کاربران نرم‌افزار BI هستند. آنها از BI برای گرفتن تصمیمات راهبردی استفاده می‌کنند؛ تصمیماتی نظیر این که چه محصولات جدیدی را در منو قرار دهند، چه غذاهایی را حذف کنند و کدام شعبه‌های کم درآمد را تعطیل کنند. همچنین از BI برای مسائل تاکتیکی نیز استفاده می‌کنند، مثلا بررسی دوباره‌ی قراردادهایی که با شرکت‌های تأمین‌کننده‌ی مواد اولیه‌ی غذایی دارند یا برای بهبود شیوه‌های ناکارآمدی که تا الان به کار برده می‌شد. با توجه به شیوه‌ی کار عملیاتی رستوران‌های زنجیره‌ای و خاصیت مرکزی بودن سیستم BI برای کمک به آنها در اداره‌ی این کسب و کار، رستوران‌های زنجیره‌ای در صدر لیست همه‌ی صنایعی هستند که از ارزش واقعی این سیستم بهره‌مند می‌شوند.

یکی از اجزای اصلی هوش کسب و کار، تجزیه و تحلیل تجاری است. این عامل برای موفقیت بسیاری از شرکت‌ها در صنایع مختلف از جمله موفقیت تیم‌های ورزشیِ حرفه‌ای مهم است.

@aryavisions
چه نوع شرکت‌هایی از سیستم‌های هوش کسب‌ و‌ کار استفاده می‌کنند؟
@aryavisions
هفت قدم برای راه‌اندازی یک سیستم BI

۱. اطمینان از اینکه پاک‌سازی داده‌ها انجام شده است (حذف داده‌های پِرت، برطرف کردن ناسازگاری‌ها، حذف داده‌های تکراری و…)
۲. آموزش مؤثر کاربران
۳. همه چیز را سریع پیش ببرید و به تدریج تعادل ایجاد کنید. برای تهیه‌ی یک گزارش بی‌نقص وقت‌تان را تلف نکنید. همان طور که کسب و کار به سمت تکامل پیش می‌رود، نیازها هم پیش می‌روند. گزارش‌هایی را که باارزش‌ترین اطلاعات را در اختیار می‌گذارند به سرعت انتخاب کنید و روی آنها کار کنید‌.
۴. تمام تلاش‌تان را انجام دهید تا منبع داده‌های‌تان را از همان اول بسازید. خودتان را با یک استراتژی ناکارآمد برای به دست آوردن داده محدود نکنید.
۵. قبل از شروع کار معنای نرخ بازگشت سرمایه‌گذاری (ROI) را برای خودتان مشخص کنید. میزان سودی که انتظار دارید به دست بیاورید را تعیین کنید و هر فصل یا هر شش ماه یک بار بررسی کنید که تا چه حد این مقدار با واقعیت مطابقت دارد.
۶. بر اهداف کسب‌ و کار تمرکز کنید.
۷. به این دلیل که فکر می‌کنید به نرم‌افزار هوش کسب‌وکار احتیاج دارید آن را نخرید. هوش کسب‌‌وکار را با این ایده راه‌اندازی کنید که اعدادی وجود دارند که شما باید از آنها اطلاع داشته باشید ولی نمی‌دانید کجا باید دنبال آنها بگردید.

@aryavisions
پایگاه داده آپاچی کاساندرا(Apache Cassandra) چیست؟

کاساندرا یک پایگاه داده توزیع شده است. برای اینکه بدانید توزیع شدگی چیست، بهتر است درس سیستم توزیع شده چیست را مطالعه ای داده داشته باشید. این پایگاه داده برای مدیریت کلان داده یا مه داده کاربرد فراوانی دارد. کاساندرا هیچ نقطه خاص خرابی ندارد و به راحتی میتواند بر روی چندین کامپیوتر توزیع شود. این پایگاه داده توسعه پذیر خطی است و دسترس پذیری بالایی دارد. برای درک مفهوم توسعه پذیر خطی میتوانید این درس را مطالعه کنید. کاساندرا برای کار با داده های بسیار بزرگ طراحی شده است تا کاربران بتوانند این داده ها را به راحتی و با سرعت بالا دریافت کنند.در کاساندرا از معماری مستر/اسلیو استفاده نشده است. زیرا در این معماری معمولا گره (سرپرست) به دلیل کارکرد زیاد به گلوگاه سیستم تبدیل می شود. یعنی در صورتی که مستر از کار بیفتد یا کند شود، کل سیستم از کار می افتد یا کند می شود. برای همین در کاساندرا چیزی به نام مستر وجود ندارد و تمامی گره ها(کامپیوترها)ی متصل به هم، مانند یکدیگر رفتار می کنند. داده ها در گره های مختلف تکرارمی شوند. ساختار تکرار و تکثیر در آپاچی کاساندرا مانند شکل زیر است:

در درس آشنایی انواع با پایگاه داده NoSQL بحث کردیم که Cassandra از دسته Column Family Database ها است. این پایگاه داده ها که داده ها را به جای اینکه به صورت سطر به سطر مشاهده کنند، به صورت ستون به ستون مشاهده و ذخیره سازی میکنند، مناسب برای کاربردهایی مانند پردازش داده های بزرگ و BigData هستند. Cassandra از زبان پرس و جویی به نام CQL استفاده میکند که بسیار شبیه SQL است و برنامه نویسانی که میخواهند از SQL به Cassandra مهاجرت کنند، کار زیاد سختی در پیش ندارند.
@aryavisions
آریا ویژن از آپاچی کاساندرا هم استفاده می کند
@aryavisions
مشکلات سیستم bi

خودداری کاربران یکی از موانع بزرگ بر سر راه موفقیت BI است. مشکلات دیگر شامل ناچار شدن به غربال حجم زیادی از داده‌های نامربوط و کیفیت پایین داده‌هاست.
کلید به دست آوردن بینش دقیق از طریق سیستم BI، داده‌های استاندارد است. در هر بررسی BI، داده‌ها مهم‌ترین نقش را دارند. داده‌ها مثل آجرهایی هستند که بینش تجاری را می‌سازند. شرکت‌ها قبل از اینکه شروع به تجزیه و تحلیل کنند و بر اساس بینشی که به دست می‌آورند تصمیم‌گیری کنند، باید منابع داده‌های‌شان را به ترتیبی درست سازماندهی کنند. در غیر این صورت عملکرد آنها برپایه‌ی اطلاعات نادرستی خواهد بود.
مشکل دیگری که ممکن است با آن رو به رو شوید خودِ ابزار‌های BI هستند. هر چند این ابزارها امروزه جای بیشتری برای پیشرفت دارند و کار با آنها برای کاربران آسان‌تر از قبل شده است. هسته‌ی اصلی BI به جای آن که مدیریت روند باشد، هنوز بر پایه‌ی گزارش است؛ البته این وضعیت کم‌کم شروع به تغییر کرده‌ است. مراقب باشید مفهوم هوش کسب‌وکار را با تجزیه‌ و تحلیل تجاری اشتباه نگیرید.
سومین مانعی که بر سر راه استفاده از BI برای دگرگون کردن روند کسب و کار وجود دارد عدم شناخت بیشتر شرکت‌ها از روند کسب و کارشان است. (یا حداقل آن قدر نیست که بتواند به آنها در بهبود این روند کمک کند) شرکت‌ها باید در مورد روندی که انتخاب می‌کنند احتیاط زیادی به خرج دهند. اگر این روند تأثیر مستقیمی بر درآمد نداشته باشد یا کسب‌وکار در جهت استاندارد کردن این روند در شرکت نباشد، ممکن است کل کار BI مختل شود. شرکت‌ها باید همه‌ی فعالیت‌هایی که روند یک کسب و کار مشخص را شکل می‌دهند درک کنند، چگونگی انتقال داده در روندهای مختلف و چگونگی انتقال داده بین کاربران مختلف را درک کنند و بدانند که هر فرد چطور از آنها استفاده می‌کند تا نقش خود را در این روند ایفا کند. اگر آنها می‌خواهند از طریق BI نحوه‌ی کار افراد را بهبود ببخشند باید همه‌ی این موضوعات را قبل از شروع پروژه‌ی BI شناسایی و تحلیل کنند.


@aryavisions
خبر داریم خبر...!
نسخه دسکتاپ Visual Spark Studio منتشر شد!

@aryavisions
محیط نرم افزار جدید Visual Spark Studio

@aryavisions
Visual Spark Studio

یکی از محبوب ترین فریمورک های کلان داده در حال حاضر است. با وجودی که محبوبیت Spark به طور قابل ملاحظه ای افزایش یافته است.
با توجه به اینکه فناوری اطلاعات که به سرعت در حال تغییر است، Spark خود در حال تکامل است و توسعه دهندگان و شرکت های فناوری اطلاعات می توانند برای انجام کارهای چالش برانگیز برای دستیابی به سرعت آن باشند. هرچند که دسترسی متن باز Spark به یک پلتفرم آسان برای آزمایش کمک می کند، منحنی و نیاز به توسعه گسترده، ادغام و تست، برای تولید برنامه های مختلف آماده است.

ویژوال اسپارک استودیو یک راه حل مناسب برای پیچیدگی های درگیر در ساخت برنامه های کاربردی کلاس Enterprise در جرقه برای هر دو حالت دسته ای و جریان است. این یک محصول سبک وزن آزاد و سریع است که هر کسی می تواند آن را دانلود و استفاده کند تا یادگیری و استفاده از جرقه خود را تسریع کند.


@aryavisions
تفاوت اسپارک و https://news.1rj.ru/str/AryaVisions Map Reduce .
5 مزیت استفاده از هدوپ کاهش هزینه، قدرت محاسباتی، مقیاس پذیری، قدرت انعطاف، تقویت حفاظت از داده در پشتیبان گیری .https://news.1rj.ru/str/AryaVisions
در تلگرام آریا ویژن پاسخگوی سوالات شما هستیم
t.me/aryavisions_bot

@aryavisions
یادگیری عمیق با استفاده از اسپارک
https://www.kdnuggets.com/2018/04/deep-learning-apache-spark-part-1.html
در این مقاله که بخش اول ان است به معماری پیاده سازی یادگیری عمیق با استفاده از اسپارک و بازدهی سرعت با حالتهای مختلف اشاره شده است.
https://news.1rj.ru/str/AryaVisions
16 کتابخانه و پلت فرم کدباز درباره یادگیری عمیق
در این مقاله پلت فرم ها و کتابخانه های مطرح مانند تنسورفلو معرفی شده اند.
https://www.kdnuggets.com/2018/04/top-16-open-source-deep-learning-libraries.html
https://news.1rj.ru/str/AryaVisions
محصولی جدید مبتنی بر اینترنت اشیا سامانه هوشمند سرویس مدارس پند
برای کسب اطلاعات بیشتر
https://www.instagram.com/smartpand/