متخصصان علم داده ها data scientists – Telegram
متخصصان علم داده ها data scientists
1.42K subscribers
924 photos
165 videos
167 files
381 links
ارتباط با ادمین @IDataScientist
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Download Telegram
هفت قدم برای راه‌اندازی یک سیستم BI

۱. اطمینان از اینکه پاک‌سازی داده‌ها انجام شده است (حذف داده‌های پِرت، برطرف کردن ناسازگاری‌ها، حذف داده‌های تکراری و…)
۲. آموزش مؤثر کاربران
۳. همه چیز را سریع پیش ببرید و به تدریج تعادل ایجاد کنید. برای تهیه‌ی یک گزارش بی‌نقص وقت‌تان را تلف نکنید. همان طور که کسب و کار به سمت تکامل پیش می‌رود، نیازها هم پیش می‌روند. گزارش‌هایی را که باارزش‌ترین اطلاعات را در اختیار می‌گذارند به سرعت انتخاب کنید و روی آنها کار کنید‌.
۴. تمام تلاش‌تان را انجام دهید تا منبع داده‌های‌تان را از همان اول بسازید. خودتان را با یک استراتژی ناکارآمد برای به دست آوردن داده محدود نکنید.
۵. قبل از شروع کار معنای نرخ بازگشت سرمایه‌گذاری (ROI) را برای خودتان مشخص کنید. میزان سودی که انتظار دارید به دست بیاورید را تعیین کنید و هر فصل یا هر شش ماه یک بار بررسی کنید که تا چه حد این مقدار با واقعیت مطابقت دارد.
۶. بر اهداف کسب‌ و کار تمرکز کنید.
۷. به این دلیل که فکر می‌کنید به نرم‌افزار هوش کسب‌وکار احتیاج دارید آن را نخرید. هوش کسب‌‌وکار را با این ایده راه‌اندازی کنید که اعدادی وجود دارند که شما باید از آنها اطلاع داشته باشید ولی نمی‌دانید کجا باید دنبال آنها بگردید.

@aryavisions
پایگاه داده آپاچی کاساندرا(Apache Cassandra) چیست؟

کاساندرا یک پایگاه داده توزیع شده است. برای اینکه بدانید توزیع شدگی چیست، بهتر است درس سیستم توزیع شده چیست را مطالعه ای داده داشته باشید. این پایگاه داده برای مدیریت کلان داده یا مه داده کاربرد فراوانی دارد. کاساندرا هیچ نقطه خاص خرابی ندارد و به راحتی میتواند بر روی چندین کامپیوتر توزیع شود. این پایگاه داده توسعه پذیر خطی است و دسترس پذیری بالایی دارد. برای درک مفهوم توسعه پذیر خطی میتوانید این درس را مطالعه کنید. کاساندرا برای کار با داده های بسیار بزرگ طراحی شده است تا کاربران بتوانند این داده ها را به راحتی و با سرعت بالا دریافت کنند.در کاساندرا از معماری مستر/اسلیو استفاده نشده است. زیرا در این معماری معمولا گره (سرپرست) به دلیل کارکرد زیاد به گلوگاه سیستم تبدیل می شود. یعنی در صورتی که مستر از کار بیفتد یا کند شود، کل سیستم از کار می افتد یا کند می شود. برای همین در کاساندرا چیزی به نام مستر وجود ندارد و تمامی گره ها(کامپیوترها)ی متصل به هم، مانند یکدیگر رفتار می کنند. داده ها در گره های مختلف تکرارمی شوند. ساختار تکرار و تکثیر در آپاچی کاساندرا مانند شکل زیر است:

در درس آشنایی انواع با پایگاه داده NoSQL بحث کردیم که Cassandra از دسته Column Family Database ها است. این پایگاه داده ها که داده ها را به جای اینکه به صورت سطر به سطر مشاهده کنند، به صورت ستون به ستون مشاهده و ذخیره سازی میکنند، مناسب برای کاربردهایی مانند پردازش داده های بزرگ و BigData هستند. Cassandra از زبان پرس و جویی به نام CQL استفاده میکند که بسیار شبیه SQL است و برنامه نویسانی که میخواهند از SQL به Cassandra مهاجرت کنند، کار زیاد سختی در پیش ندارند.
@aryavisions
آریا ویژن از آپاچی کاساندرا هم استفاده می کند
@aryavisions
مشکلات سیستم bi

خودداری کاربران یکی از موانع بزرگ بر سر راه موفقیت BI است. مشکلات دیگر شامل ناچار شدن به غربال حجم زیادی از داده‌های نامربوط و کیفیت پایین داده‌هاست.
کلید به دست آوردن بینش دقیق از طریق سیستم BI، داده‌های استاندارد است. در هر بررسی BI، داده‌ها مهم‌ترین نقش را دارند. داده‌ها مثل آجرهایی هستند که بینش تجاری را می‌سازند. شرکت‌ها قبل از اینکه شروع به تجزیه و تحلیل کنند و بر اساس بینشی که به دست می‌آورند تصمیم‌گیری کنند، باید منابع داده‌های‌شان را به ترتیبی درست سازماندهی کنند. در غیر این صورت عملکرد آنها برپایه‌ی اطلاعات نادرستی خواهد بود.
مشکل دیگری که ممکن است با آن رو به رو شوید خودِ ابزار‌های BI هستند. هر چند این ابزارها امروزه جای بیشتری برای پیشرفت دارند و کار با آنها برای کاربران آسان‌تر از قبل شده است. هسته‌ی اصلی BI به جای آن که مدیریت روند باشد، هنوز بر پایه‌ی گزارش است؛ البته این وضعیت کم‌کم شروع به تغییر کرده‌ است. مراقب باشید مفهوم هوش کسب‌وکار را با تجزیه‌ و تحلیل تجاری اشتباه نگیرید.
سومین مانعی که بر سر راه استفاده از BI برای دگرگون کردن روند کسب و کار وجود دارد عدم شناخت بیشتر شرکت‌ها از روند کسب و کارشان است. (یا حداقل آن قدر نیست که بتواند به آنها در بهبود این روند کمک کند) شرکت‌ها باید در مورد روندی که انتخاب می‌کنند احتیاط زیادی به خرج دهند. اگر این روند تأثیر مستقیمی بر درآمد نداشته باشد یا کسب‌وکار در جهت استاندارد کردن این روند در شرکت نباشد، ممکن است کل کار BI مختل شود. شرکت‌ها باید همه‌ی فعالیت‌هایی که روند یک کسب و کار مشخص را شکل می‌دهند درک کنند، چگونگی انتقال داده در روندهای مختلف و چگونگی انتقال داده بین کاربران مختلف را درک کنند و بدانند که هر فرد چطور از آنها استفاده می‌کند تا نقش خود را در این روند ایفا کند. اگر آنها می‌خواهند از طریق BI نحوه‌ی کار افراد را بهبود ببخشند باید همه‌ی این موضوعات را قبل از شروع پروژه‌ی BI شناسایی و تحلیل کنند.


@aryavisions
خبر داریم خبر...!
نسخه دسکتاپ Visual Spark Studio منتشر شد!

@aryavisions
محیط نرم افزار جدید Visual Spark Studio

@aryavisions
Visual Spark Studio

یکی از محبوب ترین فریمورک های کلان داده در حال حاضر است. با وجودی که محبوبیت Spark به طور قابل ملاحظه ای افزایش یافته است.
با توجه به اینکه فناوری اطلاعات که به سرعت در حال تغییر است، Spark خود در حال تکامل است و توسعه دهندگان و شرکت های فناوری اطلاعات می توانند برای انجام کارهای چالش برانگیز برای دستیابی به سرعت آن باشند. هرچند که دسترسی متن باز Spark به یک پلتفرم آسان برای آزمایش کمک می کند، منحنی و نیاز به توسعه گسترده، ادغام و تست، برای تولید برنامه های مختلف آماده است.

ویژوال اسپارک استودیو یک راه حل مناسب برای پیچیدگی های درگیر در ساخت برنامه های کاربردی کلاس Enterprise در جرقه برای هر دو حالت دسته ای و جریان است. این یک محصول سبک وزن آزاد و سریع است که هر کسی می تواند آن را دانلود و استفاده کند تا یادگیری و استفاده از جرقه خود را تسریع کند.


@aryavisions
تفاوت اسپارک و https://news.1rj.ru/str/AryaVisions Map Reduce .
5 مزیت استفاده از هدوپ کاهش هزینه، قدرت محاسباتی، مقیاس پذیری، قدرت انعطاف، تقویت حفاظت از داده در پشتیبان گیری .https://news.1rj.ru/str/AryaVisions
در تلگرام آریا ویژن پاسخگوی سوالات شما هستیم
t.me/aryavisions_bot

@aryavisions
یادگیری عمیق با استفاده از اسپارک
https://www.kdnuggets.com/2018/04/deep-learning-apache-spark-part-1.html
در این مقاله که بخش اول ان است به معماری پیاده سازی یادگیری عمیق با استفاده از اسپارک و بازدهی سرعت با حالتهای مختلف اشاره شده است.
https://news.1rj.ru/str/AryaVisions
16 کتابخانه و پلت فرم کدباز درباره یادگیری عمیق
در این مقاله پلت فرم ها و کتابخانه های مطرح مانند تنسورفلو معرفی شده اند.
https://www.kdnuggets.com/2018/04/top-16-open-source-deep-learning-libraries.html
https://news.1rj.ru/str/AryaVisions
محصولی جدید مبتنی بر اینترنت اشیا سامانه هوشمند سرویس مدارس پند
برای کسب اطلاعات بیشتر
https://www.instagram.com/smartpand/
استخدام توسعه دهنده frontend در شیراز
حقوق تا سقف ۲.۵ میلیون تومان
با بیمه و مزایا
به آدرس najafi@aryahamrah.com رزومه خود را ارسال نمایید
با داده‌هایتان چت خواهید کرد
خوشبختانه، کارایی چت‌بات‌های هوش تجاری به خدمات نمایندگان فروش محدود نمی‌شود و آن‌ها را می‌توان یک عضو کلیدی از تیم تحلیل داده دانست.
چت‌بات‌هایی که به داده‌ها و سیستم هوش تجاری مرتبط می‌شوند، قادرند به پرسش‌هایی که با زبان انسانی از آن‌ها پرسیده می‌شود، پاسخ دهند.
این امر، کاوش داده و دسترسی به هوش تجاری را تسهیل می‌کند. اگر به دنبال توسعه‌ی دیدگاه در حوزه‌ی کسب‌وکارتان هستید، دیگر نیازی نیست به سطرهای طولانی کدها و تصویرهای رنگارنگ، خیره شوید؛ کافی است پرسشی که در ذهن دارید را به زبانی ساده، مطرح کنید و پاسخ آن را به ساده‌ترین شکل ممکن، بگیرید. هر پاسخی که در مکالمه با چت‌بات‌های هوش تجاری دریافت می‌کنید، ذهن شما را تغذیه می‌کند و زمینه را برای سؤال بعدی، مهیا می‌سازد.
انجام مکالمه در اکثر چت‌بات‌های هوش تجاری حاضر، از طرق پلتفرمی مانند اسلک، اسکایپ، فیس‌بوک مسنجر و یا تلگرام انجام می‌گیرد. چت‌بات‌های هوش تجاری به «یکی از اعضای تیم شما» تبدیل می‌شوند و وظیفه‌ی گزارش، بازیابی و تجزیه‌وتحلیل داده را به عهده می‌گیرند.

@aryavisions
تمامی چت‌بات‌های هوش تجاری یکسان نیستند
سطح پیچیدگی هوش مصنوعی به کار رفته در چت‌بات‌ها، آن‌ها را از هم متمایز می‌کند.

چت‌بات‌های هوش مصنوعی پیچیده، مانند ربات هوش تجاری سیسنس (Sisense)، به‌منزله‌ی دستیاران تحلیل داده هستند. آن‌ها به دسته‌ی عظیمی از منابع داده‌ی کسب‌وکار متصل می‌شوند و در پاسخ به سؤالات، از آن‌ها استفاده می‌کنند. آگاه‌سازی سایر اعضای تیم از دیدگاه انتخابی یک نفر، تنظیم هشدارهای هوشمند و جریان کاری برای افراد، نمونه‌هایی از کاربردهای دیگر ربات سیسنس هستند.

@aryavisions