Data Science – Telegram
Data Science
7.47K subscribers
754 photos
49 videos
85 files
451 links
ارتباط با ادمین:
@Datascience
Download Telegram
شهادت بانوی دوعالم حضرت فاطمه سلام الله علیها تسلیت باد.

@DataAnalysis
از بین نرم افزارهای داده کاوی سقوط ای بی ام و رشد رپیدماینر و نایم نسبت به سالهای قبل و حضور تیبکو در جمع لیدرها قابل توجه است
برای سال 2019 گارتنر لیست جدید ابزارهای حوزه هوش تجاری را منتشر کرد. مایکروسافت فاصله را از تبلو که سال گذشته جلو زد بیشتر کرده است. اوارکل هم به لیست اضافه شده است. https://news.1rj.ru/str/AryaVisions
معرفی فیلم‌ Moneyball!

فیلم Moneyball یک فیلمی در ژانر درام و ورزشی می‌باشد. در این فیلم بخشی از داستان واقعی مدیر یک تیم ورزشی به نام «بیلی بین» را روایت می‌کند. بیلی بین کسی بود که موفق شد با بودجه‌ای اندک و تنها با استفاده از قوانین غیرعرفی بازی بیسبال، رقیبان بزرگ و ثروتمند خود را شکست دهد.

تصمیم‌گیری داده محور یا Data Driven Decision Making در این فیلم به زیبایی برای مخاطبان نمایش داده می‌شود. در عصری که حجم اطلاعات و داده‌ها بسیار زیاد هست تنها با تحلیل داده و کشف الگوها و دانش‌های پنهان می‌توان در جهت کسب انتخاب‌های بهینه، درست و اثربخش گام برداشت. در این فیلم به چالش کشیدن قوانین پذیرفته‌شده و بازنویسی قواعد جدید با رویکرد تحلیل‌داده به‌خوبی به مخاطب انتقال داده می‌شود.

مشاهده این فیلم جذاب رو به‌تمامی علاقه‌مندان حوزه‌های هوش مصنوعی، علم‌داده و... پیشنهاد می‌کنم.

ارادتمند
محمدرضا محتاط

@DataAnalysis
graphsage_gin-ita-feb19.pdf
11.9 MB
الگوریتمهایی که روی داده از نوع گراف مانند شبکه های اجتماعی کار می کنند متفاوت از داده تراکنشی هستند. عموما چالش الگوریتمهای روی داده گراف چالش بیشتری بخصوص بخاطر تنکی داده دارند. آخرین سخنرانی Lescovec که سالهاست در زمینه گراف در دانشگاه استفورد فعالیت می کند برای ارائه الگوریتم یادگیری عمیق روی داده گراف بوده است. اسلاید این سخنرانی را از لینک زیر می توانید دانلود کنید.
https://news.1rj.ru/str/AryaVisions
http://i.stanford.edu/~jure/pub/talks2/graphsage_gin-ita-feb19.pdf
This media is not supported in your browser
VIEW IN TELEGRAM
10 مهارتی که در 2019 بر اساس امار لینکدین بیشترین تقاضا را خواهند داشت.
محاسبات ابری، هوش مصنوعی، استدال تحلیلی و طراحی کاربر محور جز این 10 مورد است. منبع اقتصاد انلاین
https://news.1rj.ru/str/AryaVisions
روندهای تحول دیجیتال در سال 2019!

از روندهای حوزه Digital Transformation در سال 2019 می‌توان به حوزه‌های کلان داده، اینترنت اشیا، هوش مصنوعی، بلاک‌چِین، شبکه‌های 5G و... اشاره کرد.

بهره‌گیری هوشمندانه از روندهای فوق سبب هوشمندسازی کسب و کار و در نهایت کسب مزیت رقابتی برای سازمان شما خواهد گردید.

@DataAnalysis
نقش علم‌داده در بهبود فرایندهای کسب‌وکار!

https://bit.ly/2XbrhCg

فرایندکاوی یا Process Mining یکی از کاربردهای جذاب حوزه علم‌داده در بهبود و بهینه سازی فرایندهای کسب کار می‌باشد.

با بهره‌گیری از متدها و روش‌های فرایندکاوی امکان بررسی میزان بهره‌وری فرایندهای موجود، کشف فرایندهای نهان سازمان، بررسی میزان انطباق‌پذیری فرایندها با فرایندهای بهینه و ارتقا فرایندها امکان پذیر خواهد بود.

فرآیندکاوی برای هر صنعت و کسب و کاری مفید و پرفایده است و فقط به اطلاعاتی نیاز دارد که می‌توانند به عنوان اطلاعات پایه استفاده شوند.

جهت پیاده سازی متدهای فرایندکاوی نیاز به وجود داده‌های Event Log فرایندها می‌باشد. این داده‌ها در اکثر سازمان‌ها تحت داده‌های تاریک وجود دارد اما معمولا استفاده از آنها صورت نمی‌پذیرد.

نرم‌افزاری مختلفی در حوزه فرایندکاوی وجود دارد که از این بین نرم افزارهای Disco ،Celonis و نرم‌افزار متن باز ProM دارای عملکرد خوبی هستند.

ارادتمند
محمدرضا محتاط

@DataAnalysis
10 روند تکنولوژی استراتژیک برتر در سال 2019 از نظر گارتنر https://news.1rj.ru/str/AryaVisions
داده؛ نفت عصر جدید

https://bit.ly/2GWtewR

بدون شک داده و تحلیل داده محور یکی از مهم‌ترین منابع قدرت سازمان‌ها در جهت اخذ تصمیمات بهینه می‌باشد. جملاتی از قبیل Data is the new oil نیز موکد بر همین قضیه می‌باشد.

در بسیاری از سازمان‌ها و شرکت‌های داخلی به حوزه Data توجهاتی شده است اما لزوما سبب کسب مزیت‌ رقابتی یا افزایش بهره‌وری نگردیده است!

توجه صرف به موضوعات فنی یکی از مشکلات عدیده‌ای است که شرکت‌های داخلی با آن مواجه هستند. این در حالی است که رویکرد ترکیبی از حوزه‌های مدیریت و فناوری اطلاعات راهکار این مسیر خواهد بود.

جهت کسب موفقیت و مدیریت بهینه پروژه‌های داده محور مولفه‌های کلیدی زیر پیشنهاد می‌گردد.

1- ارزیابی میزان بلوغ تحلیل داده و کلان داده سازمان
2- تدوین استراتژی سازمانی در حوزه داده و تحلیل داده
3- شناسایی اولویت‌های سازمان
4- شناسایی منابع و ذی‌نفعان حوزه Data
5- مدیریت پروژه و مدیریت تغییرات
6- تدوین معماری بهینه شامل ابزارها، پلتفرم‌ها
7- شناسایی و جذب مهارت‌های دانشی مورد نیاز

بسیاری از سازمان‌ها نیز تنها به جمع‌آوری اطلاعات اکتفا کرده و بعضا به‌صورت خام از فروش اطلاعات و دادگان خود کسب درآمد می‌نمایند. ارائه ارزش‌افزوده ناشی از تحلیل اطلاعات می‌تواند سبب کسب درآمد بیشتر و به طبع افزایش اثربخشی شما گردد. شناسایی منابع داده‌ای، استخراج اطلاعات، تحلیل، توزیع و در نهایت کسب ارزش از گام‌های اصلی این فرایند خواهد بود.

سازمان و شرکت شما چه میزان از نفت موجود در سازمان خود در حال بهره‌برداری و کسب مزیت رقابتی است؟!

ارادتمند
محمدرضا محتاط

@DataAnalysis
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت‌های دیجیتال برنده اصلی عصر جدید!

ویدیو فوق نشان از نحوه رشد و افت ارزش برند شرکت‌های برتر دنیا از سال 2000 تا 2018 دارد. رشد خیره کننده ارزش برند شرکت‌های دیجیتال طی چندسال اخیر در نمودار فوق کاملا محسوس است.

در مقابل افزایش ارزش برند شرکت‌های از قبیل اپل، مایکروسافت، آمازون و... سقوط ارزش برند شرکت‌هایی از قبیل نوکیا نیز قابل ملاحظه است.

اخذ استراتژی‌ها نادرست و عدم پیش‌بینی بازار از عوامل اصلی شکست این قبیل شرکت‌ها در محیط‌ رقابتی عصر جدید خواهد بود.

اولین بودن، نمی تواند تضمینی برای بهترین بودن باشد.

@DataAnalysis
نقد و بررسی لایحه صیانت و حفاظت از داده‌های شخصی!

https://bit.ly/2EdapCA

پیش‌نویس لایحه صیانت و حفاظت از داده‌های شخصی به همت وزارتخانه ارتباطات و فناوری اطلاعات پیشنهاد و تدوین گردیده است. ضمن قددرانی از این اقدام شایسته در ادامه برخی خلاها و ابهامات این لایحه مورد نقد و بررسی قرار خواهد گرفت:

1- پردازش داده‌های شخصی:
یکی از موضوعات اصلی لایحه فوق تمرکز بر پردازش داده‌های شخصی و معیارهای نظارت بر این عمل می‌‌باشد. این در حالی هست که در این لایحه به موضوعاتی از قبیل نحوه جمع‌آوری اطلاعات شخصی، افراز میان موضوعات پردازش و تحلیل اطلاعات و... توجه نگردیده است.

2- داده‌های باز:
در برخی از بندهای پیشنهادی لایحه فوق برخی قوانین و مقررات در حوزه داده‌های عمومی پیشنهاد گردیده است. این درحالی می‌باشد که در مبحث داده‌های باز و عمومی تدوین قوانین نظارتی با ماهیت آن در تناقص است.

3- ذکر معیارها و مولفه‌های انتزاعی:
مطرح شدن معیارهای کلی و مبهم در جهت ارزیابی خسارت‌ ناشی از نقض حریم خصوصی همچون خسارت مالی شدید، صيانت از حيثيت و... در فرایند اجرایی این لایجه پیشنهادی، مشکلات متعددی را ایجاد خواهد کرد.

4-مرجع صلاحیت‌دار:
ذکر عناوینی همچون مرجع صلاحیت‌دار، ناظر و... سبب ایجاد ابهام در قوانین پیشنهادی خواهد گردید. مشخص شدن صریح مجری، ناظر، مسئولین تعيين الزامات و سازكارها فني و... سبب کارایی بیشتر این طرح می‌گردد.

5- کلان‌داده:
عدم توجه به کلان‌داده در لایحه فوق با توجه ماموریت‌ها و جایگاه طرح پیشنهادی قابل تامل می‌باشد. قابل ذکر است تمرکز لایحه پیشنهادی در محدوده اطلاعات شخصی و صیانت از آن می‌باشد.

در کمیسیون اینترنت اشیا و کلان‌داده سازمان نظام صنفی رایانه‌ای در حال بررسی تخصصی لایحه فوق و ارائه نکات اصلاحی و پیشنهادی به وزارت ارتباطات و فناوری اطلاعات می‌باشیم. ان‌شالله نتایج تکمیلی جلسات این کمیسیون و اصلاحیات احتمالی به اطلاع شما بزرگواران نیز خواهد رسید.

ارادتمند
محمدرضا محتاط

پی‌نوشت:
این لایحه از طریق وب سایت وزارت ارتباطات و سازمان فناوری اطلاعات به آدرس زیر در دسترس قرار دارد:
https://bit.ly/2xFRi0X

@DataAnalysis
Tr_Crisp_DM.pdf
1.4 MB
روش انجام پروژه داده کاوی بر اساس فرایند کریسپ. این متن ترجمه ای است که سال 90 انجام شده است. https://news.1rj.ru/str/AryaVisions
جدول تناوبی علم‌داده!

https://bit.ly/2INMH5k

در جدول زیر که توسط موسسه DataCamp تدوین شده است به تفکیک مولفه‌ها و موضوعات زیر، فضای حوزه علوم‌داده افراز گردیده است.

1-موسسات برگزار کننده دوره‌های آموزشی
2- دوره‌های آموزشی
3- کنفرانس‌ها و سمنیارهای حوزه علم‌داده
4-زبان‌های برنامه‌نویسی
5- پایگاه داده و ابزارهای مدیریت داده
6- ابزارها و کتابخانه‌های یادگیری ماشین
7- نرم‌افزارهای گزارش‌گیری و مصورسازی داده
8- ابزارهای مدیریت پروژه‌های نرم‌افزاری
9- وبسایت‌های مرجع حوزه علم‌داده
10- پاکدست‌های حوزه علوم‌داده
11- اجتماعات و شبکه‌های تخصصی علم‌داده
12- مسابقات علم‌داده
13- منابع ارائه دهنده Open Data

@DataAnalysis
کتاب Big Data Application Architecture

https://bit.ly/2Ez0vez

کتاب کلان داده‌ها، معماری و کاربردها انتشارات Apress یکی از کتاب‌های مرجع و با کیفیت در حوزه Big Data می‌باشد. رویکرد کتاب فوق کاملا کاربردی و براساس پرسش و پاسخ می‌باشد. در این کتاب جنبه‌های نرم‌افزاری و سخت‌افزاری حوزه کلان‌داده پوشش داده شده است.

سرفصل‌های این کتاب به شرح زیر است:

فصل1: مقدمه ای بر کلان داده
فصل2: معماری نرم‌افزاری کلان داده
فصل3: الگوهای جریان‌سازی وفروبری کلان داده
فصل4: الگوهای ذخیرسازی کلان داده
فصل5: الگوهای دسترسی کلان داده
فصل6: الگوهای تحلیل وکشف داده
فصل7: الگوهای مصورسازی کلان داده
فصل8: الگوهای توسعه کلان داده
فصل9: نیازمندی‌های غیرعملیاتی کلان داده
فصل10: موارد مطالعاتی کلان داده
فصل11: منابع، مراجع و ابزارها

مطالعه کتاب فوق را به تمامی متخصصین و علاقه‌مندان حوزه Big Data توصیه میکنم.

ارادتمند
محمدرضا محتاط

پی‌نوشت:
کتاب فوق توسط انتشارات دیباگران تحت عنوان "کلان داده ها معماری و کاربردها" ترجمه و در اختیار علاقه‌مندان قرار گرفته است.

@DataAnalysis
Big Data Application Architecture.pdf
7 MB
کتاب Big Data Application Architecture

@DataAnalysis
معرفی فیلم Margin Call

https://bit.ly/2Utvlwg

فیلم درخواست نهایی یک فیلمی در ژانر هیجانی با بازی کوین اسپیسی هست. داستان فیلم در سال ۲۰۰۸ و در اوج بحران‌های اقتصادی ایالات متحده آمریکا اتفاق میافتد. زمانی که بخش‌های اقتصادی در حال ورشکستگی هستند. این فیلم برشی 24 ساعته از اتفاقات درون یک شرکت فعال در بازار بورس آمریکا است.

در فیلم Margin Call روند کشف یک بحران احتمالی، مراحل پیدا کردن راه‌حل و در نهایت اجرایی کردن آن به زیبایی نشان داده‌ می‌شود.

بهره‌گیری از تحلیل‌های داده‌محور پیش‌گویانه در جهت شناسایی بحران از محورهای کلیدی این فیلم هست. مشاهده این فیلم جذاب رو به‌تمامی علاقه‌مندان حوزه‌های بازارهای مالی، هوش مصنوعی، علم‌داده و... پیشنهاد می‌کنم.

پی‌نوشت:
واژه Margin Call اصطلاحی اقتصادی و به معنی درخواست آخر کارگزار بورس از سرمایه‌گذار برای خرید سهام با هدف جلوگیری از ضرر مالی است.

ارادتمند
محمدرضا محتاط

@DataAnalysis
سلام و عرض ادب
پیرو تجمیع تجربیات و محتواهای انتشاریافته در کانال علم‌داده به پاس همراهی 4 ساله شما عزیزان، برخی از مقالات این کانال در جهت دسترسی سریع‌تر به شبکه اجتماعی ویرگول نیز انتقال یافت. از طریق حساب کاربری زیر می‌توانید تمامی محتواها را دنبال نمایید.

https://virgool.io/@mohtat

در ادامه برخی از مطالب انتشاریافته با رویکردهای توسعه دانش فردی و سازمانی در حوزه‌های علم‌داده، تحلیل‌داده و سازمان داده‌محور تقدیم حضور میگردد.

1- تبدیل شدن به یک متخصص کلان‌ داده
http://vrgl.ir/HKOOE

2- مسیر تبدیل شدن به دانشمند علم داده
http://vrgl.ir/LF1n5

3-تبدیل شدن به یک متخصص یادگیری عمیق
http://vrgl.ir/s9bhJ

4-رشته‌های دانشگاهی مرتبط با حوزه علم‌داده در ایران
http://vrgl.ir/4yFUM

5- سؤالات مصاحبه استخدامی متخصص علم‌داده
http://vrgl.ir/7V14c

6-اشتباهات رایج شرکت‌ها در جذب تحلیل‌گران داده
http://vrgl.ir/5Gd0n

7-معرفی مشاغل و فرصت‌های کاری جذاب در حوزه داده
http://vrgl.ir/lQNHD

8-پروژه‌های کلیدی حوزه علم‌داده در کسب‌وکار
http://vrgl.ir/K940c

9-انتخاب الگوریتم مناسب در پروژه‌های داده‌کاوی
http://vrgl.ir/Sg1DE

10-ده مهارت کلیدی لازم در سال 2020
http://vrgl.ir/BRGdA


@DataAnalysis
نشست سالانه هیات عمومی سازمان نظام صنفی رایانه‌ای کشور با حضور محمدجواد آذری جهرمی، وزیر ارتباطات و ابوالحسن فیروزآبادی، دبیر شورای عالی فضای مجازی در حال برگزاری است.

در این نشست، برنامه هاي راهبردی سازمان نظام صنفي رایانه‌ای(نصر) در ۲۰ محور، معرفی شد.

@DataAnalysis
برنامه داده‌های باز دیجی‌کالا

https://bit.ly/2HgHTnI

شرکت دیجی‌کالا در اقدامی ارزشمند چندین دیتاست این فروشگاه اینترنتی را با رعایت حریم خصوصی مشتریان خود به‌صورت رایگان در اختیار علاقه‌مندان قرار داده است. برنامه داده‌های باز این شرکت به‌تازگی با هدف ارائه بستر مناسب برای تحقیق و توسعه در حوزه‌ علوم داده شروع به کار کرده است.

در ادامه برخی از دیتاست‌های انتشاریافته و کارکردهای آن در حوزه علم‌داده معرفی شده است.

1- دیتاست نظرات کاربران:
این داده‌ها شامل یکصد هزار نمونه از نظرات کاربران است که شامل چندین نظر برای یک محصول می‌باشد. از موارد استفاده این داده‌ها می‌توان به پردازش زبان طبیعی، تحلیل احساسات، طبقه‌بندی بر اساس کیفیت نظرات، شناسایی اسپم و تحلیل‌های روانشناسی اشاره کرد.

2- دیتاست تاریخچه خرید مشتریان:
این داده‌ها، شامل یکصد هزار خرید توسط مشتریان است که همانند سایر داده‌های دیجیکالا بی‌نام شده‌اند تا حریم شخصی مشتریان حفظ شود. این داده‌ها دارای زمان و موقعیت مکانی می‌باشد. از موارد پیشنهادی استفاده از این داده‌ها می‌توان به تحلیل روندها در میان شهرها، پیش‌بینی خرید و سفارش مشتریان و دسته‌بندی مشتریان اشاره کرد.

3- دیتاست کیفیت نظرات محصولات:
این داده‌ها شامل تاریخچه بیش از یکصدهزار محصول می‌باشد. از موارد پیشنهادی تحقیقاتی شناسایی ناهنجاری‌ها(anomaly detection)، پیش‌بینی قیمت‌های آینده، تحلیل آماری قیمت و پایداری در میان طبقه‌بندی‌ها و استفاده از یادگیری ماشین جهت شناسایی قیمت‌های نادرست توسط فروشنده‌ها می‌باشد.

4- دیتاست لیست محصولات:
این داده‌ها شامل یکصدهزار نمونه از محصولات و طبقه‌بندی آن‌ها می‌باشد. کاربردهای پیشنهادی برای این دیتاست، پیش‌بینی طبقه‌بندی، شناسایی ناهنجاری(anomaly detection)، شناسایی اشتباهات در دسته‌بندی(Categorization) ، شناسایی موارد تکراری و دسته‌بندی پویا با استفاده از ویژگی‌های داده‌ها می‌باشد.

پی‌نوشت:
1- مخاطب اصلی این برنامه دانشجویان علاقه‌مند به انجام پژوهش‌های تحقیقاتی یا پایان‌نامه بر اساس داده‌های انتشاریافته می‌باشد. درخواست دسترسی به داده‌های فوق از طریق ایمیل دانشگاهی مقدور می‌باشد.

2- از طریق لینک زیر می‌توانید به این داده‌ها دسترسی داشته باشید.
http://opendata.digikala.com

@DataAnalysis
جشنواره بزرگ ایده و محصول سکو

کنگره بین‌المللی سیستم‌های کلان مقیاس محاسباتی و تحلیل کلان داده (TopHPC) با حمایت و مشارکت حامی ویژه کنگره، شرکت مهندسی صنایع یاس ارغوانی، برگزار می‌کند:

«جشنواره بزرگ ایده و محصول سکو با محوریت کاربرد داده‌های کلان در صنایع»

صاحبان ایده یا محصول در حوزه داده و تحلیل آن می‌توانند با ثبت‌نام در سامانه سکو در این جشنواره شرکت نمایند.

برندگان می‌تواند از جوایز حمایتی برای محصولات، گواهی حضور بین‌المللی و تخفیف تا 50 درصد برای حضور در کنگره TopHPC بهره‌مند شوند.

لینک ثبت‌نام در جشنواره:
http://portal.sakuplatform.ir

وب‌سایت کنگره TopHPC:
www.tophpc.com

وب‌سایت شرکت مهندسی صنايع ياس ارغوانی:
www.yaasie.com

@DataAnalysis