معرفی دو کتابی که مطالعه ان بسیار مفید است.
Book: An Introduction to Statistical Learning, Using R
برای دانلود رایگان از لینک زیر می توان انجام داد
https://lnkd.in/dxtV_49
The Elements of Statistical Learning.
لینک زیر اسلایدها و ویدیوهای مرتبط است
https://lnkd.in/dFsr-Ab
Book: An Introduction to Statistical Learning, Using R
برای دانلود رایگان از لینک زیر می توان انجام داد
https://lnkd.in/dxtV_49
The Elements of Statistical Learning.
لینک زیر اسلایدها و ویدیوهای مرتبط است
https://lnkd.in/dFsr-Ab
نحوه انتخاب الگوریتم مناسب برای یادگیری ماشین
https://www.datasciencecentral.com/profiles/blogs/how-to-choose-a-machine-learning-model-some-guidelines
https://www.datasciencecentral.com/profiles/blogs/how-to-choose-a-machine-learning-model-some-guidelines
Data Science Central
How to Choose a Machine Learning Model – Some Guidelines
In this post, we explore some broad guidelines for selecting machine learning models The overall steps for Machine Learning/Deep Learning are: Collect data Check for anomalies, missing data and clean the data Perform statistical analysis and initial…
محبوبترین IDE زبان پایتون در حوزه علمداده!
براساس نظرسنجی وبسایت KDnuggets از متخصصین علمداده به ترتیب واسطهای برنامهنویسی Jupyter و PyCharm جز پرکاربردترین و محبوبترین IDE در زبان برنامهنویسی پایتون هستند.
پینوشت:
1. جهت استفاده از Jupyter که یک واسط Interactive است میتوانید دستور زیر را در محیط cmd ویندوز در مسیر محل نصب پایتون اجرا نمایید.
Jupyter notebook
2. برای دانلود و نصب Pycharm نیز از طریق لینک زیر اقدام نمایید.
http://p30download.com/fa/entry/43943/
@DataAnalysis
براساس نظرسنجی وبسایت KDnuggets از متخصصین علمداده به ترتیب واسطهای برنامهنویسی Jupyter و PyCharm جز پرکاربردترین و محبوبترین IDE در زبان برنامهنویسی پایتون هستند.
پینوشت:
1. جهت استفاده از Jupyter که یک واسط Interactive است میتوانید دستور زیر را در محیط cmd ویندوز در مسیر محل نصب پایتون اجرا نمایید.
Jupyter notebook
2. برای دانلود و نصب Pycharm نیز از طریق لینک زیر اقدام نمایید.
http://p30download.com/fa/entry/43943/
@DataAnalysis
کتاب The Data Science Handbook
در این کتاب که در سال 2017 توسط انتشارات WILEY منتشر گردیده محورهای زیر پوشش داده شده است. قابل ذکر است که پیادهسازیهای صورت پذیرفته در این کتاب به زبان پایتون میباشد.
1- مسیر اجرایی پروژههای علمداده
2- آشنایی با زبانهای برنامهنویسی مطرح حوزه علمداده
3-پاکسازی داده
4-مصورسازی دادهها
5- آموزش الگوریتمهای یادگیری ماشین
6- معرفی پلتفرمهای کلانداده
7- آشنایی با پایگاهدادههای مطرح
8- پردازش زبان طبیعی
9-تحلیلهای پیشرفته
@DataAnalysis
در این کتاب که در سال 2017 توسط انتشارات WILEY منتشر گردیده محورهای زیر پوشش داده شده است. قابل ذکر است که پیادهسازیهای صورت پذیرفته در این کتاب به زبان پایتون میباشد.
1- مسیر اجرایی پروژههای علمداده
2- آشنایی با زبانهای برنامهنویسی مطرح حوزه علمداده
3-پاکسازی داده
4-مصورسازی دادهها
5- آموزش الگوریتمهای یادگیری ماشین
6- معرفی پلتفرمهای کلانداده
7- آشنایی با پایگاهدادههای مطرح
8- پردازش زبان طبیعی
9-تحلیلهای پیشرفته
@DataAnalysis
ده مهارت کلیدی لازم در سال 2020
یکی از جنبههای مورد نیاز جهت کسب موفقیت در تمامی حوزههای کاری به خصوص حوزه علمداده، توجه به مهارتهای نرم یا Soft Skills است. در زیر 10 مهارت کلیدی مورد نیاز تا سال 2020 معرفی گردیده است.
1- مهارت حل مسئله
2- تفکر انتقادی
3- خلاقیت
4- توانایی مدیریت افراد
5- روحیه همکاری و کار تیمی
6- هوش هیجانی
7- مهارت قضاوت و تصمیمگیری
8- تفکر سرویسگرا
9-فنون مذاکره
10- هوش شناختی
پینوشت:
مطالعه کتاب "ذهن کامل نو؛ گذر از عصر اطلاعاتی به عصر مفهومی" را به علاقهمندانی که به توسعه مهارتهای فردی خود توجه لازم دارند را پیشنهاد میکنم. در این کتاب مهارتها و پیشنیازهای کلیدی عصر جدید معرفی و گامهای لازم در جهت کسب موفقیت پیشنهاد گردیده است.
@DataAnalysis
یکی از جنبههای مورد نیاز جهت کسب موفقیت در تمامی حوزههای کاری به خصوص حوزه علمداده، توجه به مهارتهای نرم یا Soft Skills است. در زیر 10 مهارت کلیدی مورد نیاز تا سال 2020 معرفی گردیده است.
1- مهارت حل مسئله
2- تفکر انتقادی
3- خلاقیت
4- توانایی مدیریت افراد
5- روحیه همکاری و کار تیمی
6- هوش هیجانی
7- مهارت قضاوت و تصمیمگیری
8- تفکر سرویسگرا
9-فنون مذاکره
10- هوش شناختی
پینوشت:
مطالعه کتاب "ذهن کامل نو؛ گذر از عصر اطلاعاتی به عصر مفهومی" را به علاقهمندانی که به توسعه مهارتهای فردی خود توجه لازم دارند را پیشنهاد میکنم. در این کتاب مهارتها و پیشنیازهای کلیدی عصر جدید معرفی و گامهای لازم در جهت کسب موفقیت پیشنهاد گردیده است.
@DataAnalysis
روندهای حوزه کلان داده در سال 2019
https://bit.ly/2BgVo1k
1- گسترش حجم دادگان ناشی از اینترنت اشیا
2- افزایش استفاده از تحلیلهای پیشگویانه در صنایع
3- بهرهگیری از Dark Data در سازمانها
4- افزایش جایگاه مدیر ارشد داده(CDO) در سازمانها
5-گسترش پردازشهای کوانتومی(Quantum Computing)
6- افزایش تعداد ابزارهای Open Source در حوزه تحلیلداده
7- بهرهگیری از پردازشیهای لبهای(Edge Computing) در سازمانها
شناسایی روندها و بهرهبرداری صحیح از آنها یکی از عوامل موفقیت شرکتهای بزرگ در جهت کسب مزیت رقابتی پایدار میباشد!
پینوشت:
از میان روندهای فوق توجه به جایگاه مدیر ارشد داده و تعریف ساختار سازمانی مربوطه، گسترش استفاده از تحلیلهای پیشگویانه و بهرهگیری از Dark Data در سازمانها جز مهمترین مؤلفههای کلیدی در بازار کار ایران برای شرکتهای فعال در حوزه کلان داده و تحلیلداده خواهد بود.
ارادتمند
محمدرضا محتاط
@DataAnalysis
https://bit.ly/2BgVo1k
1- گسترش حجم دادگان ناشی از اینترنت اشیا
2- افزایش استفاده از تحلیلهای پیشگویانه در صنایع
3- بهرهگیری از Dark Data در سازمانها
4- افزایش جایگاه مدیر ارشد داده(CDO) در سازمانها
5-گسترش پردازشهای کوانتومی(Quantum Computing)
6- افزایش تعداد ابزارهای Open Source در حوزه تحلیلداده
7- بهرهگیری از پردازشیهای لبهای(Edge Computing) در سازمانها
شناسایی روندها و بهرهبرداری صحیح از آنها یکی از عوامل موفقیت شرکتهای بزرگ در جهت کسب مزیت رقابتی پایدار میباشد!
پینوشت:
از میان روندهای فوق توجه به جایگاه مدیر ارشد داده و تعریف ساختار سازمانی مربوطه، گسترش استفاده از تحلیلهای پیشگویانه و بهرهگیری از Dark Data در سازمانها جز مهمترین مؤلفههای کلیدی در بازار کار ایران برای شرکتهای فعال در حوزه کلان داده و تحلیلداده خواهد بود.
ارادتمند
محمدرضا محتاط
@DataAnalysis
تفاوت یادگیری ماشین و یادگیری عمیق!
یکی از قابلیت های اصلی مدل های مبتنی بر یادگیری عمیق Automatic Feature Extraction یا مفهومی به نام Feature Learning هست.
به صورت کلی در روش های مبتنی بر یادگیری عمیق دو گام Feature Extraction و Classification توسط مدل و لایه های پنهان شبکه عصبی انجام میشود.
@DataAnalysis
یکی از قابلیت های اصلی مدل های مبتنی بر یادگیری عمیق Automatic Feature Extraction یا مفهومی به نام Feature Learning هست.
به صورت کلی در روش های مبتنی بر یادگیری عمیق دو گام Feature Extraction و Classification توسط مدل و لایه های پنهان شبکه عصبی انجام میشود.
@DataAnalysis
مهمترین روندهای حوزه هوشتجاری در سال 2019
https://bit.ly/2Bm8pqm
از مهمترین روندهای حوزه هوشتجاری در سال آتی میتوان به موارد زیر اشاره کرد:
1- مدیریت داده مرجع(MDM) و مدیریت کیفیت داده(DQM)
2- مصورسازی داده
3- هوشتجاری Self Serive
4- حاکمیت داده
5- استقرار فرهنگ تصمیمگیری داده محور در سازمانها
6- بهرهگیری از معماریهای نوین انبار داده
7- توسعه چابک پروژههای هوشتجاری
8- استفاده از متدهای یادگیری ماشین و تحلیلهای پیشرفته
9- ارائه تحلیل بر رویدادههای بلادرنگ و جریانی
10- تحلیل کلان داده
پینوشت:
1- توجه به حوزههای حاکمیت داده، مدیریت داده مرجع و مدیریت کیفیت داده و استقرار آن، نقش اساسی در موفقیت یا شکست پروژههای هوشتجاری و تحلیل داده در سازمانها خواهد داشت. خلل توجه به این محورها در سازمانها و شرکتهای ایرانی محسوس است.
2- افزایش کاربردها و کارکردهای حوزه Data Analytics در هوش تجاری از روندهای اصلی خواهد بود. ارائه تحلیلهای پیشرفته مبتنی بر یادگیری ماشین، تحلیل کلان داده، تجمیع قابلیتهای تحلیلی با پلتفرمهای هوشتجاری، تحلیل دادهای ناشی از اینترنت اشیا و... همگی نشان از این امر دارد. به کارشناسان و متخصصین حوزه هوشتجاری توصیه میشود در کنار مهارتها و دانش تخصصی فعلی، در جهت توسعه مهارتهای تحلیلی خود برنامهریزی ویژهای نمایند.
ارادتمند
محمدرضا محتاط
@DataAnalysis
https://bit.ly/2Bm8pqm
از مهمترین روندهای حوزه هوشتجاری در سال آتی میتوان به موارد زیر اشاره کرد:
1- مدیریت داده مرجع(MDM) و مدیریت کیفیت داده(DQM)
2- مصورسازی داده
3- هوشتجاری Self Serive
4- حاکمیت داده
5- استقرار فرهنگ تصمیمگیری داده محور در سازمانها
6- بهرهگیری از معماریهای نوین انبار داده
7- توسعه چابک پروژههای هوشتجاری
8- استفاده از متدهای یادگیری ماشین و تحلیلهای پیشرفته
9- ارائه تحلیل بر رویدادههای بلادرنگ و جریانی
10- تحلیل کلان داده
پینوشت:
1- توجه به حوزههای حاکمیت داده، مدیریت داده مرجع و مدیریت کیفیت داده و استقرار آن، نقش اساسی در موفقیت یا شکست پروژههای هوشتجاری و تحلیل داده در سازمانها خواهد داشت. خلل توجه به این محورها در سازمانها و شرکتهای ایرانی محسوس است.
2- افزایش کاربردها و کارکردهای حوزه Data Analytics در هوش تجاری از روندهای اصلی خواهد بود. ارائه تحلیلهای پیشرفته مبتنی بر یادگیری ماشین، تحلیل کلان داده، تجمیع قابلیتهای تحلیلی با پلتفرمهای هوشتجاری، تحلیل دادهای ناشی از اینترنت اشیا و... همگی نشان از این امر دارد. به کارشناسان و متخصصین حوزه هوشتجاری توصیه میشود در کنار مهارتها و دانش تخصصی فعلی، در جهت توسعه مهارتهای تحلیلی خود برنامهریزی ویژهای نمایند.
ارادتمند
محمدرضا محتاط
@DataAnalysis
Top Python Libraries in 2018 in Data Science, Deep Learning, Machine Learning
1 – TensorFlow
2 – pandas
3 – scikit-learn
4 – PyTorch
5 – Matplotlib
6 – Keras
7 – NumPy
8 – SciPy
9 – Apache MXNet
10 – Theano
پینوشت:
از ده کتابخانه برتر زبان پایتون در سال 2018، 5 کتابخانه در حوزه یادگیری عمیق است.
@DataAnalysis
1 – TensorFlow
2 – pandas
3 – scikit-learn
4 – PyTorch
5 – Matplotlib
6 – Keras
7 – NumPy
8 – SciPy
9 – Apache MXNet
10 – Theano
پینوشت:
از ده کتابخانه برتر زبان پایتون در سال 2018، 5 کتابخانه در حوزه یادگیری عمیق است.
@DataAnalysis
برترین فناوریها از نظر جذب سرمایه در 5 سال آینده!
1- کلانداده و علمداده(Big Data & Data Science)
2- آنالیز کسبوکار(Business Analytics)
3- کسب و کار ابری(Cloud Business)
4- بازاریابی دیجیتال(Digital Marketing)
5- مدیریت تجربه مشتری(Customer Experience Management)
6- تجارت الکترونیک(Ecommerce)
پینوشت:
بهرهگیری از مدلهای کسبوکار مبتنی بر تکنولوژیهای فوق سبب ایجاد مزیت رقابتی پایدار برای سازمان یا شرکت شما خواهد گردید.
@DataAnalysis
1- کلانداده و علمداده(Big Data & Data Science)
2- آنالیز کسبوکار(Business Analytics)
3- کسب و کار ابری(Cloud Business)
4- بازاریابی دیجیتال(Digital Marketing)
5- مدیریت تجربه مشتری(Customer Experience Management)
6- تجارت الکترونیک(Ecommerce)
پینوشت:
بهرهگیری از مدلهای کسبوکار مبتنی بر تکنولوژیهای فوق سبب ایجاد مزیت رقابتی پایدار برای سازمان یا شرکت شما خواهد گردید.
@DataAnalysis
Forwarded from Dr Amin Najafi
محصولی جدید مبتنی بر اینترنت اشیا سامانه هوشمند سرویس مدارس پند
برای کسب اطلاعات بیشتر
https://www.instagram.com/smartpand/
برای کسب اطلاعات بیشتر
https://www.instagram.com/smartpand/
«دعوت به سومین رویداد کلاندادهها»
https://ibb.co/XDKrfC5
به: فرهیخته گرامی/ نمایندگان شرکتهای فعال در حوزه کلانداده
با سلام و احترام؛
به استحضار میرساند، سومین رویداد کلاندادهها با تمرکز بر موضوعات «ترسیم وضعیت زیستبوم کلاندادهها در کشور» و «تبیین روال مقرراتگذاری جهت توسعه کسب و کارهای دادهمحور» در پژوهشگاه ارتباطات و فناوری اطلاعات به همراه برپایی نمایشگاه با حضور شرکتهای فعال حوزه کلانداده کشور برگزار خواهد شد.
محورهای رویداد:
- کسب و کارهای دادهمحور و راهبردهای مهاجرت به کلاندادهها
- امنیت، مسائل حقوقی و تنظیم مقررات کلاندادهها
- استانداردها، زیرساختها و کاربردهای کلاندادها
جهت شبکهسازی و آشنایی با شرکتهای فعال حوزه کلانداده کشور، در این رویداد همچنین این فرصت ایجاد گردیده تا شرکتها در قالب غرفههای نمایشگاهی از آخرین محصولات و خدمات خود رونمایی نمایند. شرکتهای علاقهمند جهت اخذ غرفه در نمایشگاه تا تاریخ 8 دیماه میتوانند اقدام نمایند.
زمان برگزاری رویداد: سهشنبه مورخ 1397/10/11
محل برگزاری: تهران- انتهای خیابان کارگر شمالی– روبروی سازمان انرژی اتمی- پژوهشگاه ارتباطات و فناوری اطلاعات
اطلاعات بیشتر و ثبت نام:
http://bigdata2018.itrc.ac.ir
021-84978143
@DataAnalysis
https://ibb.co/XDKrfC5
به: فرهیخته گرامی/ نمایندگان شرکتهای فعال در حوزه کلانداده
با سلام و احترام؛
به استحضار میرساند، سومین رویداد کلاندادهها با تمرکز بر موضوعات «ترسیم وضعیت زیستبوم کلاندادهها در کشور» و «تبیین روال مقرراتگذاری جهت توسعه کسب و کارهای دادهمحور» در پژوهشگاه ارتباطات و فناوری اطلاعات به همراه برپایی نمایشگاه با حضور شرکتهای فعال حوزه کلانداده کشور برگزار خواهد شد.
محورهای رویداد:
- کسب و کارهای دادهمحور و راهبردهای مهاجرت به کلاندادهها
- امنیت، مسائل حقوقی و تنظیم مقررات کلاندادهها
- استانداردها، زیرساختها و کاربردهای کلاندادها
جهت شبکهسازی و آشنایی با شرکتهای فعال حوزه کلانداده کشور، در این رویداد همچنین این فرصت ایجاد گردیده تا شرکتها در قالب غرفههای نمایشگاهی از آخرین محصولات و خدمات خود رونمایی نمایند. شرکتهای علاقهمند جهت اخذ غرفه در نمایشگاه تا تاریخ 8 دیماه میتوانند اقدام نمایند.
زمان برگزاری رویداد: سهشنبه مورخ 1397/10/11
محل برگزاری: تهران- انتهای خیابان کارگر شمالی– روبروی سازمان انرژی اتمی- پژوهشگاه ارتباطات و فناوری اطلاعات
اطلاعات بیشتر و ثبت نام:
http://bigdata2018.itrc.ac.ir
021-84978143
@DataAnalysis
ImgBB
Big-Data-Event
Image Big-Data-Event hosted in ImgBB
🔰 اگر توسعه دهنده ی #java هستید
🔰 اگرعلاقمند به فعالیت در
حوزه #Big_Data هستید
به #سحاب بپیوندید.
✅ ارسال رزومه به:
jobs@sahab.ir
@DataAnalysis
🔰 اگرعلاقمند به فعالیت در
حوزه #Big_Data هستید
به #سحاب بپیوندید.
✅ ارسال رزومه به:
jobs@sahab.ir
@DataAnalysis
سلسله نشستهای علماطلاعات با موضوع مدیریت دادهمحور
در تاریخ 22 دیماه با موضوع مهارتهای دادهای در عصر دیجیتال پیرامون مهارتها، دانشها و ابزارهای تخصصی حوزههای علمداده، دادهکاوی، هوشتجاری و... جهت موفقیت در بازار کار ایران سخنرانی خواهم کرد.
ارادتمند
محمدرضا محتاط
@DataAnalysis
در تاریخ 22 دیماه با موضوع مهارتهای دادهای در عصر دیجیتال پیرامون مهارتها، دانشها و ابزارهای تخصصی حوزههای علمداده، دادهکاوی، هوشتجاری و... جهت موفقیت در بازار کار ایران سخنرانی خواهم کرد.
ارادتمند
محمدرضا محتاط
@DataAnalysis
همه دروغ میگویند!
https://bit.ly/2RxlWFm
کتاب EVERYBODY LIES یکی از کتابهای جذاب برای آشنایی با قابلیتهای حوزه Big Data میباشد که توسط ست استفندیویدویتز یکی از دانشمندان داده شرکت گوگل در جهت معرفی قابلیتهای تحلیلداده منتشر گردیده است.
این محقق چهار سال را صرف تحلیل دادههای ناشناس گوگل کرده است. تحقیقات او درباره موضوعاتی همچون بیماریهای روانی، سقط جنین، مذهب و پزشکی بوده است. او معتقد است که جستجوهای گوگل مهمترین پایگاه دادهای است که تاکنون در مورد روح و روان انسان وجود دارد.
در این کتاب مقایسههای مختلفی از جستجوهای کاربران موتور جستجو گوگل با نظرسنجیها عمومی صورت گرفته است. نتایج این تحقیق نشان از وجود اختلاف میان این دو حوزه و ارزش تحلیل اطلاعات در عصر جدید است.
در ادامه بخشی از توضیحات این کتاب آورده شده است:
همه دروغ میگویند. مردم در مورد اینکه چند بار به باشگاه میروند، قیمت کفش آنها چقدر است و کتابهایی که میخوانند، دروغ میگویند. آنها سر کار نمیروند چون بیمار هستند، اما در واقع دروغ میگویند. آنها میگویند که با شما تماس میگیرند، اما نمیگیرند.
محور اصلی این کتاب جمله زیر میباشد:
آیا مردم در سرچهای خود در موتور جستجو گوگل نیز دروغ خواهد گفت؟!
پینوشت:
1- اگر علاقهمند به شنیدن کتابهای صوتی و پادکست هستید میتوانید خلاصه این کتاب را در اپیزود شماره 3 پادکست Bplus گوش دهید. در پست بعدی این پادکست قرار داده خواهد شد.
2-مطالعه این کتاب برای متخصصین جامعهشناسی، روانشناسی، مدیران و... بسیار مفید خواهد بود.
ارادتمند
محمدرضا محتاط
@DataAnalysis
https://bit.ly/2RxlWFm
کتاب EVERYBODY LIES یکی از کتابهای جذاب برای آشنایی با قابلیتهای حوزه Big Data میباشد که توسط ست استفندیویدویتز یکی از دانشمندان داده شرکت گوگل در جهت معرفی قابلیتهای تحلیلداده منتشر گردیده است.
این محقق چهار سال را صرف تحلیل دادههای ناشناس گوگل کرده است. تحقیقات او درباره موضوعاتی همچون بیماریهای روانی، سقط جنین، مذهب و پزشکی بوده است. او معتقد است که جستجوهای گوگل مهمترین پایگاه دادهای است که تاکنون در مورد روح و روان انسان وجود دارد.
در این کتاب مقایسههای مختلفی از جستجوهای کاربران موتور جستجو گوگل با نظرسنجیها عمومی صورت گرفته است. نتایج این تحقیق نشان از وجود اختلاف میان این دو حوزه و ارزش تحلیل اطلاعات در عصر جدید است.
در ادامه بخشی از توضیحات این کتاب آورده شده است:
همه دروغ میگویند. مردم در مورد اینکه چند بار به باشگاه میروند، قیمت کفش آنها چقدر است و کتابهایی که میخوانند، دروغ میگویند. آنها سر کار نمیروند چون بیمار هستند، اما در واقع دروغ میگویند. آنها میگویند که با شما تماس میگیرند، اما نمیگیرند.
محور اصلی این کتاب جمله زیر میباشد:
آیا مردم در سرچهای خود در موتور جستجو گوگل نیز دروغ خواهد گفت؟!
پینوشت:
1- اگر علاقهمند به شنیدن کتابهای صوتی و پادکست هستید میتوانید خلاصه این کتاب را در اپیزود شماره 3 پادکست Bplus گوش دهید. در پست بعدی این پادکست قرار داده خواهد شد.
2-مطالعه این کتاب برای متخصصین جامعهشناسی، روانشناسی، مدیران و... بسیار مفید خواهد بود.
ارادتمند
محمدرضا محتاط
@DataAnalysis
BPlus Podcast Episode 3 : Everybody Lies
Ali Bandari
3:Everybody Lies اپیزود سوم پادکست بیپلاس