الْحَمْدُ لِلَّهِ الَّذِی جَعَلَنَا مِنَ الْمُتَمَسِّکِینَ بِوِلاَیَةِ أَمِیرِ الْمُؤْمِنِینَ وَ الْأَئِمَّةِ عَلَیْهِمُ السَّلاَمُ
الْحَمْدُ لِلَّهِ الَّذِی جَعَلَ کَمَالَ دِینِهِ وَ تَمَامَ نِعْمَتِهِ بِوِلاَیَةِ أَمِیرِ الْمُؤْمِنِینَ عَلِیِّ بْنِ أَبِی طَالِبٍ عَلَیْهِ السَّلاَم.
الْحَمْدُ لِلَّهِ الَّذِی أَکْرَمَنَا بِهَذَا الْیَوْمِ وَ جَعَلَنَا مِنَ الْمُوفِینَ بِعَهْدِهِ إِلَیْنَا وَ مِیثَاقِهِ الَّذِی وَاثَقَنَا بِهِ مِنْ وِلاَیَةِ وُلاَةِ أَمْرِهِ وَ الْقُوَّامِ بِقِسْطِهِ وَ لَمْ یَجْعَلْنَا مِنَ الْجَاحِدِینَ وَ الْمُکَذِّبِینَ بِیَوْمِ الدِّین.
الْحَمْدُ لِلَّهِ الَّذِی جَعَلَ کَمَالَ دِینِهِ وَ تَمَامَ نِعْمَتِهِ بِوِلاَیَةِ أَمِیرِ الْمُؤْمِنِینَ عَلِیِّ بْنِ أَبِی طَالِبٍ عَلَیْهِ السَّلاَم.
الْحَمْدُ لِلَّهِ الَّذِی أَکْرَمَنَا بِهَذَا الْیَوْمِ وَ جَعَلَنَا مِنَ الْمُوفِینَ بِعَهْدِهِ إِلَیْنَا وَ مِیثَاقِهِ الَّذِی وَاثَقَنَا بِهِ مِنْ وِلاَیَةِ وُلاَةِ أَمْرِهِ وَ الْقُوَّامِ بِقِسْطِهِ وَ لَمْ یَجْعَلْنَا مِنَ الْجَاحِدِینَ وَ الْمُکَذِّبِینَ بِیَوْمِ الدِّین.
Forwarded from مسابقه دادهكاوی اميركبير
مقایسه بین استفاده از زبانهای پایتون و R در پیادهسازیهای صورت گرفته در مسابقات علمداده وبسایت Kaggle
@dataanalysis
@dataanalysis
معماری پروژه هوش تجاری مبتنی بر کلان داده:
جهت پیادهسازی یک پروژه هوش تجاری مبتنی بر کلان داده نیازمند برخی ابزارها و پلتفرمهای مطرح Big Data میباشد که در ادامه برخی از این ابزارها به تفکیک گامهای یک پروژه هوش تجاری معرفی خواهند شد:
http://bit.ly/2h7CCPI
1- فرایند ETL:
*این گام یکی از مراحل مهم در پیاده سازی یک پروژه هوش تجاری میباشد. در صورتی که از پایگاه دادههای رابطه همانند Sql, MySQL و... استفاده می کنید جهت انتقال اطلاعات و پیاده سازی فرایند Extract به پلتفرمهای کلان داده همچون آپاچی هدوپ میتوانید از پروژه آپاچی Sqoop استفاده نمایید.
* جهت اعمال برخی فرایندهای پردازشی در گام Transform زبان اسکریپتی آپاچی Pig یا نرم افزار آپاچی Nifi جهت این فرایند کاربرد خواهد داشت.
+برخی از Message Broker های مطرح نیز همچون آپاچی Kafka, Flume و Nifi جهت انتقال بلادرنگ اطلاعات از پایگاه دادهها و منابع ورودی اطلاعات سازمان شما به انبار داده در گام Load میتواند کاربرد داشته باشد.
2- انبار داده:
جهت ایجاد انبارداده از پایگاه دادههای Nosql یا فایل سیستمهای مطرح در سطح کلان داده همچون فایلسیستم توزیعی هدوپ( HDFS), کاساندرا، HBASE و... بنا به معماری و ویژگیهای پروژه خود می توانید انتخاب کنید.
3- پردازش تحلیلی آنلاین(OLAP):
جهت ساخت OLAP و مکعبهای پردازشی در کلان داده ها از پروژه آپاچی Kylin استفاده میشود. این معماری از معماری Map Reduce و اتصال به پایگاه داده های رابطهای مانند Hive, Impala و... جهت ساخت مدل تحلیلی پردازشی آنلاین استفاده میگردد. جهت تحلیلهای پیشرفته مبتنی بر یادگیری ماشین و دادهکاوی هم کتابخانههای تحلیلی آپاچی ماهوت در هدوپ و MLlib در اسپارک وجود دارد.
@dataanalysis
ارادتمند
محمدرضا محتاط
جهت پیادهسازی یک پروژه هوش تجاری مبتنی بر کلان داده نیازمند برخی ابزارها و پلتفرمهای مطرح Big Data میباشد که در ادامه برخی از این ابزارها به تفکیک گامهای یک پروژه هوش تجاری معرفی خواهند شد:
http://bit.ly/2h7CCPI
1- فرایند ETL:
*این گام یکی از مراحل مهم در پیاده سازی یک پروژه هوش تجاری میباشد. در صورتی که از پایگاه دادههای رابطه همانند Sql, MySQL و... استفاده می کنید جهت انتقال اطلاعات و پیاده سازی فرایند Extract به پلتفرمهای کلان داده همچون آپاچی هدوپ میتوانید از پروژه آپاچی Sqoop استفاده نمایید.
* جهت اعمال برخی فرایندهای پردازشی در گام Transform زبان اسکریپتی آپاچی Pig یا نرم افزار آپاچی Nifi جهت این فرایند کاربرد خواهد داشت.
+برخی از Message Broker های مطرح نیز همچون آپاچی Kafka, Flume و Nifi جهت انتقال بلادرنگ اطلاعات از پایگاه دادهها و منابع ورودی اطلاعات سازمان شما به انبار داده در گام Load میتواند کاربرد داشته باشد.
2- انبار داده:
جهت ایجاد انبارداده از پایگاه دادههای Nosql یا فایل سیستمهای مطرح در سطح کلان داده همچون فایلسیستم توزیعی هدوپ( HDFS), کاساندرا، HBASE و... بنا به معماری و ویژگیهای پروژه خود می توانید انتخاب کنید.
3- پردازش تحلیلی آنلاین(OLAP):
جهت ساخت OLAP و مکعبهای پردازشی در کلان داده ها از پروژه آپاچی Kylin استفاده میشود. این معماری از معماری Map Reduce و اتصال به پایگاه داده های رابطهای مانند Hive, Impala و... جهت ساخت مدل تحلیلی پردازشی آنلاین استفاده میگردد. جهت تحلیلهای پیشرفته مبتنی بر یادگیری ماشین و دادهکاوی هم کتابخانههای تحلیلی آپاچی ماهوت در هدوپ و MLlib در اسپارک وجود دارد.
@dataanalysis
ارادتمند
محمدرضا محتاط
👍1
به جامعه متخصصین علمداده ایران با حضور اساتید و متخصصین برجسته کشور در حوزههای تحلیلهای پیشرفته کسبوکار، دادهکاوی، هوشتجاری، کلانداده و پردازش متن بپیوندید!
آدرس کانال:
@dataanalysis
آدرس کانال:
@dataanalysis
فایل ارائه دانشگاه استنفورد پیرامون فریمورکهای یادگیری عمیق
https://goo.gl/CFu3jD
لینک دانلود:
http://stanford.io/2eVHV7U
@dataanalysis
https://goo.gl/CFu3jD
لینک دانلود:
http://stanford.io/2eVHV7U
@dataanalysis
معرفی دوره آموزشی Applied Data Science with Python:
https://goo.gl/a4NoKA
این دوره آموزشی توسط دانشگاه میشیگان آمریکا در حوزه علمداده و زبان پایتون به صورت آنلاین و در سطح مقدماتی و متوسط تدریس میگردد. این دوره آموزشی شامل 5 درس با عناوین زیر میباشد.
1-Introduction to Data Science in Python
2- Applied Plotting, Charting & Data Representation
3- Applied Machine Learning in Python
4- Applied Text Mining in Python
5- Applied Social Network Analysis in Python
لینک دوره:
https://www.coursera.org/specializations/data-science-python#courses
پینوشت:
جهت ثبتنام پس از مراجعه به صفحه اصلی دوره با انتخاب درس مدنظر و رفتن به صفحه درس گزینه Enroll و سپس گزینه Audit را فعال نمایید. گفتنی است جهت ثبتنام به دلیل تحریم بودن کشور ایران نیاز به فیلترشکن خواهید داشت.
@dataanalysis
https://goo.gl/a4NoKA
این دوره آموزشی توسط دانشگاه میشیگان آمریکا در حوزه علمداده و زبان پایتون به صورت آنلاین و در سطح مقدماتی و متوسط تدریس میگردد. این دوره آموزشی شامل 5 درس با عناوین زیر میباشد.
1-Introduction to Data Science in Python
2- Applied Plotting, Charting & Data Representation
3- Applied Machine Learning in Python
4- Applied Text Mining in Python
5- Applied Social Network Analysis in Python
لینک دوره:
https://www.coursera.org/specializations/data-science-python#courses
پینوشت:
جهت ثبتنام پس از مراجعه به صفحه اصلی دوره با انتخاب درس مدنظر و رفتن به صفحه درس گزینه Enroll و سپس گزینه Audit را فعال نمایید. گفتنی است جهت ثبتنام به دلیل تحریم بودن کشور ایران نیاز به فیلترشکن خواهید داشت.
@dataanalysis
تعداد اتفاق در یک دقیقه در اینترنت سال 2017 https://news.1rj.ru/str/dataanalysis
مقایسه کامل الگوریتمهای بانظارت یادگیریماشین:
https://goo.gl/Fte7WZ
لینک کامل مطلب:
http://www.dataschool.io/comparing-supervised-learning-algorithms/
@dataanalysis
https://goo.gl/Fte7WZ
لینک کامل مطلب:
http://www.dataschool.io/comparing-supervised-learning-algorithms/
@dataanalysis
برترین کتابخانههای زبان برنامهنویسی پایتون در حوزه علمداده در سال 2017:
https://goo.gl/74UmP4
1. NumPy
2. SciPy
3. Pandas
4.Matplotlib
5. Seaborn
6. Bokeh
7. Plotly
8. SciKit-Learn
9.Theano
10. TensorFlow
11. Keras
12. NLTK
13. Gensim
14. Scrapy
15. Statsmodels
لینک کامل مقاله وبسایت kdnuggets:
http://www.kdnuggets.com/2017/06/top-15-python-libraries-data-science.html
@dataanalysis
https://goo.gl/74UmP4
1. NumPy
2. SciPy
3. Pandas
4.Matplotlib
5. Seaborn
6. Bokeh
7. Plotly
8. SciKit-Learn
9.Theano
10. TensorFlow
11. Keras
12. NLTK
13. Gensim
14. Scrapy
15. Statsmodels
لینک کامل مقاله وبسایت kdnuggets:
http://www.kdnuggets.com/2017/06/top-15-python-libraries-data-science.html
@dataanalysis
مقایسه میان ابزارهای مورد استفاده توسط مهندس داده و دانشمند علمداده
https://goo.gl/CkwBDp
ملاحظه:
بخش زرد: دانشمند علمداده
بخش آبی: مهندس داده
@dataanalysis
https://goo.gl/CkwBDp
ملاحظه:
بخش زرد: دانشمند علمداده
بخش آبی: مهندس داده
@dataanalysis
Forwarded from آمارش
This media is not supported in your browser
VIEW IN TELEGRAM
❇️ روایت جالب دکتر نخعی زاده در کنفرانس MIPIS از روند آشنایی با داده کاوی در شرکت مرسدس بنز و نحوه ی ارتباط این علم با آمار
@Amaresh96
@Amaresh96
ده مهارتی که بیشترین استفاده را در فرصتهای شغلی مرتبط با دانشمند علم داده دارد!
https://goo.gl/HukHtH
1-Python
2-R
3-SQL
4-Hadoop
5-Java
6-SAS
7-Spark
8-Matlab
9-Hive
10-Tableau
@dataanalysis
https://goo.gl/HukHtH
1-Python
2-R
3-SQL
4-Hadoop
5-Java
6-SAS
7-Spark
8-Matlab
9-Hive
10-Tableau
@dataanalysis
Forwarded from Arya Hamrah
دکتر مهدی نصیری، مدیر واحد علم دادهها شرکت آریا همراه در کارگاه آموزشی نمایشگاه تراکنش ایران، به ارائه دستاوردهای آریاهمراه در حوزه دادهکاوی و کلانداده خواهد پرداخت.
http://www.itefaba.com/fa/news/%D8%B3%D8%AE%D9%86%D8%B1%D8%A7%D9%86-%D9%85%D9%87%D8%AF%DB%8C-%D9%86%D8%B5%DB%8C%D8%B1%DB%8C/
http://www.itefaba.com/fa/news/%D8%B3%D8%AE%D9%86%D8%B1%D8%A7%D9%86-%D9%85%D9%87%D8%AF%DB%8C-%D9%86%D8%B5%DB%8C%D8%B1%DB%8C/
Itefaba
سخنران: مهدی نصیری
<span dir="RTL">مهدی نصیری <span dir="RTL">مدیر واحد علم داده ها شرکت آریاهمراه سامانه، سخنران نمایشگاه تراکنش ایران (ITE 2017) است.
ویژگیهای جدید Sql Server 2017!
متخصصین علمداده از این نسخه میتوانند از زبان پایتون(Anaconda)و R به صورت یکپارچه در Sql Server استفاده نمایند
@dataanalysis
متخصصین علمداده از این نسخه میتوانند از زبان پایتون(Anaconda)و R به صورت یکپارچه در Sql Server استفاده نمایند
@dataanalysis