مقایسه کامل الگوریتمهای بانظارت یادگیریماشین:
https://goo.gl/Fte7WZ
لینک کامل مطلب:
http://www.dataschool.io/comparing-supervised-learning-algorithms/
@dataanalysis
https://goo.gl/Fte7WZ
لینک کامل مطلب:
http://www.dataschool.io/comparing-supervised-learning-algorithms/
@dataanalysis
برترین کتابخانههای زبان برنامهنویسی پایتون در حوزه علمداده در سال 2017:
https://goo.gl/74UmP4
1. NumPy
2. SciPy
3. Pandas
4.Matplotlib
5. Seaborn
6. Bokeh
7. Plotly
8. SciKit-Learn
9.Theano
10. TensorFlow
11. Keras
12. NLTK
13. Gensim
14. Scrapy
15. Statsmodels
لینک کامل مقاله وبسایت kdnuggets:
http://www.kdnuggets.com/2017/06/top-15-python-libraries-data-science.html
@dataanalysis
https://goo.gl/74UmP4
1. NumPy
2. SciPy
3. Pandas
4.Matplotlib
5. Seaborn
6. Bokeh
7. Plotly
8. SciKit-Learn
9.Theano
10. TensorFlow
11. Keras
12. NLTK
13. Gensim
14. Scrapy
15. Statsmodels
لینک کامل مقاله وبسایت kdnuggets:
http://www.kdnuggets.com/2017/06/top-15-python-libraries-data-science.html
@dataanalysis
مقایسه میان ابزارهای مورد استفاده توسط مهندس داده و دانشمند علمداده
https://goo.gl/CkwBDp
ملاحظه:
بخش زرد: دانشمند علمداده
بخش آبی: مهندس داده
@dataanalysis
https://goo.gl/CkwBDp
ملاحظه:
بخش زرد: دانشمند علمداده
بخش آبی: مهندس داده
@dataanalysis
Forwarded from آمارش
This media is not supported in your browser
VIEW IN TELEGRAM
❇️ روایت جالب دکتر نخعی زاده در کنفرانس MIPIS از روند آشنایی با داده کاوی در شرکت مرسدس بنز و نحوه ی ارتباط این علم با آمار
@Amaresh96
@Amaresh96
ده مهارتی که بیشترین استفاده را در فرصتهای شغلی مرتبط با دانشمند علم داده دارد!
https://goo.gl/HukHtH
1-Python
2-R
3-SQL
4-Hadoop
5-Java
6-SAS
7-Spark
8-Matlab
9-Hive
10-Tableau
@dataanalysis
https://goo.gl/HukHtH
1-Python
2-R
3-SQL
4-Hadoop
5-Java
6-SAS
7-Spark
8-Matlab
9-Hive
10-Tableau
@dataanalysis
Forwarded from Arya Hamrah
دکتر مهدی نصیری، مدیر واحد علم دادهها شرکت آریا همراه در کارگاه آموزشی نمایشگاه تراکنش ایران، به ارائه دستاوردهای آریاهمراه در حوزه دادهکاوی و کلانداده خواهد پرداخت.
http://www.itefaba.com/fa/news/%D8%B3%D8%AE%D9%86%D8%B1%D8%A7%D9%86-%D9%85%D9%87%D8%AF%DB%8C-%D9%86%D8%B5%DB%8C%D8%B1%DB%8C/
http://www.itefaba.com/fa/news/%D8%B3%D8%AE%D9%86%D8%B1%D8%A7%D9%86-%D9%85%D9%87%D8%AF%DB%8C-%D9%86%D8%B5%DB%8C%D8%B1%DB%8C/
Itefaba
سخنران: مهدی نصیری
<span dir="RTL">مهدی نصیری <span dir="RTL">مدیر واحد علم داده ها شرکت آریاهمراه سامانه، سخنران نمایشگاه تراکنش ایران (ITE 2017) است.
ویژگیهای جدید Sql Server 2017!
متخصصین علمداده از این نسخه میتوانند از زبان پایتون(Anaconda)و R به صورت یکپارچه در Sql Server استفاده نمایند
@dataanalysis
متخصصین علمداده از این نسخه میتوانند از زبان پایتون(Anaconda)و R به صورت یکپارچه در Sql Server استفاده نمایند
@dataanalysis
سمینار تحلیل دادگان شبکیه چشم با رویکرد آماری و یادگیری ماشین!
زمان:چهارشنبه 19 مهر از ساعت 10 الی 12
مکان:سالن صدری دانشکده مهندسی کامپیوتر شیراز
مدرس:دکتر یوسفی از دانشگاه تنسی آمریکا
@dataanalysis
زمان:چهارشنبه 19 مهر از ساعت 10 الی 12
مکان:سالن صدری دانشکده مهندسی کامپیوتر شیراز
مدرس:دکتر یوسفی از دانشگاه تنسی آمریکا
@dataanalysis
سه ویژگی کلیدی نسخه SQL Server 2017 برای دانشمندان علمداده:
https://goo.gl/GqnbRZ
1- پایتون و R: در این نسخه به صورت یکپارچه امکان استفاده از زبانهای مطرح علمداده همچون زبانهای برنامهنویسی پایتون و R را در SQL Server خواهید داشت.
2- پایگاه داده گرافی: در نسخه 2017 پایگاه داده SQL Server امکان مدیریت دادگان و اطلاعات مبتنی بر Graph ایجاد گردیده است.
3- هوش تجاری: با اضافهسازی ابزار داشبوردسازی Power BI، از طریق SSRS امکان ساخت داشبوردهای کارآمد را به صورت یکپارچه در پلتفرم هوش تجاری SQL Server وجود دارد.
@dataanalysis
https://goo.gl/GqnbRZ
1- پایتون و R: در این نسخه به صورت یکپارچه امکان استفاده از زبانهای مطرح علمداده همچون زبانهای برنامهنویسی پایتون و R را در SQL Server خواهید داشت.
2- پایگاه داده گرافی: در نسخه 2017 پایگاه داده SQL Server امکان مدیریت دادگان و اطلاعات مبتنی بر Graph ایجاد گردیده است.
3- هوش تجاری: با اضافهسازی ابزار داشبوردسازی Power BI، از طریق SSRS امکان ساخت داشبوردهای کارآمد را به صورت یکپارچه در پلتفرم هوش تجاری SQL Server وجود دارد.
@dataanalysis
بررسی سؤال مسابقه دادهکاوی دانشگاه امیرکبیر:
مسابقه دادهکاوی دانشگاه امیرکبیر با تمرکز بر حل مسائل روز بانکی آغاز گردیده است. با توجه به آگاهی علاقهمندان و مخاطبان کانال برخی از جزئیات مطرحشده در این مسابقه در ادامه بیان میگردد:
https://goo.gl/sFEVtd
این مسابقه سومین مسابقه رسمی دادهکاوی برگزارشده در چند سال اخیر در کشور میباشد. سؤال اصلی مطرحشده پیشبینی وفاداری مشتریان از روی تراکنشهای بانکی میباشد. دادگان اصلی مسابقه شامل اطلاعات تراکنش 5 ماه یکی از بانکهای کشور با جامعه آماری 40 هزار مشتری میباشد.
در این سؤال هدف پیشبینی میانگین موجودی یک مشتری در ماه آتی بانک میباشد. دادگان تحویل دادهشده به شرکتکنندگان شامل متغیرهای کد مشتری، شمارهحساب، مبلغ تراکنش، ماندهحساب، تاریخ تراکنش، شماره پایانه بانکی، حالت حساب و کد تراکنش بانکی میباشد.
قابلذکر میباشد با توجه به اهمیت حفظ حریم خصوصی مشتریان بانکی برخی از ویژگیهای فوق کدگذاری گردیدهاند.
روشها و ویژگیهای مورد نیاز جهت حل مسئله فوق نیز پس از پایان مسابقات در همین کانال مورد بررسی بیشتر قرار خواهد گرفت.
ارادتمند
محمدرضا محتاط
@dataanalysis
مسابقه دادهکاوی دانشگاه امیرکبیر با تمرکز بر حل مسائل روز بانکی آغاز گردیده است. با توجه به آگاهی علاقهمندان و مخاطبان کانال برخی از جزئیات مطرحشده در این مسابقه در ادامه بیان میگردد:
https://goo.gl/sFEVtd
این مسابقه سومین مسابقه رسمی دادهکاوی برگزارشده در چند سال اخیر در کشور میباشد. سؤال اصلی مطرحشده پیشبینی وفاداری مشتریان از روی تراکنشهای بانکی میباشد. دادگان اصلی مسابقه شامل اطلاعات تراکنش 5 ماه یکی از بانکهای کشور با جامعه آماری 40 هزار مشتری میباشد.
در این سؤال هدف پیشبینی میانگین موجودی یک مشتری در ماه آتی بانک میباشد. دادگان تحویل دادهشده به شرکتکنندگان شامل متغیرهای کد مشتری، شمارهحساب، مبلغ تراکنش، ماندهحساب، تاریخ تراکنش، شماره پایانه بانکی، حالت حساب و کد تراکنش بانکی میباشد.
قابلذکر میباشد با توجه به اهمیت حفظ حریم خصوصی مشتریان بانکی برخی از ویژگیهای فوق کدگذاری گردیدهاند.
روشها و ویژگیهای مورد نیاز جهت حل مسئله فوق نیز پس از پایان مسابقات در همین کانال مورد بررسی بیشتر قرار خواهد گرفت.
ارادتمند
محمدرضا محتاط
@dataanalysis
سؤالات مصاحبه استخدامی متخصص علمداده:
یکی از مهمترین گامهای ارزیابی یک متخصص علمداده علاوه بر بررسی کردن رزومه کاری، مصاحبه استخدامی و پرسیدن برخی از سؤالات تخصصی از وی میباشد. لذا اگر در شرکت خود قصد استخدام دانشمند علمداده دارید میتوانید از سؤالات ذیل جهت بررسی هر چه بیشتر دانش تخصصی وی استفاده نمایید.
متخصصین و دانشمندان علمداده هم با پاسخ به سؤالات زیر میتوانند دانش خود را محک بزنند!
https://goo.gl/xx3Zpi
1- چرخه انجام یک پروژه علمداده چیست؟
2- روش Cross Validation چیست و چه مزایایی دارد؟
3- مراحل پیادهسازی یک محصول تجاری داده محور چگونه میباشد؟
4- بیشترین حجم دادگان مورداستفاده در پروژههای قبلی چه میزان بوده است؟ جهت مدیریت این حجم از چه پلتفرم و ابزارهایی استفاده کردهاید؟
5- مهمترین گام در چرخه متدولوژی CRISP-DM چیست و چرا؟
6- پاکسازی اطلاعات چیست و چگونه انجام میگردد؟
7- چگونه دادگان غیر ساختیافته به اطلاعات ساختیافته تبدیل میگردند؟
8- در پیادهسازی یک مدل مبتنی بر یادگیری ماشین، پایدار بودن(robust) اهمیت بیشتری دارد یا میزان صحت(Accurate)؟
9- گامهای بهینهسازی یک الگوریتم ازلحاظ سرعت و کیفیت چیست؟
10- تفاوت الگوریتمها و روشهای با نظارت با روشهای بدون نظارت چیست؟
11- تفاوت Overfitting و Underfitting چیست و چه زمانی اتفاق میافتند؟
12- تفاوت معیارهای ارزیابی precision و recall چیست؟ کدامیک کارآمدتر هست؟
13- از چه راهکارهایی جهت مدیریت دادگان غیرمتوازن(Unbalance Data) استفاده خواهید کرد؟
14- چه معیارهای جهت انتخاب یک الگوریتم یادگیری ماشین جهت پاسخ به یک مسئله وجود دارد؟
15- تفاوت پایگاه داده، انبار داده و Data Mart چیست؟
16- چه زمانی از الگوریتمهایی مانند SVM یا Random Forset استفاده میکنید و چرا؟
17- تحلیل مؤلفههای اصلی (Principal component analysis) چیست و چه مزایا و معایبی دارد؟
18- نسلهای معماریهای پردازشی کلان داده چیست و Map Redcue چه تفاوتی با موتور پردازشی Spark دارد؟
19- پایگاه دادههای غیر رابطهای به چند دسته تقسیم میشوند و در چه مسائلی میتوانند مورداستفاده قرار بگیرند؟
20- روشهای مبتنی بر شبکههای عصبی پیشرفته(یادگیری عمیق) چه مزایا و معایبی نسبت به سایر الگوریتمها و روشها دارد؟
@dataanalysis
موفق و موید باشید
محمدرضا محتاط
یکی از مهمترین گامهای ارزیابی یک متخصص علمداده علاوه بر بررسی کردن رزومه کاری، مصاحبه استخدامی و پرسیدن برخی از سؤالات تخصصی از وی میباشد. لذا اگر در شرکت خود قصد استخدام دانشمند علمداده دارید میتوانید از سؤالات ذیل جهت بررسی هر چه بیشتر دانش تخصصی وی استفاده نمایید.
متخصصین و دانشمندان علمداده هم با پاسخ به سؤالات زیر میتوانند دانش خود را محک بزنند!
https://goo.gl/xx3Zpi
1- چرخه انجام یک پروژه علمداده چیست؟
2- روش Cross Validation چیست و چه مزایایی دارد؟
3- مراحل پیادهسازی یک محصول تجاری داده محور چگونه میباشد؟
4- بیشترین حجم دادگان مورداستفاده در پروژههای قبلی چه میزان بوده است؟ جهت مدیریت این حجم از چه پلتفرم و ابزارهایی استفاده کردهاید؟
5- مهمترین گام در چرخه متدولوژی CRISP-DM چیست و چرا؟
6- پاکسازی اطلاعات چیست و چگونه انجام میگردد؟
7- چگونه دادگان غیر ساختیافته به اطلاعات ساختیافته تبدیل میگردند؟
8- در پیادهسازی یک مدل مبتنی بر یادگیری ماشین، پایدار بودن(robust) اهمیت بیشتری دارد یا میزان صحت(Accurate)؟
9- گامهای بهینهسازی یک الگوریتم ازلحاظ سرعت و کیفیت چیست؟
10- تفاوت الگوریتمها و روشهای با نظارت با روشهای بدون نظارت چیست؟
11- تفاوت Overfitting و Underfitting چیست و چه زمانی اتفاق میافتند؟
12- تفاوت معیارهای ارزیابی precision و recall چیست؟ کدامیک کارآمدتر هست؟
13- از چه راهکارهایی جهت مدیریت دادگان غیرمتوازن(Unbalance Data) استفاده خواهید کرد؟
14- چه معیارهای جهت انتخاب یک الگوریتم یادگیری ماشین جهت پاسخ به یک مسئله وجود دارد؟
15- تفاوت پایگاه داده، انبار داده و Data Mart چیست؟
16- چه زمانی از الگوریتمهایی مانند SVM یا Random Forset استفاده میکنید و چرا؟
17- تحلیل مؤلفههای اصلی (Principal component analysis) چیست و چه مزایا و معایبی دارد؟
18- نسلهای معماریهای پردازشی کلان داده چیست و Map Redcue چه تفاوتی با موتور پردازشی Spark دارد؟
19- پایگاه دادههای غیر رابطهای به چند دسته تقسیم میشوند و در چه مسائلی میتوانند مورداستفاده قرار بگیرند؟
20- روشهای مبتنی بر شبکههای عصبی پیشرفته(یادگیری عمیق) چه مزایا و معایبی نسبت به سایر الگوریتمها و روشها دارد؟
@dataanalysis
موفق و موید باشید
محمدرضا محتاط
پکیج جدید نرم افزار آر برای استفاده از نقشه گوگل برای موقعیت یابی
https://www.linkedin.com/groups/6728779/6728779-6328461879807213571
https://news.1rj.ru/str/dataanalysis
https://www.linkedin.com/groups/6728779/6728779-6328461879807213571
https://news.1rj.ru/str/dataanalysis
Linkedin
Sign Up
500 million+ members | Manage your professional identity. Build and engage with your professional network. Access knowledge, insights and opportunities.
Forwarded from انجمن علوم کامپیوتر بهشتی
جهت ثبت نام و کسب اطلاعات بیشتر به لینک های زیر مراجعه نمایید.
http://cssbu.ir/
http://conf.sbu.ac.ir/index.php/data/data
@cssbu
http://cssbu.ir/
http://conf.sbu.ac.ir/index.php/data/data
@cssbu