Data Science – Telegram
Data Science
7.47K subscribers
754 photos
49 videos
85 files
451 links
ارتباط با ادمین:
@Datascience
Download Telegram
برترین کتابخانه‌های زبان برنامه‌نویسی پایتون در حوزه علم‌داده در سال 2017:
https://goo.gl/74UmP4

1. NumPy
2. SciPy
3. Pandas
4.Matplotlib
5. Seaborn
6. Bokeh
7. Plotly
8. SciKit-Learn
9.Theano
10. TensorFlow
11. Keras
12. NLTK
13. Gensim
14. Scrapy
15. Statsmodels

لینک کامل مقاله وب‌سایت kdnuggets:
http://www.kdnuggets.com/2017/06/top-15-python-libraries-data-science.html

@dataanalysis
مراحل اجرایی یک پروژه مبتنی بر علم داده:

https://goo.gl/ui6XdW

@dataanalysis
مقایسه میان ابزارهای مورد استفاده توسط مهندس داده و دانشمند علم‌داده

https://goo.gl/CkwBDp

ملاحظه:
بخش زرد: دانشمند علم‌داده
بخش آبی: مهندس داده

@dataanalysis
Forwarded from آمارش
This media is not supported in your browser
VIEW IN TELEGRAM
❇️ روایت جالب دکتر نخعی زاده در کنفرانس MIPIS از روند آشنایی با داده کاوی در شرکت مرسدس بنز و نحوه ی ارتباط این علم با آمار

@Amaresh96
ده مهارتی که بیشترین استفاده را در فرصت‌های شغلی مرتبط با دانشمند علم داده دارد!
https://goo.gl/HukHtH

1-Python
2-R
3-SQL
4-Hadoop
5-Java
6-SAS
7-Spark
8-Matlab
9-Hive
10-Tableau

@dataanalysis
Forwarded from Arya Hamrah
دکتر مهدی نصیری، مدیر واحد علم داده‌ها شرکت آریا همراه در کارگاه آموزشی نمایشگاه تراکنش ایران، به ارائه دستاوردهای آریاهمراه در حوزه داده‌کاوی و کلان‌داده خواهد پرداخت.

http://www.itefaba.com/fa/news/%D8%B3%D8%AE%D9%86%D8%B1%D8%A7%D9%86-%D9%85%D9%87%D8%AF%DB%8C-%D9%86%D8%B5%DB%8C%D8%B1%DB%8C/
ویژگی‌های جدید Sql Server 2017!

متخصصین علم‌داده از این نسخه می‌توانند از زبان پایتون(Anaconda)و R به صورت یکپارچه در Sql Server استفاده نمایند

@dataanalysis
فرصت شغلی Backend Developer و Lead Developer شرکت #دایکه!

@dataanalysis
ابزارها، تکنولوژی‌ها و مفاهیم مرتبط با حوزه علم‌داده!

@dataanalysis
سمینار تحلیل دادگان شبکیه چشم با رویکرد آماری و یادگیری ماشین!

زمان:چهارشنبه 19 مهر از ساعت 10 الی 12
مکان:سالن صدری دانشکده مهندسی کامپیوتر شیراز
مدرس:دکتر یوسفی از دانشگاه تنسی آمریکا
@dataanalysis
کتاب کاربردی یادگیری ماشین در اسپارک!

@dataanalysis
Machine Learning with Spark.pdf
5.4 MB
هفت مهارت برتر حوزه فناوری‌اطلاعات در سال 2017!

@dataanalysis
سه ویژگی کلیدی نسخه SQL Server 2017 برای دانشمندان علم‌داده:

https://goo.gl/GqnbRZ

1- پایتون و R: در این نسخه به صورت یکپارچه امکان استفاده از زبان‌های مطرح علم‌داده همچون زبان‌های برنامه‌نویسی پایتون و R را در SQL Server خواهید داشت.

2- پایگاه داده گرافی: در نسخه 2017 پایگاه داده SQL Server امکان مدیریت دادگان و اطلاعات مبتنی بر Graph ایجاد گردیده است.

3- هوش تجاری: با اضافه‌سازی ابزار داشبوردسازی Power BI، از طریق SSRS امکان ساخت داشبوردهای کارآمد را به صورت یکپارچه در پلتفرم هوش تجاری SQL Server وجود دارد.

@dataanalysis
بررسی سؤال مسابقه داده‌کاوی دانشگاه امیرکبیر:

مسابقه داده‌کاوی دانشگاه امیرکبیر با تمرکز بر حل مسائل روز بانکی آغاز گردیده است. با توجه به آگاهی علاقه‌مندان و مخاطبان کانال برخی از جزئیات مطرح‌شده در این مسابقه در ادامه بیان می‌گردد:
https://goo.gl/sFEVtd

این مسابقه سومین مسابقه رسمی داده‌کاوی برگزارشده در چند سال اخیر در کشور می‌باشد. سؤال اصلی مطرح‌شده پیش‌بینی وفاداری مشتریان از روی تراکنش‌های بانکی می‌باشد. دادگان اصلی مسابقه شامل اطلاعات تراکنش 5 ماه یکی از بانک‌‌های کشور با جامعه آماری 40 هزار مشتری می‌باشد.

در این سؤال هدف پیش‌بینی میانگین موجودی یک مشتری در ماه آتی بانک می‌باشد. دادگان تحویل داده‌شده به شرکت‌کنندگان شامل متغیرهای کد مشتری، شماره‌حساب، مبلغ تراکنش، مانده‌حساب، تاریخ تراکنش، شماره پایانه بانکی، حالت حساب و کد تراکنش بانکی می‌باشد.

قابل‌ذکر می‌باشد با توجه به اهمیت حفظ حریم خصوصی مشتریان بانکی برخی از ویژگی‌های فوق کدگذاری گردیده‌اند.

روش‌ها و ویژگی‌های مورد نیاز جهت حل مسئله فوق نیز پس از پایان مسابقات در همین کانال مورد بررسی بیشتر قرار خواهد گرفت.

ارادتمند
محمدرضا محتاط
@dataanalysis
سؤالات مصاحبه استخدامی متخصص علم‌داده:

یکی از مهم‌ترین‌ گام‌های ارزیابی یک متخصص علم‌داده علاوه بر بررسی کردن رزومه کاری، مصاحبه استخدامی و پرسیدن برخی از سؤالات تخصصی از وی ‌می‌باشد. لذا اگر در شرکت خود قصد استخدام دانشمند علم‌داده دارید می‌توانید از سؤالات ذیل جهت بررسی هر چه بیشتر دانش تخصصی وی استفاده نمایید.
متخصصین و دانشمندان علم‌داده هم با پاسخ به سؤالات زیر می‌توانند دانش خود را محک بزنند!

https://goo.gl/xx3Zpi

1- چرخه انجام یک پروژه علم‌داده چیست؟
2- روش Cross Validation چیست و چه مزایایی دارد؟
3- مراحل پیاده‌سازی یک محصول تجاری داده محور چگونه می‌باشد؟
4- بیشترین حجم دادگان مورداستفاده در پروژه‌های قبلی چه میزان بوده است؟ جهت مدیریت این حجم از چه پلتفرم و ابزارهایی استفاده کرده‌اید؟
5- مهم‌ترین گام در چرخه متدولوژی CRISP-DM چیست و چرا؟
6- پاک‌سازی اطلاعات چیست و چگونه انجام می‌گردد؟
7- چگونه دادگان غیر ساخت‌یافته به اطلاعات ساخت‌یافته تبدیل می‌گردند؟
8- در پیاده‌سازی یک مدل مبتنی بر یادگیری ماشین، پایدار بودن(robust) اهمیت بیشتری دارد یا میزان صحت(Accurate)؟
9- گام‌های بهینه‌سازی یک الگوریتم ازلحاظ سرعت و کیفیت چیست؟
10- تفاوت الگوریتم‌ها و روش‌های با نظارت با روش‌های بدون نظارت چیست؟
11- تفاوت Overfitting و Underfitting چیست و چه زمانی اتفاق می‌افتند؟
12- تفاوت معیارهای ارزیابی precision و recall چیست؟ کدام‌یک کارآمدتر هست؟
13- از چه راهکارهایی جهت مدیریت دادگان غیرمتوازن(Unbalance Data) استفاده خواهید کرد؟
14- چه معیارهای جهت انتخاب یک الگوریتم یادگیری ماشین جهت پاسخ به یک مسئله وجود دارد؟
15- تفاوت پایگاه داده، انبار داده و Data Mart چیست؟
16- چه زمانی از الگوریتم‌هایی مانند SVM یا Random Forset استفاده می‌کنید و چرا؟
17- تحلیل مؤلفه‌های اصلی (Principal component analysis) چیست و چه مزایا و معایبی دارد؟
18- نسل‌های معماری‌های پردازشی کلان داده چیست و Map Redcue چه تفاوتی با موتور پردازشی Spark دارد؟
19- پایگاه داده‌های غیر رابطه‌ای به چند دسته تقسیم می‌شوند و در چه مسائلی می‌توانند مورداستفاده قرار بگیرند؟
20- روش‌های مبتنی بر شبکه‌های عصبی پیشرفته(یادگیری عمیق) چه مزایا و معایبی نسبت به سایر الگوریتم‌ها و روش‌ها دارد؟

@dataanalysis
موفق و موید باشید

محمدرضا محتاط
مهارت‌های کلیدی و تخصصی مرتبط با حوزه علم داده!

@dataanalysis
جهت ثبت نام و کسب اطلاعات بیشتر به لینک های زیر مراجعه نمایید.
http://cssbu.ir/

http://conf.sbu.ac.ir/index.php/data/data

@cssbu
اسلاید کلان داده، کاربرد در بانک و ارتباط با هوش تجاری-
ارائه شده در نمایشگاه تراکنش

https://www.slideshare.net/secret/6NsPnQAuv8caxJ