NEW BOT Телеграм, страница - 398937168

Data Science

7.44K subscribers

754 photos

49 videos

85 files

451 links

ارتباط با ادمین:
@Datascience

Download Telegram

About

Blog

Apps

Platform

7.44K subscribers

فرصت شغلی Backend Developer و Lead Developer شرکت #دایکه!

@dataanalysis

4.47K views‌محمدرضا محتاط, edited 14:06

ابزارها، تکنولوژی‌ها و مفاهیم مرتبط با حوزه علم‌داده!

@dataanalysis

3.66K views‌محمدرضا محتاط, edited 19:51

سمینار تحلیل دادگان شبکیه چشم با رویکرد آماری و یادگیری ماشین!

زمان:چهارشنبه 19 مهر از ساعت 10 الی 12
مکان:سالن صدری دانشکده مهندسی کامپیوتر شیراز
مدرس:دکتر یوسفی از دانشگاه تنسی آمریکا
@dataanalysis

3.77K views‌محمدرضا محتاط, edited 15:26

کتاب کاربردی یادگیری ماشین در اسپارک!

@dataanalysis

4.03K views‌محمدرضا محتاط, 15:15

Machine Learning with Spark.pdf

4.64K views‌محمدرضا محتاط, 15:15

هفت مهارت برتر حوزه فناوری‌اطلاعات در سال 2017!

@dataanalysis

10.6K views‌محمدرضا محتاط, 13:39

سه ویژگی کلیدی نسخه SQL Server 2017 برای دانشمندان علم‌داده:

https://goo.gl/GqnbRZ

1- پایتون و R: در این نسخه به صورت یکپارچه امکان استفاده از زبان‌های مطرح علم‌داده همچون زبان‌های برنامه‌نویسی پایتون و R را در SQL Server خواهید داشت.

2- پایگاه داده گرافی: در نسخه 2017 پایگاه داده SQL Server امکان مدیریت دادگان و اطلاعات مبتنی بر Graph ایجاد گردیده است.

3- هوش تجاری: با اضافه‌سازی ابزار داشبوردسازی Power BI، از طریق SSRS امکان ساخت داشبوردهای کارآمد را به صورت یکپارچه در پلتفرم هوش تجاری SQL Server وجود دارد.

@dataanalysis

6.17K views‌محمدرضا محتاط, 18:10

بررسی سؤال مسابقه داده‌کاوی دانشگاه امیرکبیر:

مسابقه داده‌کاوی دانشگاه امیرکبیر با تمرکز بر حل مسائل روز بانکی آغاز گردیده است. با توجه به آگاهی علاقه‌مندان و مخاطبان کانال برخی از جزئیات مطرح‌شده در این مسابقه در ادامه بیان می‌گردد:
https://goo.gl/sFEVtd

این مسابقه سومین مسابقه رسمی داده‌کاوی برگزارشده در چند سال اخیر در کشور می‌باشد. سؤال اصلی مطرح‌شده پیش‌بینی وفاداری مشتریان از روی تراکنش‌های بانکی می‌باشد. دادگان اصلی مسابقه شامل اطلاعات تراکنش 5 ماه یکی از بانک‌‌های کشور با جامعه آماری 40 هزار مشتری می‌باشد.

در این سؤال هدف پیش‌بینی میانگین موجودی یک مشتری در ماه آتی بانک می‌باشد. دادگان تحویل داده‌شده به شرکت‌کنندگان شامل متغیرهای کد مشتری، شماره‌حساب، مبلغ تراکنش، مانده‌حساب، تاریخ تراکنش، شماره پایانه بانکی، حالت حساب و کد تراکنش بانکی می‌باشد.

قابل‌ذکر می‌باشد با توجه به اهمیت حفظ حریم خصوصی مشتریان بانکی برخی از ویژگی‌های فوق کدگذاری گردیده‌اند.

روش‌ها و ویژگی‌های مورد نیاز جهت حل مسئله فوق نیز پس از پایان مسابقات در همین کانال مورد بررسی بیشتر قرار خواهد گرفت.

ارادتمند
محمدرضا محتاط
@dataanalysis

4.47K views‌محمدرضا محتاط, 19:24

سؤالات مصاحبه استخدامی متخصص علم‌داده:

یکی از مهم‌ترین‌ گام‌های ارزیابی یک متخصص علم‌داده علاوه بر بررسی کردن رزومه کاری، مصاحبه استخدامی و پرسیدن برخی از سؤالات تخصصی از وی ‌می‌باشد. لذا اگر در شرکت خود قصد استخدام دانشمند علم‌داده دارید می‌توانید از سؤالات ذیل جهت بررسی هر چه بیشتر دانش تخصصی وی استفاده نمایید.
متخصصین و دانشمندان علم‌داده هم با پاسخ به سؤالات زیر می‌توانند دانش خود را محک بزنند!

https://goo.gl/xx3Zpi

1- چرخه انجام یک پروژه علم‌داده چیست؟
2- روش Cross Validation چیست و چه مزایایی دارد؟
3- مراحل پیاده‌سازی یک محصول تجاری داده محور چگونه می‌باشد؟
4- بیشترین حجم دادگان مورداستفاده در پروژه‌های قبلی چه میزان بوده است؟ جهت مدیریت این حجم از چه پلتفرم و ابزارهایی استفاده کرده‌اید؟
5- مهم‌ترین گام در چرخه متدولوژی CRISP-DM چیست و چرا؟
6- پاک‌سازی اطلاعات چیست و چگونه انجام می‌گردد؟
7- چگونه دادگان غیر ساخت‌یافته به اطلاعات ساخت‌یافته تبدیل می‌گردند؟
8- در پیاده‌سازی یک مدل مبتنی بر یادگیری ماشین، پایدار بودن(robust) اهمیت بیشتری دارد یا میزان صحت(Accurate)؟
9- گام‌های بهینه‌سازی یک الگوریتم ازلحاظ سرعت و کیفیت چیست؟
10- تفاوت الگوریتم‌ها و روش‌های با نظارت با روش‌های بدون نظارت چیست؟
11- تفاوت Overfitting و Underfitting چیست و چه زمانی اتفاق می‌افتند؟
12- تفاوت معیارهای ارزیابی precision و recall چیست؟ کدام‌یک کارآمدتر هست؟
13- از چه راهکارهایی جهت مدیریت دادگان غیرمتوازن(Unbalance Data) استفاده خواهید کرد؟
14- چه معیارهای جهت انتخاب یک الگوریتم یادگیری ماشین جهت پاسخ به یک مسئله وجود دارد؟
15- تفاوت پایگاه داده، انبار داده و Data Mart چیست؟
16- چه زمانی از الگوریتم‌هایی مانند SVM یا Random Forset استفاده می‌کنید و چرا؟
17- تحلیل مؤلفه‌های اصلی (Principal component analysis) چیست و چه مزایا و معایبی دارد؟
18- نسل‌های معماری‌های پردازشی کلان داده چیست و Map Redcue چه تفاوتی با موتور پردازشی Spark دارد؟
19- پایگاه داده‌های غیر رابطه‌ای به چند دسته تقسیم می‌شوند و در چه مسائلی می‌توانند مورداستفاده قرار بگیرند؟
20- روش‌های مبتنی بر شبکه‌های عصبی پیشرفته(یادگیری عمیق) چه مزایا و معایبی نسبت به سایر الگوریتم‌ها و روش‌ها دارد؟

@dataanalysis
موفق و موید باشید

محمدرضا محتاط

7.96K views‌محمدرضا محتاط, edited 17:16

مهارت‌های کلیدی و تخصصی مرتبط با حوزه علم داده!

@dataanalysis

3.85K views‌محمدرضا محتاط, 17:59

پکیج جدید نرم افزار آر برای استفاده از نقشه گوگل برای موقعیت یابی
https://www.linkedin.com/groups/6728779/6728779-6328461879807213571
https://news.1rj.ru/str/dataanalysis

500 million+ members | Manage your professional identity. Build and engage with your professional network. Access knowledge, insights and opportunities.

4.18K viewsMahdi Nasiri, edited 09:06

Forwarded from انجمن علوم کامپیوتر بهشتی

جهت ثبت نام و کسب اطلاعات بیشتر به لینک های زیر مراجعه نمایید.
http://cssbu.ir/

http://conf.sbu.ac.ir/index.php/data/data

@cssbu

97 views‌محمدرضا محتاط, 14:23

اسلاید کلان داده، کاربرد در بانک و ارتباط با هوش تجاری-
ارائه شده در نمایشگاه تراکنش

https://www.slideshare.net/secret/6NsPnQAuv8caxJ

5K viewsMahdi Nasiri, edited 06:14

جریان‌کاری پروژه‌های مبتنی بر علم داده!

https://goo.gl/K1UGCa

@dataanalysis

3.13K views‌محمدرضا محتاط, 17:11

بهینه سازی کاربرد استریم اسپارک برای خواندن داده در اپاچی کفکا
http://www.stratio.com/blog/optimizing-spark-streaming-applications-apache-kafka/
https://news.1rj.ru/str/dataanalysis

Optimizing Spark Streaming applications reading data from Apache Kafka - Stratio Blog

Spark Streaming is one of the most widely used frameworks for real time processing in the world with Apache Flink, Apache Storm and Kafka Streams.

3.31K viewsMahdi Nasiri, 05:38

هوش مصنوعی، کلان داده و سلامت
https://www.linkedin.com/pulse/artificial-intelligence-big-data-healthcare-stella-guo/?trackingId=29c%2Bbo62GUPuRorxRi985Q%3D%3D
https://news.1rj.ru/str/dataanalysis

3.12K viewsMahdi Nasiri, 05:47

نقد و بررسی دومین مسابقه داده‌کاوی پارسی پرداز با محوریت نظرکاوی!

http://uupload.ir/files/k8d_sentimentanalysis.jpg

دومین دوره مسابقه داده‌کاوی پارسی پرداز با محوریت نظر کاوی توسط آزمایشگاه تخصصی فناوری وب دانشگاه فردوسی مشهد در هفته گذشته به‌صورت آنلاین برگزار شد. نکات ذیل پیرامون این مسابقه که به نسبت سایر مسابقات داده‌کاوی انجام‌شده در کشور دارای سطح بسیار پایین‌تری بوده است به شرح ذیل می‌باشد:

1- در تمامی مسابقات داده‌کاوی جهت آموزش و ساخت مدل، برخی اطلاعات و داده‌ها توسط برگزارکنندگان به شرکت‌کنندگان تحویل داده می‌شود. شرکت‌کنندگان نیز پس از پیاده‌سازی مدل بهینه بر اساس دادگان تست نتیجه را برای ارزیابی به طراحان مسابقه ارسال می‌نمایند. در مسابقه برگزارشده تنها دادگان تست شامل 100 هزار داده متنی به شرکت‌کنندگان تحویل داده گردید که کاملاً برخلاف اصول پایه‌ای مسابقات داده‌کاوی می‌باشد.

2- در این مسابقه تمامی شرکت‌کنندگان موظف بودند که تمامی سورس‌کدها، فایل‌های اجرایی، مستندات، فایل گزارش متنی و ... را در اختیار تیم برگزارکننده قرار دهند. قابل‌ذکر هست به‌طور مرسوم در اکثر مسابقات تنها تیم‌های برتر می‌بایست مستندات و سورس‌کدهای خود را جهت بررسی و اهدا جوایز به برگزارکننده مسابقه تحویل دهند.

3- از نکات بسیار جالب این مسابقه مدت‌زمان برگزاری آن بود. مدت‌زمان اعلامی توسط تیم برگزارکننده تنها سه ساعت و از ساعت 9 الی 12 روز جمعه اعلام شد!

4- در تمامی مسابقات و چالش‌های داده‌کاوی جوایز تیم‌های برتر به‌صورت دقیق اعلام و مشخص می‌باشد. در توضیحات این مسابقه ذکر شده بود که به تیم‌های برتر جوایز نفیسی اهدا خواهد گردید.

با توجه به فعالیت‌های خوب دانشگاه فردوسی مشهد در حوزه متن‌کاوی و وجود اساتید برجسته و اهمیت حوزه تحلیل احساسات در زبان فارسی انتظار برگزاری مسابقه‌ای با سطح بسیار بالاتر و باکیفیت‌تر بود که متاسفانه میسر نگردید.

@dataanalysis
ارادتمند
محمدرضا محتاط

3.4K views‌محمدرضا محتاط, edited 16:50

طی چند سال آینده تقاضا برای متخصصین علم‌داده و یادگیری ماشین نزولی خواهد گردید؟

منبع: وبسایت Kdnuggets
@dataanalysis

2.73K views‌محمدرضا محتاط, edited 15:45

طی چند سال آینده تقاضا برای متخصصین علم‌داده و یادگیری ماشین نزولی خواهد گردید؟ منبع: وبسایت Kdnuggets @dataanalysis

/تکمیلی‌/
در نظرسنجی فوق این نکته قابل ذکر می باشد که در حدود 25 درصد متخصصین علم‌داده شرکت کننده در این نظرسنجی بیان کرده‌اند که طی 4 الی 6 سال آینده تقاضا برای جذب متخصصین علم‌داده و یادگیری ماشین با کاهش روبه‌رو خواهد شد.
این درصد برای مدت زمان هفت الی ده سال در حدود بیست درصد می‌باشد.
شایان ذکر هست که در حال حاضر اکثر کشورها با کمبود متخصص علم‌داده مواجه هستند!

طی مطلب آتی نیز مدت زمان مورد نیاز جهت تبدیل شدن به یک متخصص علم‌داده مورد بررسی بیشتر قرار خواهد گرفت!
@dataanalysis

موفق و موید باشید

2.99K views‌محمدرضا محتاط, 18:40

فرصت‌های شغلی کارشناس و مدیر فنی تیم علوم‌داده در شرکت پایانه‌های داده‌ای نوین!

@dataanalysis

3.98K views‌محمدرضا محتاط, 06:19

مدت زمان لازم جهت تبدیل شدن به یک متخصص علم‌داده براساس نظرسنجی وب‌سایت Kdnuggets

در قاره آسیا طبق بیان متخصصین علم‌داده این مدت زمان در حدود میانگین پنج سال بوده است.

@dataanalysis

4.13K views‌محمدرضا محتاط, 07:13