Data Science – Telegram
Data Science
7.47K subscribers
754 photos
49 videos
85 files
451 links
ارتباط با ادمین:
@Datascience
Download Telegram
سه ویژگی کلیدی نسخه SQL Server 2017 برای دانشمندان علم‌داده:

https://goo.gl/GqnbRZ

1- پایتون و R: در این نسخه به صورت یکپارچه امکان استفاده از زبان‌های مطرح علم‌داده همچون زبان‌های برنامه‌نویسی پایتون و R را در SQL Server خواهید داشت.

2- پایگاه داده گرافی: در نسخه 2017 پایگاه داده SQL Server امکان مدیریت دادگان و اطلاعات مبتنی بر Graph ایجاد گردیده است.

3- هوش تجاری: با اضافه‌سازی ابزار داشبوردسازی Power BI، از طریق SSRS امکان ساخت داشبوردهای کارآمد را به صورت یکپارچه در پلتفرم هوش تجاری SQL Server وجود دارد.

@dataanalysis
بررسی سؤال مسابقه داده‌کاوی دانشگاه امیرکبیر:

مسابقه داده‌کاوی دانشگاه امیرکبیر با تمرکز بر حل مسائل روز بانکی آغاز گردیده است. با توجه به آگاهی علاقه‌مندان و مخاطبان کانال برخی از جزئیات مطرح‌شده در این مسابقه در ادامه بیان می‌گردد:
https://goo.gl/sFEVtd

این مسابقه سومین مسابقه رسمی داده‌کاوی برگزارشده در چند سال اخیر در کشور می‌باشد. سؤال اصلی مطرح‌شده پیش‌بینی وفاداری مشتریان از روی تراکنش‌های بانکی می‌باشد. دادگان اصلی مسابقه شامل اطلاعات تراکنش 5 ماه یکی از بانک‌‌های کشور با جامعه آماری 40 هزار مشتری می‌باشد.

در این سؤال هدف پیش‌بینی میانگین موجودی یک مشتری در ماه آتی بانک می‌باشد. دادگان تحویل داده‌شده به شرکت‌کنندگان شامل متغیرهای کد مشتری، شماره‌حساب، مبلغ تراکنش، مانده‌حساب، تاریخ تراکنش، شماره پایانه بانکی، حالت حساب و کد تراکنش بانکی می‌باشد.

قابل‌ذکر می‌باشد با توجه به اهمیت حفظ حریم خصوصی مشتریان بانکی برخی از ویژگی‌های فوق کدگذاری گردیده‌اند.

روش‌ها و ویژگی‌های مورد نیاز جهت حل مسئله فوق نیز پس از پایان مسابقات در همین کانال مورد بررسی بیشتر قرار خواهد گرفت.

ارادتمند
محمدرضا محتاط
@dataanalysis
سؤالات مصاحبه استخدامی متخصص علم‌داده:

یکی از مهم‌ترین‌ گام‌های ارزیابی یک متخصص علم‌داده علاوه بر بررسی کردن رزومه کاری، مصاحبه استخدامی و پرسیدن برخی از سؤالات تخصصی از وی ‌می‌باشد. لذا اگر در شرکت خود قصد استخدام دانشمند علم‌داده دارید می‌توانید از سؤالات ذیل جهت بررسی هر چه بیشتر دانش تخصصی وی استفاده نمایید.
متخصصین و دانشمندان علم‌داده هم با پاسخ به سؤالات زیر می‌توانند دانش خود را محک بزنند!

https://goo.gl/xx3Zpi

1- چرخه انجام یک پروژه علم‌داده چیست؟
2- روش Cross Validation چیست و چه مزایایی دارد؟
3- مراحل پیاده‌سازی یک محصول تجاری داده محور چگونه می‌باشد؟
4- بیشترین حجم دادگان مورداستفاده در پروژه‌های قبلی چه میزان بوده است؟ جهت مدیریت این حجم از چه پلتفرم و ابزارهایی استفاده کرده‌اید؟
5- مهم‌ترین گام در چرخه متدولوژی CRISP-DM چیست و چرا؟
6- پاک‌سازی اطلاعات چیست و چگونه انجام می‌گردد؟
7- چگونه دادگان غیر ساخت‌یافته به اطلاعات ساخت‌یافته تبدیل می‌گردند؟
8- در پیاده‌سازی یک مدل مبتنی بر یادگیری ماشین، پایدار بودن(robust) اهمیت بیشتری دارد یا میزان صحت(Accurate)؟
9- گام‌های بهینه‌سازی یک الگوریتم ازلحاظ سرعت و کیفیت چیست؟
10- تفاوت الگوریتم‌ها و روش‌های با نظارت با روش‌های بدون نظارت چیست؟
11- تفاوت Overfitting و Underfitting چیست و چه زمانی اتفاق می‌افتند؟
12- تفاوت معیارهای ارزیابی precision و recall چیست؟ کدام‌یک کارآمدتر هست؟
13- از چه راهکارهایی جهت مدیریت دادگان غیرمتوازن(Unbalance Data) استفاده خواهید کرد؟
14- چه معیارهای جهت انتخاب یک الگوریتم یادگیری ماشین جهت پاسخ به یک مسئله وجود دارد؟
15- تفاوت پایگاه داده، انبار داده و Data Mart چیست؟
16- چه زمانی از الگوریتم‌هایی مانند SVM یا Random Forset استفاده می‌کنید و چرا؟
17- تحلیل مؤلفه‌های اصلی (Principal component analysis) چیست و چه مزایا و معایبی دارد؟
18- نسل‌های معماری‌های پردازشی کلان داده چیست و Map Redcue چه تفاوتی با موتور پردازشی Spark دارد؟
19- پایگاه داده‌های غیر رابطه‌ای به چند دسته تقسیم می‌شوند و در چه مسائلی می‌توانند مورداستفاده قرار بگیرند؟
20- روش‌های مبتنی بر شبکه‌های عصبی پیشرفته(یادگیری عمیق) چه مزایا و معایبی نسبت به سایر الگوریتم‌ها و روش‌ها دارد؟

@dataanalysis
موفق و موید باشید

محمدرضا محتاط
مهارت‌های کلیدی و تخصصی مرتبط با حوزه علم داده!

@dataanalysis
جهت ثبت نام و کسب اطلاعات بیشتر به لینک های زیر مراجعه نمایید.
http://cssbu.ir/

http://conf.sbu.ac.ir/index.php/data/data

@cssbu
اسلاید کلان داده، کاربرد در بانک و ارتباط با هوش تجاری-
ارائه شده در نمایشگاه تراکنش

https://www.slideshare.net/secret/6NsPnQAuv8caxJ
جریان‌کاری پروژه‌های مبتنی بر علم داده!

https://goo.gl/K1UGCa

@dataanalysis
نقد و بررسی دومین مسابقه داده‌کاوی پارسی پرداز با محوریت نظرکاوی!

http://uupload.ir/files/k8d_sentimentanalysis.jpg

دومین دوره مسابقه داده‌کاوی پارسی پرداز با محوریت نظر کاوی توسط آزمایشگاه تخصصی فناوری وب دانشگاه فردوسی مشهد در هفته گذشته به‌صورت آنلاین برگزار شد. نکات ذیل پیرامون این مسابقه که به نسبت سایر مسابقات داده‌کاوی انجام‌شده در کشور دارای سطح بسیار پایین‌تری بوده است به شرح ذیل می‌باشد:

1- در تمامی مسابقات داده‌کاوی جهت آموزش و ساخت مدل، برخی اطلاعات و داده‌ها توسط برگزارکنندگان به شرکت‌کنندگان تحویل داده می‌شود. شرکت‌کنندگان نیز پس از پیاده‌سازی مدل بهینه بر اساس دادگان تست نتیجه را برای ارزیابی به طراحان مسابقه ارسال می‌نمایند. در مسابقه برگزارشده تنها دادگان تست شامل 100 هزار داده متنی به شرکت‌کنندگان تحویل داده گردید که کاملاً برخلاف اصول پایه‌ای مسابقات داده‌کاوی می‌باشد.

2- در این مسابقه تمامی شرکت‌کنندگان موظف بودند که تمامی سورس‌کدها، فایل‌های اجرایی، مستندات، فایل گزارش متنی و ... را در اختیار تیم برگزارکننده قرار دهند. قابل‌ذکر هست به‌طور مرسوم در اکثر مسابقات تنها تیم‌های برتر می‌بایست مستندات و سورس‌کدهای خود را جهت بررسی و اهدا جوایز به برگزارکننده مسابقه تحویل دهند.

3- از نکات بسیار جالب این مسابقه مدت‌زمان برگزاری آن بود. مدت‌زمان اعلامی توسط تیم برگزارکننده تنها سه ساعت و از ساعت 9 الی 12 روز جمعه اعلام شد!

4- در تمامی مسابقات و چالش‌های داده‌کاوی جوایز تیم‌های برتر به‌صورت دقیق اعلام و مشخص می‌باشد. در توضیحات این مسابقه ذکر شده بود که به تیم‌های برتر جوایز نفیسی اهدا خواهد گردید.

با توجه به فعالیت‌های خوب دانشگاه فردوسی مشهد در حوزه متن‌کاوی و وجود اساتید برجسته و اهمیت حوزه تحلیل احساسات در زبان فارسی انتظار برگزاری مسابقه‌ای با سطح بسیار بالاتر و باکیفیت‌تر بود که متاسفانه میسر نگردید.

@dataanalysis
ارادتمند
محمدرضا محتاط
طی چند سال آینده تقاضا برای متخصصین علم‌داده و یادگیری ماشین نزولی خواهد گردید؟

منبع: وبسایت Kdnuggets
@dataanalysis
Data Science
طی چند سال آینده تقاضا برای متخصصین علم‌داده و یادگیری ماشین نزولی خواهد گردید؟ منبع: وبسایت Kdnuggets @dataanalysis
/تکمیلی‌/
در نظرسنجی فوق این نکته قابل ذکر می باشد که در حدود 25 درصد متخصصین علم‌داده شرکت کننده در این نظرسنجی بیان کرده‌اند که طی 4 الی 6 سال آینده تقاضا برای جذب متخصصین علم‌داده و یادگیری ماشین با کاهش روبه‌رو خواهد شد.
این درصد برای مدت زمان هفت الی ده سال در حدود بیست درصد می‌باشد.
شایان ذکر هست که در حال حاضر اکثر کشورها با کمبود متخصص علم‌داده مواجه هستند!

طی مطلب آتی نیز مدت زمان مورد نیاز جهت تبدیل شدن به یک متخصص علم‌داده مورد بررسی بیشتر قرار خواهد گرفت!
@dataanalysis

موفق و موید باشید
فرصت‌های شغلی کارشناس و مدیر فنی تیم علوم‌داده در شرکت پایانه‌های داده‌ای نوین!

@dataanalysis
مدت زمان لازم جهت تبدیل شدن به یک متخصص علم‌داده براساس نظرسنجی وب‌سایت Kdnuggets

در قاره آسیا طبق بیان متخصصین علم‌داده این مدت زمان در حدود میانگین پنج سال بوده است.

@dataanalysis
شرکت مشاورین گسترش الکترونیک ایما(مگا) فعال در زمینه تجارت الکترونیکی جهت تکمیل کادر فنی خود دارندگان تخصصهای زیر را به صورت تمام وقت یا پاره وقت به همکاری دعوت مینماید:
1- برنامه نویس مسلط در حوزه تولید نرمافزارهای وب پایه، ترجیحاً دارای تخصصها و مهارتهای زیر:

• Experienced in building scalable enterprise applications using C#/.NET
• Deep understanding of modern web technologies (ASP.NET, MVC, Web API, etc.)
• Familiar with SQL, LINQ, and relational database design • Familiar with single page application structure and technologies

2- برنامه نویس آشنا به محیط Orchard یا سایر CMS های مشابه

علاقه مندان میتوانند رزومه خود را به آدرس info@megagroup.biz ارسال نمایند.

@dataanalysis
دعوت به همكاري پرتال جامع خودرو كشور

توسعه دهنده net. مسلط به Orchard به صورت پاره وقت


تجربیات و مهارت های مورد نیاز:

• Deep understanding of Orchard CMS
• Hands-on experience in Orchard CMS module development


موقعيت:
شيراز يا تهران


ارسال رزومه:
nouri@megagroup.biz

@dataanalysis
فرصت شغلی تحلیلگر داده در شرکت رایتل:

https://goo.gl/YeyLpF

شرکت رایتل در حوزه سیستم های تحلیل داده (سیستم هوش تجاری، مدیریت تقلب و تضمین درآمد)، از تعداد محدودی از فارغ التحصیلان دانشگاه های معتبر (حداقل کارشناسی)، با شرایط ذیل جهت همکاری بصورت تمام وقت دعوت بعمل می آورد:
1- رشته تحصیلی کامپیوتر، فناوری اطلاعات یا آمار
2- آشنایی کامل با SQL و پایگاه داده ها ترجیحا Oracle
3- سطح زبان بالا در هر چهار مهارت
4- آشنا به مفاهیم BI و تحلیل داده ها (با ابزارهای IBM Cognos یا Tableau)
5- علاقه مند به حوزه تحلیل داده های حجیم (Big Data) در یک محیط واقعی
از علاقه مندان تقاضا می شود رزومه کاری خود را حداکثر تا 15 آذر ماه 96 به آدرس BI-JV@rightel.ir ارسال نمایند.

@dataanalysis
مهم‌ترین دلایل شکست برخی از پروژه‌های فناوری اطلاعات کشور:

https://goo.gl/hDYBdh

یکی از مهم‌ترین ویژگی‌های یک متخصص علم‌داده توانایی در حوزه مدیریت پروژه و آشنایی با مفاهیم علمی و تخصصی این حوزه در راستای مدیریت هر چه‌بهتر پروژه‌ها می‌باشد. در این مقاله هدف بررسی مهم‌ترین دلایل شکست پروژه‌های فناوری اطلاعات بخصوص حوزه‌های مرتبط با علم‌داده، کلان داده و... در کشور می‌باشد:

•عدم وجود نیروی متخصص کافی:
یکی از مشکلاتی که در پروژه‌های فناوری اطلاعات وجود دارد عدم وجود نیروی متخصص کافی در کشور می‌باشد. در حوزه‌های سطح بالای تکنولوژی همچون کلان داده ، اینترنت اشیا ، علم‌داده ، داده‌کاوی ، متن‌کاوی ، پردازش ابری و... این خلأ بیشتر دیده می‌شود. عدم ارتباط دانشگاه با صنعت یکی از دلایل ایجاد این خلأ می‌باشد. این مشکل در حال حاضر در بسیاری از کشورهای توسعه‌یافته نیز وجود دارد.

•تغییرات تکنولوژی:
حوزه فناوری اطلاعات و به طبع پروژه‌های فناوری اطلاعات به تغییرات تکنولوژی و فناورانه بسیار وابسته می‌باشد به‌نحوی‌که یک تغییر در حوزه تکنولوژی ممکن هست سبب بروز شکست یک پروژه گردد. به‌عنوان‌مثال برخی از پروژه‌های فناوری اطلاعاتی که در کشور منعقد گردیده است ممکن هست پس از متن‌باز شدن پروژه مشابه آن توسط یک شرکت مطرح مانند گوگل دیگر توان رقابتی وجود نداشته باشد و کارفرما ترجیح خواهد داد تا از محصول باکیفیت شرکت گوگل در ادامه استفاده نماید.

•عدم دانش مدیریت پروژه:
یکی از دلایل بسیار مهم در شکست پروژه‌های فناوری اطلاعات عدم آشنایی مدیران پروژه‌ها با اصول و مفاهیم مدیریت پروژه می‌باشد. این کمبود دانش سبب بروز مشکلات فراوانی در حوزه‌های فنی و حوزه‌های مدیریتی در پروژه‌ها خواهد شد.

•مشکلات حقوقی و تحریم‌ها:
در برخی از پروژه‌های فناوری اطلاعات که نیازمند سخت‌افزارهای مخصوص و بعضاً بسیار قدرتمند می‌باشد به دلیل وجود تحریم‌ها علیه جمهوری اسلامی ایران امکان دسترسی به این قبیل سخت‌افزارها مقدور نیست یا با تأخیر فروان امکان دست‌یابی وجود دارد.

•استعفا مدیر پروژه یا کارکنان خبره:
در برخی از پروژه‌های فناوری اطلاعات به دلیل وابستگی بیش‌ازحد به مدیر پروژه یا برخی از کارکنان متخصص سبب بروز مشکلات متعددی همچون شکست گردیده است. با ترک این کارکنان یکپارچگی پروژه از بین رفته و سبب تأخیر یا درنهایت شکست پروژه شده است.
@dataanalysis
ارادتمند
محمدرضا محتاط
پنجمین همایش ملی مدیران فناوری اطلاعات هم اکنون در سالن همایش‌های بین‌المللی برج میلاد!

محور اصلی همایش حکمرانی داده‌ها و دولت الکترونیک از دیدگاه علوم و فناوری اطلاعات می‌باشد.

@dataanalysis