برترین مهارت های یک دانشمند علم داده
http://www.bigdata.ir/wp-content/uploads/2016/01/Data-Science-Skills-1.png
http://www.bigdata.ir/wp-content/uploads/2016/01/Data-Science-Skills-1.png
تفاوت کیفیت داده و صحت داده(veracity vs quality)
صحت داده می تواند از طریق کیفیت داده تشخیص داده شود. به داده ای که عمدا یا اشتباها نادرست باشد از طریق صحت داده بررسی می شود و پیچیده تر از کیفیت داده است. شاید بتوان گفت صحت داده بیشتر از کیفیت داده بعد از ازمون مدل بررسی می شود.
http://www.datasciencecentral.com/profiles/blogs/data-veracity-vs-data-quality
صحت داده می تواند از طریق کیفیت داده تشخیص داده شود. به داده ای که عمدا یا اشتباها نادرست باشد از طریق صحت داده بررسی می شود و پیچیده تر از کیفیت داده است. شاید بتوان گفت صحت داده بیشتر از کیفیت داده بعد از ازمون مدل بررسی می شود.
http://www.datasciencecentral.com/profiles/blogs/data-veracity-vs-data-quality
Datasciencecentral
Data Veracity vs. Data Quality
There is often confusion between the definitions of data veracity and data quality .
Data veracity is sometimes thought as uncertain or imprecise data, yet…
Data veracity is sometimes thought as uncertain or imprecise data, yet…
بر همین اساس مهارتهایی که حدس زده می شود در 2016 بیشتر نیاز به ان در جهان وجود دارد به همین ترتیب باشد. البته نظر من این است که این ترتیب در ایران در راستای پژوهش بیشتر باشد و در عمل با تغییراتی در رتبه مواجه باشد.
چند اشتباه رایج در مصورسازی
http://www.kdnuggets.com/2016/02/common-data-visualization-mistakes.html
http://www.kdnuggets.com/2016/02/common-data-visualization-mistakes.html
9مزیت دریاچه داده. دریاچه داده به طور خلاصه کلیه داده داخلی، خارجی ، داده رقبا و ... و سیستم پردازش داده است که ویژگیهایی مانند سرعت بالای ذخیره سازی، مقیاس پذیربودن و ... دارد. به طور کلی باید گفت که data lake با هدوپ متفاوت است
http://www.hadoop360.com/blog/9-key-benefits-of-data-lake
http://www.hadoop360.com/blog/9-key-benefits-of-data-lake
Hadoop360
9 Key Benefits of Data Lake
Guest blog post by Kumar Chinnakali
A Data Lake has flexible definition, to make this statement true the dataottam team took initiative and released a eBook called “The Collective Definition of Data Lake by Big Data Community”, which contains many definitions…
A Data Lake has flexible definition, to make this statement true the dataottam team took initiative and released a eBook called “The Collective Definition of Data Lake by Big Data Community”, which contains many definitions…