DATA SCIENCE IE – Telegram
DATA SCIENCE IE
1.51K subscribers
321 photos
54 videos
56 files
54 links
📶 پایگاه رسمی آموزش های آزاد حوزه علم داده

🌐 معرفی منابع
🌐 مقالات
🌐 فرصت های شغلی
🌐 اطلاع از دوره های دانشگاه تهران

◀️ ویژه دانشکده مهندسی صنایع و دانشگاه تهران

ارتباط با ادمین
🆔 @mrpouyannik
لینک گروه
🔘 https://news.1rj.ru/str/joinchat/EfgZ1lLWoQljX6R7
Download Telegram
مطابی در رابطه با مهاجرت به کانادا

بر اساس تجربه شخصی من یکی از راه های خوب برای رفتن به کانادا پذیرش تحصیلی است.

اگر مهندس صنایع هستید بنابراین دانشگاه های زیادی رو اونجا پیدا نمی کنید ولی میتونید از طریق پذیرش در رشته های مرتبط مثل آمار اقدام کنید.

ولی اگر علاقه به علم داده دارید الان اکثر دانشگاه ها این رشته رو دارن. با اساتید اون دانشگاه ها مکاتبه کنید و بعد از اون از علاقه تون بگید و شروع کنید به مطالعه در رابطه با موضوع تحقیقاتی استاد مربوطه، اینطوری میتونید پذیرش بگیرید.

البته از این طریق به پول نیاز دارید و شاید استاد بهتون اوایل تحصیل فاند نده. بنابرین حداقل برای یکنفر هزینه شهریه سال اول، هزینه یکسال زندگی و رفتن به کانادا نیاز هست.

هزینه ها حدودا به این صورته که دانشگاه متوسط 15 هزار دلار، زندگی متوسط 10 هزار دلار و هزینه های رفتن تون (سفارت، بلیط، ترجمه ها و ...) حدودا 2500 دلار. پس 27500 دلار کانادا لازمه که به عبارتی 21000 دلار آمریکا. با دلار امروز میشه سیصد میلیون تومان.!

یک نکته مهم، در این مسیر همه کارها رو خودتون انجام بدید و به هیچ عنوان از موسسه های مهاجرتی و ... استفاده نکنید. دلایل رو هم بهتون میگم.

ارادتمند
نیکزاد

@Datascienceie
برای پذیرش چه کار باید بکنیم؟

لیست موسسات و دانشگاه های کشور مورد علاقمون رو پیدا کنیم و بعد از پیدا کردن وبسایت اونها به قسمت برنامه هاشون یا دانشکده ها برید. بعضی وقتها اسم رشته شما اونجا پیدا نمیشه پس میتونید زمینه های مشابه و بین رشته ای رو پیدا کنید.

بعد از اون اولین کار پیدا کردن استاد مناسب هست. بنابراین به اونها ایمیل بزنید. تو این کار صبور باشید. از ایمیل های یکسان استفاده نکنید و به هر استاد با توجه به زمینه های تحقیقاتی اون و علایق شما در اون مورد حرف بزنید.

معمولا اساتید یا جواب نمیدن یا دیر جواب میدن پس باید صبور باشید و پیگیری کنید تا یک فرقی با بقیه داشته باشید.

در رابطه با رزومتون اعتماد به نفس داشته باشید و موارد مهم رو توی اون بولد کنید. پیگیر و مشتاق باشید.

توی رزومه ها تخصص های خاص، نمره زبان، اسم دانشگاه و مقاله خاص به چشم میاد. یعنی رزومه طولانی که فقط پر شده با موارد معمولی خیلی بدرد نمیخوره. یعنی بهتره مثلا برای علم داده، نمره زبان خوب، آمار قوی و پایتون رو خیلی خیلی خوب بلد باشید. نه ده تا موضوع به صورت سطحی.

با تشکر

نیکزاد

@Datascienceie
کلاس
ssas
ssis
یادگیری زبان
mdx
Dax
در حال برگزاری
۴۴ ساعت
مرکز آموزش های آزاد دانشگاه تهران

مدرس:مهندس نیکزاد

@Datascienceie
در رابطه با موسسات مهاجرتی

موسسات مهاجرتی (در زمینه گرفتن ویزای تحصیلی) بیشتر بر اساس یک استاندارد کار میکنن. به اینصورت که هدف اصلی اونها گرفتن پذیرش برای شماست. یعنی به این صورت که شما وارد این موسسات میشید. قدم اول هزینه هارو پرداخت میکنید که معمولا از 1000 تا 2000 یورو یا دلار هست. بعد از اون ازتون لیست اولویت میگیرن که کدوم رشته ها دوست دارید تو کدوم شهر و کشورها.

مزیت این موسسات این هست که احتمال زیاد براتون پذیرش میگیرن ولی بهتره از معایبشون بگیم که خود این موسسات عنوان نمیکنن.

اول، اونها عجله ای برای گرفتن پذیرش برای شما ندارن و بر اساس اینکه موسسه چقدر حجم کاری داره کار شما رو انجام میدن. (برای دوستانی که سرعت کار براشون مهمه)

دوم، این موسسات معمولا با اساتید مکاتبه نمیکنن و فقط برای دانشگاه ها اپلای میکنن و این کار خیلی ساده هست و نیازی به این همه خرج کردن نداره. و همچنین لزوما بر اساس اولویت های شما نمیرن و در نهایت از رزومه شما ایراد میگیرن و مقصر رو خودتون میدونن.

سوم، اونها حداکثر توانایی های شما رو در نظر نمیگیرن و معمولا راحت ترین موسسه و دانشگاه رو اپلای میکنن. اینطوری شاید احتمال فاند یا پذیرش با یک استاد خوب رو از دست میدهید.

برای اینکه پذیرش بگیرید بهتره که با اساتید اون دانشگاه ها مکاتبه کنید، خودتون مطالعه کنید راجع به اینکار و حرفه ای بشید. چون در این صورت احتمال گرفتن پذیرش بهتر بیشتره.

@Datascienceie
4_5933734912719847976.pdf
267.3 KB
زبان های مورد استفاده برای
Data scientist

#datascienceie

@Datascienceie
تجربیات تغییر سرور

یکی از زیرساخت های اصلی انبار داده سرور و مشخصات آن است. گاها سخت افزار سرور یا سیستم عامل آن قدیمی است. مثلا در صورتی که بخواهیم از نسخه های جدید اس کیو ال مثلا 2017 استفاده کنیم نیاز به ویندوز سرور 2012 به بالا داریم.

یکی از مزیت های اصلی اس کیو ال های جدید پشتیبانی از columnstore و جداول بر رویmemory هست که مزیت های فوق العاده ای دارد.

برای تغییر سرور نیاز است برنامه پشتیبان داشته باشید که در صورت به وجود آمدن مشکل بتوانید به سرعت سوئیچ نمایید. مثلا اگر از ویندوز مجاری استفاده می کنید. یک ویندوز مجازی موازی ایجاد کنید.

در انتقال دسترسی ها، جاب ها، لینک سرور ها دقت کنید و همچنین ممکن است پکیج های SSISدچار مشکل شوند که این موضوع را با تعریف دوباره کانکشن ها حل نمایید.

در صورت امکان از هارد دیسک های مجزا استفاده کنید تا از پردازش موازی بتوانید استفاده کنید.

همچنین برای موارد، Log، Page،data، Backupهارد های مجزا بگذارید.

ارادتمند شما

نیکزاد

@Datascienceie
تجربیاتی از طراحی فرایند ETL

فرآیند ETL که معادل Extract ، Transform وLoad است به منظور انتقال اطلاعات از OLTPهای مختلف برای ساخت انبار داده و یک پایگاهOLAP استفاده می گردد.

OLAP 
پایگاهی است که برای تحلیل یا همانAnalytics استفاده می گردد.

در این فرایند باید هدف نهایی به کلی تعیین گردد. مشخص شود که پیچیده ترین تحلیل ها چیست و آنها به چه دیتایی نیاز دارند. در این فرایند باید موارد زیر به درستی در نظر گرفته شوند.

نوع طراحی star یا snow flake انبار داده. (این مورد با در نظر گرفتن بزرگی Dim ها تعیین میشود). نکته: انبار داده از dim و fact تشکیل میشود.

سرعت و کارایی فرایند ETL ، یعنی استفاده مناسب از ابزارها برای سرعت حداکثری

فیلتر کردن دیتای اضافه از مبدا تا دیتای اضافه وارد fact نشود.

ایجاد یک Log برای ذخیره اطلاعات کلی فرایندETL مثلا حجم داده انتقال یافته، تعداد رکورد، زمان انتقال و سایر شاخص ها.

ماژولار طراحی کردن فرایند ETL در صورت نیاز به تغییر دوباره کاری ها حداقل شود.

تعیین شاخص های مغایرت.

ارادتمند شما

نیکزاد

 @Datascienceie
DATA SCIENCE IE
Getting Your First Data Science Job.pdf
تشریح کامل وظایف و ابزارهای مورد استفاده در حوزه علم داده
هدوپ

برنامه هدوپ مجموعه ای از برنامه های open source است که امکان انجام محاسبات به صورت پخش شده یا Distributed را برای حجم زیادی از دیتا میدهد. این شبکه میتواند شامل هزاران کامپیوتر و فضای ذخیره سازی باشد که بدین صورت قابلیت اطمینان شبکه را به شدت افزایش میدهد.

برنامه در زبان جاوا نوشته شده است و از قسمت های اصلی Map Reduce ، Haddop Distributed file system و Hadoop common استفاده میکند. این فضا از پردازش موازی و پخش شده استفاده میکند. برنامه map reduce بدین صورت کار میکند که پردازش ها و توابع را به قسمت های کوچکی تبدیل کرده که در یک فضای پخش شده محاسبه شده و در نهایت نتایج را با یکدیگر ترکیب میکند.

از ساختار این برنامه برای ماشین لرنینگ و داده کاوی میتوان استفاده کرد به دلیل اینکه قابلیت های بالایی برای پردازش روی داده های غیر ساختار یافته دارد.

@Datascienceie
خلاصه ای از BI
AZURE
HADOOP

@DATASCIENCEIE
مختصری از sql

@Datascienceie
برنامه هایی که یک پژوهشگر داده باید به آنها مسلط باشد.
برای توسعه برنامه های داده کاوی
برای تحلیل کسب و کارها
برای ساخت داشبوردهای تحلیلی
برای توسعه انبار داده
برای ساخت مدل های داده
برای توسعه فرآیندهای ETL

کانال @datascienceie
⁉️ مفهوم هرم DIKW چیست؟

به صورت کلی هرم DIKW حالت سلسله مراتبی دارد که مشخص می کند چگونه داده ها با اطلاعات، دانش و خِرد تکامل می یابند.
D stands for Data
I stands for Information
K stands for Knowledge
W stands for Wisdom

با یک مثال ساده این موضوع را شرح می دهیم.
در یک فروشگاه، در سبد خریدها که بررسی می کنیم می بینیم که محصولاتی که خریداری می شود به شکل زیر می باشند.

سبد خرید 1 : 🍌🍎🍆🍉
سبد خرید 2 : 🍒🍎🍌🥒
سبد خرید 3 : 🍑🍒🍎🍌

1️⃣ این سبدها بعنوان واقعیت خام یعنی Data به حساب می آیند.
2️⃣ سیب ها و موزها اغلب با یکدیگر همراه می شوند . یعنی تشخیص روابط و به معنی Information
3️⃣ بر این اساس اگر سیب را ببینم، موز را نیز خواهم دید یعنی یک نقش را بدست آوردیم هر نقش یک Knowledge
4️⃣ اگر سیب و موز را با هم بگذارم، می توانم فروش را افزایش دهم یعنی Wisdom

#مثبت_داده
🌎 @datascienceIE
Topic: DiKW Pyramid
🎙 فضای کاری هرم DIKW در ایران چطور است؟



#مثبت_تجربه
🌎 @datascienceIE
⁉️ بررسی Microsoft Azure

🌐 یک مجموعه گسترده ای از سرویس های ابری است که به سازمان شما کمک می کند تا با چالش های کسب و کارتان روبرو شوید. این آزادی برای ساخت، مدیریت و اعمال برنامه ها در یک شبکه عظیم جهانی با استفاده از ابزار و فریمورک های مورد علاقه شماست.

🌐 مایکروسافت متعهد به بالاترین سطح اعتماد، شفافیت، انطباق استانداردها و انطباق با مقررات گسترده ترین مجموعه ای از پیشنهادات سازگاری هر ارائه دهنده خدمات ابری است.

اگر تمایل دارید بیشتر اطلاعات کسب کنید در پست بعدی به #مثبت_تجربه گوش دهید.

#مثبت_داده
🌎 @datascienceIE
Topic: Microsoft Azure
🎙 بررسی Microsoft Azure

🎚 نحوه استفاده آن چگونه است؟
🎚 مزایای استفاده چیست ؟
🎚 در چه حوزه هایی استفاده می شود؟
🎚 فضای کاری Microsoft Azure چگونه است؟



#مثبت_تجربه
🌎 @datascienceIE