Data Science – Telegram
Data Science
7.49K subscribers
754 photos
49 videos
85 files
451 links
ارتباط با ادمین:
@Datascience
Download Telegram
مفتا: آشنایی با الگوریتم Word2Vec گوگل

برای بسیاری از روشهای پردازش متن و NLP، نیاز به نمایش عددی کلمات و متون داریم تا بتوانیم از انواع روشهای عددی حوزه یادگیری ماشین مانند اکثر الگوریتم های دسته بندی روی لغات و اسناد استفاده کنیم. یکی از رهیافت هایی که در این حوزه بسیار رایج شده است ، نمایش برداری کلمات و جملات است . روشی که توسط گوگل در سال ۲۰۱۳ پیشنهاد شده است و روشی بسیار کارآمد و مناسب برای نمایش لغات و متون و پردازش آنها است روش Word2Vec است. در این روش به کمک شبکه عصبی یک بردار با اندازه کوچک و ثابت برای نمایش تمام لغات و متون در نظرگرفته شده و با اعداد مناسب در فاز آموزش مدل یا training برای هر لغت این بردار محاسبه می شود. بعد از ایجاد بردارهای مرتبط با هر لغت، برای نمایش برداری هر متن یا خبر ، می توان بردار تک تک کلمات به کار رفته در آنرا یافته و میانگین اعداد هر ستون را به دست آورد که نتیجه آن یک بردار برای هر متن یا سند خواهد بود. این روش که الگوریتم آن به صورت متن باز نیز منتشر شده است و کتابخانه های مختلفی برای زبانهای مختلف برای کار با آن تولید شده است، زمانی که توسط گوگل بر روی حجم بالای متون و اطلاعات به کار رفته است ، نتایج بسیار شگرفی را به همراه داشته است .

http://mfta.ir/data-science/id=10394

@mfta_ir
مفتا: علت موفقیت زنان در تبدیل شدن به دانشمند داده

مایکل والکر(دانشمند داده): علم داده میتواند به عنوان یک انتخاب خوب و حرفه ای برای زنان باشد تا بتوانند تبدیل به یک دانشمند داده شوند. زنان متفکران بزرگ متضاد هستند. یکی از مهارت های کلیدی دانشمندان بزرگ داده داشتن تفکرات معکوس و تحلیلی همراه با توانایی برقراری ارتباط دوطرفه با اعضای تیم و رهبران سازمان برای رسیدن به اهداف میباشد که تمام اینها در خصوصیات اخلاقی زنان دیده می شود.

http://mfta.ir/data-science/id=10459

@mfta_ir
مفتا: معرفی سایت CodeSchool برای آموزش زبان R

با انجام دادن یاد بگیرید.
این شعار زیبا مربوط به سایت آموزشی codeschool.com است. این سایت خود را جز مجموعه بزرگ Pluralsight معرفی می کند که به حق یکی از پیشروهای آموزش بر خط برای توسعه دهندگان نرم افزار، متخصصان فناوری اطلاعات و فناوران خلاق است. اما چیزی که تصمیم گرفتیم به شما معرفی کنیم محیط تعاملی و زیبای سایت codeschool.com برای آموزش زبان R است که از طریق لینک زیر قابل دسترسی است.
http://tryr.codeschool.com/

http://mfta.ir/data-science/id=10157

@mfta_ir
مفتا: بیگ دیتا چالشی برای دانشمندان

در بررسی های اخیر انجام شده بوسیله Paradigm4(شرکت های پایگاه داده محاسباتی) مشخص شد بیگ دیتا به یک چالش برای دانشمندان داده تبدیل شده است اما نه به دلیل مقدار و یا حجم بلکه به خاطر تولید متنوع داده ها که این را حرفه ای ها بهتر درک می کنند. باوجود استفاده زیاد از پلتفرم Hadoop کمتر ازنیمی(۴۸%) از هدوپ یا اسپارک استفاده کرده اند و از این تعداد ۷۶% گفته اند بسیار کند است. همچنین ۳۹ درصد می گویند با رشد بیگ دیتا، استرس شغلی آنها هم بالا می رود.

http://mfta.ir/data-science/id=10160

@mfta_ir
مفتا: جدول تناوبی بسته های ماشین لرنینگ


پکیج ها و بسته های ماشین لرنینگ زیر برای پایتون، جاوا، بیگ دیتا، Lua/JS/Clojure، Scala، سی/سی ++ و R در تصویر زیر و با استعاره از جدول تناوبی عناصر طراحی و ارائه شده اند. این جدول تناوبی از MLN.io بدست آمده است که یک خبرنامه ماشین لرنینگ می باشد .

http://mfta.ir/data-science/id=9912


@mfta_ir
Forwarded from Amirhossein Asgari
#استخدام #بازارکار

درخواست همکاری:
برنامه نویس php یا Java
تجربه برنامه نویسی پیشرفته
ترجیحا تجربه کار با کلان داده(BigData)
ترجیحا تسلط با حوزه داده‌کاوی(DataMining)
دارای توان تحلیل و مهارت حل مسئله

شرایط: تهران،عباس‌آباد/ بیمه+ سنوات+ عیدی و پاداش/ شنبه تا چهارشنبه/

دوستانی که واجد شرایط هستن میتونن رزومه خودشون رو به ایمیل job@lifeweb.ir مربوط به شرکت لایف‌وب ارسال کنند.

لطفا این پیام رو برای گروه‌ها یا دوستانی که مرتبط با فراخوان هستند بفرستین تا ...
👆👆👆
مفتا: داده کاوی، این بار از خود داده کاوان! + گراف


در مقاله ای جالب که جدیدا توسط فردی به نام Ferris Jumah نوشته شده است در ابتکاری، به رسم گراف ( در سایت مفتا می توانید مشاهده کنید) از مهارت های داده کاوان پرداخته و عنوان شده است که دانشمندان داده عموما دارای خصوصیات زیر اند: نگاه به داده از پنجره ریاضیات - استفاده از یک زبان مشترک برای دسترسی، داده کاوی و مدل سازی داده ها -
توسعه علوم کامپیوتر و برنامه نویسی خود.

http://mfta.ir/data-science/id=10683

@mfta_ir
Forwarded from Deleted Account
Forwarded from Deleted Account
عکس بالا مربوط به نرم افزار XMind است
Forwarded from Deleted Account
مفتا: 9 کتاب رایگان برای یادگیری داده کاوی و تجزیه و تحلیل داده

اگر شما برای اولین بار در حال یادگیری علم اطلاعات هستید، این کتاب های رایگان به شما برای یادگیری داده کاوی کمک خواهد کرد . با آموختن از این کتابها، شما به سرعت اسرار داده کاوی و تجزیه و تحلیل داده ها را کشف خواهید کرد.
Data Mining Algorithms In R

الگوریتم های داده کاوی در R

A Programmer’s Guide to Data Mining

راهنمای یک برنامه نویس برای داده کاوی

برای دیدن ادامه منابع، به سایت مفتا مراجعه کنید.

http://mfta.ir/data-science/id=9870/9

@mfta_ir