یادگیری ماشین و یادگیری ژرف – Telegram
یادگیری ماشین و یادگیری ژرف
549 subscribers
78 photos
10 videos
115 files
47 links
این کانال با هدف ارائه تکنیک های هوش مصنوعی شامل یادگیری ماشین، داده کاوی، اتاماتای سلولی، پردازش تصویر، شبکه های عصبی و یادگیری ژرف و بیگ دیتا برای محققین و دانشجویان گرامی ایجاد شده است.


@AIPHD95
Download Telegram
🔵Speech

TIMIT Speech Corpus: phoneme classification (http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC93S1)
Aurora : Timit with noise and additional information

🔴Recommendation Systems

MovieLens: Two datasets available from http://www.grouplens.org. The first dataset has 100,000 ratings for 1682 movies by 943 users, subdivided into five disjoint subsets. The second dataset has about 1 million ratings for 3900 movies by 6040 users.
Jester: This dataset contains 4.1 million continuous ratings (-10.00 to +10.00) of 100 jokes from 73,421 users.
Netflix Prize: Netflix released an anonymised version of their movie rating dataset; it consists of 100 million ratings, done by 480,000 users who have rated between 1 and all of the 17,770 movies.
Book-Crossing dataset: This dataset is from the Book-Crossing community, and contains 278,858 users providing 1,149,780 ratings about 271,379 books.
Misc

🔴“Musk” dataset

CMU Motion Capture Database: (http://mocap.cs.cmu.edu/)
Brodatz dataset: texture modeling (http://www.ux.uis.no/~tranden/brodatz.html)
Million Song dataset: http://labrosa.ee.columbia.edu/millionsong/
Merck Molecular Activity Challenge – http://www.kaggle.com/c/MerckActivity/data

👎👎👎👎👎👎👎👎👎👎👎
https://news.1rj.ru/str/MachineLearningDeep
✳️جدول محاسبه امتیاز مصاحبه دکتری این جدول معمولا ثابته پس اگر قصد شرکت در آزمون دکتری را دارید با تقویت ایتم های جدول فوق به سمت موفقیت گام بردارید.
🔴نیازمندی های سخت افزاری سوال میکنن روز به روز افزایش پیدا میکند
🌑اتفاقی که در شبکه های یادگیری عمیق رخ میدهد چیزی جز یکسری محاسبات ریاضی و بطور خاص ماتریسی در مقیاس زیاد نیست. به همین دلیل استفاده عملی از یک شبکه عصبی عمیق اگر با پردازند ه های معمولی انجام شود تقریبا غیر ممکن خواهد بود. به همین دلیل هم شما در تمامی کتابخونه ها و چارچوب های معتبر مشاهده میکنید که پردازش ها تحت کارتهای گرافیک انجام می شود. البته همه این کتابخونه ها پیاده سازی مبتنی بر CPU رو دارند که معمولا برای آشنایی و اجرای دموها و اشکال زدایی ها مورد استفاده قرار می گیرد.
🌎اوائل شروع یادگیری عمیق اجرای پردازش ها محدود به استفاده از کارتهای گرافیک بود. اما طی یکسال اخیر فعالیتهایی در جهت استفاده از سیستم های توزیع شده هم صورت گرفته که در کفی میشه به SparkCaffe و در جاوا به DeepLearning4J و احتمالا معروف تر از همه Tensorflow اشاره کرد. ذکر این نکته ضروریست که یک کارت گرافیک با قیمت متوسط مثل GTX960 یا حتی GTX1060 از یک سرور با پردازنده xeon هم به مراتب قوی تر است.
🌕در حال حاضر شرکت Nvidia برنده بی چون و چرای این حوزه است. تمامی کتابخونه ها و چارچوبها بدون استثنا از کارتهای انویدیا پشتیبانی میکنند و مبتنی بر Cuda و cudnn هستند. پشتیبانی از کارتهای AMD/Intel و متنفرقه یا مبتنی بر OpenCL یا وجود نداره و یا بشدت ضعیف هست بعنوان مثال AMD برنچی از کفی رو به OpenCL پورت کرد اما خیلی زود هم آن را کنار گذاشت و پشتیبانی از آن را قطع کردند. هرچند در حال حاضر یک برنچ مبتنی بر OpenCL در کفی وجود دارد . کسانی که کارت گرافیک AMD و یا Intel دارن میتوانند از آن استفاده کنند اما از لحاظ سرعت و بروز رسانی قابل قیاس با ورژن اصلی و مبتنی بر Cuda/cudnn نیست.
🌓با هر کارتی امکان آموزش شبکه های عمیق رو شما ندارید (البته اگر منظور استفاده از کتابخونه ها/فریم ورکهای معتبر باشه اگر خودتون بخوایید برنامه نویسی کنید که دستتون بازه) . در اینجا چند نکته است که باید بهش توجه بشه.
🌚شما ار هر کتابخونه و یا چارچوبی که قراره استفاده کنید باید به نیازمندی های سخت افزاری اون توجه کنید. بعنوان مثال اگر از کفی میخوایید استفاده کنید باید حتما کارت گرافیک شما compute capability 2.1 به بالا داشته باشه. اگر ار تنسورفلو میخوایید استفاده کنید (پکیج های آماده اش) باید حتما کارت گرافیک شما compute capability 3 به بالا داشته باشه. این قضیه برای torch هم صادقه.
🌻توصیه ها برای گرافیک مناسب:
TitanXp Pascal-12Gig*
TitanX Pascal-12Gig
GTX 1080 TI -11Gig*
TitanX Maxwell-12Gig
GTX 1080–8Gig
GTX 1070–8Gig
GTX 980 TI-6Gig
GTX 1060–6Gig
GTX 980-4Gig
GTX 960-4Gig
GTX 950-4Gig


مطالب برگرفته از سایت deeplearning است.
🌎 یادداشتی از محمود سریع القلم در عصر ایران
🌕دوستی آرشیتکت، این جملات را نقل می‌کرد: شخصی با ریشۀ‌ خاورمیانه‌ای در آمریکا بدون اینکه مجوز شهرداری اخذ کند، اتاقی به منزل خود اضافه کرد. بعد از مدتی کوتاه شهرداری مطلع شد و جرایم سنگینی را وضع نمود. اما شهرداری چگونه متوجه زرنگی این فرد شد؟ شهرداری توسط عکس‌های ماهواره‌ای که هر چند ماه یکبار گرفته می‌شود متوجه تغییرات در املاک می‌شود. نرم‌افزاری این عکس‌ها را مقایسه می‌کند. هر قدر مربع‌های عکس (Pixel) کوچک تر باشد، شفافیت آن بالاتر می‌رود. این فرد قانون شکن غافل بود که عکس‌ هوایی منزل او به وضوح نشان می‌دهد که مربع‌های عکس تغییر کرده‌اند. وقتی مسئولین شهرداری، به فایل این ملک مراجعه کردند، متوجه شدند مجوز جدیدی در کار نیست. سپس سراغ او آمدند.
🌑موضوع دیگری: FedEx یک شرکت تحویل نامه، پاکت و بسته در عرض ۲۴ ساعت است. ۴۶ سال است که کار می‌کند و سال گذشته ۶/۱ میلیارد دلار درآمد داشته است. این شرکت ۶۵۰ هواپیما دارد که از نظر تعداد هواپیما رتبه چهارم جهانی است. نکته حائز اهمیت در مورد این شرکت اینست که از تمام نقاط دنیا، بسته‌ها و نامه‌ها به ۱۶ فرودگاه تا ساعت ۸ شب وارد شده و پس از دسته‌بندی تا ۳ صبح با پروازهای جدید به مقاصد خود ارسال می‌شوند. در روز بعد، نامه‌ها و بسته‌ها تا ظهر یا بعد از ظهر تحویل داده می‌شوند. فقط در فرودگاه Memphis (ایالت تنسی) حدوداً ۱/۵ میلیون بسته تا ساعت ۸ شب وارد می‌شود و با حدود ۱۰۰ هواپیما به مقاصد خود در داخل و بیرون آمریکا حرکت می‌کنند. در ایام کریسمس و سال نو، تا ۳/۵ میلیون بسته نیز این شرکت در ۲۴ ساعت در تمام دنیا تحویل می‌دهد. در داخل آمریکا، این شرکت در Memphis و Oakland (کالیفرنیا) دو مرکز (یا Hub) دارد. در مرکز فرماندهی جهانی این شرکت (Global Command Center) در Memphis، یک نقشه عظیم دیواری حرکت ۶۵۰ هواپیما را هدایت و مدیریت می‌کند.
🌴یک نکته مشترک در این دو مثال وجود دارد: مدیریت در دنیای امروز با دانش، سیستم دیجیتالی و قاعده‌مندی است. نظارت از طریق دانش و سیستم دیجیتالی است. تصور کنید اگر مدیریت ۱۶ Hub داخلی و بین‌المللی شرکت FedEx را به "مدیریت افراد" و به سطح حوصله، دقت و نظم بشری می‌سپردند که در آن‌ها هزاران خطا متصور است چه هرج و مرجی می‌شد و بسته‌ها نه در ۲۴ ساعت بلکه در ۲۴ روز هم به مقصد نمی‌رسیدند. وزارت خزانه‌داری آمریکا در همه بانک‌ها، نرم‌افزاری تعبیه کرده که از انتقال پولی بالای ده هزار دلار اتوماتیک به آن وزارت خانه گزارش داده می‌شود. این در کنار صد‌ها نرم‌افزاری است که در سیستم مالیاتی به کارگرفته می‌شود.
🌳اگر نظام دیجیتالی در جهان امروز را مبنا قرار دهیم، مدیریت در کشور عموماً حالت توصیه‌ای، تلفنی، فردی، نصیحتی، حجره‌ای و رفاقتی است. در دنیای امروز، خطا را نرم‌افزار تشخیص می‌دهد و نه افراد. بی دلیل نیست که حقوق سالیانۀ یک مهندس نرم‌افزار در آمریکا که حدود ۲۳-۲۲ سال سن دارد از ۱۵۰ هزار دلار شروع می‌شود. در چین ۷۰۰ میلیون نفر به هیچ وجه از اسکناس استفاده نمی‌کنند و تمام پرداخت‌ها از طریق موبایل انجام می‌گیرد. حتی متکدیان در چین در ته کاسه‌ای، بارکُد حساب بانکی خود را چسبانده‌اند و شهروندان از طریق موبایل به حساب شخص متکدی، پول پرداخت می‌کنند.
🍀دولت و حاکمیت آلمان، اقتصادی بالغ بر چهار تریلیون دلار تولید ناخالص داخلی و رتبه چهارم جهانی (بعد از آمریکا، چین و ژاپن) را مدیریت می‌کنند. آلمان حدود ۳/۱ تریلیون دلار در سال صادرات دارد. مسئولین آلمانی همه ساعت پنج بعد از ظهر از محل کار رفته و زندگی می‌کنند. تعداد جلسات مدیران در این کشور بسیار محدود است. سیستمی منسجم، دیجیتالی و منظم کار می‌کند. مدیران به این سیستم وفادار هستند و نه به افراد.
🐲اگر قرار باشد کشور پیشرفت کند، راه‌حل‌ها بسیار شفاف و ساده هستند: مدیریت نرم‌افزاری بر سیستم بانکی، مالیاتی، گمرکی و ده‌ها مورد دیگر. اگر کشور دیجیتالی نشود، همچنان باید در رابطه با بانکداری، گمرک و غیره همایش برگزار شود، چند وزیر و استاد دانشگاه و کارشناس سخنرانی کنند و در نهایت، اظهار امیدواری بر اصلاح امور کنند.

🔴دغدغه ی جدید دانشمندان:
آيا ممكن است جهان مارا هم ارتعاش يك موسيقى بوجود آورده باشد؟
🌎سایت گمپانی داده سایتی بسیار عالی برای آموزش پردازش داده در پایتون،R و یادگیری عمیق در این دو نرم افزار می باشد
https://www.datacamp.com/home
🌑این سایت دارای بیش از 75 ویدیوی رایگان در زمینه یادگیری ماشین می باشد.
مجله ماشین بینایی و پردازش تصویر، دارای اعتبار علمی - پژوهشی
http://jmvip.sinaweb.net/
🔴پروفسور لطفعلی عسگر‌زاده مشهور به «لطفی‌زاده»،بنیانگذار «منطق فازی» ودانش ‌آموخته دانشگاه تهران،در 97 سالگی دار فانی را وداع گفت
روزی یک معلم در کلاس ریاضی شروع به نوشتن بر روی تخته‌سیاه کرد :
9*1=7
9*2=18
9*3=27
9*4=36
9*5=45
9*6=54

وقتی کارش تمام شد به دانش‌آموزان نگاه کرد ، آن‌ها دیگر نتوانستند جلوی خود را بگیرند و شروع به خنده کردند . وقتی او پرسید چرا می‌خندید ، یکی از دانش‌آموزان اشاره کرد که معادله اولی اشتباه است!

معلم پاسخ داد : "من معادله اول را عمدا اشتباه نوشتم! ، تا درسی بسیار مهم به شما دهم.
دنیا با شما همین‌گونه رفتار خواهد کرد. همان‌طور که می‌بینید من 5 معادله را درست نوشتم، اما شما به آن‌ها هیچ اهمیتی ندادید! همه‌ی شما فقط به خاطر آن یک اشتباه به من خندیدید و من را قضاوت کردید . دنیا همیشه به خاطر موفقیت‌ها و کارهای خوب‌تان از شما قدردانی نمی‌کند، اما در مقابل یک اشتباه سریع با شما برخورد خواهد کرد . پس قوی‌تر از قضاوت‌هایی که همیشه وجود خواهند داشت باشید .
🌴🌴🌴🌴🌴🌴🌴🌴🌴🌴
🌑زمینه های تحقیقاتی رمزنگاری
مباني رمزشناسي
· مباني نظري رمزنگاري
· طراحي و تحليل الگوريتم­ هاي رمزنگاري جرياني و قالبي متقارن
· طراحي و تحليل الگوريتم­ هاي رمز نا­متقارن و طرح­ هاي امضاي رقمي
· طراحي و تحليل توابع چکيده ­ساز
· روش­ هاي نوين در رمزنگاري (نظير پسا کوانتومي، رمزگذاري تابعي، رمزنگاري همريخت، ...)

📌پياده ­سازي الگوريتم­ هاي رمزنگاري و حملات مرتبط
· پياده­ سازي نرم­ افزاري و سخت­ افزاري الگوريتم ­هاي رمزنگاري
· حملات کانال­ جانبي و روش ­هاي مقابله با آن
· سامانه­ هاي نهفته رمزنگاري
· دستکاري سخت­افزار و روش­هاي مقابله با آن
· شتاب دهنده­ هاي سخت­افزاري براي پروتکل­ هاي امنيتي
· درستي سنجي و عيب­ يابي پياده ­سازي­ ها

📌امنيت شبکه
· امنيت شبکه هاي بي ­سيم و موبايل
· امنيت زير ساخت­ هاي شبکه
· امنيت پروتکل­ ها و لايه ­هاي شبکه
· سيستم­ هاي تشخيص، رديابي و جلوگيري از نفوذ
· امنيت زيرساخت­ هاي حياتي

📌پروتکل­ هاي امنيتي
· احراز هويت و اصالت
· گمنامي، حريم خصوصي و مديريت اعتماد
· تحليل پروتکل­ هاي امنيتي
· مدل­ هاي امنيت و اعتماد
· روش ­هاي صوري در امنيت اطلاعات

📌امنيت رايانش
· امنيت معماري رايانه
· امنيت سيستم­ عامل
· امنيت پايگاه داده
· تحليل آسيب­ پذيري و امنيت نرم ­افزار و برنامه ­هاي کاربردي
· امنيت و حريم خصوصي در افزاره­ هاي همراه
· امنيت رايانش ابري
· کنترل دسترسي

📌مهندسي امنيت و امنيت خدمات الکترونيکي
· روش­ هاي مهندسي اجتماعي در امنيت
· سامانه مديريت امنيت اطلاعات (ISMS)
· آموزش امنيت
· امنيت کسب و کار و خدمات الکترونيکي
· امنيت سلامت الکترونيکي
· امنيت بانکداري الکترونيکي
· امنيت آموزش الکترونيکي

📌نهان­سازي اطلاعات
· الگوريتم­هاي جديد در نهان­نگاري و نشان­گذاري
· مدل­ سازي حملات و کانال نشان ­گذاري
· نهان­ کاوي اطلاعات
· کاربردهاي نهان ­سازي اطلاعات

📌جرم­ يابي در فضاي مجازي
· روش ­هاي جرم ­يابي و ريشه­ يابي ديجيتال
· جرم­ يابي پايگاه داده و شبکه
· تشخيص کلاه­برداري
· تشخيص و جلوگيري از دستکاري
یک کتاب بسیار مناسب در زمینه واترمارکیگ و استکانوگرافی
کتاب رایانش ابری فارسی