NEW BOT Телеграм, страница

Data Science Guy

В 2-х словах о том, как стартовать соревнование на kaggle новичкам:
Более подробно поговорим о kaggle в одном из следующих видео.

1.96K views12:23

Data Science Guy

Поговорим о зарплатах в data science в новом видео!
https://www.youtube.com/watch?v=Qq4hDvwjjYE

YouTube

Сколько платят в data science || Зарплаты дата саентистов

В этом видео покажу сколько зарабатывают junior, middle и senior дата саентисты. Посмотрим на график распределения зарплат, выясним сколько можно получать со старта карьеры и сколько же платят в data science в принципе. Приятного просмотра!

Наш телеграмм…

2.14K views12:32

Data Science Guy

Наткнулся на неплохой сайт с подборкой бесплатных книг по программированию в общем и по Python в частности. Делюсь)
http://programming-motherfucker.com/become.html

2.09K views14:34

Data Science Guy

Намечается бесплатный онлайн курс «Введение в машинное обучение» от сообщества The Rolling Scopes. Начало занятий 18 января 2021.
https://rs.school/machine-learning

Возможно будет годный.

1.59K views06:05

Data Science Guy

Forwarded from Новое электричество

GPU Basics
#ai_hardware

Несмотря на обилие возможностей глубинного обучения в облаке, десятки тысяч людей продолжают делать это дома на своих компьютерах. И, наверное, уже все знают, что для обучения модели будет использоваться видеокарта – graphical processing unit (“GPU”), а не процессор (“CPU”).

Чтобы дать числовую оценку преимуществ GPU (будем использовать англоязычный термин, так как в нем присутствует «вычислительный» аспект, в отличие от слова «видеокарта») приведу недавний пример из практики. Решили посмотреть, за какое время центральный процессор справится с задачей, на которую у GPU уходит около часа. Оказалось – за 25 часов!

Конечно, данное значение будет отличаться для разных видов задач, CPU и GPU, архитектур систем и используемых для обучения библиотек, но вывод не изменится – GPU быстрее. Намного быстрее. До такой степени, что заниматься современным глубинным обучением на центральном процессоре сейчас вряд ли имеет смысл.

Сегодня немного поговорим о том, почему же GPU быстрей? Простой ответ – процесс глубинного обучения практически целиком состоит из перемножений очень больших матриц для оптимизации огромного количества параметров, а GPU с такой задачей справляется лучше.

Но возникает следующий вопрос – а почему именно GPU лучше перемножает матрицы?

Есть классическая аналогия, что CPU работает как гоночный автомобиль (чаще всего используется Феррари), а GPU как огромный трак. Если нужно доставить из пункта А в пункт Б небольшой груз, то Феррари это сделает намного быстрей.

Но если нужно перевести большое количество стройматериалов, то медленный трак сделает это намного быстрей, так как сможет это сделать за одну «ходку», в то время как Феррари потребуется десятки.

Самый простой способ продемонстрировать этот эффект, сравнить количество ядер. Для самых мощных современных процессоров это несколько десятков (32 – очень круто; 48 – фактически существующий предел). Это очень впечатляет, особенно тех, кто застал времена всего с одним единственным ядром. Но топовые GPU сейчас имеют более 10 тысяч ядер!

Да, ядра GPU другие, намного проще, чем сложные ядра CPU. Но против грубой силы приема нет, 10 тысяч ядер все равно позволяет производить намного больше параллельных вычислений, чем 32, а значит намного быстрей обучать модель.

С перевозкой грузов на траке есть одна большая проблема – его нужно долго нагружать и это может очень сильно удлинять общее время транспортировки.

И действительно, в базовом варианте необходимость перемещения больших объемов данных от процессора на GPU могла бы привести к большим потерям времени.

Но современные системы научились хорошо с этим справляться – они используют параллелизм, фактически, большое количество траков, работающих одновременно, и это позволяет решить проблему перемещения данных относительно быстро.

Таким образом, GPU имеют огромный выигрыш в скорости вычислений и теряют совсем немного из-за необходимости перемещения данных. Общий выигрыш в скорости очень велик.

Глубже в технические детали не пойдем – кто хочет легко может найти про них информацию в других источниках, да и для большинства задач обучения Искусственного интеллекта это не обязательно. Но время от время мы будем писать про практические аспекты «домашнего глубинного обучения».

1.58K views10:49

Data Science Guy

Новое видео!
Расскажу о 5 местах, где можно найти готовые датасеты или просто данные для ваших проектов в data science. Сам ими пользуюсь постоянно и делюсь с вами этой инфой.
https://youtu.be/dGjgTflGdps

YouTube

ТОП 5 мест с халявными данными для машинного обучения\нейросетей

Расскажу о 5 местах, где можно найти готовые датасеты или просто данные для ваших проектов в data science. Сам ими пользуюсь постоянно и делюсь с вами этой инфой. Как обычно все ссылки чуть ниже в описании.

Ccылки из видео:
Поиск датасетов в гугл - htt…

1.72K views11:24

Data Science Guy

Подборочка хакатонов и соревнований на ближайшие недели. Отличная возможность попрактиковаться и возможно даже заработать.
https://proglib.io/p/hakatony-i-sorevnovaniya-dlya-specialistov-po-data-science-2020-11-18

Библиотека программиста

🥇👨‍🎓️📈Хакатоны и соревнования для специалистов по Data Science

Мы собрали для вас все ближайшие соревнования в сфере Data Science, полезные для обучения и карьерного роста. На фоне пандемии коронавируса многие из них проходят в онлайн-формате.

2.13K views15:25

Data Science Guy

Интересная статейка про собеседования на хабре.
https://habr.com/ru/post/529226/

Хабр

Интервью как продажи, часть 1 (из декретов в машинное обучение)

Проходить интервью — отдельный навык. И это навык продаж. Недавно я поменяла карьеру и искала работу, прошла немало интервью. Это был мой первый опыт интервью и на него отлично лег мой наработанный...

1.72K views16:20

Data Science Guy

Forwarded from Новое электричество

AI и open source

Мы уже не раз писали, что Python — главный язык AI. Например, тут рассказывали, как самим начать делать AI (это не очень сложно!), а здесь обсуждали основные библиотеки, которые для этого используются.

Одна из важнейших причин, почему для Питона написано много библиотек, пишутся новые, и все ими пользуются, в том, что они бесплатные и open source — с открытым, доступным в интернете программным кодом. Именно это позволяет разработчикам всего мира кооперироваться в работе над ними, объединяя усилия и знания.

Говоря про open source, сразу хочется вспомнить известный анекдот про Microsoft: в начале 2000х они активно боролись с open source, а CEO Стив Баллмер говорил: "Линукс — это рак".
С тех пор, впрочем, многое поменялось. Так, компания активно развивает open source-продукт Visual Studio Code — одну из самых удобных сред для написания кода. Часть нашей команды пользуется именно ею.

Почти для всех популярных программ и задач есть open source-аналоги. Их довольно удобно искать через так называемые awesome-подборки, куда попадают "хорошие" по мнению пользователей программы: вот, например, большая подборка по Питону, а вот — отличная подборка только по AI (сюда мы и сами часто заглядываем). Рекомендуем!

Новое электричество

С чего начать?
#ai_tips

Популярный вопрос, с чего начать заниматься AI, если у меня нет опыта? Конечно, сначала надо поучиться. Вариантов очень много, есть даже на русском языке (на английском их вообще без счета).

Так как проще всего пользоваться библиотеками…

1.59K views07:40

Data Science Guy

Если вы интересуетесь компьютерным зрением и нейросетями, то у меня для вас есть хорошая новость. Недавно на kaggle началось соревнование, которое очень хорошо подойдет для новичков в этой сфере, чтобы разобраться как вообще работает классификация изображений с помощью нейросетей, поюзать аугментации, различные препроцессинги и тд. Да и не только для новичков подойдет, думаю там будет с чем разобраться и опытным.
Наверно после нового года и сам ворвусь туда, так что возможно увидимся на лидерборде)
https://www.kaggle.com/c/cassava-leaf-disease-classification

Кстати в ближайшее время (в начале декабря) выпущу видео, про то как врываться в свое первое соревнование на kaggle.

Kaggle

Cassava Leaf Disease Classification

Identify the type of disease present on a Cassava Leaf image

1.7K viewsedited 12:23

Data Science Guy

С помощью нейросетей и библиотеки Jukebox от Open.ai сгенерировал новогоднюю песню на основе других, всем известных. Экспериментальный формат видео, надеюсь вам понравится!
https://www.youtube.com/watch?v=pp7sRXioTao&feature=youtu.be

YouTube

Нейросеть пытается продолжить новогоднюю песню || ИИ сочиняет песни

С помощью нейросетей и библиотеки Jukebox от Open.ai сгенерировал новогоднюю песню на основе других, всем известных. Подаются оригиналы песен, а потом нейросеть пытается продолжить песню Голосуйте в комментариях, какой вам больше всего понравился! Делитесь…

1.83K viewsedited 12:41

Data Science Guy

Нашел тут пару интересных ресурсов, которые могут вам помочь в подготовке к собеседованию в дата саенс вакансиях. Успехов! 👨‍🎓👩‍🎓

https://github.com/slgero/testovoe
https://github.com/andrewekhalel/MLQuestions
https://interview-mds.ru/
https://www.analyticsvidhya.com/blog/2018/06/comprehensive-data-science-machine-learning-interview-guide/

2.34K viewsedited 11:58

Нейросетевой клип.
Предупреждаю сразу, там дичь) 🙈
Песня из последнего видео, сгенеренная нейросеткой. Видеоряд тоже сгенерирован нейросеткой и пытается попадать под слова в песне.
Получилось что то в духе канала @NeuralShit

2.35K viewsedited 08:35

Data Science Guy

Скоро новый год, это время дарить подарки! 🎅
В одном из следующих видео я анонсирую розыгрыш, думаю это будут книги.
Решил провести опрос, по какой теме вы хотели бы выиграть книгу?

Anonymous Poll

Глубокое обучение (нейронки)

420 voters2.27K views11:06

Data Science Guy

В этом видео расскажу о таком сайте как kaggle.
Что это, зачем он вам и как начать, все это вы узнаете в ролике.
https://youtu.be/3IddaSy-9Lc

YouTube

Лучшее место для практики в data science - Kaggle: Что это и зачем он вам.

В этом видео расскажу о таком сайте как kaggle. Что это, зачем он вам и как начать, все это вы узнаете в ролике. Это лучшее место для практики в data science.

Еще парочка полезных видео о kaggle:

Как побеждать на kaggle - https://www.youtube.com/watch?v=o6u_Od27IFw…

2.25K views11:19

2.56K views16:57

Небольшая прикольная методичка по ML, как раз на выходные чтобы было чем заняться. 👨‍🎓👩‍🎓

1.9K viewsedited 16:57

Data Science Guy

Forwarded from Neural Shit

This media is not supported in your browser

VIEW IN TELEGRAM

Время наряжать нейроёлки!

Всю ночь обучал стайлган генерировать ёлочные игрушки

1.58K views10:42

Data Science Guy

В этом видео покажу как создавать песни с помощью нейросетей. Мы воспользуемся библиотекой Jukebox от open.ai и в бесплатной среде для программирования google colab попробуем создать новую новогоднюю песню на основе старой.
https://youtu.be/AqKZx9isd1g

YouTube

Туториал: Нейросеть пытается продолжить песню в google colab

1.87K views13:36

Data Science Guy

В видео мы генерировали 3 мелодии, а в послушали только одну. Остальные 2 можно послушать тут)
С наступающим новым годом 🥳

1.75K viewsedited 14:00

Data Science Guy

Neuro_jingle_bells (2).wav

7.6 MB

Neuro_jingle_bells (3).wav

7.6 MB

Neuro_jingle_bells.wav