Магия данных | Артур Сапрыкин – Telegram
Магия данных | Артур Сапрыкин
906 subscribers
329 photos
57 videos
9 files
316 links
Канал Артура Сапрыкина.
- Основатель и CEO Maglosya (@maglosya)
- Создаю со своей командой AI/ML-проекты
- Преподаватель, автор курсов
- Исследователь ML и AI.

Сайт: https://arthursaprykin.ru/

По вопросам сотрудничества пишите мне: @arthur_saprykin
Download Telegram
Друзья, вчера прошел Geekpicnic, и в павильоне "Путь в IT" вещал я и сотрудники Нетологии.

Было очень интересно, живо и познавательно.

Хочу поблагодарить всех, кто пришёл поддержать меня, посмотреть, задавать вопросы и, конечно, тех, кто присоединился к каналу. ☀️🔥

PS: Фото и видео отчёт будет позже, как придут остальные материалы 🙂
🔥151
Обещанный фото и видео отчёт с мероприятия.
Наслаждайтесь ❤️
7🔥5💯2
Чудесное объяснение того, как и для чего работает Residual block в нейронных сетях (привет старый-добрый ResNet).

В тексте статьи максимально ясно рассказано про всю интуицию этого блока.

Обязательно к ознакомлению 👆

#теориянейронныхсетей
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Карта стандартных структур данных в Python 🐍
👍10
Периодически меня спрашивают про книги в DS, а мне сложно ответить, потому что книги по этой сфере я не читаю. Не вижу в этом необходимости.

Чаще всего рекомендую идти на курсы (хоть бесплатные), чтобы получить структуру, а также скорей перейти к практике, и уже в процессе восполнять теорию.

Так эффективней, и знания укладываются сразу, ведь мозг лучше запоминает то, чем пользуются.

Однако мне недавно попался на канал с книгами по Data Science.
Книг много, и встречал те, которые обсуждают. Причём с возможностью скачать бесплатно.

Пользуйтесь на здоровье, и если книга была полезна, заплатите за неё издателю. Всегда стоит платить за труд.
👍5
Привезли стереокамеру от Intel.

Весь вечер пытался установить библиотеки Real Sense на свой M1, но пока потерпел фиаско.

Почему-то Intel решили прекратить развитие библиотек под компьютеры от Apple, и приходится собирать вручную.

Буду продолжать танцевать с бубном, но хорошо, что есть мак с процессором от Intel.

Можно работать пока без ухищрений особых.

На самом деле, самое нелюбимое в моей работе - это установка чего-либо туда, где это не должно работать.
Хотя с другой стороны, максимальный кайф, когда всё-таки это работает.

Я решил, что практически не рассказываю про свои будни, а они у меня интересные, поэтому периодически буду освещать какие-то любопытные по моему мнению моменты и истории.

#моя_работа
👍20
Forwarded from IT Юмор
This media is not supported in your browser
VIEW IN TELEGRAM
Случай на собеседовании
😁16👍4🔥2🤡1
Удалось завести камеру, но на старом маке.

Проблем не возникло. Всё пошло, как по маслу.

Ощущения ликующего ребёнка. Очень интересно, там ещё куча режимов и настроек.

Прогнозирую неделю повышенного интереса к компьютерному зрению 👁‍🗨

В ближайшее время скину видео, как это всё чудо работает, и что можно в Python с этим делать.

#моя_работа
👏12🙏1
Оставлю это здесь, потому что очень полезно и интересно.
Audio
🔉Impulse response dataset 📂

Если вы в какой-то момент зададитесь вопросом, а как мне аугментировать аудио данные для задач речи, то наверняка наткнетесь на разные методы вроде добавления шума, реверберации и всего такого. Среди прочих датасетов можете найти так называемые RIR-датасеты, которые содержат room impulse response аудио. Как например этот: https://github.com/RoyJames/room-impulse-responses

И в начале этот датасет может ввести в замешательство, ведь все звуки из датасета будут похожи вот на такие щелчки (прекрепленное аудио).

Не очень понятно как такие использовать для аугментации данных. Вот и я по началу попал в такое замешательство.

Оказывается, здесь все несколько хитрее, чем просто складывание чистого аудио с шумом. Эти аудио на самом деле не совсем аудио, а некоторый "фильтр" который вы можете применить к вашей аудиодорожке по средствам свертки и получить искаженный звук, например получить эхо.

Данные фильтры получаются путем проигрывания заранее известного звука через очень качественные колонки и одновременной записи этого звука на микрофон в этом же помещении. Через разницу между изначальным звуком и записью можно вывести особенности комнаты где ведется запись, и получить фильтр который из чистой записи симулирует запись в этом помещении (например в большом органном зале).
Так с набором этих фильтров и различных шумов вы сможете симулировать огромное множество различных сред и разнообразить ваш датасет.


А вот краткий пример как делается применение RIR фильтра:

audio_orig = torch.tensor(librosa.load("audio.wav")[0]).unsqueeze(0)
rir = torch.tensor(librosa.load("rir.wav")[0]).unsqueeze(0).abs()
rir = (rir / torch.norm(rir, p=2)).flip([1])
audio = torch.nn.functional.pad(audio_orig, (rir.shape[1]-1, 0))
audio = torch.nn.functional.conv1d(audio.unsqueeze(0), rir.unsqueeze(0)).squeeze(0)
🔥7
Когда веса итоговой обученной модели похожи на звук.
🔥6
Испытываю детскую радость, работая с реальным устройством для формирования датасета.

Обычно всё достаю из информационной среды, и вся деятельность производится через компьютер.

Но когда пришлось сооружать свой стенд, чтобы сымитировать условия задачи, то испытал чудесный восторг.

В этот момент начинаю понимать, как классно передвигаться в нашей профессии. Мозги получают больше дофамина ☀️

#моя_работа
🔥21