Магия данных | Артур Сапрыкин – Telegram
Магия данных | Артур Сапрыкин
906 subscribers
329 photos
57 videos
9 files
316 links
Канал Артура Сапрыкина.
- Основатель и CEO Maglosya (@maglosya)
- Создаю со своей командой AI/ML-проекты
- Преподаватель, автор курсов
- Исследователь ML и AI.

Сайт: https://arthursaprykin.ru/

По вопросам сотрудничества пишите мне: @arthur_saprykin
Download Telegram
Привезли стереокамеру от Intel.

Весь вечер пытался установить библиотеки Real Sense на свой M1, но пока потерпел фиаско.

Почему-то Intel решили прекратить развитие библиотек под компьютеры от Apple, и приходится собирать вручную.

Буду продолжать танцевать с бубном, но хорошо, что есть мак с процессором от Intel.

Можно работать пока без ухищрений особых.

На самом деле, самое нелюбимое в моей работе - это установка чего-либо туда, где это не должно работать.
Хотя с другой стороны, максимальный кайф, когда всё-таки это работает.

Я решил, что практически не рассказываю про свои будни, а они у меня интересные, поэтому периодически буду освещать какие-то любопытные по моему мнению моменты и истории.

#моя_работа
👍20
Forwarded from IT Юмор
This media is not supported in your browser
VIEW IN TELEGRAM
Случай на собеседовании
😁16👍4🔥2🤡1
Удалось завести камеру, но на старом маке.

Проблем не возникло. Всё пошло, как по маслу.

Ощущения ликующего ребёнка. Очень интересно, там ещё куча режимов и настроек.

Прогнозирую неделю повышенного интереса к компьютерному зрению 👁‍🗨

В ближайшее время скину видео, как это всё чудо работает, и что можно в Python с этим делать.

#моя_работа
👏12🙏1
Оставлю это здесь, потому что очень полезно и интересно.
Audio
🔉Impulse response dataset 📂

Если вы в какой-то момент зададитесь вопросом, а как мне аугментировать аудио данные для задач речи, то наверняка наткнетесь на разные методы вроде добавления шума, реверберации и всего такого. Среди прочих датасетов можете найти так называемые RIR-датасеты, которые содержат room impulse response аудио. Как например этот: https://github.com/RoyJames/room-impulse-responses

И в начале этот датасет может ввести в замешательство, ведь все звуки из датасета будут похожи вот на такие щелчки (прекрепленное аудио).

Не очень понятно как такие использовать для аугментации данных. Вот и я по началу попал в такое замешательство.

Оказывается, здесь все несколько хитрее, чем просто складывание чистого аудио с шумом. Эти аудио на самом деле не совсем аудио, а некоторый "фильтр" который вы можете применить к вашей аудиодорожке по средствам свертки и получить искаженный звук, например получить эхо.

Данные фильтры получаются путем проигрывания заранее известного звука через очень качественные колонки и одновременной записи этого звука на микрофон в этом же помещении. Через разницу между изначальным звуком и записью можно вывести особенности комнаты где ведется запись, и получить фильтр который из чистой записи симулирует запись в этом помещении (например в большом органном зале).
Так с набором этих фильтров и различных шумов вы сможете симулировать огромное множество различных сред и разнообразить ваш датасет.


А вот краткий пример как делается применение RIR фильтра:

audio_orig = torch.tensor(librosa.load("audio.wav")[0]).unsqueeze(0)
rir = torch.tensor(librosa.load("rir.wav")[0]).unsqueeze(0).abs()
rir = (rir / torch.norm(rir, p=2)).flip([1])
audio = torch.nn.functional.pad(audio_orig, (rir.shape[1]-1, 0))
audio = torch.nn.functional.conv1d(audio.unsqueeze(0), rir.unsqueeze(0)).squeeze(0)
🔥7
Когда веса итоговой обученной модели похожи на звук.
🔥6
Испытываю детскую радость, работая с реальным устройством для формирования датасета.

Обычно всё достаю из информационной среды, и вся деятельность производится через компьютер.

Но когда пришлось сооружать свой стенд, чтобы сымитировать условия задачи, то испытал чудесный восторг.

В этот момент начинаю понимать, как классно передвигаться в нашей профессии. Мозги получают больше дофамина ☀️

#моя_работа
🔥21
Друзья, дорогие мои, а 8 и 9 июля будет проходит Pro IT Fest!

Мероприятие с очень насыщенной программой с любым направлением IT и всё, что связано около этого.

Почему я об этом сообщаю?

Потому что я буду участвовать в секции "Комната страха" в обсуждении "Data Сатанисты. Что мы делаем с вашими данными" 😈.

Будет интересно и здорово!

Само событие пройдёт в городе Санкт-Петербург в парке 300-летия СПб.

Мероприятие платное, но от меня для вас есть промокод на 10% - SAPRYKIN

Подробности на сайте - https://proitfest.ru/

Буду рад увидеться вживую 🙌☀️

#мероприятия
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
16384 оттенков серого яркость с 1 до 14 бита. Наглядно.

#основыданных
🔥6
Чтобы не забывали 🤓
👍16🔥2
Нашёл на просторах сети очень классную статью, рассказывающую про компьютерное зрение (CV).

Это такой каталог задач, где можете увидеть самые популярные задачи в этой сфере.

Получилось классно, интересно, красиво - рекомендую к прочтению. 🦾
4👍1🔥1
Заходите на занятию по переносу стилей на изображениях :)
👍2🫡1
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Перенос стилей изображений

Успевайте зарегистрироваться. Количество мест строго ограничено!

↘️Регистрация

Время проведения:

15 Июня (Четверг) в 20:00 по МСК

Программа практикума:

🔹Для чего это нужно?
🔹История развития этого направления
🔹Какие решения существуют, и как обучить свою модель переноса стилей

Кто ведет?

Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Бросайте эти ваши мышиные лернинги
👍22😁3