Удалось завести камеру, но на старом маке.
Проблем не возникло. Всё пошло, как по маслу.
Ощущения ликующего ребёнка. Очень интересно, там ещё куча режимов и настроек.
Прогнозирую неделю повышенного интереса к компьютерному зрению 👁🗨
В ближайшее время скину видео, как это всё чудо работает, и что можно в Python с этим делать.
#моя_работа
Проблем не возникло. Всё пошло, как по маслу.
Ощущения ликующего ребёнка. Очень интересно, там ещё куча режимов и настроек.
Прогнозирую неделю повышенного интереса к компьютерному зрению 👁🗨
В ближайшее время скину видео, как это всё чудо работает, и что можно в Python с этим делать.
#моя_работа
👏12🙏1
Audio
🔉Impulse response dataset 📂
Если вы в какой-то момент зададитесь вопросом, а как мне аугментировать аудио данные для задач речи, то наверняка наткнетесь на разные методы вроде добавления шума, реверберации и всего такого. Среди прочих датасетов можете найти так называемые RIR-датасеты, которые содержат room impulse response аудио. Как например этот: https://github.com/RoyJames/room-impulse-responses
И в начале этот датасет может ввести в замешательство, ведь все звуки из датасета будут похожи вот на такие щелчки (прекрепленное аудио).
Не очень понятно как такие использовать для аугментации данных. Вот и я по началу попал в такое замешательство.
Оказывается, здесь все несколько хитрее, чем просто складывание чистого аудио с шумом. Эти аудио на самом деле не совсем аудио, а некоторый "фильтр" который вы можете применить к вашей аудиодорожке по средствам свертки и получить искаженный звук, например получить эхо.
Данные фильтры получаются путем проигрывания заранее известного звука через очень качественные колонки и одновременной записи этого звука на микрофон в этом же помещении. Через разницу между изначальным звуком и записью можно вывести особенности комнаты где ведется запись, и получить фильтр который из чистой записи симулирует запись в этом помещении (например в большом органном зале).
Так с набором этих фильтров и различных шумов вы сможете симулировать огромное множество различных сред и разнообразить ваш датасет.
А вот краткий пример как делается применение RIR фильтра:
Если вы в какой-то момент зададитесь вопросом, а как мне аугментировать аудио данные для задач речи, то наверняка наткнетесь на разные методы вроде добавления шума, реверберации и всего такого. Среди прочих датасетов можете найти так называемые RIR-датасеты, которые содержат room impulse response аудио. Как например этот: https://github.com/RoyJames/room-impulse-responses
И в начале этот датасет может ввести в замешательство, ведь все звуки из датасета будут похожи вот на такие щелчки (прекрепленное аудио).
Не очень понятно как такие использовать для аугментации данных. Вот и я по началу попал в такое замешательство.
Оказывается, здесь все несколько хитрее, чем просто складывание чистого аудио с шумом. Эти аудио на самом деле не совсем аудио, а некоторый "фильтр" который вы можете применить к вашей аудиодорожке по средствам свертки и получить искаженный звук, например получить эхо.
Данные фильтры получаются путем проигрывания заранее известного звука через очень качественные колонки и одновременной записи этого звука на микрофон в этом же помещении. Через разницу между изначальным звуком и записью можно вывести особенности комнаты где ведется запись, и получить фильтр который из чистой записи симулирует запись в этом помещении (например в большом органном зале).
Так с набором этих фильтров и различных шумов вы сможете симулировать огромное множество различных сред и разнообразить ваш датасет.
А вот краткий пример как делается применение RIR фильтра:
audio_orig = torch.tensor(librosa.load("audio.wav")[0]).unsqueeze(0)
rir = torch.tensor(librosa.load("rir.wav")[0]).unsqueeze(0).abs()
rir = (rir / torch.norm(rir, p=2)).flip([1])
audio = torch.nn.functional.pad(audio_orig, (rir.shape[1]-1, 0))
audio = torch.nn.functional.conv1d(audio.unsqueeze(0), rir.unsqueeze(0)).squeeze(0)
🔥7
Магия данных | Артур Сапрыкин
Когда веса итоговой обученной модели похожи на звук.
В этом что-то есть, как считаете?
💯4
Испытываю детскую радость, работая с реальным устройством для формирования датасета.
Обычно всё достаю из информационной среды, и вся деятельность производится через компьютер.
Но когда пришлось сооружать свой стенд, чтобы сымитировать условия задачи, то испытал чудесный восторг.
В этот момент начинаю понимать, как классно передвигаться в нашей профессии. Мозги получают больше дофамина ☀️
#моя_работа
Обычно всё достаю из информационной среды, и вся деятельность производится через компьютер.
Но когда пришлось сооружать свой стенд, чтобы сымитировать условия задачи, то испытал чудесный восторг.
В этот момент начинаю понимать, как классно передвигаться в нашей профессии. Мозги получают больше дофамина ☀️
#моя_работа
🔥21
Друзья, дорогие мои, а 8 и 9 июля будет проходит Pro IT Fest!
Мероприятие с очень насыщенной программой с любым направлением IT и всё, что связано около этого.
Почему я об этом сообщаю?
Потому что я буду участвовать в секции "Комната страха" в обсуждении "Data Сатанисты. Что мы делаем с вашими данными" 😈.
Будет интересно и здорово!
Само событие пройдёт в городе Санкт-Петербург в парке 300-летия СПб.
Мероприятие платное, но от меня для вас есть промокод на 10% - SAPRYKIN
Подробности на сайте - https://proitfest.ru/
Буду рад увидеться вживую 🙌☀️
#мероприятия
Мероприятие с очень насыщенной программой с любым направлением IT и всё, что связано около этого.
Почему я об этом сообщаю?
Потому что я буду участвовать в секции "Комната страха" в обсуждении "Data Сатанисты. Что мы делаем с вашими данными" 😈.
Будет интересно и здорово!
Само событие пройдёт в городе Санкт-Петербург в парке 300-летия СПб.
Мероприятие платное, но от меня для вас есть промокод на 10% - SAPRYKIN
Подробности на сайте - https://proitfest.ru/
Буду рад увидеться вживую 🙌
#мероприятия
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Магия данных | Артур Сапрыкин
16384 оттенков серого яркость с 1 до 14 бита. Наглядно. #основыданных
С какого момента вы бы не заметили разницы? Только честно 🙃
Нашёл на просторах сети очень классную статью, рассказывающую про компьютерное зрение (CV).
Это такой каталог задач, где можете увидеть самые популярные задачи в этой сфере.
Получилось классно, интересно, красиво - рекомендую к прочтению. 🦾
Это такой каталог задач, где можете увидеть самые популярные задачи в этой сфере.
Получилось классно, интересно, красиво - рекомендую к прочтению. 🦾
V7Labs
Image Recognition: Definition, Algorithms & Uses
Image recognition is the process of identifying objects in images. We cover the basics of the task and different approaches to it.
❤4👍1🔥1
Заходите на занятию по переносу стилей на изображениях :)
👍2🫡1
Forwarded from Data Science by REBRAIN
Успевайте зарегистрироваться. Количество мест строго ограничено!
Время проведения:
15 Июня (Четверг) в 20:00 по МСК
Программа практикума:
🔹Для чего это нужно?
🔹История развития этого направления
🔹Какие решения существуют, и как обучить свою модель переноса стилей
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Друзья, а что вы знали про выделение границ?
Фильтр Канни? Оператор Собеля?
Погружаясь в метод разницы гауссиан (Difference of Gaussians - DoG), я наткнулся на отличное видео, где наглядно показываются не только результаты его работы, но и принципы.
Вперед за новыми знаниями☀️ 🦾
Фильтр Канни? Оператор Собеля?
Погружаясь в метод разницы гауссиан (Difference of Gaussians - DoG), я наткнулся на отличное видео, где наглядно показываются не только результаты его работы, но и принципы.
Вперед за новыми знаниями
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
This is the Difference of Gaussians
In the realm of image based edge detection, aesthetically pleasing edges are hard to come by. But, what if we could get stylized edge lines by just blurring our image twice?
Download my GShade shader pack!
https://github.com/GarrettGunnell/AcerolaFX/wiki…
Download my GShade shader pack!
https://github.com/GarrettGunnell/AcerolaFX/wiki…
👍7
Я считаю, это очень интересно и полезно.
Особенно, когда до конца не осознаёшь, как это всё работает.
Моё почтение таким проектам ☀️
Особенно, когда до конца не осознаёшь, как это всё работает.
Моё почтение таким проектам ☀️
👍2