Привезли стереокамеру от Intel.
Весь вечер пытался установить библиотеки Real Sense на свой M1, но пока потерпел фиаско.
Почему-то Intel решили прекратить развитие библиотек под компьютеры от Apple, и приходится собирать вручную.
Буду продолжать танцевать с бубном, но хорошо, что есть мак с процессором от Intel.
Можно работать пока без ухищрений особых.
На самом деле, самое нелюбимое в моей работе - это установка чего-либо туда, где это не должно работать.
Хотя с другой стороны, максимальный кайф, когда всё-таки это работает.
Я решил, что практически не рассказываю про свои будни, а они у меня интересные, поэтому периодически буду освещать какие-то любопытные по моему мнению моменты и истории.
#моя_работа
Весь вечер пытался установить библиотеки Real Sense на свой M1, но пока потерпел фиаско.
Почему-то Intel решили прекратить развитие библиотек под компьютеры от Apple, и приходится собирать вручную.
Буду продолжать танцевать с бубном, но хорошо, что есть мак с процессором от Intel.
Можно работать пока без ухищрений особых.
На самом деле, самое нелюбимое в моей работе - это установка чего-либо туда, где это не должно работать.
Хотя с другой стороны, максимальный кайф, когда всё-таки это работает.
#моя_работа
👍20
Forwarded from IT Юмор
This media is not supported in your browser
VIEW IN TELEGRAM
Случай на собеседовании
😁16👍4🔥2🤡1
Удалось завести камеру, но на старом маке.
Проблем не возникло. Всё пошло, как по маслу.
Ощущения ликующего ребёнка. Очень интересно, там ещё куча режимов и настроек.
Прогнозирую неделю повышенного интереса к компьютерному зрению 👁🗨
В ближайшее время скину видео, как это всё чудо работает, и что можно в Python с этим делать.
#моя_работа
Проблем не возникло. Всё пошло, как по маслу.
Ощущения ликующего ребёнка. Очень интересно, там ещё куча режимов и настроек.
Прогнозирую неделю повышенного интереса к компьютерному зрению 👁🗨
В ближайшее время скину видео, как это всё чудо работает, и что можно в Python с этим делать.
#моя_работа
👏12🙏1
Audio
🔉Impulse response dataset 📂
Если вы в какой-то момент зададитесь вопросом, а как мне аугментировать аудио данные для задач речи, то наверняка наткнетесь на разные методы вроде добавления шума, реверберации и всего такого. Среди прочих датасетов можете найти так называемые RIR-датасеты, которые содержат room impulse response аудио. Как например этот: https://github.com/RoyJames/room-impulse-responses
И в начале этот датасет может ввести в замешательство, ведь все звуки из датасета будут похожи вот на такие щелчки (прекрепленное аудио).
Не очень понятно как такие использовать для аугментации данных. Вот и я по началу попал в такое замешательство.
Оказывается, здесь все несколько хитрее, чем просто складывание чистого аудио с шумом. Эти аудио на самом деле не совсем аудио, а некоторый "фильтр" который вы можете применить к вашей аудиодорожке по средствам свертки и получить искаженный звук, например получить эхо.
Данные фильтры получаются путем проигрывания заранее известного звука через очень качественные колонки и одновременной записи этого звука на микрофон в этом же помещении. Через разницу между изначальным звуком и записью можно вывести особенности комнаты где ведется запись, и получить фильтр который из чистой записи симулирует запись в этом помещении (например в большом органном зале).
Так с набором этих фильтров и различных шумов вы сможете симулировать огромное множество различных сред и разнообразить ваш датасет.
А вот краткий пример как делается применение RIR фильтра:
Если вы в какой-то момент зададитесь вопросом, а как мне аугментировать аудио данные для задач речи, то наверняка наткнетесь на разные методы вроде добавления шума, реверберации и всего такого. Среди прочих датасетов можете найти так называемые RIR-датасеты, которые содержат room impulse response аудио. Как например этот: https://github.com/RoyJames/room-impulse-responses
И в начале этот датасет может ввести в замешательство, ведь все звуки из датасета будут похожи вот на такие щелчки (прекрепленное аудио).
Не очень понятно как такие использовать для аугментации данных. Вот и я по началу попал в такое замешательство.
Оказывается, здесь все несколько хитрее, чем просто складывание чистого аудио с шумом. Эти аудио на самом деле не совсем аудио, а некоторый "фильтр" который вы можете применить к вашей аудиодорожке по средствам свертки и получить искаженный звук, например получить эхо.
Данные фильтры получаются путем проигрывания заранее известного звука через очень качественные колонки и одновременной записи этого звука на микрофон в этом же помещении. Через разницу между изначальным звуком и записью можно вывести особенности комнаты где ведется запись, и получить фильтр который из чистой записи симулирует запись в этом помещении (например в большом органном зале).
Так с набором этих фильтров и различных шумов вы сможете симулировать огромное множество различных сред и разнообразить ваш датасет.
А вот краткий пример как делается применение RIR фильтра:
audio_orig = torch.tensor(librosa.load("audio.wav")[0]).unsqueeze(0)
rir = torch.tensor(librosa.load("rir.wav")[0]).unsqueeze(0).abs()
rir = (rir / torch.norm(rir, p=2)).flip([1])
audio = torch.nn.functional.pad(audio_orig, (rir.shape[1]-1, 0))
audio = torch.nn.functional.conv1d(audio.unsqueeze(0), rir.unsqueeze(0)).squeeze(0)
🔥7
Магия данных | Артур Сапрыкин
Когда веса итоговой обученной модели похожи на звук.
В этом что-то есть, как считаете?
💯4
Испытываю детскую радость, работая с реальным устройством для формирования датасета.
Обычно всё достаю из информационной среды, и вся деятельность производится через компьютер.
Но когда пришлось сооружать свой стенд, чтобы сымитировать условия задачи, то испытал чудесный восторг.
В этот момент начинаю понимать, как классно передвигаться в нашей профессии. Мозги получают больше дофамина ☀️
#моя_работа
Обычно всё достаю из информационной среды, и вся деятельность производится через компьютер.
Но когда пришлось сооружать свой стенд, чтобы сымитировать условия задачи, то испытал чудесный восторг.
В этот момент начинаю понимать, как классно передвигаться в нашей профессии. Мозги получают больше дофамина ☀️
#моя_работа
🔥21
Друзья, дорогие мои, а 8 и 9 июля будет проходит Pro IT Fest!
Мероприятие с очень насыщенной программой с любым направлением IT и всё, что связано около этого.
Почему я об этом сообщаю?
Потому что я буду участвовать в секции "Комната страха" в обсуждении "Data Сатанисты. Что мы делаем с вашими данными" 😈.
Будет интересно и здорово!
Само событие пройдёт в городе Санкт-Петербург в парке 300-летия СПб.
Мероприятие платное, но от меня для вас есть промокод на 10% - SAPRYKIN
Подробности на сайте - https://proitfest.ru/
Буду рад увидеться вживую 🙌☀️
#мероприятия
Мероприятие с очень насыщенной программой с любым направлением IT и всё, что связано около этого.
Почему я об этом сообщаю?
Потому что я буду участвовать в секции "Комната страха" в обсуждении "Data Сатанисты. Что мы делаем с вашими данными" 😈.
Будет интересно и здорово!
Само событие пройдёт в городе Санкт-Петербург в парке 300-летия СПб.
Мероприятие платное, но от меня для вас есть промокод на 10% - SAPRYKIN
Подробности на сайте - https://proitfest.ru/
Буду рад увидеться вживую 🙌
#мероприятия
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Магия данных | Артур Сапрыкин
16384 оттенков серого яркость с 1 до 14 бита. Наглядно. #основыданных
С какого момента вы бы не заметили разницы? Только честно 🙃
Нашёл на просторах сети очень классную статью, рассказывающую про компьютерное зрение (CV).
Это такой каталог задач, где можете увидеть самые популярные задачи в этой сфере.
Получилось классно, интересно, красиво - рекомендую к прочтению. 🦾
Это такой каталог задач, где можете увидеть самые популярные задачи в этой сфере.
Получилось классно, интересно, красиво - рекомендую к прочтению. 🦾
V7Labs
Image Recognition: Definition, Algorithms & Uses
Image recognition is the process of identifying objects in images. We cover the basics of the task and different approaches to it.
❤4👍1🔥1
Заходите на занятию по переносу стилей на изображениях :)
👍2🫡1
Forwarded from Data Science by REBRAIN
Успевайте зарегистрироваться. Количество мест строго ограничено!
Время проведения:
15 Июня (Четверг) в 20:00 по МСК
Программа практикума:
🔹Для чего это нужно?
🔹История развития этого направления
🔹Какие решения существуют, и как обучить свою модель переноса стилей
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1