Пресидский залив – Telegram
Пресидский залив
6.29K subscribers
449 photos
53 videos
3 files
337 links
Pre-seed'ский, не персидский! Я DL engineer, который хочет стать акулой бизнеса. Рассказываю про успехи и фейлы 🦈
вместе с @mnk_stories создаем fashion tech стартап Aesty (Antler'24 Saudi)
чат: https://news.1rj.ru/str/+SvmaVb3PV6MyNGJi
@im_moonko - сотрудничество
Download Telegram
Вчера пыталась нафайнтюнить на своих фотках опенсурсную диффузию, но вышло какое-то безобразие (см комменты к посту). Потом добралась до приложения lensa — после того как вы загрузите 20 селфи, вам сгенерируется очень годный контент в разных стилях. Стоит это удовольствие 279 рублей за 50 картинок.
12🔥4🥰3😍3👏1
Я купила себе год назад айпад по двум причинам:

1) чтобы учить японский
2) чтобы использовать как полноценный второй экран в путешествиях (sidecar)

и если первый пункт большинству пока бесполезен, то второй очень даже может пригодиться
👍10👌2
Недавно мы встретились с друзьями-стартаперами и заметили такую интересную вещь — перед нормальной беседой всегда идет small talk про работу.
У каждого участника есть заранее заученный ответ-скороговорка, над которым он не очень сильно задумывается, потому что рассказывал уже миллион раз, причем скорее всего еще и на русском/английском. Это быстрое резюме, чем ты сейчас занимаешься. В общих чертах у меня оно звучит как-то так:
"работаю в 2 стартапах, один из них b2b для кол-центров, другой b2c для тренировки произношения на разных языках. Пока в Ереване, но ближе к весне надеюсь перебраться в Калифорнию, если статус O-1 одобрят". И только после этого вы переходите к менее рабочим вопросам.
Забавно, на тех же собеседованиях все наоборот — в качестве разминки вы обсуждаете околопогодные темы и потом переходите к интервью, а с друзьями с которыми долго не виделись наоборот — сперва то, что легко (работа), а потом уже про более творческие темы.
😁24👍14🔥41
To create a company culture list for your B2B startup, consider the following steps:

1. Identify the values and beliefs that are important to your organization. These values should reflect the goals and mission of your startup, and should be reflected in the way you do business.
2. Foster a positive work environment by providing employees with the resources and support they need to be successful. This may include things like training, development opportunities, and a positive work-life balance.
3. Encourage open communication and collaboration among employees. This could include regular team meetings, feedback sessions, and other opportunities for employees to share their ideas and opinions.
4. Recognize and reward employees for their contributions to the organization. This could include things like bonuses, promotions, and public recognition for their achievements.
Invest in the well-being of your employees. This could include offering things like health insurance, gym memberships, and other benefits that support their physical and mental health.

By following these steps, you can create a strong company culture that will help your B2B startup to thrive. It's important to remember that creating a positive company culture takes time and effort, but the benefits are well worth it.


⬆️ Нашла отличную статью про корпоративную культуру в компаниях! Подробнее — тут
Как вы поняли, это новая модель-болталка от openai. Кстати сервера отвисли и можно бесплатно поиграться. Главное, вам нужен нероссийский номер если еще не зареганы. Даже если это просто перефраз, он пугающе осмысленный
😁9👍3
Только что созванивалась с китайской компанией про закупку данных — это конечно вообще другой мир по сравнению с моим прошлым опытом (Индия, Европа, Америка).

1) они зашли за 5 минут до звонка в зум
2) перед звонком прислали агенду и основные ссылки мне на почту и даже документ с историей компании 😅
3) не было никакого смолтолка, сразу быстро и по делу
4) в течение получаса после звонка прислали мне семплы датасетов
5) прямо на первом звонке озвучили свой прайс

в итоге за 15 минут мы обсудили то, о чем с другими компаниями обычно договариваемся неделями...

а еще они думали что я американка и очень удивились когда в конце я сказала, что русская. Говорят акцента нет совсем, приятно
👍5711🔥5🤔1
В твиттере заметили, что openai выложили в сайлент режиме whisper v2. Интересно, не хотят смещать фокус внимания с chatGPT или какая мотивация?)
разбор первой версии

- The "large-v2" model is trained for more epochs with regularization and shows improved performance compared to the previous large.
- It has the same architecture as the original large model.
- When load_model("large") is called, the "large-v2" model will be loaded.
- We will soon update the paper regarding this new model.
👍122🔥1
🦄 Самый часто задаваемый вопрос от незнакомых разработчиков у меня в личке — "посоветуй курс по звуку в dl". У меня с одной стороны есть заготовленное сообщение, и начинается оно примерно так: "есть несколько хороших теоретических курсов и отдельных лекций, но лучше всего Learning by doing".
А что лучше doing если не знаком с популярными архитектурами в спиче и вообще не знаешь, куда копать? И на этот вопрос у меня нет ответа, кроме как общаться с комьюнити, следить за конференциями и каналами, идти работать.
Я решила, что хочу, чтобы этот ответ был!
У меня появилась мысль записать на новогодних праздниках несколько видео, где я расскажу про существующие на январь 2023 способы извлечения фичей из звука, архитектуры для распознавания речи и других задач, в которых у меня есть боевой опыт и способы деплоя на сервер/девайс. А также приложу ссылки бейзлайн-код для обучения/портирования, который можно будет забрать и адаптировать

Пока что это идея, я еще ничего не записывала — но я уверена, что если будет много людей, для которых этот курс полезен, мне будет проще замотивировать себя его записать 😎

❗️Этот мини-курс точно будет платным — я считаю, что любой труд должен быть оплачен. Но так как это тестовый запуск, я хочу сделать курс доступным, и сама все повторить/структурировать, то цена будет небольшая за все лекции, в зависимости от того сколько я запишу я ориентируюсь на 3-5к рублей за весь доступ ну и я оставлю вам возможность задонатить мне больше если курс зайдет))

‼️ Так что пишите, что думаете и про что вам хотелось бы узнать подробнее в рамках такого курса!
🔥75👍1211👎3
Давненько я не писала про О-1!
Тем временем мнк сторис уже получил свой статус О-1, я же финально собрала портфолио и все что мне осталось до подачи это указать физический офис моей компании — такое требование теперь предъявляется ко всем подающимся.

Хорошая новость, что офисом может быть закрепленный стол в ковокринге в штате, куда подаешься. Еще один важный момент — если компания зарегистрирована в одном штате, то нельзя без дополнительных разрешений работать из другого, поэтому и коворкинг можно арендовать только в штате, в котором зарегистрирована компания.

После того как юристы отправят мою петицию, по ускоренной процедуре мне ответят в течение двух недель, затем мне нужно будет выбрать наименее загруженное посольство и полететь туда на собеседование. Для сравнения в Ереване срок ожидания собеседования по O-1 88 дней, а в Милане всего 8.
Если все сложится — в конце января уже буду в Лос Анджелесе. Если нет — буду искать другие варианты :)
#O1
👏19🔥6😁5🙏5👍1
Пресидский залив pinned «🦄 Самый часто задаваемый вопрос от незнакомых разработчиков у меня в личке — "посоветуй курс по звуку в dl". У меня с одной стороны есть заготовленное сообщение, и начинается оно примерно так: "есть несколько хороших теоретических курсов и отдельных лекций…»
интересный факт: за поиск МЕСТА В КОВОРКИНГЕ агент в us берет себе комиссию в 100%.......
🤬20😱11👎1
что будет, если нафайнтюнить диффузию на спектрограммах? 🧐
кое-что очень любопытное! Это литерали text2music, даже с Гриффином-Лимом очень достойно
собрала на коленке вечерний колабчик, параметры надо подбирать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17
Встретимся в субботу 24.12 в coffee 3 в 12:00 на Петроградке! Поговорим про стартапы, путешествия, визы, обсудим последние новости, а еще там будут ребята из CoffeeCode :)
6🔥3
Считаю, что лучшее применение chatGPT — это писать поздравления на новый год партнерам генерация данных под ваши требования. Вот вам и промпт-инженеринг покруче unreal engine и super resolution 😎
если вдруг кто-то еще не добрался
🔥22👍5👏1
😧 Девочка: ищет в инстраграме бывшую своего парня
😎 Женщина: ищет через scholar диссер разработчика Adobe, чтобы узнать архитектуру

🚀 Нашла бесплатную
тулзу studio speech enhancement от adobe research и она реально классно работает. Если посмотреть на мелспеки, то видно, что звук стал глубже и фоновых шумов действительно стало меньше.

Модель отрабатывает достаточно долго и точно не годится для рилтайма — значит скорее всего внутри что-то рекуррентное и довольно крупное. Мне стало интересно раскопать, что именно.

Достаточно быстро я нашла на скаляре, что статей со словами studio/adobe/enhancement за 2021+ год не особо много и везде фигурировала Jiaqi Su — PhD из Принстона с этой же темой диссера из adobe research, дальше среди ее недавних работ выделилась и статья с IEEE воркшопа, которая, скорее всего, и является основой технологии

🧩 В чем суть архитектуры?
Внутри wav2wav Hifi-GAN-2. Авторы выделили три критерия "студийности" и их улучшают: зашумленность, реверберация и балансировка эквалайзера. В архитектуре выделяются три компоненты:

1. RNN, которая предсказывает по raw signal (инпут по дефолту 16kHz) MFCC фичи для чистого сигнала
2. WaveNet, который берет на вход raw signal и предсказанные MFCC фичи из первой сетки и предсказывает raw signal в 16kHz
3. Апсемплер в 48 kHz

Данные генерили традиционно — портили хорошие через доступные шумы и скрипты из DAPS/ACE Challenge/etc. В начале статьи авторы вспоминают модели постарше вроде DEMUCS, PoCoNet, обученные на шумах и датасетах из DNS Challenge, где многие данные в 16kHz и что студийки там при всем желании не получится 🙃

Отличие от оригинального Hifi-GANа заключается как раз в первом пункте — сетке, которая считает акустические фичи по шумному инпуту. По мнению авторов, эта модификация значительно улучшает качество звука на выходе.
Большой минус архитектуры — скорость работы, много пространства для оптимизаций господа-студенты, ловите тему для диплома
В статье супер много примеров и схем, так что рекомендую ознакомиться 🤓
34👍8🔥6🤔1
🧩 Читаю сейчас очень любопытную книжку — "автоматическое опознавание говорящего по голосу". Самое интересное, что эта книга была издана в СССР в 1981 году и в ней в основном рассказывается, как максимально низкоуровнево выделить из речи говорящего признаки, какую-нибудь хитрую спектрограмму и по L2 посчитать, один ли человек говорит. А еще со всех сторон обложить статистикой для проверки гипотез) Кстати, идея с L2 также использовалась в работах примерно 5-7 летней давности по скорингу произношения на заранее подготовленных фразах

Ограничений само собой очень много — нет элайнмента и верификацию можно делать только по коротким словам, очень большая погрешность и на 1981 год это скорее что-то фантастическое, о чем авторы и сами говорят в конце. Однако, в этой книге очень много информации про физику и биологию звука — вплоть до того, что на "спектрограммах" авторы пытаются искать такие разладки как "заложенный нос", "картавость", "шепелявость" спикера и так далее. Очень похоже на попытку интерпретировать все, что мы делегируем нейросетям.

Для верификации голоса на "инференсе" его статистики также сравниваются со статистиками, посчитанными на записях проверяемого человека, а эти записи так и называются — экземпляры обучающей выборки 🙃
Интересно, что по мнению авторов такая верификация в будущем должна была бы использоваться в криминалистике, а совсем не для "Hey Siri where is my iphone?"
🔥31👍4👏4
Нашла интересный инструмент от Google из далекого 2020 для быстрой отрисовки схем/слайдов/постеров. Вы начинаете рисовать и дальше модель находит наиболее близкий к вашему рисунок. Никакой генерации, только ранжирование заранее нарисованных художниками иконок. Попробовала нарисовать первую схему, которая пришла в голову. Потратила на весь процесс минуты полторы.
Из минусов — не хватает грида, чтобы все было ровно.

Штука бесплатная и работает на любых устройствах. Думаю, что буду использовать в презентациях и для документаций 😎
👍21🔥32👏1