NEW BOT Телеграм, страница

Пресидский залив

Вчера пыталась нафайнтюнить на своих фотках опенсурсную диффузию, но вышло какое-то безобразие (см комменты к посту). Потом добралась до приложения lensa — после того как вы загрузите 20 селфи, вам сгенерируется очень годный контент в разных стилях. Стоит это удовольствие 279 рублей за 50 картинок.

❤12🔥4🥰3😍3👏1

2K viewsNadia ズエバ, 07:54

Пресидский залив

Я купила себе год назад айпад по двум причинам:

1) чтобы учить японский
2) чтобы использовать как полноценный второй экран в путешествиях (sidecar)

и если первый пункт большинству пока бесполезен, то второй очень даже может пригодиться

Apple Support

Use an iPad as a second display for a Mac

With Sidecar, you can use your iPad as a display that extends or mirrors your Mac desktop.

👍10👌2

1.57K viewsNadia ズエバ, edited 13:38

Пресидский залив

Недавно мы встретились с друзьями-стартаперами и заметили такую интересную вещь — перед нормальной беседой всегда идет small talk про работу.
У каждого участника есть заранее заученный ответ-скороговорка, над которым он не очень сильно задумывается, потому что рассказывал уже миллион раз, причем скорее всего еще и на русском/английском. Это быстрое резюме, чем ты сейчас занимаешься. В общих чертах у меня оно звучит как-то так:
"работаю в 2 стартапах, один из них b2b для кол-центров, другой b2c для тренировки произношения на разных языках. Пока в Ереване, но ближе к весне надеюсь перебраться в Калифорнию, если статус O-1 одобрят". И только после этого вы переходите к менее рабочим вопросам.
Забавно, на тех же собеседованиях все наоборот — в качестве разминки вы обсуждаете околопогодные темы и потом переходите к интервью, а с друзьями с которыми долго не виделись наоборот — сперва то, что легко (работа), а потом уже про более творческие темы.

😁24👍14🔥4❤1

2.86K viewsNadia ズエバ, 18:19

Пресидский залив

To create a company culture list for your B2B startup, consider the following steps:

1. Identify the values and beliefs that are important to your organization. These values should reflect the goals and mission of your startup, and should be reflected in the way you do business.
2. Foster a positive work environment by providing employees with the resources and support they need to be successful. This may include things like training, development opportunities, and a positive work-life balance.
3. Encourage open communication and collaboration among employees. This could include regular team meetings, feedback sessions, and other opportunities for employees to share their ideas and opinions.
4. Recognize and reward employees for their contributions to the organization. This could include things like bonuses, promotions, and public recognition for their achievements.
Invest in the well-being of your employees. This could include offering things like health insurance, gym memberships, and other benefits that support their physical and mental health.

By following these steps, you can create a strong company culture that will help your B2B startup to thrive. It's important to remember that creating a positive company culture takes time and effort, but the benefits are well worth it.

⬆️ Нашла отличную статью про корпоративную культуру в компаниях! Подробнее — тут

Как вы поняли, это новая модель-болталка от openai. Кстати сервера отвисли и можно бесплатно поиграться. Главное, вам нужен нероссийский номер

если еще не зареганы. Даже если это просто перефраз, он пугающе осмысленный

😁9👍3

1.67K viewsNadia ズエバ, edited 19:12

Пресидский залив

Только что созванивалась с китайской компанией про закупку данных — это конечно вообще другой мир по сравнению с моим прошлым опытом (Индия, Европа, Америка).

1) они зашли за 5 минут до звонка в зум
2) перед звонком прислали агенду и основные ссылки мне на почту и даже документ с историей компании 😅
3) не было никакого смолтолка, сразу быстро и по делу
4) в течение получаса после звонка прислали мне семплы датасетов
5) прямо на первом звонке озвучили свой прайс

в итоге за 15 минут мы обсудили то, о чем с другими компаниями обычно договариваемся неделями...

а еще они думали что я американка и очень удивились когда в конце я сказала, что русская. Говорят акцента нет совсем, приятно

👍57❤11🔥5🤔1

1.83K viewsNadia ズエバ, edited 11:24

Пресидский залив

В твиттере заметили, что openai выложили в сайлент режиме whisper v2. Интересно, не хотят смещать фокус внимания с chatGPT или какая мотивация?)
разбор первой версии

- The "large-v2" model is trained for more epochs with regularization and shows improved performance compared to the previous large.
- It has the same architecture as the original large model.
- When load_model("large") is called, the "large-v2" model will be loaded.
- We will soon update the paper regarding this new model.

👍12❤2🔥1

1.62K viewsNadia ズエバ, edited 18:24

Пресидский залив

🦄 Самый часто задаваемый вопрос от незнакомых разработчиков у меня в личке — "посоветуй курс по звуку в dl". У меня с одной стороны есть заготовленное сообщение, и начинается оно примерно так: "есть несколько хороших теоретических курсов и отдельных лекций, но лучше всего Learning by doing".
А что лучше doing если не знаком с популярными архитектурами в спиче и вообще не знаешь, куда копать? И на этот вопрос у меня нет ответа, кроме как общаться с комьюнити, следить за конференциями и каналами, ~~идти работать~~.
Я решила, что хочу, чтобы этот ответ был!
У меня появилась мысль записать на новогодних праздниках несколько видео, где я расскажу про существующие на январь 2023 способы извлечения фичей из звука, архитектуры для распознавания речи и других задач, в которых у меня есть боевой опыт и способы деплоя на сервер/девайс. А также приложу ссылки бейзлайн-код для обучения/портирования, который можно будет забрать и адаптировать

Пока что это идея, я еще ничего не записывала — но я уверена, что если будет много людей, для которых этот курс полезен, мне будет проще замотивировать себя его записать 😎

❗️Этот мини-курс точно будет платным — я считаю, что любой труд должен быть оплачен. Но так как это тестовый запуск, я хочу сделать курс доступным, и сама все повторить/структурировать, то цена будет небольшая за все лекции, в зависимости от того сколько я запишу я ориентируюсь на 3-5к рублей за весь доступ ~~ну и я оставлю вам возможность задонатить мне больше если курс зайдет))~~

‼️ Так что пишите, что думаете и про что вам хотелось бы узнать подробнее в рамках такого курса!

🔥75👍12❤11👎3

1.87K viewsNadia ズエバ, edited 12:57

Пресидский залив

Давненько я не писала про О-1!
Тем временем мнк сторис уже получил свой статус О-1, я же финально собрала портфолио и все что мне осталось до подачи это указать физический офис моей компании — такое требование теперь предъявляется ко всем подающимся.

Хорошая новость, что офисом может быть закрепленный стол в ковокринге в штате, куда подаешься. Еще один важный момент — если компания зарегистрирована в одном штате, то нельзя без дополнительных разрешений работать из другого, поэтому и коворкинг можно арендовать только в штате, в котором зарегистрирована компания.

После того как юристы отправят мою петицию, по ускоренной процедуре мне ответят в течение двух недель, затем мне нужно будет выбрать наименее загруженное посольство и полететь туда на собеседование. Для сравнения в Ереване срок ожидания собеседования по O-1 88 дней, а в Милане всего 8.
Если все сложится — в конце января уже буду в Лос Анджелесе. Если нет — буду искать другие варианты :)
#O1

👏19🔥6😁5🙏5👍1

2.84K viewsNadia ズエバ, edited 08:27

Пресидский залив

Пресидский залив pinned «🦄 Самый часто задаваемый вопрос от незнакомых разработчиков у меня в личке — "посоветуй курс по звуку в dl". У меня с одной стороны есть заготовленное сообщение, и начинается оно примерно так: "есть несколько хороших теоретических курсов и отдельных лекций…»

08:35

Пресидский залив

интересный факт: за поиск МЕСТА В КОВОРКИНГЕ агент в us берет себе комиссию в 100%.......

🤬20😱11👎1

2.04K viewsNadia ズエバ, 19:21

Пресидский залив

что будет, если нафайнтюнить диффузию на спектрограммах? 🧐
кое-что очень любопытное! Это литерали text2music, даже с Гриффином-Лимом очень достойно
собрала на коленке вечерний колабчик, параметры надо подбирать

Please open Telegram to view this post

VIEW IN TELEGRAM

www.producer.ai

Producer.ai | AI Music Agent

Create the music you imagine. Producer.ai is a generative AI instrument for creating, remixing, and sharing studio-quality songs from simple prompts. Swap stems, extend tracks, and personalize your sound effortlessly.

🔥17

2.37K viewsNadia ズエバ, 18:34

Пресидский залив

Встретимся в субботу 24.12 в coffee 3 в 12:00 на Петроградке! Поговорим про стартапы, путешествия, визы, обсудим последние новости, а еще там будут ребята из CoffeeCode :)

❤6🔥3

1.97K viewsNadia ズエバ, edited 10:57

Пресидский залив

Считаю, что лучшее применение chatGPT — это ~~писать поздравления на новый год партнерам~~ генерация данных под ваши требования. Вот вам и промпт-инженеринг покруче unreal engine и super resolution 😎
если вдруг кто-то еще не добрался

🔥22👍5👏1

1.59K viewsNadia ズエバ, edited 19:02

Пресидский залив

😧 Девочка: ищет в инстраграме бывшую своего парня
😎 Женщина: ищет через scholar диссер разработчика Adobe, чтобы узнать архитектуру

🚀 Нашла бесплатную тулзу studio speech enhancement от adobe research и она реально классно работает. Если посмотреть на мелспеки, то видно, что звук стал глубже и фоновых шумов действительно стало меньше.

Модель отрабатывает достаточно долго и точно не годится для рилтайма — значит скорее всего внутри что-то рекуррентное и довольно крупное. Мне стало интересно раскопать, что именно.

Достаточно быстро я нашла на скаляре, что статей со словами studio/adobe/enhancement за 2021+ год не особо много и везде фигурировала Jiaqi Su — PhD из Принстона с этой же темой диссера из adobe research, дальше среди ее недавних работ выделилась и статья с IEEE воркшопа, которая, скорее всего, и является основой технологии

🧩 В чем суть архитектуры?
Внутри wav2wav Hifi-GAN-2. Авторы выделили три критерия "студийности" и их улучшают: зашумленность, реверберация и балансировка эквалайзера. В архитектуре выделяются три компоненты:

1. RNN, которая предсказывает по raw signal (инпут по дефолту 16kHz) MFCC фичи для чистого сигнала
2. WaveNet, который берет на вход raw signal и предсказанные MFCC фичи из первой сетки и предсказывает raw signal в 16kHz
3. Апсемплер в 48 kHz

Данные генерили традиционно — портили хорошие через доступные шумы и скрипты из DAPS/ACE Challenge/etc. В начале статьи авторы вспоминают модели постарше вроде DEMUCS, PoCoNet, обученные на шумах и датасетах из DNS Challenge, где многие данные в 16kHz и что студийки там при всем желании не получится 🙃

Отличие от оригинального Hifi-GANа заключается как раз в первом пункте — сетке, которая считает акустические фичи по шумному инпуту. По мнению авторов, эта модификация значительно улучшает качество звука на выходе.
Большой минус архитектуры — скорость работы, много пространства для оптимизаций ~~господа-студенты, ловите тему для диплома~~
В статье супер много примеров и схем, так что рекомендую ознакомиться 🤓

❤34👍8🔥6🤔1

5.33K viewsNadia ズエバ, 17:23

Пресидский залив

🧩 Читаю сейчас очень любопытную книжку — "автоматическое опознавание говорящего по голосу". Самое интересное, что эта книга была издана в СССР в 1981 году и в ней в основном рассказывается, как максимально низкоуровнево выделить из речи говорящего признаки, какую-нибудь хитрую спектрограмму и по L2 посчитать, один ли человек говорит. А еще со всех сторон обложить статистикой для проверки гипотез) Кстати, идея с L2 также использовалась в работах примерно 5-7 летней давности по скорингу произношения на заранее подготовленных фразах

Ограничений само собой очень много — нет элайнмента и верификацию можно делать только по коротким словам, очень большая погрешность и на 1981 год это скорее что-то фантастическое, о чем авторы и сами говорят в конце. Однако, в этой книге очень много информации про физику и биологию звука — вплоть до того, что на "спектрограммах" авторы пытаются искать такие разладки как "заложенный нос", "картавость", "шепелявость" спикера и так далее. Очень похоже на попытку интерпретировать все, что мы делегируем нейросетям.

Для верификации голоса на "инференсе" его статистики также сравниваются со статистиками, посчитанными на записях проверяемого человека, а эти записи так и называются — экземпляры обучающей выборки 🙃
Интересно, что по мнению авторов такая верификация в будущем должна была бы использоваться в криминалистике, а совсем не для "Hey Siri where is my iphone?"

🔥31👍4👏4

2.36K viewsNadia ズエバ, 13:00

About

Blog

Apps

Platform