Последние две недели чиллил во Вьетнаме.
И не просто так, а с ИИ-пользой на ИИ-саммите от AI Talent Hub. Полсотни молодых, талантливых, энергичных технооптимистов, верящих в силу ИИ.
Стартаперы, ML-щики, продуктовики, тимлиды ну очень больших компаний, аутсорсеры из Корпуса, магистранты ИТМО - этаких безумный нетворк-замес на берегу океана в Муйне.
Наконец-то познакомился с Ильей Макаровым (обсудили родной мехмат), встретился оффлайн с Димой Широносовым (обсудили EveryPixel), посадил на байк Диму Ботова, катнул на Ветратории на виндсерфинге, успел покататься на Будде на лонге пока волны были, нашел вьетнамский покерный катран и встретил нереальную массу знакомых из Дахаба.
Кстати, одним из неожиданных знакомств, оказалась встреча с ребятами из XOR. Я подписан на канал DataSecrets - мне нравится ортогональный моему стиль подачи, обезличенный, но с юмором, задачками и тонной полезного контента для тех, кто в теме. Я думал там жоские ботаники, но оказалось, что это прекрасная Влада(см. фото) и скромный Ваня. Мой шаблон был разорван. После чего я еще более неистово плюсую за их канал. У меня теперь приятные воспоминания, когда читаю их контент. Подписывайтесь, они классные: @data_secrets
И не просто так, а с ИИ-пользой на ИИ-саммите от AI Talent Hub. Полсотни молодых, талантливых, энергичных технооптимистов, верящих в силу ИИ.
Стартаперы, ML-щики, продуктовики, тимлиды ну очень больших компаний, аутсорсеры из Корпуса, магистранты ИТМО - этаких безумный нетворк-замес на берегу океана в Муйне.
Наконец-то познакомился с Ильей Макаровым (обсудили родной мехмат), встретился оффлайн с Димой Широносовым (обсудили EveryPixel), посадил на байк Диму Ботова, катнул на Ветратории на виндсерфинге, успел покататься на Будде на лонге пока волны были, нашел вьетнамский покерный катран и встретил нереальную массу знакомых из Дахаба.
Кстати, одним из неожиданных знакомств, оказалась встреча с ребятами из XOR. Я подписан на канал DataSecrets - мне нравится ортогональный моему стиль подачи, обезличенный, но с юмором, задачками и тонной полезного контента для тех, кто в теме. Я думал там жоские ботаники, но оказалось, что это прекрасная Влада(см. фото) и скромный Ваня. Мой шаблон был разорван. После чего я еще более неистово плюсую за их канал. У меня теперь приятные воспоминания, когда читаю их контент. Подписывайтесь, они классные: @data_secrets
🔥56👍25
Ну, за челленджи.
Есть такой ютюбер pwnisher, у него нехилый такой канал по 3Д и разным челленджам. Я немного залип на последнем.
Был дан образец - болванчик поднимается по винтовой лестнице, надо было сделать креативный 3Д-рендер, на основе этого.
Народ прислал аж 2800 работ. Поглядите лучшие по ссылке.
А я подумал, что такого рода механики рано или поздно будут девальвированы с помощью ИИ.
Уже сейчас можно взять начальный образец и прогнать его через video style transfer и получить примерно 100 000 вариантов, которые можно прислать на конкурс.
Далее, если глядеть в сторону SORA, то можно представить себе генератор промптов, который на основе заданного сеттинга генерит 100 000 промптов, описывающих креативы, которые даже в голову не придут трехмерщикам, их мышление, как правило, слегка (и предсказуемо) деформировано ограничениями производства 3Д контента (от времени рендера и каустик, но всяких сложностей, связанных с симуляциями). А ИИ вам нагенерит безбашенных роликов с каустиками и водичкой наперевес.
Я это к чему. Вон Клод стихи уже пишет как царь, с текстами и креативами все понятно, с креативом на картинках тоже становится понятно, что фантазия ИИ порождает такие шедевры, которые не придут в голову кожаным. Теперь он идет за видео и 3Д. Дайте ему время.
https://youtu.be/UNjMSFLkMZA
Есть такой ютюбер pwnisher, у него нехилый такой канал по 3Д и разным челленджам. Я немного залип на последнем.
Был дан образец - болванчик поднимается по винтовой лестнице, надо было сделать креативный 3Д-рендер, на основе этого.
Народ прислал аж 2800 работ. Поглядите лучшие по ссылке.
А я подумал, что такого рода механики рано или поздно будут девальвированы с помощью ИИ.
Уже сейчас можно взять начальный образец и прогнать его через video style transfer и получить примерно 100 000 вариантов, которые можно прислать на конкурс.
Далее, если глядеть в сторону SORA, то можно представить себе генератор промптов, который на основе заданного сеттинга генерит 100 000 промптов, описывающих креативы, которые даже в голову не придут трехмерщикам, их мышление, как правило, слегка (и предсказуемо) деформировано ограничениями производства 3Д контента (от времени рендера и каустик, но всяких сложностей, связанных с симуляциями). А ИИ вам нагенерит безбашенных роликов с каустиками и водичкой наперевес.
Я это к чему. Вон Клод стихи уже пишет как царь, с текстами и креативами все понятно, с креативом на картинках тоже становится понятно, что фантазия ИИ порождает такие шедевры, которые не придут в голову кожаным. Теперь он идет за видео и 3Д. Дайте ему время.
https://youtu.be/UNjMSFLkMZA
YouTube
Top 100 3D Artist Montage | Eternal Ascent
Want to enter the next challenge? Join us on Discord: https://discord.gg/createwithclint
And consider supporting me on Patreon to support more of these: https://patreon.com/pwnisher
Artist Index: https://docs.google.com/spreadsheets/d/1OVItn5a1xpctMr0SGh…
And consider supporting me on Patreon to support more of these: https://patreon.com/pwnisher
Artist Index: https://docs.google.com/spreadsheets/d/1OVItn5a1xpctMr0SGh…
👍30👎19🔥14❤1
Тема ИИ-гадалок пошла в массы.
Наконец-то.
Я писал об этом ровно 6 лет назад, когда ИИ еще ворочался в утробе слабых видеокарт.
Но, прогресс, как обычно, свернул не туда, поэтому поглядите на скриншоты и почитайте этот ад на русском вот тут:
https://twitter.com/facelessboy00/status/1777160844607988063
и вот тут:
https://twitter.com/gambala_codes/status/1777219418772128205
Ну и конечно, эти гадалки в телеграмме попросят у вас денег и призваны налить трафика себе в подол.
Я в свое время думал над ИИ-кукушкой, которая по вашему лицу и телефону накукует, сколько вам еще осталось лет куковать.
А тут коллеги подкинули вот такую работу прошлого года:
Глубокое обучение для предсказания прогноза рака по портретным фотографиям с помощью StyleGAN.
https://arxiv.org/abs/2306.14596v2
Я немного содрогнулся, потому что, если гадальщики выше сделают такой сервис и народ начнет получать свои онкопрогнозы, то у некоторых могут включиться очень нехорошие программы внутри. И я надеюсь, что на уровень инсты и ботов в телеге это не выйдет.
Но думаю, что инфоцыганская физиогномика сейчас расцветет в полный рост. Пока в интернетике активно работают раздеваторы и одеваторы по фото. Дальше по селфи они будут обнажать вашу душу и делать приворот шиткойнов. А потом доберутся до предсказаний чего угодно. По личику.
Хотя три года назад мы уже это проходили.
Анализ черт личности людей по их фотографиям (гадалки в кучу).
https://hightech.fm/2020/05/22/ai-personal-character
Также держите анализ здоровья и facial blood flow по фотачкам.
https://news.1rj.ru/str/cgevent/1862
Ну и вишенка на торте:
"Этот искусственный интеллект, финансируемый ЕС, оценивает, насколько неотвратительно ваше лицо - с точки зрения общества. Система также определяет ваш возраст, индекс массы тела(body shaming detected)), продолжительность жизни(!) и пол."
https://thenextweb.com/neural/2020/10/06/this-eu-funded-ai-rates-how-hideous-your-face-is-for-societys-sake/
Погадаем?
Наконец-то.
Я писал об этом ровно 6 лет назад, когда ИИ еще ворочался в утробе слабых видеокарт.
Но, прогресс, как обычно, свернул не туда, поэтому поглядите на скриншоты и почитайте этот ад на русском вот тут:
https://twitter.com/facelessboy00/status/1777160844607988063
и вот тут:
https://twitter.com/gambala_codes/status/1777219418772128205
Ну и конечно, эти гадалки в телеграмме попросят у вас денег и призваны налить трафика себе в подол.
Я в свое время думал над ИИ-кукушкой, которая по вашему лицу и телефону накукует, сколько вам еще осталось лет куковать.
А тут коллеги подкинули вот такую работу прошлого года:
Глубокое обучение для предсказания прогноза рака по портретным фотографиям с помощью StyleGAN.
https://arxiv.org/abs/2306.14596v2
Я немного содрогнулся, потому что, если гадальщики выше сделают такой сервис и народ начнет получать свои онкопрогнозы, то у некоторых могут включиться очень нехорошие программы внутри. И я надеюсь, что на уровень инсты и ботов в телеге это не выйдет.
Но думаю, что инфоцыганская физиогномика сейчас расцветет в полный рост. Пока в интернетике активно работают раздеваторы и одеваторы по фото. Дальше по селфи они будут обнажать вашу душу и делать приворот шиткойнов. А потом доберутся до предсказаний чего угодно. По личику.
Хотя три года назад мы уже это проходили.
Анализ черт личности людей по их фотографиям (гадалки в кучу).
https://hightech.fm/2020/05/22/ai-personal-character
Также держите анализ здоровья и facial blood flow по фотачкам.
https://news.1rj.ru/str/cgevent/1862
Ну и вишенка на торте:
"Этот искусственный интеллект, финансируемый ЕС, оценивает, насколько неотвратительно ваше лицо - с точки зрения общества. Система также определяет ваш возраст, индекс массы тела(body shaming detected)), продолжительность жизни(!) и пол."
https://thenextweb.com/neural/2020/10/06/this-eu-funded-ai-rates-how-hideous-your-face-is-for-societys-sake/
Погадаем?
🔥25👍13👎6
Забавное исследование отклика на музыку.
Взяли восемь коротких мелодий, состоящих всего из четырех аккордов каждая. И полтыщщи слушателей.
В каждой мелодии было разнообразное сочетание свежих и предсказуемых аккордов, а также определенных и странных последовательностей этих аккордов.
«Наше исследование показывает, что разные последовательности аккордов вызывают схожие телесные ощущения в определенных органах, особенно в голове, сердце и брюшной полости».
Предсказуемая мелодия - ощущения в животе (безопасность?)
Мелодия с неожиданными новыми сочетаниями аккордов - ощущения в сердце (новизна?)
Тревожная музыка - в голове (все проблемы в голове).
Загвоздка в том, что картирование участков тела проводилось со слов испытуемых, а не датчиками или сенсорами. И, возможно, это показывает стереотипы (языковые прежде всего) о том, где живут тревога или спокойствие.
В любом случае это жутко интересно. И возможно в пятой версии Suno мы увидим галочки "Музыка для сердца\живота\головы". ИИ подучится на таких исследованиях и ну генерить музыку для специфический ощущений.
https://neurosciencenews.com/music-body-sensation-25858/
Взяли восемь коротких мелодий, состоящих всего из четырех аккордов каждая. И полтыщщи слушателей.
В каждой мелодии было разнообразное сочетание свежих и предсказуемых аккордов, а также определенных и странных последовательностей этих аккордов.
«Наше исследование показывает, что разные последовательности аккордов вызывают схожие телесные ощущения в определенных органах, особенно в голове, сердце и брюшной полости».
Предсказуемая мелодия - ощущения в животе (безопасность?)
Мелодия с неожиданными новыми сочетаниями аккордов - ощущения в сердце (новизна?)
Тревожная музыка - в голове (все проблемы в голове).
Загвоздка в том, что картирование участков тела проводилось со слов испытуемых, а не датчиками или сенсорами. И, возможно, это показывает стереотипы (языковые прежде всего) о том, где живут тревога или спокойствие.
В любом случае это жутко интересно. И возможно в пятой версии Suno мы увидим галочки "Музыка для сердца\живота\головы". ИИ подучится на таких исследованиях и ну генерить музыку для специфический ощущений.
https://neurosciencenews.com/music-body-sensation-25858/
Neuroscience News
Music Evokes Distinct Bodily Sensations
A new study reveals how music evokes distinct bodily sensations, particularly in the heart and abdomen, linking these feelings to emotional responses and aesthetic appreciation.
🔥20👍6👎2
This media is not supported in your browser
VIEW IN TELEGRAM
В прошлом году писал про ситуацию с Аленой, у которой "украли голос".
Ее ролик набрал больше миллиона просмотров на разных платформах. Голос Алены уже убрали "из продаж голосов". В общем ситуация бомбанула и поставила много вопросов, на которые нет ответов.
Вот тут развитие истории
https://dtf.ru/u/952987-holly-forve/2084880-tinkoff-zametaet-sledy
Но похоже на эти вопросы будет один ответ: читайте контракты.
Вот свежий пример: барышня озвучивала голосовой помощник Кортану для Микрософта. На немецком. За 3000 долларов.
Озвучила.
А потом ей стали звонить знакомые и говорить, что слышат ее голос отнюдь не из Кортаны, а воще непонятно где.
Все просто - голос был продан как оцифрованное звучание голосовых связок.
Девушку покрал у Игоря.
Ее ролик набрал больше миллиона просмотров на разных платформах. Голос Алены уже убрали "из продаж голосов". В общем ситуация бомбанула и поставила много вопросов, на которые нет ответов.
Вот тут развитие истории
https://dtf.ru/u/952987-holly-forve/2084880-tinkoff-zametaet-sledy
Но похоже на эти вопросы будет один ответ: читайте контракты.
Вот свежий пример: барышня озвучивала голосовой помощник Кортану для Микрософта. На немецком. За 3000 долларов.
Озвучила.
А потом ей стали звонить знакомые и говорить, что слышат ее голос отнюдь не из Кортаны, а воще непонятно где.
Все просто - голос был продан как оцифрованное звучание голосовых связок.
Девушку покрал у Игоря.
👍12🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Ну за концептеров. Это я готовлюсь к постам про Креа, Визком и будущие нормальные интерфейсы, а не вот это вот все комфиюаищще и автоматищ1щ1щ1щ1е.
У корейцев много такого добра, прочекайте тут:
https://www.youtube.com/shorts/EoCdwUaErt0
У корейцев много такого добра, прочекайте тут:
https://www.youtube.com/shorts/EoCdwUaErt0
🔥31👍8
Forwarded from Трендоскоп
Эпохальный сдвиг: от приложений к супераппам
Apple на днях ослабила ограничения в App Store, в связи с давлением регуляторов.
Теперь приложения официально могут не зашивать внутрь некоторый контент — в частности, мини-аппы и игры, чат-боты, плагины. Супераппы по типу WeChat могут дышать свободно, как и wannabe-платформы вроде Telegram и Discord.
Это ещё один вестник платформенного сдвига, в котором мы сейчас живем. Старые подходы к созданию и продвижению IT-продуктов уже не работают. Рынок насытился, в сторах высочайшая конкуренция, а платная реклама зарубает на корню экономику 99% проектов.
Зарождается новая взлётная полоса — Layer2-платформы, такие как Telegram, Discord, Roblox. Сейчас здесь самые сладкие условия для стартеров: масштабный переток пользователей в эти платформы, высокие виральные возможности, быстрая и дешёвая разработка.
В Китае такая модель победила изначально. Для многих китайцев, весь интернет — это WeChat, внутри которого уже есть все нужные сервисы от платежей до заказа еды. А сейчас мы наблюдаем этот сдвиг и в других странах.
И благодаря новым правилам Apple, Телеграм/Discord могут больше не шифроваться с Mini App’ами. Вполне вероятно, что это станет триггером и для других платформ: для Layer2-разработчиков могут открыться eX-Twitter, WhatsApp, Instagram.
Уже активно срываются «низковисящие фрукты» в B2C, что мы и видим на примерах Notcoin или The Pixels. Но для В2В это даже бОльшие возможности, если судить по траектории WeChat.
В эту среду (10 апреля) мы проведём онлайн-брейншторм на тему инструментов для Layer2-разработчиков. Если вы хотите поучаствовать и найти соратников — присоединяйтесь к нашему сообществу Трендоскоп Lab. Подать заявку можно в этой Гугл-форме. Велкам 🙂
@trendoscope
Apple на днях ослабила ограничения в App Store, в связи с давлением регуляторов.
Теперь приложения официально могут не зашивать внутрь некоторый контент — в частности, мини-аппы и игры, чат-боты, плагины. Супераппы по типу WeChat могут дышать свободно, как и wannabe-платформы вроде Telegram и Discord.
Это ещё один вестник платформенного сдвига, в котором мы сейчас живем. Старые подходы к созданию и продвижению IT-продуктов уже не работают. Рынок насытился, в сторах высочайшая конкуренция, а платная реклама зарубает на корню экономику 99% проектов.
Зарождается новая взлётная полоса — Layer2-платформы, такие как Telegram, Discord, Roblox. Сейчас здесь самые сладкие условия для стартеров: масштабный переток пользователей в эти платформы, высокие виральные возможности, быстрая и дешёвая разработка.
В Китае такая модель победила изначально. Для многих китайцев, весь интернет — это WeChat, внутри которого уже есть все нужные сервисы от платежей до заказа еды. А сейчас мы наблюдаем этот сдвиг и в других странах.
И благодаря новым правилам Apple, Телеграм/Discord могут больше не шифроваться с Mini App’ами. Вполне вероятно, что это станет триггером и для других платформ: для Layer2-разработчиков могут открыться eX-Twitter, WhatsApp, Instagram.
Уже активно срываются «низковисящие фрукты» в B2C, что мы и видим на примерах Notcoin или The Pixels. Но для В2В это даже бОльшие возможности, если судить по траектории WeChat.
В эту среду (10 апреля) мы проведём онлайн-брейншторм на тему инструментов для Layer2-разработчиков. Если вы хотите поучаствовать и найти соратников — присоединяйтесь к нашему сообществу Трендоскоп Lab. Подать заявку можно в этой Гугл-форме. Велкам 🙂
@trendoscope
👍28👎6🔥5
chatGPT-нашлепка на телефон.
У меня мозг взрывается от такого девайса.
На телефон вешается вот такая нашлепка, которая в принципе является диктофоном, который может выкликать chatGPT с целью суммаризации и перевода.
Вот тут они явно врут: Chime Note может мгновенно переводить со 108 языков. Это я про "мгновенно".
Ну и у меня один вопрос: а зачем тут эта нашлепка? Ведь можно написать приложение, которое делает то же самое. Или нельзя?
Кроме того, последний Самсунг в реалтайме переводит разговор НА УСТРОЙСТВЕ, без всяких вызовов chatGPT.
В чем сила, брат?
https://www.kickstarter.com/projects/chimenoteairecorder/chime-note-chatgpt-powered-ai-voice-recorder
У меня мозг взрывается от такого девайса.
На телефон вешается вот такая нашлепка, которая в принципе является диктофоном, который может выкликать chatGPT с целью суммаризации и перевода.
Вот тут они явно врут: Chime Note может мгновенно переводить со 108 языков. Это я про "мгновенно".
Ну и у меня один вопрос: а зачем тут эта нашлепка? Ведь можно написать приложение, которое делает то же самое. Или нельзя?
Кроме того, последний Самсунг в реалтайме переводит разговор НА УСТРОЙСТВЕ, без всяких вызовов chatGPT.
В чем сила, брат?
https://www.kickstarter.com/projects/chimenoteairecorder/chime-note-chatgpt-powered-ai-voice-recorder
👍20👎5🔥3
Нейроигры с погружением. В мозг
Я уже писал про Гейба Ньюэлла, главу Valve и папу Half Life (одного из 100 самых богатых людей США, его состояние оценивалось в 5,5 млрд долларов в 2017 году).
Прочтите мой лонгрид для разминки. Там как раз про стимуляцию игрока.
И если раньше Ньюэлл пытался соединить виар-шлемы и гарнитуры для съема энцефалограмм, чтобы подстраивать игровой опыт под ментально-физиологичекое состояние игрока, то сейчас, насмотревшись на Маска, решил делать импланты. В мозг.
Также стоит вспомнить проект OpenBCI+Galea - идея снимать тонну данных с головы игрока лежит на поверхности.
Но вот что будет, когда процесс пойдет в обраточку - и в голову игрока пойдут стимулы?
Вот тогда и придет настоящий киберпанк.
Поглядите на сайт, где похудевший на 20 кило Гейб Ньюэлл представляет свой новый проект:
Мы создаем следующее поколение нейроинтерфейсов, решаем важные проблемы и совершенствуем способы взаимодействия с миром.
https://starfishneuroscience.com/
Я уже писал про Гейба Ньюэлла, главу Valve и папу Half Life (одного из 100 самых богатых людей США, его состояние оценивалось в 5,5 млрд долларов в 2017 году).
Прочтите мой лонгрид для разминки. Там как раз про стимуляцию игрока.
И если раньше Ньюэлл пытался соединить виар-шлемы и гарнитуры для съема энцефалограмм, чтобы подстраивать игровой опыт под ментально-физиологичекое состояние игрока, то сейчас, насмотревшись на Маска, решил делать импланты. В мозг.
Также стоит вспомнить проект OpenBCI+Galea - идея снимать тонну данных с головы игрока лежит на поверхности.
Но вот что будет, когда процесс пойдет в обраточку - и в голову игрока пойдут стимулы?
Вот тогда и придет настоящий киберпанк.
Поглядите на сайт, где похудевший на 20 кило Гейб Ньюэлл представляет свой новый проект:
Мы создаем следующее поколение нейроинтерфейсов, решаем важные проблемы и совершенствуем способы взаимодействия с миром.
https://starfishneuroscience.com/
👍20🔥17
This media is not supported in your browser
VIEW IN TELEGRAM
Принес вам еще одну реалтаймовую нейрорисовалку.
Работает криво и косо. Можете попробовать вот тут:
https://akuma.ai/canvas
Не креа или визком, но сам факт того, что такие инструменты множатся, говорит о том, что есть огромный запрос на РИСОВАНИЕ, а не на КНОПКОЖАНИЕ.
Рисовалка смешная, исполняет в обнаженку (см пример в коментах), имеет разные стили, может быть использована как турбо генератор картинок.
Ждем такого функционала в фотошопе, чтобы закрыт вопрос с такими поделками.
Работает криво и косо. Можете попробовать вот тут:
https://akuma.ai/canvas
Не креа или визком, но сам факт того, что такие инструменты множатся, говорит о том, что есть огромный запрос на РИСОВАНИЕ, а не на КНОПКОЖАНИЕ.
Рисовалка смешная, исполняет в обнаженку (см пример в коментах), имеет разные стили, может быть использована как турбо генератор картинок.
Ждем такого функционала в фотошопе, чтобы закрыт вопрос с такими поделками.
👍22🔥6👎4
This media is not supported in your browser
VIEW IN TELEGRAM
Krea.ai, конечно, огнище.
Помните первые восторги от смешивания двух картинок в Midjourney?
А теперь расширяем сознание - подвешиваем в нем ТРИ картинки (в пространстве) и пытаемся представить микс из трех изображений. Причем микс идет не в пиксельном, а в "смысловом" пространстве. Ментальное 3Д.
Веса картинок можно менять, а новая HD модель выдает все это расширение сознания в 1024х1024.
Бежим пробовать: https://www.krea.ai/apps/image/realtime
И все это в реальном времени, Карл!
Помните первые восторги от смешивания двух картинок в Midjourney?
А теперь расширяем сознание - подвешиваем в нем ТРИ картинки (в пространстве) и пытаемся представить микс из трех изображений. Причем микс идет не в пиксельном, а в "смысловом" пространстве. Ментальное 3Д.
Веса картинок можно менять, а новая HD модель выдает все это расширение сознания в 1024х1024.
Бежим пробовать: https://www.krea.ai/apps/image/realtime
И все это в реальном времени, Карл!
🔥77👍9
А еще Krea.ai воще без цензуры. Вы ей показываете кружки и квадратики, а она вам рисует вот ТАКОЕ, извращенка.
Тут показать не могу, шуруйте в коментарии, там все-таки закрытая группа, телеграмм меня там не должен прищучить.
Тут показать не могу, шуруйте в коментарии, там все-таки закрытая группа, телеграмм меня там не должен прищучить.
🔥38👍3👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Вот эта вот audio-to-audio фича, которая появилась в Stable Audio 2.0 может иметь неожиданные применения, например, в производстве саунд-эффектов и при озвучке фильмов, причем речь идет не о голосе, а именно о шумах.
Поглядите забавный пример.
Если обобщать, то получается, что речь идет о скинах для звука или про style-transfer в очень общем смысле.
Поглядите забавный пример.
Если обобщать, то получается, что речь идет о скинах для звука или про style-transfer в очень общем смысле.
🔥39👍11
Ну и в целом фича audio-to-audio совсем не нова, я уже писал про очень забавный проект Musicfy, поглядите, если забыли:
https://news.1rj.ru/str/cgevent/7077
https://news.1rj.ru/str/cgevent/7077
Telegram
Метаверсище и ИИще
После Suno.ai, который взорвал нам все уши и мозги (в коментах просто шквал шедевров), я пощупал еще один сервис:
https://musicfy.lol/
И снова огонь.
Динозавры помнят все эти синтезаторы, типа курцвейла, где можно засэмплировать звук, а потом наигрывать…
https://musicfy.lol/
И снова огонь.
Динозавры помнят все эти синтезаторы, типа курцвейла, где можно засэмплировать звук, а потом наигрывать…
👍14🔥8
Давно предполагал, что разработчики Сбера на базе GigaChat будут создавать целое семейство Al-сервисов. SberDevices представили Giga Acoustic Model. Генеративные модели для обработки речи(звука) на русском языке.
GigaAM — аудиоэнкодер на 240 миллионов параметров, базовая модель, подходящая для адаптации под другие задачи;
GigaAM-CTC — открытая модель распознавания речи на русском языке (допускает в коротких запросах на 20–35% меньше ошибок в словах по сравнению с другими открытыми решениями);
GigaAM-Emo — модель определения эмоций, продемонстрировала лучший результат на крупнейшем датасете Dusha среди известных моделей.
Очень много технических подробностей с примерами использования этого семейства Al-сервисов на Хабре: https://habr.com/ru/companies/sberdevices/articles/805569/
GigaAM — аудиоэнкодер на 240 миллионов параметров, базовая модель, подходящая для адаптации под другие задачи;
GigaAM-CTC — открытая модель распознавания речи на русском языке (допускает в коротких запросах на 20–35% меньше ошибок в словах по сравнению с другими открытыми решениями);
GigaAM-Emo — модель определения эмоций, продемонстрировала лучший результат на крупнейшем датасете Dusha среди известных моделей.
Очень много технических подробностей с примерами использования этого семейства Al-сервисов на Хабре: https://habr.com/ru/companies/sberdevices/articles/805569/
Хабр
GigaAM: класс открытых моделей для обработки звучащей речи
Салют, Хабр! Ранее мы в SberDevices анонсировали предобученную на русском языке модель GigaAM ( Giga A coustic M odel) и её дообученные состояния под распознавание речи (GigaAM-CTC) и определение...
🔥32👍13👎9
Forwarded from proVenture (проВенчур)
This media is not supported in your browser
VIEW IN TELEGRAM
📈 NVIDIA vs Bitcoin vs Gold.
Вы могли видеть сравнение динамики акций NVIDIA и Intel, но на мой взгляд, более прикольно сравнить с биткоином. Ну да, там еще золото, но его особо не заметно. Залипательно.
@proVenture
#оффтоп #ai
Вы могли видеть сравнение динамики акций NVIDIA и Intel, но на мой взгляд, более прикольно сравнить с биткоином. Ну да, там еще золото, но его особо не заметно. Залипательно.
@proVenture
#оффтоп #ai
👍49🔥12👎4