Сберовцы на AI Journey анонсировали сразу три опенсорс-обновы. Еще не тестил полноценно, но звучит вкусно.
Значит, так. Во-первых, большое обновление получило семейство open-source моделей распознавания речи и эмоций. В GigaAMv2 добавили новый подход к предобучению и возможность дообучаться, т.е. ошибок стало меньше, а обработка запросов значительно ускорилась.
Во-вторых, в открытый доступ выложили базированную GigaChat Lite — идеальную для типовых задач на скорость.
Ну, а в-третьих, встречаем в открытом доступе GigaEmbeddings — модель эмбеддингов для RAG (Retrieval Augmented Generation), классификации и т.д. и т.п. Качество сильно скакнуло, предшественникам типа E5 догнать шансов мало (на RAG-бенчах дает до 15% абсолютного качества).
Вот и занятие на выходные привалило.
Значит, так. Во-первых, большое обновление получило семейство open-source моделей распознавания речи и эмоций. В GigaAMv2 добавили новый подход к предобучению и возможность дообучаться, т.е. ошибок стало меньше, а обработка запросов значительно ускорилась.
Во-вторых, в открытый доступ выложили базированную GigaChat Lite — идеальную для типовых задач на скорость.
Ну, а в-третьих, встречаем в открытом доступе GigaEmbeddings — модель эмбеддингов для RAG (Retrieval Augmented Generation), классификации и т.д. и т.п. Качество сильно скакнуло, предшественникам типа E5 догнать шансов мало (на RAG-бенчах дает до 15% абсолютного качества).
Вот и занятие на выходные привалило.
This media is not supported in your browser
VIEW IN TELEGRAM
Принёс вам видео из загнивающего твиттора. Просто посмотрите какая годнота! Чувак использует новый Gemini как персонального наставника по программированию расшарив нейронке свой экран. Все это голосом и с минимальной задержкой.
Будущее уже тут.
Попробовать так же можно тут (нужен гуглоаккаунт и айпишник США)
Будущее уже тут.
Попробовать так же можно тут (нужен гуглоаккаунт и айпишник США)
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за подкасты.
Не очень понятно зачем теперь нужны кожаные блогеры, влогеры, инфлюматьихенсеры.
Я тут смотрел, как народ упарывается в NotebokLM, создавая аудио-подкаст из текста, потом вырезает в аудасити звук для каждого голоса, потом огородит с хейгеном и звуком, и тд.
Все.
Одна кнопка.
Сделать красиво.
Тупо, но красиво.
А зачем еще это все?
Хейген, похоже, сами не понимают, как они троллят интернет.
@cgevent
Не очень понятно зачем теперь нужны кожаные блогеры, влогеры, инфлюматьихенсеры.
Я тут смотрел, как народ упарывается в NotebokLM, создавая аудио-подкаст из текста, потом вырезает в аудасити звук для каждого голоса, потом огородит с хейгеном и звуком, и тд.
Все.
Одна кнопка.
Сделать красиво.
Тупо, но красиво.
А зачем еще это все?
Хейген, похоже, сами не понимают, как они троллят интернет.
@cgevent
This media is not supported in your browser
VIEW IN TELEGRAM
Это выглядит одновременно очень мило и абсолютно проклято.
Вот бы кто-нибудь устроил матч между такими роботами. Это же действительно куда интереснее, чем мясной футбол.
P.S.: робот в синей футболке симулирует травму
Вот бы кто-нибудь устроил матч между такими роботами. Это же действительно куда интереснее, чем мясной футбол.
P.S.: робот в синей футболке симулирует травму
Тем временем гугл продолжает раздупляться и выкатывать новые годные ИИ-штуки.
Сегодня Анонсировали Veo 2 — видео генератор аналог Sora, Kling и иже с ними.
Что умеет:
▪️Создавать видосы с разрешением до 4k
▪️Понимает элементы управления камерой в подсказках, такие как общий план, съемка от первого лица, съемка с дрона
▪️Хорошо воссоздает реальную физику и реалистичное выражение лица человека.
Но это все пока только в обещаниях, а видосы выше могут быть результатом ста часов черри-пикинга. Поэтому, ждём выхода, а потом только будем делать выводы.
Записаться в вайтлист и почитать подробнее можно тут.
Сегодня Анонсировали Veo 2 — видео генератор аналог Sora, Kling и иже с ними.
Что умеет:
▪️Создавать видосы с разрешением до 4k
▪️Понимает элементы управления камерой в подсказках, такие как общий план, съемка от первого лица, съемка с дрона
▪️Хорошо воссоздает реальную физику и реалистичное выражение лица человека.
Но это все пока только в обещаниях, а видосы выше могут быть результатом ста часов черри-пикинга. Поэтому, ждём выхода, а потом только будем делать выводы.
Записаться в вайтлист и почитать подробнее можно тут.
Шульман о бате и жарке супов.wav
17.8 MB
Увидел, что в твитторе обсуждают Шульман. Самому не приходилось слушать/смотреть ее труды, но часто попадались отрывки на ютубе. Решил попросить новый Gemini 2.0 сгенерировать копипасту про батин суп в стиле ее речи. Gemini справился на отличненько, мне кажется:
Ночь была бессонной, потому решил клонировать её голос и озвучить первой попавшейся tts. Ибо она сразу и клонирует голос (кстати, довольно неплохо, как мне кажется) и озвучивает его из текста. Плюс как оказалось не надо ничего файнтюнить сутками и гигабайтами датасетов, минуты чистого оригинального голоса вполне хватает.
Единственный минус — не умеет в ударения с моделькой, которая умеет в русский язык, хоть ссы на нее, хоть уговаривай. Ни выделения ударных гласных капсом, ни отметки апострафами не помогли (а наоборот всё заруинили, в этих местах начали появляться какие-то хрюкающие звуки).
Мой отец, человек, безусловно, харизматичный и креативно-прагматичный, всегда подходил к кулинарии как к пространству личной суверенности. В этом процессе отчётливо прослеживается его неприятие как кулинарных, так и общественных условностей. Его кухня — это территория суверенного волеизъявления, свободного от догматов гастрономической этики.
Вот один из многочисленных примеров его кулинарного творчества. В обывательском представлении суп — это жидкое блюдо, подлежащее разогреву и, в конечном итоге, потреблению. Однако в нашей семье, благодаря отцу, суп проходит путь трансгрессии, граничащей с гастрономическим экзистенциализмом.
Суп не греется. Разогревание пищи — это акт покорности бытовому комфорту, а мой отец, как истинный автономист, следует другому пути. Он берёт суп и выкладывает его на сковороду, совершая, таким образом, жест иерархического переворота: жидкое становится твёрдым, мягкое — жёстким. Тут начинается настоящая кулинарная революция.
В ход идёт лук — в объёмах, которые можно было бы назвать фискально неоправданными, если бы речь шла о рыночной экономике. Далее добавляются чеснок и два вида перца — чёрный и красный. Мука (здесь прошу внимания) выполняет функцию структурного каркаса, обеспечивая блюду необходимую вязкость — как некоторым политическим системам требуется искусственно поддерживаемая стабильность. Томатная паста вносит элементы агрессивной модернизации, смещая первоначальный акцент и превращая суп в суверенное, но малоузнаваемое новообразование.
На этом этапе кухня уже окутана дымом — этот момент можно интерпретировать как предельно наглядный символ парового давления гражданского общества, стремящегося к свободе, но временно ограниченного рамками кухонного пространства. После завершения процесса суп, вернее, его мутировавшая версия, выносится на балкон. Охлаждение на балконе, как и все балконные явления в нашей истории, занимает промежуточную позицию между публичным и частным, как, скажем, политическое обсуждение в соцсетях.
Когда блюдо остывает и возвращается в кухонное пространство, отец завершает кулинарный акт обильной порцией майонеза. Майонез здесь — это консенсус, достигаемый поверх всех противоречий. Отец ест со сковороды, инструментом бескомпромиссным — металлической ложкой, которая, не стесняясь, скрежещет по поверхности сковороды, создавая звук, напоминающий предостережение. При этом он сопровождает процесс полушёпотом, почти интимно, но вполне осознанно: «Ух, бля». Эта фраза, прозвучавшая в контексте, обретает неожиданную философскую многослойность.
Любезное предложение присоединиться к трапезе я расцениваю как форму дипломатии. Однако я, будучи осторожной и предвидящей риски, отказываюсь. Конечные последствия, к сожалению, неизбежны: звуковые и ароматические эффекты после трапезы демонстрируют, что у любого действия, даже самого суверенного, есть непредсказуемые внешние издержки. От обоев, которые начинают отделяться от стен, до микроэкологических изменений в пределах жилой площади.
Таким образом, кулинарный метод моего отца представляет собой символический акт — одновременно политический, художественный и, безусловно, комический. В нём можно усмотреть элементы автаркии, деконструкции и классической постмодернистской иронии.
Ночь была бессонной, потому решил клонировать её голос и озвучить первой попавшейся tts. Ибо она сразу и клонирует голос (кстати, довольно неплохо, как мне кажется) и озвучивает его из текста. Плюс как оказалось не надо ничего файнтюнить сутками и гигабайтами датасетов, минуты чистого оригинального голоса вполне хватает.
Единственный минус — не умеет в ударения с моделькой, которая умеет в русский язык, хоть ссы на нее, хоть уговаривай. Ни выделения ударных гласных капсом, ни отметки апострафами не помогли (а наоборот всё заруинили, в этих местах начали появляться какие-то хрюкающие звуки).
Media is too big
VIEW IN TELEGRAM
Гляньте какая годнота ❤️
Автор пишет, что сделал это с помощью Flux 1.1 pro + различных видео генераторов (sora, kling, minimax)
Автор пишет, что сделал это с помощью Flux 1.1 pro + различных видео генераторов (sora, kling, minimax)
This media is not supported in your browser
VIEW IN TELEGRAM
Как тебе такое, Boston Dynamics?
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Наконец-то нормальная симуляция взамен нашей сломанной.
Telegram
addmeto
Вот эта работа имеет все шансы стать куда более значимой, чем все нынешние "соры", выпущенные в последние полгода. Это система, в которой вы можете симулировать реальные физические процессы и визуализировать их. По сути используется физическая модель, где…