Смотрите что я вам принес
ORCa: Glossy Objects as Radiance-Field Cameras
Ни кода, ни демо, зато как интересно узнать о новом виде магии!
ORCa: Glossy Objects as Radiance-Field Cameras
Новая система компьютерного зрения превращает любой блестящий объект в своего рода камеру, позволяя наблюдателю заглядывать за углы или за препятствия.
Видео, к сожалению не нашел. Но вот по картинке должно быть понятно. Нейронка достраивает изображение по отражениям в глянцевых объектах.Ни кода, ни демо, зато как интересно узнать о новом виде магии!
🔥4
Anthropic увеличили контекстное окно своего чатбота Claude с 9000 до 100 000 токенов, что втрое больше нынешних 32 000 токенов у GPT-4. 100 000 токенов это примерно 75 000 слов на английском языке.
Авторы загрузили в Клода всю книгу Великий Гэтсби, 72 000 токенов. Он переварил ее всего за минуту. В тексте изменили одну строчку и дали Клоду задание найти различие, с чем он справился за 22 секунды
Да, в Claude можно загружать документы и целые проекты кода. Судя по статье, Anthropic делают ставку на бизнесы которым нужно обрабатывать уйму информации.
Признавайтесь, кому из вас уже дали доступ к Claude? Как впечатления?
#llm #chatbot #nlp
Авторы загрузили в Клода всю книгу Великий Гэтсби, 72 000 токенов. Он переварил ее всего за минуту. В тексте изменили одну строчку и дали Клоду задание найти различие, с чем он справился за 22 секунды
Да, в Claude можно загружать документы и целые проекты кода. Судя по статье, Anthropic делают ставку на бизнесы которым нужно обрабатывать уйму информации.
Признавайтесь, кому из вас уже дали доступ к Claude? Как впечатления?
#llm #chatbot #nlp
Anthropic
Introducing 100K Context Windows
Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.
👍3🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Relightify: Relightable 3D Faces from a Single Image via Diffusion Models
Высококачественная реконструкция 3D-модели лица по одному изображению, с релайтингом
Кода нет, демо нет
#facialanimation #relighting #talkinghead #imageto3D #3Davatar #image2avatar
Высококачественная реконструкция 3D-модели лица по одному изображению, с релайтингом
Кода нет, демо нет
#facialanimation #relighting #talkinghead #imageto3D #3Davatar #image2avatar
👍1
ЕС подготовили первый в мире закон о регулировании ИИ.
➥ИИ разделят на 4 категории, от безопасных до «неприемлимо опасных».
➥Вводится полный запрет на распознавание лиц в общественных местах с помощью ИИ (привет, Китай). Даже для полиции. Исключения – поиск потерявшихся детей, преступников и террористов.
➥Также запретят создание баз данных фото из социальных сетей.
➥Запретят распознавание эмоций с помощью ИИ, даже для полиции.
➥Запретят предиктивную аналитику для раскрытия преступлений (привет, «Особое мнение»).
➥Введут обязательно маркирование произведений ИИ, чтобы отличить их от человеческих. Такую функцию анонсировал Google в недавней презентации.
➥ИИ, специализирующиеся на здравоохранении, беспилотных авто, юриспруденции, образовании и трудоустройстве относятся к рискованным и и будут тщательно регулироваться.
➥Часть ИИ, например выставляющие социальный рейтинг (привет, Китай), окажутся под запретом.
Закон планируют принять до конца 2023 года.
➥ИИ разделят на 4 категории, от безопасных до «неприемлимо опасных».
➥Вводится полный запрет на распознавание лиц в общественных местах с помощью ИИ (привет, Китай). Даже для полиции. Исключения – поиск потерявшихся детей, преступников и террористов.
➥Также запретят создание баз данных фото из социальных сетей.
➥Запретят распознавание эмоций с помощью ИИ, даже для полиции.
➥Запретят предиктивную аналитику для раскрытия преступлений (привет, «Особое мнение»).
➥Введут обязательно маркирование произведений ИИ, чтобы отличить их от человеческих. Такую функцию анонсировал Google в недавней презентации.
➥ИИ, специализирующиеся на здравоохранении, беспилотных авто, юриспруденции, образовании и трудоустройстве относятся к рискованным и и будут тщательно регулироваться.
➥Часть ИИ, например выставляющие социальный рейтинг (привет, Китай), окажутся под запретом.
Закон планируют принять до конца 2023 года.
vc.ru
В ЕС поддержали законопроект о регулировании ИИ — он запрещает онлайн-системы распознавания лиц в общественных местах — Право на…
Если его примут, он также обяжет компании маркировать контент как сгенерированный ИИ и прогнозировать риски.
👍5🤔1
Forwarded from shonenkov AI
This media is not supported in your browser
VIEW IN TELEGRAM
3D с DeepFloyd-IF выглядит неплохо, модель справилась с рендерингом и генерацией текста на кепке 👀
если вдруг кому-то интересно потыкать, то вот [GitHub с реализацией IF и 3D]
+ в комменты закинул еще несколько 3D анимаций
@shonenkovAI
если вдруг кому-то интересно потыкать, то вот [GitHub с реализацией IF и 3D]
+ в комменты закинул еще несколько 3D анимаций
@shonenkovAI
❤2
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Наконец-то к параметрической голове приделали шею. Теперь по фотографии можно зафитить 3D голову на шее, а не без нее, как было раньше.
Тема крутая, потому что с такой моделью можно более реалистично анимировать говорящие головы. Авторы собрали огромный датасет сканов, чтобы обучить параметрическую модель.
❱❱ Статья: HACK: Learning a Parametric Head and Neck Model for High-fidelity Animation
❱❱ Код
Если хотите узнать больше про 3D Human Modeling, то вот тут я делал подборку материалов и лекций.
@ai_newz
Тема крутая, потому что с такой моделью можно более реалистично анимировать говорящие головы. Авторы собрали огромный датасет сканов, чтобы обучить параметрическую модель.
❱❱ Статья: HACK: Learning a Parametric Head and Neck Model for High-fidelity Animation
❱❱ Код
Если хотите узнать больше про 3D Human Modeling, то вот тут я делал подборку материалов и лекций.
@ai_newz
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
dream3d.com
текст-в-3D на основе Shap-E и диффузии
вписывайтесь в бету, пройдите по ссылке в дискорд, ответьте там боту на пару вопросов. Все, можно вернуться на сайт и поэкспериментировать
#textto3D
текст-в-3D на основе Shap-E и диффузии
вписывайтесь в бету, пройдите по ссылке в дискорд, ответьте там боту на пару вопросов. Все, можно вернуться на сайт и поэкспериментировать
#textto3D
This media is not supported in your browser
VIEW IN TELEGRAM
SoundStorm:Efficient Parallel Audio Generation
В полку генераторов речи прибыло. Гугл наколдовал ооочень крутой #text2speech. Крутой не только качеством речи, но и скоростью. 30 секунд речи генерится за полсекунды на TPU-v4. На вход можно подать не только текст, можно подать кусочек диалога, и он его продолжит.
Кода нет, демо нет.
#tts
В полку генераторов речи прибыло. Гугл наколдовал ооочень крутой #text2speech. Крутой не только качеством речи, но и скоростью. 30 секунд речи генерится за полсекунды на TPU-v4. На вход можно подать не только текст, можно подать кусочек диалога, и он его продолжит.
Кода нет, демо нет.
#tts
❤1
Яндекс интегрировал в Алису свой аналог ChatGPT — YandexGPT.
Что умеет: пишет тексты, предлагает разные идеи, составляет сценарии для выпускного, придумывает планы путешествий.
Что умеет: пишет тексты, предлагает разные идеи, составляет сценарии для выпускного, придумывает планы путешествий.
YandexGPT пока только тестируется, но уже можно поиграть с ней в приложении Яндекса, Браузере, Станциях и умных телевизорах с Алисой.Опробуете - поделитесь впечатлениями.
Достаточно сказать «Алиса, давай придумаем!». В компании подчеркнули, что технология пока ещё сыровата, например, ИИ не понимает контекст и может «выдумывать небылицы». Однако постепенно новая разработка будет совершенствоваться, отметили в «Яндексе»
❤3
Stability AI только что релизнули StableStudio - опенсорсный вариант DreamStudio
гегемонии Automatic1111 пришел конец (но это не точно, ибо)
разработчики готовы поддержать
- Локальный инференс через WebGPU
- Локальный инференс через stable-diffusion-webui
- Десктопный инсталлятор
- Инструменты ControlNet
и примут во внимание прочие хотелки
Код
гегемонии Automatic1111 пришел конец
- Локальный инференс через WebGPU
- Локальный инференс через stable-diffusion-webui
- Десктопный инсталлятор
- Инструменты ControlNet
и примут во внимание прочие хотелки
Код
Отличия от DreamStudio:
- удалили брендинг, специфичный для DreamStudio.
- Все вызовы API "по проводам" (что бы это ни значило) заменили системой плагинов, которая позволяет легко заменить серверную часть.
- В релизе только плагин для Stability API, но, немного поработав с TypeScript, вы сможете создать свой собственный.
- удалили функции учетной записи, связанные со Stability, такие как выставление счетов, управление ключами API и т.д.
- удалили брендинг, специфичный для DreamStudio.
- Все вызовы API "по проводам" (что бы это ни значило) заменили системой плагинов, которая позволяет легко заменить серверную часть.
- В релизе только плагин для Stability API, но, немного поработав с TypeScript, вы сможете создать свой собственный.
- удалили функции учетной записи, связанные со Stability, такие как выставление счетов, управление ключами API и т.д.
👍8
Новости с полей промт-инъекции.
Выкладываем на ютуб видео с субтитрами, сваренными по особому рецепту. Скармиливаем это видео ChatGPT через плагин суммаризации видео. Вуаля(в 20% случаев)
Выкладываем на ютуб видео с субтитрами, сваренными по особому рецепту. Скармиливаем это видео ChatGPT через плагин суммаризации видео. Вуаля
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Make-A-Protagonist:Generic Video Editing with An Ensemble of Experts
Редактирование видео по текстовому промту и референсному изображению. Похоже, модель обучена находить на видео главное действующее лицо/объект
Код
Демо обещают позже
#video2video
Редактирование видео по текстовому промту и референсному изображению. Похоже, модель обучена находить на видео главное действующее лицо/объект
Код
Демо обещают позже
#video2video
Universal Source Separation (USS) with Weakly labelled Data
Фарш возможно прокрутить назад!
Вы наверняка знаете что нейросетки умеют выделять из микса вокал, и даже отдельные инструменты. Но это новый уровень. Эта штука способна различать сотни классов звука
Код
#audioseparation #audio2audio #unmix
Фарш возможно прокрутить назад!
Вы наверняка знаете что нейросетки умеют выделять из микса вокал, и даже отдельные инструменты. Но это новый уровень. Эта штука способна различать сотни классов звука
Код
#audioseparation #audio2audio #unmix
🔥7
BlendFields: Few-Shot Example-Driven Facial Modeling
Коротко говоря, #NeRF обучили по нескольким ракурсам восстанавливать анимируемые лица. С мелкими деталями и деформациями, делающими результат более реалистичным. На видео они показывают полигональную сетку, интересно откуда такая сетка, неужели сгенерированная? Среди авторов Microsoft, Google BRAIN и прочие
Кода нет, демо нет
#image2face #imageto3D #image2avatar #facialanimation
Коротко говоря, #NeRF обучили по нескольким ракурсам восстанавливать анимируемые лица. С мелкими деталями и деформациями, делающими результат более реалистичным. На видео они показывают полигональную сетку, интересно откуда такая сетка, неужели сгенерированная? Среди авторов Microsoft, Google BRAIN и прочие
Кода нет, демо нет
#image2face #imageto3D #image2avatar #facialanimation
👍1
AutoRecon: Automated 3D Object Discovery and Reconstruction
Новый полностью автоматический метод фотограмметрии
Кода пока нет
#imageto3D #photogrammetry
Новый полностью автоматический метод фотограмметрии
Кода пока нет
#imageto3D #photogrammetry
🔥4