Forwarded from эйай ньюз
Некоторым пользователям уже дали доступ к Vision функциям ChatGPT-4V, которую только недавно анонсировали.
Вы только гляньте как глубоко заходит понимание изображения у новой модели. Один твиторский решил скормить ChatGPT дичайшие слайды Пентагона про Афганистан. И модель улавливает детали и основной смысл слайдов, где требуется очень детальное распознание мелкого текста и связей между сущностям.
Конечно, тут самый маленький текст модель не увидела, но надписи покрупнее (которые все равно небольшие) и связи между ними в виде стрелочек модель уловила. Для меня и это удивительно!
При большем вычислительном бюджете, можно было бы позволить модели зумировать участки изображения, так же как делает человек, при рассмотрении картины, где очень много мелких деталей. Но это многократно увеличило бы стоимость таких запросов.
@ai_newz
Вы только гляньте как глубоко заходит понимание изображения у новой модели. Один твиторский решил скормить ChatGPT дичайшие слайды Пентагона про Афганистан. И модель улавливает детали и основной смысл слайдов, где требуется очень детальное распознание мелкого текста и связей между сущностям.
Конечно, тут самый маленький текст модель не увидела, но надписи покрупнее (которые все равно небольшие) и связи между ними в виде стрелочек модель уловила. Для меня и это удивительно!
При большем вычислительном бюджете, можно было бы позволить модели зумировать участки изображения, так же как делает человек, при рассмотрении картины, где очень много мелких деталей. Но это многократно увеличило бы стоимость таких запросов.
@ai_newz
❤1
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Я просто охреневаю, какие грани обретает идея, если посмотреть на неё под немного другим углом.
Что это - ретро-реконструкция, historical splatting, prehistoric metaverse? Хаха.
Так или иначе, Polycam научился Gaussian splatting, и на мобильных устройствах его тоже можно попробовать.
Кидайте идеи, что можно перевести в 3D? Прибытие поезда и высадка на луну уже заняты!
Что это - ретро-реконструкция, historical splatting, prehistoric metaverse? Хаха.
Так или иначе, Polycam научился Gaussian splatting, и на мобильных устройствах его тоже можно попробовать.
Кидайте идеи, что можно перевести в 3D? Прибытие поезда и высадка на луну уже заняты!
Попробовал модельку img to 3D. Подождем следующую.
🤣22
🔥 3D Gaussian Splatting.
Качественные 3D-модели теперь можно делать с пары десятков фоток. Комната величайшего. https://poly.cam/capture/fd9b597f-60c5-4835-995d-063b3e5e79d8
Качественные 3D-модели теперь можно делать с пары десятков фоток. Комната величайшего. https://poly.cam/capture/fd9b597f-60c5-4835-995d-063b3e5e79d8
👍5⚡1
Forwarded from Denis Sexy IT 🤖
Есть «Девушка с жемчужной сережкой» Вермеера, а теперь вот есть «Жемчужина с девушкой-сережкой»
😁10👍4👀4
Forwarded from эйай ньюз
NSFW: Dalle-3 удивил...
Погенерить с Dalle-3 можно через Bing create. Но скоро лавочку прикроют, как минимум закрутят гайки по контенту. Так что, как сказали на реддите, "Enjoy it while it lasts".
@ai_newz
Погенерить с Dalle-3 можно через Bing create. Но скоро лавочку прикроют, как минимум закрутят гайки по контенту. Так что, как сказали на реддите, "Enjoy it while it lasts".
@ai_newz
👍6🤣4🥴2