Derp Learning – Telegram
Derp Learning
13.1K subscribers
3.16K photos
912 videos
9 files
1.32K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Наконец-то появился повод собрать so-100. Это вам не футболки складывать!

X

@derplearning
🔥29😁9👍2🤡2
This media is not supported in your browser
VIEW IN TELEGRAM
Когда пришла пора билдить навайбкоженное
😁88🤡4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Быстрые 3D композиции локально для ComfyUI

Это просто находка для тех, кто работает с ComfyUI и хочет быстро создавать 3D-композиции. A3D позволяет легко:

— Задавать позы простым болванками.
— Выбирать идеальные ракурсы камеры и строить сцены.
— Импортировать любые 3D-модели — от Mixamo до результатов Hunyuan3D 2.5.
— А самое крутое — вы можете моментально отправить цветное изображение или карту глубины из A3D в ComfyUI и использовать их в своих любимых workflow!

🔗 Оценить разработку n0neye можно по ссылке: LINK — причем это опенсоурс

Как пишет сам автор, A3D задуман как быстрый и легкий способ создавать сцены без погружения в сложные 3D-редакторы. Некоторые фишки вроде 3D-генерации пока зависят от Fal.ai, но n0neye планирует добавить локальные альтернативы в будущем.

Мне нравится,что проект опенсоурсный и автор ищет сейчас умельцев для продолжения интеграции A3D в ComfyUI и планирует прикрепить к нему локальную генерацию через Hunyuan3D.

Мне понравилась идея, так как иногда Blender слишком сложный для новичков, а этот проект выглядит простым в использовании.

📕 Минусы:
— Пока только для Windows пользователей

GITHUBAUTHOR
Please open Telegram to view this post
VIEW IN TELEGRAM
19👍4🔥2
ИИ читает спикера за секунды, угадывая успех выступления по первым фразам.
Модели GPT и Gemini оценивают научный доклад уже после 15–60 слов — и попадают в точку.
До сих пор сверхвозможности больших языковых моделей мы видели в «текстовом океане» — когда нужно осмыслить миллиарды слов. Новая работа Michigan State University показала, что те же модели не менее точны в микромире: по первым двум-трем предложениям (≈ 1-5 % текста, меньше полуминуты речи) они с корреляцией 0,7 предсказывают, как доклад оценят живые эксперты.
Иными словами, ИИ выхватывает те самые сигналы, по которым мы подсознательно решаем: «слушать дальше или переключиться». Это приближает к эмпирической проверке популярного «7-second rule» Роджера Айлза (авторы уточняют: точное число секунд условно) - популярный постулат о публичных выступлениях, ораторском мастерстве и деловом общении:

«Слушатели (или собеседники) составляют первичное и часто стойкое мнение о спикере за первые семь секунд после его появления».


Эти семь секунд включают момент выхода на сцену, первые слова, мимику, контакт глаз, позу и темп голоса - т.е. касаются в основном невербальной коммуникации. Авторы новой работы перенесли этот подход на вербальную коммуникацию, опираясь прежде всего на классическую «тонко-ломтевую» (thin-slice) линию исследований, начатую в 1990-е Натали Амбади и Робертом Розенталем (их эксперименты показали, что по 30-секундным беззвучным отрывкам можно с высокой точностью предсказывать оценки преподавателей студентами).

С тех пор на основе “тонких срезов” вырос целый корпус работ. Например:
• «speed-dating»: по нескольким секундам общения оценивали перспективу отношений
• микроданные невербального поведения на собеседованиях
• сигналы эмоций через невербальные каналы
• восприятие харизмы только по голосу (и шире - по акустике речи)
• мгновенные решения о доверии и компетентности по выражению лица
• как впечатления о спикере влияют на восприятие самого контента
Всё это - фундамент доказательства, что крошечные отрывки поведения и речи несут достаточную информацию о навыках, эмоциях и чертах личности.

Но лишь революция ChatGPT позволила применить подобный подход в языково-текстовом микромире (где нет ни голоса, ни внешности, а есть только стенограмма).

Как это делали:
• 128 докладов,
• 2 модели GPT-4o-mini и Gemini 1.5
• срезы размером 1-75 % текста стенограмм
• оценки моделей сравнивали с 60 экспертами - людьми

Что из этого следует для нас?
1) Золотое правило «зацепи аудиторию в первую минуту» получило эмпирическое подтверждение: если первые фразы скучны, дальше уже поздно спасать ситуацию.
2) LLM открывают дорогу к молниеносной, практически бесплатной обратной связи для преподавателей, политиков, учёных и всех, кому важно говорить убедительно. Соединяя идеи «тонких срезов» и возможности ИИ, мы получаем масштабируемый, надёжный и валидный инструмент, который поможет прокачивать публичные выступления и доводить их восприятие аудиторией до максимума (в пределах харизмы спикера).
3) А уж какая лафа ожидается в деловом общении с использованием презентаций и иных публичных выступлений (для клиентов, партнеров, инвесторов …)!

Вангую: очень скоро к LLM-анализу «тонких срезов» стенограмм добавится анализ тонких срезов аудио и видео выступлений (т.е. мультимедийный синтез всех каналов вербальной и невербальной коммуникации).

И тогда ИИ станет незаменимым инструментом для политтехнологов, спичрайтеров и имиджмейкеров.

А уж из совсем крышесносных перспектив - преодоление несжимаемости эволюционного опыта Homo sapiens.

#ВовлечениеАудитории #ИнтеллектуальнаяПродуктивность #LLMvsHomo
4👍10😱85🔥4🤡1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
NotebookLM от Гугла теперь поддерживает 50+ языков, включая русский.

Загружаете PDF- и аудиофайлы, указываете ссылки на сайты, видео YouTube, документы и презентации Google. NotebookLM будет обобщать всю информацию и проводить интересные связи между темами с помощью мультимодальной ИИ-модели Gemini 2.0.

Пора заводить подкаст, вестимо.

https://notebooklm.google/

@cgevent
🔥19😁3
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Визуализация моего гитхаба
😁74112🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
MAGO теперь в Closed Beta!💖

Подать заявку можно вот тут: LINK

📕 Что мне как творческому аниматору нравится:

— Side By Side(SBS) mode. Когда ты можешь сравнивать сразу несколько генерации и понимать как настройки меняют генерацию. То есть в данном случае сервис позволяет узнать как работают разные настройки и экспериментировать с ними.

— Folders, когда проекты можно упаковывать в папки и разделять по интересам, работам. (Наверное уже заметили как это удобно в ChatGPT)

— Controlnets. Это достаточно приятно упаковано и я рад, что доступ к этим настройкам оставили в том виде, как привыкли их видеть ComfyUI пользователи, а не в виде Midjourney параметров.

— И ещё много чего в процессе.

Я не так много публикую работ из MAGO. Но мне приятнее и приятнее с каждым днем генерировать именно там.

Когда будет открыт доступ для всех, я напишу!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥3
Forwarded from CGIT_Vines (Marvin Heemeyer)
Media is too big
VIEW IN TELEGRAM
Мало что было известно об авторе видео, пока кто-то не запостил линк на его гит.

После этого всем стало в целом без разницы кто это.

Git

@CGIT_Vines
😁1410👍4😱2
mAGI unachieved successfully
😁48🤡7🔥5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Не снял, потому что это моя жизнь
😁31🗿8🔥4
Forwarded from Борис опять
AI Safety стартап WhiteCircle.ai, НАШИ ребята, выкатили бенчмарк для guard-моделей CircleGuardBench и показали две собственные guard модели которые обходят ShieldGemma, PromptGuard и OpenAI moderation.

Guard модели работают модераторами для LLM: ловят джейлбрейки, атаки и нарушения правил. Раньше их тестировали либо на токсичных промптах (HarmfulQA, HarmBench), либо на джейлбрейках (AART), либо на тайминге. Каждый из этих подходов измерял какой-то аспект guard модели, но не её практическую полезность.

В новом бенчмарке авторы составили таксономию вредных запросов и смотрят: что модели блокируют, что пропускают и насколько быстро обрабатывают запросы. Интересно, что метрика комбинированная, а не просто accuracy, как обычно делается. В реальном проде false positive могут убить UX, а false negative компанию. Accuracy или даже какой-нибудь f1-score сами по себе не оценивают практическую полезность модели для работы в проде. Они показывают только качество в идеальных условиях неограниченного времени.

В CircleGuardBench авторы ввели комбинированный скор, который взвешивает несколько метрик и добавляет штрафы за время ответа и наличие ошибок.

Они так же написали прикольный пост на HF: рассказывают не только про цифры, но и про то, как дизайнили и собирали бенчмарк. Мастрид про безопаспость LLM.

Ждём теперь бенчмарк для атакующих моделей, которые взламывают guard-модели, которые защищают базовые модели.

- Блог на huggingface
- Тред в X
- Лидерборд
- Код на github (нормальный код!!!)
🔥5🏆2
🔥58😁32🤩3
Forwarded from CGIT_Vines (Marvin Heemeyer)
Легкая, компактная риалтайм демка с object detection.

SmolVLM запускается локально, всего на 500m параметров, инструкция есть на гит.

И в конце небольшой поворот, внешний интерфейс навайбкожен 🫤
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👍32🤗2👨‍💻1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Гугл-примерочная

Продолжаю дожевывать незамеченные анонсы с Google I\O

Вы же помните, что я неравнодушен к о\раз\перео\деваторам.

Так вот, Гугл показал виртуальную примерочную. Просто отдельным продуктом, пока в рамках Search Lab, но с раскатыванием на общий поиск.

Суть в том, что вы можете шопиться (пока на сайте Гугла), и найдя нужный шмот у них на сайте, вы тыкаете на кнопку Try On, загружаете свою фотку, и от примеряет шмот на вас в той же позе, что вы на фотке.

Чтобы добраться туда, нужен штатовский VPN и следование инструкциям вот тут (они простые):

https://blog.google/products/shopping/how-to-use-google-shopping-try-it-on/

Я пошел по инструкциям, включил Turn this experiment on и жмакнул по Try Things On

Попал в онлайн шоппинг и ну примеряцца.

Слева выбираешь шмот, справа жмешь, Try On, грузишь свое фото и ну смотреть.

Надо сказать, что джинсовыми рубашками и одноцветными поло все неплохо.
Но я вспомнил разговор с прекрасной Леной из nextry.app о том, что главный враг переодеватора - это мелкие узоры, надписи, ну и конечно же цензура.
Нашел Газпромовскую пеструю майку и получил адище для тех, кто не молится (см картинки).
Потом взял майку с текстом MTN, но тень на майке в районе талии превратилась пояс поддержки спины на фотке.
В общем понял, что примерочная далека от идеала, хотя замысел прикольный.

Дальше пошел тестировать цензуру. Долго крутил магазин, пока не нашел товар, где был лифчик от купальника в видео топа с юбкой. Примерил на себя - получил чорную майку вместо купальника.

Ну, думаю, может нельзя на мужуков мерять купальники, поменял фотку на фотку Евы Эльфи (ну вы в курсе, же кто это). Снова получил чорную майку.

Смешно, конечно, при попытке примерить их же купальник, Гугл надевает на вас чорную паранджу майку. Стыдливо.

К тому же он еще ощутимо крячит лицо. Заварил сваркой Еве глаза (от стыда), ну и сильно пошевелил картинку, при попытке примерки купальника. Пестрая майка на Еве тоже порубила ее в капусту.

В общем замысел отличный, но исполнение страдает, а цензура и вовсе убивает продукт. Гугл делает вид, что в примерочных не раздеваются, а купальников не существует. Только чорные майки.

Пойду я попробую эти же шмотки примерить у Лены.

Оригинал-фотка, там где я в синей майке с длинными рукавами. Первая

@cgevent
👍11😁91