Derp Learning – Telegram
Derp Learning
13.2K subscribers
3.26K photos
944 videos
9 files
1.37K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
☕️ Daily AI Digest — Feb 14, 2026 (Valentine's Edition 💘)

━━━━━━━━━━━━━━━━━━━━

🔬 PAPERS & RESEARCH

🔥 DeepGen 1.0 — Lightweight 5B unified model for image gen + editing. Beats 80B HunyuanImage by 28% on WISE, 27B Qwen-Image-Edit by 37%. Open-source weights, code, datasets.
📄 arxiv.org/abs/2602.12205
💻 github.com/DeepGenTeam/DeepGen

Latent Forcing — Pixel-space image generation matching latent diffusion quality without a separate decoder. Joint latent+pixel denoising with tuned noise schedules.
📄 arxiv.org/abs/2602.11401

Ctrl&Shift — Geometry-aware object manipulation in images/videos. Move & reorient objects while preserving scene realism, no explicit 3D reconstruction needed.
📄 arxiv.org/abs/2602.11440

Active-Zero — Self-evolving VLMs through active environment exploration (self-play but for vision models). Shifts from passive datasets to active visual data seeking.
📄 arxiv.org/abs/2602.11241

C-JEPA — Causal world models via object-level latent interventions. Extends JEPA from image patches to object-centric representations with counterfactual reasoning.
📄 arxiv.org/abs/2602.11389

New day, new JEPA. Extension, anyone? :D
🔥81
Forwarded from Denis Sexy IT 🤖
Все никак не могу привыкнуть к этому новому миру – скачал Need For Speed Underground, и естественно на маке такие игры запускать это танцы с бубнами (сам запустить я не смог)

Открываешь папку, запускаешь там Claude Code в терминале, и через 10 минут играешь – потому что Opus 4.6 залез там в .exe файл и какими-то патчами починил то, что роняло эмулятор винды

Еще раз – подправил 🪟 файл, сам

Скоро весь легаси софт оживим роботами, дурун-дун-дун
Please open Telegram to view this post
VIEW IN TELEGRAM
😱4711🔥3🤩2🤡2
This media is not supported in your browser
VIEW IN TELEGRAM
Если не нравится сюжет, теперь можно переснять
Ждем римейков последних сезонов Игры престолов :D

твит
19😁7🤡6🔥4😱4👍1👀1
⚡️ Daily AI Digest — Sun, Feb 15

🔥 MonarchRT — Real-time video diffusion via Monarch matrix attention + Triton kernels
arxiv.org/abs/2602.12271

🔥 DeepGen 1.0 — 5B model beats 80B HunyuanImage (+28%), open-source
arxiv.org/abs/2602.12205 | github.com/DeepGenTeam/DeepGen

🔥 DreamID-Omni — Unified human-centric audio-video gen, multi-character identity+voice
arxiv.org/abs/2602.12160

UniT — Multimodal CoT test-time scaling
arxiv.org/abs/2602.12279

UniDFlow — Unified discrete flow matching, LoRA per task
arxiv.org/abs/2602.12221

FAIL — Adversarial imitation learning for flow matching
arxiv.org/abs/2602.12155

GigaBrain — VLA from world model RL
arxiv.org/abs/2602.12099
🔥6🤡21
💯268😁3
This media is not supported in your browser
VIEW IN TELEGRAM
Я проверяю пуллреквесты Claude Code перед деплоем в прод
1😁70🤣16😢3💯2
Аудиофилы не смогли отличить звук, идущий по медному проводу, от звука, который пустили через банан и грязь.

В эксперименте участвовали «гурманы качественного звука», уверенные, что разные провода и материалы сильно влияют на звучание.

Всего было несколько версий одного и того же аудиофайла:
— Оригинал с CD (контрольная версия);
— Запись через 180 см профессионального медного аудиокабеля;
— Через 20 см мокрой грязи;
— Через старый микрофонный кабель, припаянный к монетам;
— Через банан.

Слушателям предложили вслепую определить, где какой вариант.

Из 43 попыток правильно угадали только 6 раз — то есть на уровне случайного угадывания. Некоторые даже хвалили звук через грязь, называя его лучшим.

Тотальное унижение аудиофилов
r/#LinusTechTips
1😁65👍106🗿2
🤩25💯22🤣21😁42
Forwarded from Dev Meme / devmeme
😁262
😁25👍5💯2🤣1
😁35🤩7🫡6🤣1
Forwarded from Neural Shit
Лол, Метачка хочет запатентовать технологию цифрового воскрешения.

Суть патента проста: нейронка жрёт для обучения все твои посты, переписки, лайки и комменты, чтобы создать твою полную цифровую копию.

В документе прямым текстом прописаны два сценария использования этого цифрового голема:

1) Когда ты просто решил отдохнуть от соцсетей (ну да, конечно).
2) Когда ты умер)

То есть, буквально сюжет той самой серии из "Черного зеркала". Ты уже давно почил, а твой аккаунт продолжает сраться в комментах, лайкать мемы и отвечать друзьям "лол, жиза".

Цукерберг решил, что смерть это не повод терять активную аудиторию. Теперь даже на том свете придется генерировать контент.
🤡9😁5🗿3🤬1
This media is not supported in your browser
VIEW IN TELEGRAM
Image Generation with a Sphere Encoder

Китайцы упоролись и запилили круглые тензоры сферический латент.

Мапят исходные картинки на сферу, решая проблему "углов" - отсутствия значения латента, которые не мапятся обратно в исходное распределение.

Таким образом, любое значение латента можно превратить в картинку из трейн сета.

project
paper
code - soon
🤩16🔥7😁73🌚3
В предыдущем посте был webm видос, пришлось запилить сервис по конвертации webp -> PNG, webm -> MP4

Все локально в браузере.

Webplease
1🔥18
🤩18😁12👍3
🤩18😁13
🔬 ML PAPERS (arXiv, Feb 19)

📄 Towards a Science of AI Agent Reliability — 12 metrics for agent eval beyond success rate
arxiv.org/abs/2602.16666

📄 Agent Skill Framework — Can SLMs benefit from agent skills (Copilot, LangChain style)? On-prem focus
arxiv.org/abs/2602.16653

📄 Framework of Thoughts (FoT) — Unifies CoT/ToT/GoT with dynamic reasoning + auto-tuning
arxiv.org/abs/2602.16512

📄 Calibrate-Then-Act — LLM agents that reason about cost vs uncertainty tradeoffs
arxiv.org/abs/2602.16699

📄 MMA: Multimodal Memory Agent — Reliability scoring for retrieved memories (decay, credibility, conflict)
arxiv.org/abs/2602.16493

📄 Self-Supervised Semantic Bridge — Diffusion bridge for unpaired img2img translation + text-guided editing
arxiv.org/abs/2602.16664

📄 TeCoNeRV — Neural video compression with 20× memory reduction, +5.35dB PSNR at 720p
arxiv.org/abs/2602.16711

📄 ReMoRa — Long-video MLLM using compressed representations (sparse keyframes + motion)
arxiv.org/abs/2602.16412
4👍1