Derp Learning
13.2K subscribers
3.23K photos
940 videos
9 files
1.36K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
Clawra - Agent as AGIrlfriend
или ответ на вопрос "любил бы ты меня если бы я была червем крабом"

Ребята из SumeLabs решили, что AI-ассистенту не хватает одного - возможности делать селфи.
Clawra - скилл для openclaw, который превращает вашего агента в виртуальную тню с возможностью ебашить луки.
Мы в очередной раз обречены, грок привет.

Под капотом:
- фиксированный reference image
- генерация через xAI Grok Imagine на fal.ai
- два режима - зеркало (full-body, луки) и прямой (крупный план, локации)
- работает через все каналы openclaw - telegram, discord, whatsapp

По сути, это img2img с фиксированным reference + промпт из контекста диалога.
Технически ничего нового, но продукт забавный.
Главное - не давать боту свою кредитку, иначе выйдет слишком дорогой тамагочи.

GitHub
Твит

@derplearning
😁20🤣32🤩2👍1
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь китайцы рекламу всякого барахла снимают так. Модель с каменной ебучкой стоит и иногда жестикулирует, а всё остальное делают нейроночки. А совсем скоро и кожаная модель пойдёт на рынок торговать луком.
😁25👀9😢61
Forwarded from The After Times
😁55💯9😎5👍1🤩1
⚡️ Ежедневная подборка (с сегодняшнего дня лол) - четверг, 12.02.2026

🔬 ML PAPERS

🔥 FastFlow: 2.6x speedup for flow-matching (image/video gen), plug-and-play. ICLR 2026!
arxiv.org/abs/2602.11105 | github.com/Div290/FastFlow

🔥 DiNa-LRM: Diffusion-native reward model — preference optimization directly on noisy diffusion states. Beats VLMs at fraction of compute.
arxiv.org/abs/2602.11146

HairWeaver: Photorealistic hair animation from single image via sim-to-real video diffusion.
arxiv.org/abs/2602.11117

ViLaVT: "Chatting with images" — language-guided visual re-encoding. Strong on multi-image & video reasoning.
arxiv.org/abs/2602.11073

RLCER: Self-evolving rubrics for CoT reasoning. No human labels, beats outcome-only RLVR.
arxiv.org/abs/2602.10885

FormalJudge: 7B model detects deception from 72B agents (90%+ acc) via formal verification.
arxiv.org/abs/2602.11136

GameDevBench: 132 game dev tasks. Best agent only solves 54.5%.
arxiv.org/abs/2602.11103
🔥161
😁24🌚7💯5🗿2
Угар гарантирован: @ffmemesbot
🤣50🤩7😁2🌚2💯1
😁528
Forwarded from Stolen memes (al)
😁3613👍4🎉3
This media is not supported in your browser
VIEW IN TELEGRAM
Цукерберг и виар-индустрия 😭
Please open Telegram to view this post
VIEW IN TELEGRAM
😁35
🔬 ML PAPERS Дайджест (Image,video,text - arXiv, Feb 13 2026)

🔥 MonarchRT — Efficient attention for real-time video generation via Monarch matrix factorization. Makes autoregressive video DiT viable.
arxiv.org/abs/2602.12271

🔥 DreamID-Omni — Unified human-centric audio-video gen. Multi-person identity + voice disentanglement in one framework.
arxiv.org/abs/2602.12160

UniT — Unified multimodal CoT with test-time scaling
arxiv.org/abs/2602.12279

UniDFlow — Discrete flow matching for multimodal understanding + generation + editing
arxiv.org/abs/2602.12221

DeepGen 1.0 — Lightweight unified model for image gen & editing
arxiv.org/abs/2602.12205

FAIL — Adversarial imitation learning for flow matching post-training (no reward model needed)
arxiv.org/abs/2602.12155

GigaBrain-0.5M — VLA from world model RL (robotics)
arxiv.org/abs/2602.12099
🔥9🗿1
😁462💯1
This media is not supported in your browser
VIEW IN TELEGRAM
ладно seedream 2 победил все

(но это не точно)
🔥28🤡41
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen AI Slides

Под капотом Qwen3 Agent и Qwen-Image 2.0

Пробуем тут:
https://chat.qwen.ai/?inputFeature=slides

Нужно зарегаться и залогиниться.

Стартапы-слайдоделы напряглись

@cgevent
5🔥1
11
☕️ Daily AI Digest — Feb 14, 2026 (Valentine's Edition 💘)

━━━━━━━━━━━━━━━━━━━━

🔬 PAPERS & RESEARCH

🔥 DeepGen 1.0 — Lightweight 5B unified model for image gen + editing. Beats 80B HunyuanImage by 28% on WISE, 27B Qwen-Image-Edit by 37%. Open-source weights, code, datasets.
📄 arxiv.org/abs/2602.12205
💻 github.com/DeepGenTeam/DeepGen

Latent Forcing — Pixel-space image generation matching latent diffusion quality without a separate decoder. Joint latent+pixel denoising with tuned noise schedules.
📄 arxiv.org/abs/2602.11401

Ctrl&Shift — Geometry-aware object manipulation in images/videos. Move & reorient objects while preserving scene realism, no explicit 3D reconstruction needed.
📄 arxiv.org/abs/2602.11440

Active-Zero — Self-evolving VLMs through active environment exploration (self-play but for vision models). Shifts from passive datasets to active visual data seeking.
📄 arxiv.org/abs/2602.11241

C-JEPA — Causal world models via object-level latent interventions. Extends JEPA from image patches to object-centric representations with counterfactual reasoning.
📄 arxiv.org/abs/2602.11389

New day, new JEPA. Extension, anyone? :D
🔥71
Forwarded from Denis Sexy IT 🤖
Все никак не могу привыкнуть к этому новому миру – скачал Need For Speed Underground, и естественно на маке такие игры запускать это танцы с бубнами (сам запустить я не смог)

Открываешь папку, запускаешь там Claude Code в терминале, и через 10 минут играешь – потому что Opus 4.6 залез там в .exe файл и какими-то патчами починил то, что роняло эмулятор винды

Еще раз – подправил 🪟 файл, сам

Скоро весь легаси софт оживим роботами, дурун-дун-дун
Please open Telegram to view this post
VIEW IN TELEGRAM
😱305🤡2🤩1