Sveriges mest populära poddar

Embodied AI 101

Vetenskap Teknologi

Qwen-VLA: A Generalist Vision–Language–Action Robot Model

36 min•29 maj 2026

A single generalist VLA built on Qwen3.5-4B + 1.15B DiT flow-matching action decoder that unifies manipulation, navigation, and trajectory prediction across 11 embodiments via text-described embodiment prompts. Trained in four stages and outperforms task-specific specialists on real ALOHA and sim benchmarks without per-task fine-tuning.

Fler avsnitt av Embodied AI 101

Hy-Embodied-0.5-VLA: A Massive Bimanual Teleoperation Dataset for Vision-Language-Action

15 juni•21 min

Q-Guided Flow: Test-Time Gradient Guidance of Flow Policies

14 juni•35 min

Flow Reversal Steering: Guiding Diffusion-Based Robot Policies with High-Level Reasoning

14 juni•38 min

Test-Time Compute Scaling for Robot Policies (DIRECT)

14 juni•25 min

LabVLA: Bringing Vision-Language-Action to the Chemistry Lab

14 juni•42 min

Humanoid-GPT: A Foundation Model for Zero-Shot Humanoid Control

13 juni•26 min

CHORUS: Decentralized Multi-Robot Collaboration with a Single Shared VLA Model

13 juni•37 min

RISE: Self-Improving Robot Policy with Compositional World Model

13 juni•40 min

EmbodiedOneVision: Interleaved Vision-Text-Action Pretraining for General Robot Control

12 juni•35 min

Robix: A Unified Model for Robot Interaction, Reasoning and Planning

12 juni•35 min

Embodied AI 101 med Shaoqing Tan finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.