Sveriges mest populära poddar

MolmoAct2-LIBERO: An Open Vision-Language-Action Model for Robotics

39 min•17 maj 2026

Vision-Language-Action (VLA) model fine-tuned on the merged LIBERO robotics dataset (1,693 episodes, 273k+ frames) achieving 98.25% success rate on manipulation tasks. Released with both checkpoint and dataset for VLA finetuning.

Fler avsnitt av Embodied AI 101

Hy-Embodied-0.5-VLA: A Massive Bimanual Teleoperation Dataset for Vision-Language-Action

15 juni•21 min

Q-Guided Flow: Test-Time Gradient Guidance of Flow Policies

14 juni•35 min

Flow Reversal Steering: Guiding Diffusion-Based Robot Policies with High-Level Reasoning

14 juni•38 min

Test-Time Compute Scaling for Robot Policies (DIRECT)

14 juni•25 min

LabVLA: Bringing Vision-Language-Action to the Chemistry Lab

14 juni•42 min

Humanoid-GPT: A Foundation Model for Zero-Shot Humanoid Control

13 juni•26 min

CHORUS: Decentralized Multi-Robot Collaboration with a Single Shared VLA Model

13 juni•37 min

RISE: Self-Improving Robot Policy with Compositional World Model

13 juni•40 min

EmbodiedOneVision: Interleaved Vision-Text-Action Pretraining for General Robot Control

12 juni•35 min

Robix: A Unified Model for Robot Interaction, Reasoning and Planning

12 juni•35 min

Embodied AI 101 med Shaoqing Tan finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.