핵심 요약:
- 알리바바, 로봇이 물리적 세계를 이해할 수 있는 AI 모델 출시
- 해당 모델은 ACE ROBOTICS의 Kairos 및 World Labs 등 경쟁 분야에 진입
- 월드 모델은 언어 기반 AI를 넘어 체화된 지능으로의 전환을 의미
핵심 요약:

알리바바 그룹 홀딩스(Alibaba Group Holding Ltd.)가 로봇이 물리적 세계를 인지하고 상호작용할 수 있도록 설계된 인공지능 모델을 출시했다. 이는 기존의 언어 기반 AI를 넘어서는 '월드 모델'을 구축하기 위한 중국 기술 대기업들과 글로벌 스타트업들 간의 경쟁이 치열해지는 흐름에 동참하는 행보다.
구체적인 모델명과 파라미터 수는 공개되지 않았지만, 이 모델은 로봇이 공간 환경, 객체 간 관계 및 물리적 역학을 이해할 수 있는 능력을 부여하는 것을 목표로 한다. 이러한 능력은 기존의 비전-언어-행동 시스템이 오랫동안 해결하지 못했던 영역이다. 알리바바의 이번 행보는 AI 업계의 초점이 대규모 언어 모델(LLM)에서 실제 물리 세계를 시뮬레이션하고 예측할 수 있는 월드 모델로 옮겨가고 있는 시점에 나왔다.
"월드 모델은 체화된 지능(Embodied Intelligence)의 다음 프론티어를 대표하며, AI를 텍스트 생성에서 물리적 세계 이해로 전환시키고 있습니다."라고 ACE ROBOTICS의 왕샤오강 회장은 이달 초 성명을 통해 밝혔다. 그의 회사가 오픈소스로 공개한 Kairos 월드 모델은 최근 RoboTwin 2.0 이중 팔 조작 벤치마크에서 96.1%의 점수를 포함해 4개의 글로벌 체화 지능 벤치마크에서 최고 순위를 기록했다.
알리바바의 진입은 빠르게 확장 중인 경쟁 분야에 맞서는 것이다. ACE ROBOTICS의 Kairos-4B 모델은 단 40억 개의 파라미터만으로 WorldModelBench Robot 벤치마크에서 9.30의 종합 점수를 기록하며 엔비디아(Nvidia Corp.) 등이 보유한 최대 280억 개 파라미터 시스템을 능가했다. 페이페이 리(Fei-Fei Li)의 월드 랩스(World Labs)는 기업 가치 10억 달러를 인정받았으며, 지난 11월 Marble 앱을 출시해 월드 모델을 활용해 시각적 또는 텍스트 프롬프트로부터 대화형 3D 공간 복제본을 생성한다.
경쟁 구도는 중국과 미국 모두에 걸쳐있다. 엔비디아가 올해 선보인 Cosmos 3.0은 비전 추론, 세계 생성 및 행동 예측을 하나의 통합 시스템으로 결합한 아키텍처를 채택했는데, 이는 ACE ROBOTICS가 2025년 12월에 처음 도입한 것과 동일한 설계 철학이다. 알리바바의 모델은 로봇 공학 개발자 및 하드웨어 제조업체들의 관심을 얻기 위해 이러한 벤치마크에 부합하거나 이를 능가해야 할 것이다.
알리바바에게 이 모델은 클라우드 컴퓨팅 및 엔터프라이즈 소프트웨어를 넘어 AI 야망을 확장하는 의미를 갖는다. 이 회사는 자사의 통이첸원(Tongyi Qianwen, Qwen) 대규모 언어 모델 제품군에 막대한 투자를 해왔으며, 이제 산업 자동화, 물류 및 스마트 리테일 분야에서 새로운 수익원을 창출할 수 있는 시장인 체화 AI로 영역을 넓히고 있다. 알리바바 클라우드(Alibaba Cloud)는 이 모델을 기업 고객에게 제공하는 자연스러운 플랫폼이 될 전망이다.
로봇공학 AI 시장은 상당한 기회를 나타낸다. ACE ROBOTICS는 2026년 상반기에 지리 캐피탈(Geely Capital)과 선전 캐피탈 그룹(Shenzhen Capital Group) 등 투자자들로부터 수억 달러를 조달했으며, 이는 체화 지능에 대한 강한 투자자 수요를 시사한다. 알리바바의 규모와 기존 클라우드 인프라는 소규모 경쟁사보다 유통 측면에서 우위를 제공할 수 있지만, 기존 벤치마크 대비 자사 모델의 성능은 아직 검증되지 않았다.
알리바바 주가는 이번 발표로 상승세를 보였다. 월드 모델에 대한 회사의 진출은 성장 중인 로봇공학 소프트웨어 스택 시장의 점유율을 두고 경쟁할 수 있는 위치를 마련해준다. 이 시장에서 조명, 레이아웃, 객체 및 센서 노이즈 등 본 적 없는 환경 전반에 걸쳐 일반화할 수 있는 능력이 여전히 핵심 기술적 과제로 남아있다. 그러나 독립적인 벤치마크 결과 없이는 알리바바의 모델이 LIBERO-Plus 벤치마크에서 89.0을 기록한 Kairos와 같은 선두주자의 장면 수준 일반화 점수나 Kairos-4B와 같은 모델의 파라미터 효율성에 필적할 수 있을지 평가하기에는 아직 이르다.
본 문서는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.