AI 요약
최근 AI 및 로봇 스타트업들이 실세계 물리 데이터를 확보하기 위해 독특한 데이터 수집 방식을 도입하며 치열한 경쟁을 벌이고 있습니다. 2026년 5월 29일 더 버지(The Verge)의 로버트 하트(Robert Hart) 기자가 보도한 바에 따르면, AI 학습 스타트업인 '시프트(Shift)'는 뉴욕 시민들의 집을 무료로 청소해 주는 대신 식기 세척, 바닥 물걸레질 등 모든 가사 노동 과정을 촬영한 동영상을 제공받는 비즈니스를 시작했습니다. 기존의 챗봇이나 이미지 생성 AI와 달리, 물리적 로봇을 개발하기 위해서는 인간이 무의식적으로 터득하는 공간감, 마찰력, 힘의 조절, 까다로운 조명 등을 기계에 학습시켜야만 합니다. 이 때문에 실세계 데이터를 수집하는 것이 물리 AI 분야의 거대한 병목 현상으로 떠올랐습니다. 이에 따라 인도의 홈 서비스 플랫폼 '프론토(Pronto)'가 고객 가정을 AI 촬영지로 활용하고, 실리콘밸리의 '휴먼 아카이브(Human Archive)'가 카메라 모자를 통해 긱 워커의 1인칭 시점 데이터를 수집하는 등 관련 기업들의 데이터 확보 경쟁이 다각도로 진행되고 있습니다.
핵심 인사이트
- 2026년 5월 29일 보도: 더 버지(The Verge)의 AI 전문 기자 로버트 하트(Robert Hart)가 보도한 내용으로, 로봇 학습을 위한 실세계 물리 데이터 확보 시장의 부상을 조명함.
- 스타트업 시프트(Shift)의 무료 가사 대행: 뉴욕에서 시작하여 향후 런던 등으로의 확장을 계획 중인 시프트는 무료 청소를 제공하는 대가로 식기 세척, 바닥 닦기 등의 가사 행동 데이터 전체를 촬영함.
- 인도 프론토(Pronto)의 고객 데이터 수집: 인도 홈 서비스 플랫폼 프론토는 요리, 청소, 세탁 등의 가사 행동을 학습시키기 위해 고객 가정을 AI 훈련 촬영지로 활용했으며, 동의(opt-in) 절차를 거쳤으나 시장의 강한 반발을 삼.
- 실리콘밸리 휴먼 아카이브(Human Archive)의 1인칭 데이터 수집: 프론토 등과 파트너십을 맺고, 긱 워커들에게 자체 개발한 카메라 장착 모자를 씌워 로봇 훈련에 필요한 1인칭(Egocentric) 시점의 행동 데이터를 대량 수집할 계획을 세움.
주요 디테일
- 물리적 세계 데이터의 학습 장벽: 기존 이미지나 텍스트 AI 모델은 인터넷에 존재하는 데이터를 쉽게 무단 수집(Scraping)할 수 있었지만, 현실의 물리 법칙(공간, 운동, 마찰력 등)을 다뤄야 하는 로봇 공학 데이터는 은밀하거나 공짜로 수집하기가 불가능에 가까움.
- 인간에게 쉽고 로봇에게 어려운 태스크: 옷을 개거나, 사과를 집어 들거나, 물컵에 물을 따르는 일 등 인간이 본능적으로 쉽게 수행하는 기초 가사 노동이 로봇 공학자들에게는 기계가 배우기 가장 어려운 코딩 영역임.
- 1인칭 시점(Egocentric) 데이터의 필요성: 기계가 작업의 전체 흐름과 도구 제어 방식을 사람처럼 직관적으로 배우기 위해선 작업자의 눈높이와 손 움직임이 그대로 담긴 1인칭 시점의 비디오 데이터가 필수적임.
- 사생활 침해 반발 및 시장 반응: 인도 프론토의 가사 촬영 소식이 전해지자 시장 내에서 큰 반발이 일어났으며, 경쟁 스타트업들은 고객의 프라이버시를 절대 침해하지 않으며 집안을 촬영해 AI를 학습시킬 계획이 없다고 선언함.
향후 전망
- 고품질 가사 데이터 가치의 급상승: 로봇 가사 비서 상용화를 목표로 하는 글로벌 테크 기업 및 로봇 제조사들이 늘어나면서, 고품질 가사 노동 물리 데이터에 대한 가치와 구매 비용이 크게 치솟을 것으로 전망됨.
- 개인 정보 보호 및 수집 표준화 정립 필요: 타인의 집 내부라는 지극히 사적인 공간을 촬영하는 과정에서 사생활 노출을 막기 위한 가이드라인 및 데이터 제공자에 대한 합당한 보상 및 보안 규정 수립이 요구될 것임.
