AI 요약
구글 리서치의 마르코스 시펠더(Marcos Seefelder)와 페드로 벨레스(Pedro Velez)는 구글 포토에 도입된 '자동 프레임(Auto frame)' 기능을 통해 사진 촬영 후 구도를 완벽하게 재구성하는 새로운 접근 방식을 공개했습니다. 기존의 이미지 편집 도구가 고정된 원근법 안에서 크롭이나 줌 기능에 의존했다면, 이 기술은 표준 2D 사진을 머신러닝(ML) 모델을 통해 3D 장면으로 해석하는 것이 핵심입니다. 이를 통해 사용자는 시간이 지나 다시 찍을 수 없는 순간의 사진에서도 카메라의 위치와 각도를 지능적으로 변경할 수 있게 되었습니다. 생성형 AI는 원래 보이지 않았던 프레임 밖의 콘텐츠를 자연스럽게 생성하여 새로운 관점에서도 어색함 없는 고품질 결과물을 만들어냅니다.
핵심 인사이트
- 주요 발표일 및 저자: 2026년 4월 22일, 구글 플랫폼 & 디바이스 부문의 마르코스 시펠더와 구글 딥마인드의 페드로 벨레스가 기술 상세 내용을 발표했습니다.
- 핵심 기술명: '자동 프레임(Auto frame)' 기능은 구글 포토(Google Photos) 내에서 활성화되어 실제 서비스에 적용되었습니다.
- 차별화된 접근법: 단순히 이미지를 늘리는 것이 아니라 사진을 '시간이 멈춘 3D 공간'으로 인식하여 카메라의 내부(Intrinsics) 및 외부(Extrinsics) 파라미터를 조정합니다.
- 인물 보존 강화: 인물 사진의 왜곡을 방지하기 위해 인체와 얼굴을 충실하게 재구성하도록 특별히 구성된 '내부 3D 포인트 맵 추정 모델'을 사용합니다.
주요 디테일
- 2단계 처리 프로세스: 기술은 (1) 3D 장면 및 카메라 추정 단계와 (2) 생성형 인페인팅(Inpainting) 및 리터칭 단계로 분리되어 정교하게 작동합니다.
- 카메라 각도 자동 수정: ML 모델이 장면의 내용을 이해하고 최적의 카메라 매개변수를 자동으로 제안하여 사용자의 편집 수고를 덜어줍니다.
- 시차(Parallax) 해결: 일반적인 줌과 달리 카메라 위치 자체를 이동시키는 효과를 주어 물체 간의 상대적 위치 변화인 시차 문제를 해결합니다.
- 생성형 AI의 역할: 프레임 외부에 가려져 있던 영역을 지능적으로 채워 넣어(Inpainting) 원래 촬영된 것처럼 자연스러운 배경을 형성합니다.
- 3D 포인트 맵 활용: 이미지의 모든 픽셀에 대해 3D 위치를 추정하여 공간 레이아웃을 파악함으로써 물리적으로 정확한 재구성을 지원합니다.
향후 전망
- 모바일 사진 편집의 진화: 단순 보정을 넘어 촬영 시점의 실수나 장비의 한계(광각 렌즈 왜곡 등)를 사후에 완벽히 교정하는 수준으로 발전할 것입니다.
- 생성형 AI 기술의 실용화: 추상적인 이미지 생성을 넘어 기존 데이터의 논리적 확장을 시도하는 생성형 AI의 실무 적용 사례가 더욱 늘어날 것으로 보입니다.
출처:google_research
