핵심은 구도: 사진의 구도를 완벽하게 재구성하는 기술

AI 요약

구글 리서치의 마르코스 시펠더(Marcos Seefelder)와 페드로 벨레스(Pedro Velez)는 구글 포토에 도입된 '자동 프레임(Auto frame)' 기능을 통해 사진 촬영 후 구도를 완벽하게 재구성하는 새로운 접근 방식을 공개했습니다. 기존의 이미지 편집 도구가 고정된 원근법 안에서 크롭이나 줌 기능에 의존했다면, 이 기술은 표준 2D 사진을 머신러닝(ML) 모델을 통해 3D 장면으로 해석하는 것이 핵심입니다. 이를 통해 사용자는 시간이 지나 다시 찍을 수 없는 순간의 사진에서도 카메라의 위치와 각도를 지능적으로 변경할 수 있게 되었습니다. 생성형 AI는 원래 보이지 않았던 프레임 밖의 콘텐츠를 자연스럽게 생성하여 새로운 관점에서도 어색함 없는 고품질 결과물을 만들어냅니다.

핵심 인사이트

주요 발표일 및 저자: 2026년 4월 22일, 구글 플랫폼 & 디바이스 부문의 마르코스 시펠더와 구글 딥마인드의 페드로 벨레스가 기술 상세 내용을 발표했습니다.
핵심 기술명: '자동 프레임(Auto frame)' 기능은 구글 포토(Google Photos) 내에서 활성화되어 실제 서비스에 적용되었습니다.
차별화된 접근법: 단순히 이미지를 늘리는 것이 아니라 사진을 '시간이 멈춘 3D 공간'으로 인식하여 카메라의 내부(Intrinsics) 및 외부(Extrinsics) 파라미터를 조정합니다.
인물 보존 강화: 인물 사진의 왜곡을 방지하기 위해 인체와 얼굴을 충실하게 재구성하도록 특별히 구성된 '내부 3D 포인트 맵 추정 모델'을 사용합니다.

주요 디테일

2단계 처리 프로세스: 기술은 (1) 3D 장면 및 카메라 추정 단계와 (2) 생성형 인페인팅(Inpainting) 및 리터칭 단계로 분리되어 정교하게 작동합니다.
카메라 각도 자동 수정: ML 모델이 장면의 내용을 이해하고 최적의 카메라 매개변수를 자동으로 제안하여 사용자의 편집 수고를 덜어줍니다.
시차(Parallax) 해결: 일반적인 줌과 달리 카메라 위치 자체를 이동시키는 효과를 주어 물체 간의 상대적 위치 변화인 시차 문제를 해결합니다.
생성형 AI의 역할: 프레임 외부에 가려져 있던 영역을 지능적으로 채워 넣어(Inpainting) 원래 촬영된 것처럼 자연스러운 배경을 형성합니다.
3D 포인트 맵 활용: 이미지의 모든 픽셀에 대해 3D 위치를 추정하여 공간 레이아웃을 파악함으로써 물리적으로 정확한 재구성을 지원합니다.

향후 전망

모바일 사진 편집의 진화: 단순 보정을 넘어 촬영 시점의 실수나 장비의 한계(광각 렌즈 왜곡 등)를 사후에 완벽히 교정하는 수준으로 발전할 것입니다.
생성형 AI 기술의 실용화: 추상적인 이미지 생성을 넘어 기존 데이터의 논리적 확장을 시도하는 생성형 AI의 실무 적용 사례가 더욱 늘어날 것으로 보입니다.

원문:https://research.google/blog/its-all-about-the-angle-your-photos-re-composed/

출처:google_research

핵심은 구도: 사진의 구도를 완벽하게 재구성하는 기술

AI 요약

핵심 인사이트

주요 디테일

향후 전망

이것도 읽어보세요

과학계, 강력한 양자 상태를 생성하는 놀랍도록 간단한 방법 발견

초소형 X선 망원경, 달의 숨겨진 화학적 성분 밝혀낸다

치명적인 아메바의 전 세계적 확산에 과학계 경고

미세한 원자 배열 변화로 금속 성질을 강력하게 제어한다