AI가 승인하는 풀 리퀘스트(PR): 안전한 자동화 시스템을 구축한 방법

Intercom은 9개월 만에 R&D 생산성을 2배로 높였으며, 현재 전체 Pull Request(PR)의 93%를 AI 에이전트가 주도하고 19%를 사람의 개입 없이 자동 승인하고 있습니다. 배포 빈도가 2배 늘어났음에도 불구하고 장애로 인한 가동 중단 시간은 35% 감소하여 속도가 안전의 핵심임을 증명했습니다.

AI 요약

Intercom은 '속도가 안전의 적이 아니라 전제 조건'이라는 철학을 바탕으로 개발 프로세스를 혁신하고 있습니다. 작년 CTO Darragh Curran은 12개월 내 R&D 조직의 생산성을 2배로 높이겠다는 목표를 세웠고, 이를 단 9개월 만에 달성했습니다. 이 과정에서 가장 큰 병목 현상으로 지목된 것은 사람이 수행하는 PR 리뷰였습니다. AI 에이전트가 코드를 생성하는 속도에 비해 인간의 검토 속도가 현저히 느려지면서 발생하는 '임피던스 불일치'와 이로 인한 형식적인 승인(Rubber-stamping) 문제를 해결하기 위해 Intercom은 AI 자동 승인 시스템을 구축했습니다. 현재 주요 코드베이스 PR의 19%가 사람 없이 승인되며, 코드 머지 후 실제 배포까지는 평균 12분이 소요됩니다. 결과적으로 배포 횟수는 2배 증가했으나 장애로 인한 가동 중단 시간은 35% 감소하는 성과를 거두었습니다.

핵심 인사이트

  • Intercom은 당초 12개월로 설정했던 R&D 생산성 2배 향상 목표를 9개월 만에 조기 달성했습니다.
  • 전체 PR의 93% 이상이 AI 에이전트에 의해 주도되며, 그중 19%는 인간 리뷰어 없이 자동 승인됩니다.
  • 배포 빈도가 2배로 증가했음에도 불구하고, 코드 오류로 인한 다운타임은 35% 감소했습니다.
  • 코드가 병합된 후 운영 환경에 반영되기까지 걸리는 평균 시간은 12분에 불과합니다.

주요 디테일

  • '작은 단위의 빈번한 배포'가 위험을 최소화하며, 문제가 발생했을 때 신속한 롤백을 가능하게 한다는 신뢰를 바탕으로 시스템을 설계했습니다.
  • 인간 리뷰어가 시간 압박 속에서 모든 코드의 성능, 보안, 논리적 결함을 완벽히 확인하기 어렵다는 현실적 한계를 데이터로 확인했습니다.
  • AI 자동 승인 시스템은 PR 설명과 실제 변경 사항의 일치 여부, 베스트 프랙티스 준수 등을 엄격한 기준에 따라 검토합니다.
  • AI 에이전트가 구현한 결과물을 사람이 검토하기 위해 며칠씩 대기하는 병목 현상을 제거함으로써 전체 개발 속도를 비약적으로 높였습니다.
  • 데이터 분석 결과, 인간의 주관적인 리뷰보다 자동화된 품질 게이트가 더 높은 안전성을 제공한다는 점을 확인했습니다.

향후 전망

  • AI가 코드 생성뿐만 아니라 품질 보증(QA) 및 승인 단계까지 책임지는 모델이 업계 전반으로 확산될 것입니다.
  • 소프트웨어 개발 생명주기(SDLC)에서 인간의 역할은 단순 검토자에서 아키텍처 설계 및 비즈니스 가치 판단자로 점차 전환될 것으로 보입니다.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...