AI 요약
구글 리서치가 표 형식 데이터를 위한 제로샷 파운데이션 모델인 TabFM을 공개했다. TabFM은 기존의 XGBoost나 랜덤 포레스트 같은 지도 학습 기반 모델과 달리, 컨텍스트 내 학습(ICL) 방식을 사용해 별도의 모델 학습, 하이퍼파라미터 튜닝, 피처 엔지니어링 없이도 새로운 데이터셋에 대해 즉시 예측을 수행할 수 있다. 이 모델은 전체 데이터셋을 하나의 통합 프롬프트로 처리하여 추론 시점에 열과 행 간의 관계를 학습한다. TabFM은 Hugging Face와 GitHub에서 공개되었다.
핵심 포인트
- 표 형식 데이터는 기업 데이터 인프라의 핵심으로 고객 이탈 예측, 금융 사기 탐지 등에 사용
- 기존 XGBoost 모델은 단일 .fit() 호출 외에도 방대한 하이퍼파라미터 최적화와 피처 엔지니어링 필요
- TabFM은 ICL(컨텍스트 내 학습) 방식으로 모델 가중치 업데이트 없이 새 작업 학습 가능
- Hugging Face 및 GitHub 리포지토리에서 모델 공개
향후 전망
- 표 형식 데이터 분석 워크플로우가 대폭 간소화되어 비전문가도 고품질 예측 모델 활용 가능
