머신러닝이 가져올 지극히 기묘한 미래

AI 요약

필자(Aphyr)는 아시모프와 클라크의 소설을 보며 자란 세대임에도 불구하고, 튜링 테스트가 예상보다 일찍 통과된 작금의 현실에 우려를 표합니다. 2019년 당시 이미 하이퍼스케일러들의 LLM 학습용 하드웨어 발표 현장에서 AI가 생성할 스팸과 선전의 윤리적 문제를 제기했던 그는, 5년여의 고민 끝에 AI가 '거짓말을 양산하는 기계'로 전락했음을 지적합니다. 현재 AI로 불리는 기술은 텍스트, 이미지, 오디오 등 거대한 토큰 벡터를 처리하는 정교한 머신러닝(ML)에 불과하며, 이는 근본적으로 선형 대수의 집합체입니다. 특히 LLM은 스마트폰의 자동 완성 기능처럼 통계적으로 가장 확률이 높은 문자열을 이어 붙이는 방식으로 작동합니다. 필자는 거대 기업들이 해적판 도서와 웹 페이지 등 방대한 데이터를 저작권 문제 없이 학습시켜 저렴한 비용으로 실행 가능한 모델을 보급함으로써, 정보 생태계의 신뢰성이 무너지고 있다고 진단합니다.

핵심 인사이트

2019년의 경고: 필자는 2019년 하이퍼스케일러 컨퍼런스에서 딥러닝의 대중화가 새로운 형태의 스팸과 프로파간다를 양산할 것이라는 윤리적 의제를 던졌습니다.
기술적 본질: 현재의 AI는 지능이라기보다 텍스트, 이미지, 오디오 등의 벡터를 처리하고 변환하는 '거대 선형 대수 뭉치'에 가깝습니다.
LLM의 작동 원리: Large Language Models(LLMs)는 입력된 문자열에 대해 통계적으로 가장 가능성이 높은 완성을 예측하는 '자동 완성(Autocomplete)' 알고리즘의 확장판입니다.

주요 디테일

학습 데이터의 무분별함: AI 모델은 웹 페이지, 해적판 도서(pirated books), 음악 등 방대한 말뭉치(Corpus)를 학습하여 구축됩니다.
비대칭적 비용 구조: 모델 학습에는 천문학적 비용이 소모되지만, 한 번 학습된 모델을 구동(Inference)하는 비용은 매우 저렴하여 대량의 콘텐츠 생산이 가능합니다.
정체성 정의: 필자는 AI 기술을 'Bullshit Machines(허언 기계)'로 규정하며, 이는 진실 여부와 상관없이 그럴듯한 결과물을 내놓는 특성을 비판한 것입니다.
부정적 공간의 분석: 기존의 생태학적 문제나 지적 재산권 논의에서 벗어나, 기술이 가져올 '거짓의 미래'라는 사회적 리스크에 집중합니다.

향후 전망

정보 신뢰의 붕괴: AI가 생성한 그럴듯한 거짓 정보가 인터넷을 점령함에 따라, 사용자들이 진실과 거짓을 구분하기 힘든 환경이 가속화될 것입니다.
윤리적 통제 실패: 2010년대에 제기된 우려들이 현실화되었음에도 불구하고, 기술 확산 속도에 비해 이를 제어할 윤리적, 사회적 합의는 여전히 미비한 상태로 남을 가능성이 큽니다.

원문:https://aphyr.com/posts/411-the-future-of-everything-is-lies-i-guess

출처:hackernews

머신러닝이 가져올 지극히 기묘한 미래

AI 요약

핵심 인사이트

주요 디테일

향후 전망

이것도 읽어보세요

하버드 연구진, 장내 미생물과 우울증 사이의 숨겨진 염증 연결 고리 발견

초기 우주의 중력파가 암흑 물질을 생성했을 가능성 제기

양자 통신의 패러다임을 바꿀 차세대 ‘광학 토네이도’ 기술 개발

“선사시대 거대 곤충, 생존에 고농도 산소 필수적이지 않았다” - 최신 연구 결과