Continuous Learning_Startup & Investment – Telegram
Continuous Learning_Startup & Investment
2.4K subscribers
513 photos
5 videos
16 files
2.72K links
We journey together through the captivating realms of entrepreneurship, investment, life, and technology. This is my chronicle of exploration, where I capture and share the lessons that shape our world. Join us and let's never stop learning!
Download Telegram
Continuous Learning_Startup & Investment
훌륭한 기업가의 정석 1. 아마존 창업과 '후회 최소화 프레임워크' 창업 결정의 순간: 베이조스는 아마존을 시작하기로 한 결정이 분석적인 장단점 목록을 넘어선 깊은 개인적 결정이었다고 말합니다. 그는 '후회 최소화 프레임워크(Regret Minimization Framework)'라는 사고방식을 사용했습니다. 80세의 관점: 그는 자신을 80세(또는 90세)의 미래로 투영하여 과거를 돌아본다고 상상했습니다. 그때 인터넷 혁명에 참여하지 않은 것을…
위대한 스타트업 투자자, 창업가, 연구자들에게서 흔히 발견되는 공통점이 하나 있다.
그것은 바로 몇 번의 거대한 성공을 얻기 위해, 수많은 작은 실수를 저지르는 것을 기꺼이 감수한다는 점이다.
(놀랍게도 꽤 많은 사람들은 반대로 수많은 소소한 성취를 얻는 대가로 몇 번의 치명적인 실수를 저지르는 쪽을 선호하는 듯하다.)

Sam Altman
1
위대한 창업자는 결코 '마이너스 원(Minus One)'을 떠나지 않는다

마이너스 원은 단순한 단계가 아니라 하나의 **사고방식(mindset)**입니다. 그것은 회사를 처음 있게 만든 그 독창성을 쫓아 끊임없는 재창조를 이끄는 관점이자 운영 방식입니다. 이 사고방식에서 멀어지는 창업자들은 순수한 '최적화'의 늪에 빠질 위험이 있습니다. 그렇게 되면 그들의 역할은 협상 가능한(대체 가능한) 것이 됩니다. 기술의 최전선에는 항상 미지의 영역이 존재하며, 끝까지 살아남는 기업은 그 가장자리에 머무르는 창업자가 이끄는 곳들입니다. 그들은 불확실성 속에서도 편안함을 느끼며, 스스로를 계속해서 다시 마이너스 원으로 밀어 넣는 사람들입니다.

진정으로 위대한 기업은 단순히 운영이 잘 되는 곳이 아닙니다. 그들은 끊임없이 다시 태어납니다.

심기(Planting) vs. 수확하기(Harvesting)

회사를 짓는 것을 밭을 가꾸는 일이라고 생각해보십시오.

위대한 창업자는 심는 사람이자 동시에 수확하는 사람입니다. 그들은 새로운 토양을 발견하고, 그곳에서 무엇이 자랄지 상상하며, 비가 오기 전에 씨앗을 뿌리는 위험을 기꺼이 감수합니다. 수확은 운영의 영역으로, 자라나는 것을 보호하고 효율화하는 작업입니다. 둘 다 필수적입니다. 수확 없이는 지속 가능성이 없고, 심기 없이는 미래가 없습니다.

창업자가 심기를 멈추는 순간, 미래는 제한됩니다. 시장은 따라잡습니다. 그러므로 창업자의 일은 계속 심는 것입니다. 기존의 수확이 좋아 보일 때조차 새로운 가치의 원천을 계속 발견해야 합니다. 그것이 기업을 지속 가능하게(durable) 만드는 힘입니다. 오래된 밭을 지키는 능력이 아니라, 새로운 밭을 일구는 능력 말입니다.

창업자가 수확 모드, 즉 운영의 탁월함과 이미 알려진 것을 최적화하는 일에 너무 안주하게 되면, 애초에 그들을 창업자로 만들었던 바로 그 요소를 잃게 됩니다. 창업은 발명이라는 행위입니다. 실행, 관리, 최적화를 당신보다 더 잘하는 사람은 항상 있을 것입니다. 하지만 그 누구도 당신처럼 새로운 가치를 창출할 수는 없습니다.

그것이 당신의 경쟁 우위(edge)입니다. 그것이 바로 마이너스 원 마인드셋입니다.
**메타(Meta)**를 보십시오. 저커버그는 끊임없이 새로운 탐색의 마이너스 원 상태에 있습니다: 소셜 네트워크, VR, 웨어러블, AI. "다음은 무엇인가?"라고 자문하는 것은 쉬운 일이 아닙니다.

페이스북은 모바일 전환기 때 위험을 감수했습니다. 2012년 모바일 수익은 사실상 제로였습니다. 회사를 키웠던 데스크톱 광고는 모바일로 이어지지 않았습니다. 사용자 경험은 투박했고 월가는 회의적이었습니다. 저커버그는 데스크톱을 최적화하고 마진을 개선하여 주주들을 행복하게 만드는 데 집중할 수도 있었습니다.

대신 그는 모바일에 회사의 운명을 걸었습니다. 그것은 거대한 '마이너스 원'으로의 회귀였습니다. 새로운 인터페이스가 작동하게 만드는 법을 알아내고, 핵심 인프라를 재구축하고, 인스타그램의 10명 팀을 위해 10억 달러를 썼습니다. 그 베팅은 성공했지만, 이는 오직 저커버그가 확실성을 버리고 가능성을 택했기 때문에 가능했습니다.

오늘날 메타의 시가총액은 거의 2조 달러에 달합니다. 그러나 그들은 설비 투자(capex)에 1,000억 달러 이상을, 인재 확보에 10억 달러를 쏟아붓고 있습니다. 그들의 가장 큰 스윙(도전)입니다. 규모가 커졌다고 해서 마이너스 원 마인드셋을 받아들일 수 없다고 스스로를 속이지 마십시오.

창업자의 도덕적 권위 (The Founder’s Moral Authority)

저커버그가 그런 거대한 베팅을 할 수 있는 이유는 창업자에게는 양도하거나 고용할 수 없는 일종의 도덕적 권위가 있기 때문입니다. 이는 회사가 단지 하나의 신념에 불과했던 최초의 마이너스 원 시기를 살아낸 데서 나옵니다. 그 시련을 겪어냈기에 창업자는 창조적 위험을 계속 감수할 권리를 얻습니다. 그들은 외부인은 알 수 없는 수준에서 회사의 DNA를 이해합니다. 그들은 무(無)에서 유(有)를 만드는 데 무엇이 필요한지 알기 때문에 팀을 불편하고 야심 찬 영역으로 밀어붙일 수 있습니다.

**루마(Luma)의 아밋(Amit)**에게 있어 마이너스 원은 NeRF(Neural Radiance Fields)를 작동하게 만드는 것이었습니다. 유망하지만 비현실적인 연구 논문을 실제 세계의 장면을 캡처할 수 있는 무언가로 바꾸는 것을 의미했습니다. 그다음은 기술적으로 인상적일 뿐만 아니라 살아있는 듯한 완전한 3D 환경으로 확장하는 것이었습니다. 그다음은 완전히 새로운 자산을 처음부터 생성하는 것이었습니다. 그다음은 복잡성이 기하급수적으로 증가하는 전체 비디오 생성에 도전하는 것이었습니다. 4년이 지난 지금은 어떨까요? 아밋은 여전히 기술적으로나 상업적으로 가능한 것의 경계를 넓히고 있습니다.

각 전환기마다 아밋은 다시 초심자가 되는 불편함을 받아들여야 했습니다. 그는 현재 위치에 머무를 수도 있었습니다. 기존 사업은 잘 돌아가고 있었고 업무도 흥미로웠으니까요. 하지만 더 큰 기회는 새로운 개척지를 발견하는 데 있었습니다.

창업자가 창의성을 멈추고, 주관을 잃고, 위험 감수를 멈추는 순간, 그들은 대체 가능한 존재가 됩니다. 회사에 여전히 리더십은 필요할지 모르지만, 더 이상 '그 창업자'가 필요한 것은 아닙니다. 이것은 대부분의 창업자가 피하고 싶어 하는 불편한 진실입니다. 창업자의 유일한 기여가 운영적인 것이라면, 이사회는 더 경험 많은 전문 경영인(executor)을 데려오는 것을 합리화할 것입니다. 프로세스를 최적화하고 팀을 관리하며 더 효율적으로 수확할 수 있는 사람 말입니다.

하지만 창업자가 여전히 독창성을 제공하고, 새로운 베팅과 방향을 심고 있다면, 그를 교체하는 것은 회사의 창의적 심장을 도려내는 것과 같습니다. 이것이 마이너스 원 마인드셋이 선택 사항이 아닌 이유입니다. 그것이 바로 창업자의 해자(moat)입니다.

사우스 파크 커먼스에서 우리는 어떤 회사든 가장 중요한 요소는 제품도, 시장도, 자금도 아니라고 믿습니다. 바로 당신, 창업자입니다. 우리는 단순히 실행을 돕는 파트너가 아닙니다. 우리는 당신의 야망을 날카롭게 하고 새로운 밭을 일구도록 돕는 존재입니다. 당신을 대체 불가능한 존재로 만드는 그 일을 탁월하게 해내도록 도울 것입니다.

https://blog.southparkcommons.com/the-minus-one-mindset/
2
전종현의 인사이트
“주변 사람이 당신 안에서 당신보다 먼저 잠재력을 본다면, 그것만큼 강력한 축복은 없습니다.” https://m.blog.naver.com/thingschange_/224084241066?enterPage=feed
호기심이 많고, 열심히 일하며, 적당히 괜찮은 판단력과 지능, 명료한 사고력 등을 갖추고 있다면, 정말 멀리 갈 수 있습니다. 그게 시간이 지나면서 복리 효과를 내기 때문입니다. 사람들은 보통 자신의 안주하는 수준까지만 올라갑니다. 이건 대체로 사실이며, 투자든 대기업이든 상관없습니다.

만약 당신의 꿈이 매니저가 되는 것이고 거기서 완벽히 만족한다면, 대개 거기서 멈추게 됩니다. 반대도 마찬가지라는 뜻은 아닙니다. CEO가 되고 싶어 하는 10,000명이 있다고 해서 모두가 CEO가 되는 건 아니지만, 사람들은 스스로 한계를 만듭니다. 스포츠나 비즈니스 등에서 그런 이야기를 듣죠. 사람들이 이 점을 충분히 인식하지 못하는 것 같습니다.

스포츠에서도 톰 브래디나 유명 사이클 선수인 셉 쿠스 같은 사람들을 보면 알 수 있습니다. 사람들은 자신이 얼마나 자신을 밀어붙일 수 있는지 과소평가합니다. 그건 정말 사실입니다. 그리고 그중 90% 이상은 정신적인 부분입니다.

그러니 호기심이나 근성(grit) 같은 요소들을 일찍 시작할수록 좋습니다. 하룻밤 사이에 깨우칠 순 없습니다. 쉬운 길도, 지름길도, 뒷문도 없습니다. 하지만 1%라도 더 자신을 계속 밀어붙이면 시간이 지나면서 해결해 나갈 수 있다고 생각합니다.

찰리(멍거)가 말하듯이, 모든 사람이 매일 조금만 더 똑똑해져서 잠자리에 든다면, 시간이 지남에 따라 그 복리 효과가 어떨지 생각해보세요. 부모님 덕분이고, 운 좋게 좋은 선생님들을 만나기도 했고... 네, 그 두 가지는 매우 중요한 포인트입니다. 호기심과 근성은 아무리 강조해도 지나치지 않습니다.



Q: 해외 교육 시스템이나 미국에서도 점점 더, 인생의 초기부터 1순위가 아닌 것들을 제거해야 한다는 압박을 많이 느끼는 것 같습니다. 이런 것에 대한 관찰이나, 어떻게 다양한 관심사를 유지하고 점들을 연결하면서도 전문성의 깊이를 경험할 수 있었는지, 그 과정을 어떻게 헤쳐나갔는지 말씀해 주실 수 있나요?

제가 얼마나 중구난방이었는지를 보여주는 정말 좋은 질문입니다. 당신의 생각에 덧붙이자면, 한때 저는 천체물리학자가 되고 싶다고 생각해서 플로리다 주립대의 아주 좋은 천문학 프로그램 수업들도 다 들었습니다. 금요일 자정에 플라네타륨(천문관)에 있곤 했죠. 그렇게 여기저기 관심이 많아서, 건축가가 되고 싶어 건축 수업도 들었습니다.

분명히 말하지만, 제가 이 중 어느 것도 잘했던 건 아닙니다. 그냥 19살, 20살 때 길을 찾으려고 노력했던 거죠. 그런데 데이비드 엡스타인의 『늦깎이 천재들의 비밀(Range)』이라는 정말 경이로운 책이 있습니다. 필독서가 되어야 한다고 생각하는데, 이 책의 거대한 결론은 자본주의와 사회가 사람들에게 점점 더 일찍 전문화하도록 강요한다는 점을 지적합니다. 그 말이 전적으로 맞습니다.

스포츠든 거의 모든 분야에서, 그들은 측정 가능하기 때문에 전문가는 더 빨리 출발합니다. 그래서 즉각적인 보상을 얻게 되죠. 이건 아까 말한 '타이거 맘' 이야기와도 조금 연결되는데, "전문화해, 전문화해"라고 강요하는 이유는 초반에 치고 나갈 수 있기 때문입니다. 하지만 그만큼 훨씬 일찍 정체기(plateau)에 도달합니다.

제너럴리스트(다방면의 경험자)는 예상대로 훨씬 느리게 시작하지만, 나중에 지연된 만족(delayed gratification)이 옵니다. 책에서는 훌륭한 운동선수들이 처음부터 그 종목을 하지 않았기 때문에 더 훌륭해진 흥미로운 사례들을 보여줍니다. 비록 책에서 투자 예시를 들지는 않지만, 투자의 본질이 다학제적 역량을 요구한다는 점을 고려할 때, 투자가 완벽한 예시라고 생각합니다.

그리고 그건 호기심과도 밀접하게 연결됩니다. 단순히 IQ가 높은 게 아니라, 정말로 호기심이 많다면 다양한 관심사를 갖게 될 테니까요.

물론 여기서 균형을 잡아야 할 부분은 '능력의 범위(circle of competence)'를 알고 너무 산만해지지 않는 것입니다. 행동으로 옮길 때는 자신감과 역할에 대해 알아야 합니다. "그래, 천문학에 호기심은 있어. 그렇다고 내가 뭘 제대로 안다는 뜻은 아니야." 학습 단계인지 행동 단계인지 구분해야 합니다.



당신의 친구이자 멘토인 분들, 나중에 찰리 이야기도 하겠지만, 그들에게서도 같은 점이 보입니다. 그들의 삶에는 절박함(urgency)이 있습니다. 어딘가에 도달하고 싶어 하지만, 균형도 있습니다. 가고자 하는 곳에 도달하는 데 시간이 걸린다는 것을 알고, 진정한 위대함을 성취하려면 그 형성이 이루어지도록 내버려 두는 인내심이 필요하다는 것이죠.

인생, 투자, 이 모든 것들은 단순하지만 쉽지는 않습니다(simple but not easy). 그리고 쉬워서는 안 됩니다. 할 가치가 있는 일은 원래 쉽지 않은 법이니까요. 사람들은 단기적인 만족을 원하고, "코드가 뭐야? 허점이 뭐야?" 하며 비결을 알고 싶어 하지만, 세상은 그런 식으로 작동하지 않습니다.

그리고 사람마다 다 다르게 작동합니다. 마법의 공식 같은 건 없습니다. 하지만 '리스크(Against the Gods)'를 쓴 리스크의 대가 피터 번스타인은 항상 단기보다 장기를 예측하는 것이 훨씬 쉽다고 말했습니다. 20년, 30년, 40년, 50년 후의 북극성(목표)을 가지고 있다면, 가는 길에 많이 놓쳐도 괜찮습니다. 궤적을 정확히 맞출 필요는 없습니다.

두 걸음 전진하고 한 걸음 후퇴하는 식이라도 괜찮습니다. 단기를 정밀하게 맞추는 게 훨씬 더 어렵습니다. 사회에 뿌리 박힌 그런 사고방식을 거의 뒤집어서(invert) 생각해야 합니다.



지적 호기심이 있고 열심히 일한다면 기회는 많습니다. 하지만 사람들은 역산(backsolve)하려고 실수합니다. "맥킨지에서 일하고 싶어, 돈 많이 벌고 이력서에 좋으니까." 이건 워런의 말과 정반대입니다.

저희 아이들에게 항상 말했습니다. "파리에서 화가가 되고 싶으면 해라." 워런이 즐겨 쓰는 방식인 '극단으로 밀어붙이기'를 해보면, 돈이나 명예를 쫓는 논리는 무너집니다.

인생에서 무엇을 하든 돈이나 명예, 찬사를 위해 하지 마세요. 그건 시간이 걸리고 성숙이 필요하며, 우리 모두 진화하기 때문에 바뀝니다. 정적인 것은 없습니다. 사람들은 "나는 이렇고, 이걸 위해 살 거야"라고 정적으로 생각하지만, 연구에 따르면 우리는 미래에 우리가 얼마나 변할지 엄청나게 과소평가합니다.

매 순간 우리는 끊임없이 '마르지 않은 시멘트(wet cement)'와 같습니다. 사람들은 시멘트가 굳었다고 생각하지만 그렇지 않습니다. 닐 디그래스 타이슨이 우주의 광대함에 대해 말했죠. 어떤 사람들은 그걸 우울해하지만, 어떤 사람들은 해방감과 낙관을 느낍니다. 저는 후자입니다. 워런도 확실히 그렇고요.

마법은 없습니다. 경험과 호기심에 열려 있어야 합니다. 제가 틀릴 수 있고 상황이 변할 수 있다는 사실에 열려 있어야 합니다. 실제로 변하니까요.
3
전종현의 인사이트
“주변 사람이 당신 안에서 당신보다 먼저 잠재력을 본다면, 그것만큼 강력한 축복은 없습니다.” https://m.blog.naver.com/thingschange_/224084241066?enterPage=feed
창업을 꿈꾸는 사람들을 위해 그 결정에 대해 더 이야기해 주시죠. 준비되었다고 느끼셨나요?

아뇨, 전혀요. 저는 살면서 한 번도 준비되었다고 느낀 적이 없습니다. 이건 모두가 적어둬야 할 교훈일 겁니다. 다른 사람들이 당신에게서 당신이 못 보는 무언가를 볼 때, 그건 놀라운 일입니다. 스티브, 찰리, 워런 모두 그랬습니다.

버크셔에서 처음 20~25억 달러 포트폴리오를 맡았는데 6개월 뒤 워런이 "두 배로 늘리자"고 했을 때도 저는 "음..." 했지만 그는 "넌 괜찮아"라고 했죠. 저는 헤이븐(Haven)도, 1년에 200개 인수를 검토하는 것도, 4만 명 직원의 회사를 운영하는 것도 준비되지 않았었습니다.

스티브 프리드먼을 만난 건 엘리엇 스피처(Eliot Spitzer) 검찰총장의 조사 때문이었습니다. 이사회는 스티브에게 마시를 맡아달라고 했고, 그는 보험 전문가를 찾다가 제가 이 회사를 2년 동안 공매도하고 있다는 걸 알게 된 지인을 통해 저에게 연락했습니다.

아침 식사를 하며 2시간 동안 마시 맥레넌에 대해 이야기했습니다. 끝날 무렵 스티브가 "혹시 다른 공매도하는 거 있어요?"라고 물었습니다. 저는 스티브가 패니메이(Fannie Mae) 이사회 의장인 줄도 모르고 순진하게 말했습니다.

"아, 패니메이는 마시보다 10배는 더 최악이에요."

"뭐라고?" 제가 말했죠. "완전 회계 부정이에요. 감옥 갈 사람 나올 겁니다." 그가 "나 거기 이사인 거 알아요?"라고 해서 "몰랐어요. 저라면 당장 그 이사회에서 나오겠어요"라고 했습니다.

그는 다음 날 또 아침을 먹자고 했고, 3시간 동안 파생상품 회계 등을 설명해 줬습니다. 변호사인 그는 회의에서 빠져나와 그날 저녁 5시에 이사회를 사임했습니다. 그리고 다음 날 와서 "우리가 당신 같은 사람을 7~8년 동안 찾고 있었는데, 펀드를 시작해라"라고 했습니다. 참 묘하게 일이 풀리죠.



복리 방정식으로 돌아가 보죠. 원칙(P)을 찾고(호기심), 성장률(R)을 높이는 법(능동적 학습, 노력)을 이야기했습니다. 이제 세 번째 변수인 시간(T), 지속성에 대해 이야기해 봅시다.

투자든 인생이든 5~7년은 잘하다가 멈추는 경우가 많습니다. 반면 버크셔는 계속 성장합니다. 어떻게 'T'를 연장할 수 있을까요?

목적(Purpose)으로 귀결됩니다. 톰 브래디나 페더러, 조코비치가 은퇴하지 않으려는 이유는 잘해서이기도 하지만, 그걸 사랑하기 때문입니다.

경쟁이 치열한 세상에서 100만 명이 조코비치나 워런 버핏이 되려고 노력합니다. 그중 0.1%가 그 일을 너무나 열정적으로 사랑해서 잠자리에 들 때도, 일어날 때도 그 생각만 한다면, 단순히 노력만으로는 그들을 이길 수 없습니다.

그래서 열정을 찾는 게 중요합니다. 돈이나 명예 같은 단기적이고 일시적인 것을 위해 일한다면, 진정으로 사랑하는 사람들과 경쟁할 수 없습니다.

그리고 젊을 때 많은 리스크를 감수하는 게 정말 중요합니다. 저는 잃을 게 없었기 때문에 그랬습니다. 나이가 들면 하방 리스크가 커집니다. 그러니 젊을 때 리스크를 감수하고 실수하세요. 사기 같은 게 아니라면요.

찰리와 워런과 이야기한 건데, 인생에서 100만 개의 실수를 해야 한다면, 그걸 다 앞당겨서 19살, 20살, 21살 때 다 해버리세요. 그러면 이론적으로 다시는 실수하지 않겠죠. 그러려면 초반에 시야를 엄청나게 넓혀야(widen the aperture) 합니다. 그러면서 배워서 좁혀나가는 거죠.

퍼즐을 맞출 때 조각을 다 쏟아붓고 가장자리와 모서리부터 맞추는 것과 같습니다. 중간부터 시작하지 않습니다. 밖에서 안으로(outside in) 작업하는 거죠.

——

기업가로서의 삶을 떠나 거대 조직으로 들어가는 건 드문 일입니다. 찰리에게 콜드 콜(cold call)을 하게 된 계기가 무엇인가요?

돈은 벌고 싶었지만 이미 벌었고, 저는 '핵융합'처럼 적은 투입으로 더 많은 산출을 원했습니다. 캐슬 포인트로 그걸 어느 정도 이뤘지만, 번아웃이 왔습니다. 주 80시간 근무, 월간 보고서 작성 등은 잘 될 때도 재미없었습니다.

저는 보험을 알았고, 보험 회사를 사서 영구 자본(permanent capital)을 갖고 자산은 유지하되 부채(보고 의무 등)는 없애고 싶었습니다. 그렇게 하려고 했는데, 찰리가 당시 86세쯤 되었으니 얼마 안 계실 수도 있겠다고 생각했죠.

LA에 갈 일이 있어서 "만날 리 없겠지만 한번 해보자" 하고 전화했습니다. 비서가 "원하는 게 뭐냐?"라고 해서 "아무것도 원하지 않는다. 그냥 만나고 싶다"라고 했습니다. 우연히 우리가 아는 공통의 지인(마크 넬슨)이 있었고, 그가 찰리에게 저에 대해 좋게 말해줬습니다. 마크는 제 프레젠테이션을 보고 "젊은 찰리 멍거 같다"라고 했었거든요.

찰리가 다음 날 이메일로 "아침 7시에 캘리포니아 클럽에서 보자"라고 했습니다. 6시간 동안 이야기했는데, 그분을 따라가느라 저는 진이 다 빠졌습니다. 그에게는 그냥 테니스 공 치는 것 같았겠지만요.

그 후 일주일 뒤 전화가 와서 또 몇 시간 통화하고, 다음에 LA 올 때 또 보자고 하셨습니다. 12번 정도 만났는데 처음에는 투자 이야기는 별로 안 했습니다. 그러다 결국 "뭐 할 거냐?"라고 물으시길래 계획을 말했더니, "그냥 워런이랑 이야기해 봐"라고 하셨습니다. 저는 그게 면접인 줄도 몰랐습니다. 제가 가진 주식 중 하나를 그들이 인수하려고 부르는 줄 알았죠. 그게 오히려 가식 없이 대화할 수 있게 해 주었습니다.


워런과 찰리는 당신에게서 무엇을 보았을까요?

어려운 질문이네요. 일화가 낫겠네요. 찰리와의 첫 만남에서 딥워터 호라이즌(Deepwater Horizon, BP 기름 유출 사고) 이야기가 나왔습니다. 우리는 우주와 마틴 리스의 책 『단지 여섯 개의 숫자(Just Six Numbers)』에 대해 이야기하다가 거기로 흘러갔습니다.

저는 보험 용어로 "CEO 임기가 4년이니 100년에 한 번 일어날 확률에 돈을 안 쓴 거다. 그들은 본질적으로 딥 OTM(Out-of-the-money) 풋옵션을 판 것과 같다"라고 했습니다.

찰리가 "방금 뭐라고 했나? 젠장, 그거 천재적인데(brilliant)"라고 했습니다. 저는 "아니에요, 그냥 포드 핀토(Ford Pinto) 사건 같아요. 2센트짜리 부품을 안 써서 차가 폭발하게 둔 거죠"라고 했습니다. 빈도와 심도(frequency and severity), 파워 법칙 등에 대해 이야기했습니다. 그런 사고방식이 통했던 것 같습니다.

워런과는 바로 주식 이야기로 들어갔습니다. 제 포트폴리오에 U.S. 뱅코프, 웰스파고, 마스터카드, 비자가 있었는데, 그는 아멕스(Amex)를 가지고 있었죠. "왜 아멕스 대신 마스터카드인가?"라고 물었고 저는 제 의견을 쏟아냈습니다.

워런은 지적으로 정직한 분이라 "어떤 시나리오에서 그게 틀릴 수 있지?"라고 물었고 우리는 토론했습니다. 프로그레시브와 가이코(Geico)에 대해서도, 저는 "프로그레시브가 데이터 회사라 장기적으로 이길 거다. 둘 다 기술은 별로다"라고 솔직하게 말했습니다.

CEO들은 보통 아부만 듣는데, 저는 신경 쓰지 않았습니다. "이게 제 의견입니다. 동의 안 하셔도 됩니다." 그 솔직함을 높이 사신 게 아닐까 싶습니다.



워런 버핏의 사무실 바로 옆방에서 지내며, 그와 찰리 멍거를 멘토이자 친구로 둔다는 건 어떤 느낌인가요?

"고무가 도로에 닿을 때(실전 상황이 닥칠 때)" 진가를 알게 됩니다.

힘든 상황이 터졌을 때, 사무실에 저밖에 없었는데 워런이 슬리퍼를 끌고 내려와서 "오늘 3건의 딜이 왔는데 다 쓰레기야. 왜냐하면..." 하면서 이야기를 시작합니다. 방사선 회사 이야기나 케이블 카우보이(Cable Cowboy) 책을 읽은 이야기 등등요.

제가 케이블 사업에 대해 묻자 그는 60년대에 분석했던 파일들을 보라고 했습니다. 점심 먹으러 가서 그런 이야기를 나누죠. 저는 71년생이라 60년대는 몰랐는데, 그런 역사적 맥락을 얻게 됩니다.

수백만 가지 이야기들이 3차원 홀로그램처럼 펼쳐집니다. 멀리서 보면 소음(noise)일 수 있는 것들이, 바로 옆에 있으면 아주 명확한 신호(signal)로 다가옵니다.

https://joincolossus.com/episode/combs-todd-combs-investing-the-last-liberal-art/
3
Continuous Learning_Startup & Investment
창업을 꿈꾸는 사람들을 위해 그 결정에 대해 더 이야기해 주시죠. 준비되었다고 느끼셨나요? 아뇨, 전혀요. 저는 살면서 한 번도 준비되었다고 느낀 적이 없습니다. 이건 모두가 적어둬야 할 교훈일 겁니다. 다른 사람들이 당신에게서 당신이 못 보는 무언가를 볼 때, 그건 놀라운 일입니다. 스티브, 찰리, 워런 모두 그랬습니다. 버크셔에서 처음 20~25억 달러 포트폴리오를 맡았는데 6개월 뒤 워런이 "두 배로 늘리자"고 했을 때도 저는 "음..." 했지만…
멍거의 배경과 대공황의 교훈

- 변호사가 아니었다면: 멍거는 만약 워런 버핏을 만나지 않았더라도, 법률 업무를 통해 번 돈으로 부동산 개발업자(Pritzker나 Bing 가문처럼)가 되었을 것이라고 말했습니다. 그는 클라이언트들이 하는 일을 보며 "내가 더 잘할 수 있겠다"라고 생각하는 성향이 있었습니다.

대공황(The Great Depression)의 기억:

- 대공황을 겪은 것은 이점이었다고 회고합니다. 세상에 얼마나 많은 비이성(irrationality)이 존재하는지 7살 때 깨달았습니다.
- 일화: 아버지의 친구였던 천재 수학 교수가 집안의 누수 문제로 이성을 잃고 미친 듯이 화를 내는 것을 보며, "천재도 저렇게 미칠 수 있다면, 나에게도 기회가 있다"라고 생각했습니다. 이러한 비이성적인 세상이 역설적으로 기회를 제공한다고 보았습니다.
- 기질(Temperament): 높은 지능보다 중요한 것은 이성적인 기질과 긴 집중력(long attention span)입니다. 멍거는 씨를 뿌리는 과정(분석과 매수) 자체를 수확하는 것만큼이나 즐깁니다.

Todd Comb

한 학생이 "시간을 어떻게 보내느냐"고 묻자, 버핏은 서류가 가득 든 아코디언 폴더를 들어 보이며 "나는 그냥 읽는다. 매일 500페이지씩 읽어라. 지식은 복리처럼 쌓인다. 누구나 할 수 있지만 대부분 하지 않는다"고 했다. 나는 이 말을 단순한 조언이 아닌 '도전'으로 받아들였고, 그때부터 실제로 실행에 옮겼다. 이는 수동적인 배움이 아닌 능동적인 배움의 자세를 갖게 된 계기였다.

Q: 버크셔 합류 후 어떻게 가치를 더하려 했나?

A:

워런은 나에게 포트폴리오를 맡기며 "네가 원하는 대로 하라"며 전적인 자율권을 줬다. 나는 다른 사람을 흉내 내기보다 내가 잘 아는 방식(금융, 결제 서비스 등)으로 승부하기로 했다. 워런과의 점심 식사를 통해 "크게 생각하라(Think Big)"는 교훈을 얻었고, 단순히 주식을 사는 것을 넘어 기업 전체를 인수하는 관점을 갖게 되었다. 이것이 나중에 헬스케어 프로젝트(Haven)나 JP모건 이사회 활동 등으로 이어졌다.

Q: 실수를 했을 때는 어떻게 대처하나?

A: 누구나 실수를 한다. 중요한 것은 결과(Outcome)보다 과정(Process)에 집중하는 것이다. 자신의 능력 범위(Concentric Circles)를 서서히 넓혀가야지, 금융을 하다가 갑자기 전혀 모르는 기술 분야로 건너뛰면 안 된다. 리스크를 복합적으로 계산(Path Dependency)하여 치명적인 실수를 피하려 노력한다.

Q: 현재의 독서 습관은 어떤가? 여전히 500페이지씩 읽나?

A: 읽는 양은 비슷하지만 내용이 바뀌었다. 낮에는 가이코 CEO로서 기술 로드맵이나 보고서 등 업무 관련 자료를 읽는다. 투자를 위한 독서(연례 보고서, 10K, 무역 잡지 등)는 밤이나 주말을 이용한다. 팟캐스트는 독서로 치지 않는다.

Q: 투자 리서치는 어떻게 하나?

A: 1차 자료(연례 보고서, 공시 등)와 무역 잡지를 중시한다. 남들이 잘 안 읽는 자료를 읽고, 필요하면 직접 전화를 걸어 정보를 얻는다. 투자는 정량적 분석(가치 평가)보다 정성적 분석(Qualitative)이 95~99%를 차지한다. 세부 사항(Details)에서 시작해 밖으로 나가는 '인사이드 아웃(Inside-Out)' 방식을 선호한다. 미리 시가총액을 보지 않고 스스로 가치를 산정한 뒤 시장 가격과 비교하여 '앵커링 효과(Anchoring Effect)'를 피한다.

Q: 비즈니스의 리스크는 어떻게 평가하나?

A: 비즈니스의 어떤 부분이 죽어가고 있는지, 그리고 겉으로 드러나지 않은 리스크(Tail Risk)가 무엇인지 파악하려 한다. 워런과 찰리에게 추천했던 책 'Ubiquity'에 나오는 '멱법칙(Power Laws)'처럼, 사람들은 낮은 빈도지만 발생하면 치명적인 위험(Out of the money puts 매도와 같은 행위)을 간과하는 경향이 있다. 반대로 비대칭적인 상승 잠재력이 있는지도 살핀다.

Q: 초기 경력에서 중요한 인맥은 어떻게 형성했나?

A:

프로그레시브(Progressive) 보험사 시절, 나는 마시 맥레넌(Marsh McLennan)과 패니 메이(Fannie Mae)의 문제점을 파악하고 공매도 포지션을 취하고 있었다. 당시 마시 맥레넌의 CEO를 찾던 스티브 프리드먼과 척 데이비스가 나를 '해당 사안의 전문가(Axe)'로 소개받아 만나게 되었다. 이 인연이 이어져 나중에 내 펀드를 시작할 때 그들이 초기 투자자가 되어주었다.

Q: 네트워킹에 대한 철학이 있다면?

A: '네트워킹'이라는 단어 자체를 별로 좋아하지 않는다. 거래적인 의도가 느껴지기 때문이다. 대신 '넓은 시야(Wide Aperture)'를 갖되, 내가 좋아하고 함께 있으면 즐거운 사람들에게 시간을 집중하는 방식을 선호한다. 워런에게 배운 점이기도 하다. 의도적인 네트워킹보다 과정에 충실하면 인연은 자연스럽게 이어진다고 믿는다.

Q: 18세의 토드에게 지금의 커리어를 말해주면 믿겠나?

A:

절대 안 믿을 것이다. 나는 운이 좋았고, 많은 사람들의 도움을 받았다. 과거 프로그레시브 시절, 펀드 매니저가 되고 싶어 브로커에게 물었더니 "아이비리그 출신 아니면 꿈도 꾸지 말라"는 말을 들었었다. 하지만 준비(Preparation)와 끈기(Grit)가 있었기에 운이 찾아왔을 때 잡을 수 있었다.
Continuous Learning_Startup & Investment
구글 딥마인드에는 약 5,000명의 직원이 있으며, 그중 80% 이상이 엔지니어와 박사급 연구원 Q: 범용 로보틱스를 위한 '안드로이드' 같은 운영체제(OS)를 만들 수 있다는 의미일까요? 그렇게 되면 수많은 로봇 장치, 회사, 제품이 갑자기 급성장하게 될 텐데요. 로보틱스 전반에 걸친 일종의 '안드로이드' 같은 OS 계층을 만드는 것이죠. 하지만 최신 모델을 특정 로봇 타입과 수직적으로 통합하여 종단간(end-to-end) 학습을 하는 것 또한 매우…
Gemini 3 관련 Demis Hassabis 인터뷰

가장 큰 차이점은 '추론(Reasoning)' 능력의 깊이입니다. Gemini 3는 단순히 답을 내놓는 것을 넘어, 복잡한 문제를 해결하기 위해 스스로 **'생각의 흐름(Train of Thought)'**을 유지할 수 있습니다. 이전 모델들이 3~4단계의 추론 과정에서 길을 잃거나 환각(Hallucination)을 보였다면, Gemini 3는 수십 단계의 논리적 과정을 안정적으로 밟아나갑니다. 특히 코딩과 수학 분야에서 이 능력이 두드러집니다.

Q. '생각의 흐름'이 구체적으로 사용자에게 어떤 이점을 줍니까? 예를 들어, 복잡한 코드를 짜거나 역사적 문서를 분석할 때 모델이 중간에 맥락을 놓치지 않습니다. 사용자가 "이 부분은 왜 이렇게 됐어?"라고 물으면, 모델은 자신의 논리적 경로를 되짚어 설명할 수 있습니다. 이는 신뢰성(Reliability) 측면에서 엄청난 도약입니다.

Q. Gemini 3의 개발 과정에서 가장 중점을 둔 부분은 무엇인가요? 우리는 모델이 '자신의 한계를 아는 것'에 집중했습니다. 모르는 것을 모른다고 하거나, 불확실할 때 사용자에게 되묻는 능력을 키웠습니다. 또한, 개인화(Personalization) 기능을 강화하여 사용자의 이전 작업 스타일이나 선호도를 기억하고 이에 맞춰 결과물을 생성하도록 했습니다.

AI 산업의 현황과 '거품(Bubble)' 논란

Q. 최근 AI 산업에 거품이 끼어있다는 지적이 많습니다. 이에 동의하십니까? 네, 솔직히 말하면 AI 산업의 일부 영역에는 확실히 거품이 있다고 봅니다(Probably in a bubble). 현재 시장에는 실질적인 제품이나 차별화된 기술 없이, 단순히 'AI'라는 키워드 하나로 수백억 달러의 가치를 인정받는 스타트업들이 존재합니다. 이는 지속 가능하지 않으며, 언젠가는 조정(Correction)이 올 것입니다.

Q. 그렇다면 구글이나 딥마인드도 그 위험에 노출된 것 아닙니까? 우리는 다릅니다. 거품이 꺼질 때 살아남는 것은 '실질적인 가치(Real Value)'를 증명하는 기업들입니다. 우리는 이미 Gemini를 통해 검색, 워크스페이스, 안드로이드 등 수십억 명이 쓰는 제품을 혁신하고 있습니다. 또한 Waymo(자율주행)와 Isomorphic Labs(신약 개발)처럼 AI를 물리적 세계와 과학적 발견에 적용해 실제 수익과 성과를 내고 있습니다. 우리는 이 '거품' 논란에서 가장 강력한 위치(Strong position)에 있다고 확신합니다.

Q. AI 투자가 과열되었다는 비판에 대해서는 어떻게 생각하나요? 과열된 측면이 있지만, 이는 새로운 기술 혁명 초기에 항상 나타나는 현상입니다. 인터넷 초창기에도 닷컴 버블이 있었지만, 결국 인터넷은 세상을 바꿨습니다. 중요한 건 누가 끝까지 살아남아 세상을 바꿀 기술을 완성하느냐입니다.

로봇 공학(Robotics)과 '물리적 지능'

Q. Wired와의 인터뷰에서 "로봇을 위한 안드로이드"를 언급하셨는데, 무슨 뜻인가요? 스마트폰 시장을 보세요. 안드로이드라는 OS가 있었기에 수많은 제조사가 다양한 형태의 스마트폰을 만들 수 있었습니다. 우리는 로봇 분야에서도 똑같은 일을 하려 합니다. 'Gemini Base'라는 범용 AI 소프트웨어 계층을 만들어, 휴머노이드든 바퀴 달린 로봇이든 상관없이 어떤 로봇 하드웨어에도 즉시 적용할 수 있게 할 것입니다.

Q. 그렇다면 구글이 직접 로봇을 만드는 건가요? 하드웨어보다는 '로봇의 두뇌'를 만드는 데 집중하고 있습니다. 물론 이를 테스트하기 위해 보스턴 다이내믹스 출신의 아론 샌더스(Aaron Saunders) 등을 영입해 하드웨어 역량도 강화하고 있습니다. 하지만 궁극적인 목표는 모든 로봇이 세상을 이해하고 상호작용할 수 있게 하는 '범용 로봇 지능'을 공급하는 것입니다.

Q. 로봇이 우리 일상에 들어오는 건 언제쯤일까요? 생각보다 빠를 겁니다. 향후 몇 년(Couple of years) 안에 로봇 공학에서 "와우(Wow)" 할 만한 순간을 보게 될 것입니다. Gemini와 같은 멀티모달 모델이 시각과 언어를 결합해 물리적 세계를 이해하기 시작했기 때문입니다.

AGI와 미래 전망

Q. AGI(범용 인공지능)는 언제쯤 실현될까요? 여전히 5~10년입니까? 네, 저는 여전히 **향후 5년에서 10년 사이**에 AGI가 등장할 확률이 50% 이상이라고 봅니다. 우리는 지금 올바른 궤도(Dead on track)에 있습니다. 하지만 여전히 한두 번의 큰 기술적 돌파구(Breakthrough)가 더 필요합니다. 특히 기억력(Memory), 계획 수립(Planning), 그리고 물리적 세계에 대한 이해(World Models) 측면에서 더 발전해야 합니다.

Q. '월드 모델(World Models)'이 왜 중요한가요? 현재의 LLM은 텍스트 기반이라 세상의 물리적 법칙을 완벽히 이해하지 못합니다. AGI가 되려면 텍스트를 넘어, 사과를 떨어뜨리면 왜 아래로 떨어지는지, 문을 열면 그 뒤에 무엇이 있을지 예측할 수 있는 '세상에 대한 내적 모델'을 가져야 합니다. 이것이 우리가 지금 가장 집중하고 있는 연구 분야입니다.

Q. 마지막으로, Gemini 3 이후의 계획은 무엇입니까? Gemini 3는 시작일 뿐입니다. 우리는 이미 Gemini 4와 그 이후 버전을 기획하고 있습니다. 우리의 목표는 단순히 똑똑한 챗봇을 만드는 게 아니라, 인류의 난제(질병, 기후 변화, 에너지 문제)를 해결할 수 있는 '과학적 도구로서의 AI'를 완성하는 것입니다.

https://youtu.be/rq-2i1blAlU
1
세상의 학습 환경은 두 가지로 나뉩니다:

Kind Environment (친절한 환경)

- 패턴이 반복되고, 피드백이 즉각적이며, 규칙이 명확
- 예: 체스, 골프
- 최적 전략: 조기 전문화 (Tiger Woods)

Wicked Environment (험난한 환경)

- 패턴이 불분명하고, 피드백이 지연되며, 규칙이 변함
- 예: 비즈니스, 의학, 인생의 대부분
- 최적 전략: 폭넓은 Sampling (Roger Federer)

> 핵심: 우리는 Kind 환경의 성공 사례를 Wicked 환경에 잘못 적용하고 있습니다.
>

1. 조기 전문화의 함정

조기 숙련도 ≠ 장기 잠재력

핵심 예시: 프리스타일 체스

- 인간 + 컴퓨터 대결에서 승자는 최고의 그랜드마스터가 아니었음
- Anson Williams (아마추어 체스 선수)가 우승
- 체스 실력은 평범했지만, 여러 AI 도구를 전략적으로 활용하는 통합 능력 탁월
- 교훈: Wicked 환경에서는 범위(Range)가 깊이(Depth)를 이김

보조 증거

노벨상 수상자들은 동료 과학자들보다 예술적 취미를 가질 확률이 훨씬 높음

2. 바람직한 어려움 (Desirable Difficulties)

쉬운 학습 = 얕은 이해 (빠른 망각)

어려운 학습 = 깊은 이해 (오래 지속)

핵심 개념: Interleaved Practice

- Blocked Practice: 같은 문제 반복 (AAAA, BBBB)
- 즉각적 성과는 높지만 장기 보존은 낮음
- Interleaved Practice: 다른 문제 섞어서 (ABCD, BCAD)
- 즉각적 성과는 낮지만 장기 보존은 훨씬 높음
- 핵심: 어떤 전략을 사용할지 판단하는 능력 향상

실증 예시

화가 구별: Cézanne, Picasso를 섞어서 보는 것이 각각 따로 보는 것보다 훨씬 효과적

3. 유추적 사고의 힘

Inside View: 현재 문제의 세부사항 집중 → 과신, 좁은 해결책

Outside View: 다른 영역의 구조적 유사성 찾기 → 정확한 예측, 창의적 해결책

Duncker의 방사선 문제

- 문제: 종양은 파괴하되 주변 조직은 손상 없이?
- 혼자 풀 때: 10%만 해결
- 유추 제공 (장군이 여러 방향에서 요새 공격): 80% 해결
- 교훈: 표면적 특징(의학 vs 군사)이 달라도 깊은 구조(집중된 힘)는 같을 수 있음

실용적 적용

- 사모펀드: Outside View (다른 프로젝트와 비교) → 정확한 예측
- 영화 수익: "어떤 영화와 유사한가?" → 높은 정확도

4. Match Quality와 Sampling의 중요성

조기 전문화 → 낮은 match quality → 커리어 변경 多

늦은 전문화 (Sampling) → 높은 match quality → 장기 성공

핵심 예시: 빈센트 반 고흐

- 미술상, 교사, 서점 직원, 목사 모두 실패
- 27세에야 그림 시작, 스타일도 계속 바꿈
- 교훈: "늦은 시작"과 끊임없는 "그만두기"가 그의 독특한 스타일 발견을 가능하게 함

The End of History Illusion

- 우리는 과거에 변했다는 것은 인정하지만, 미래에는 변하지 않을 것이라 믿음
- 실제: 가치관과 선호도는 평생 크게 변함
- 시사점: Test-and-Learn > Plan-and-Implement

아웃사이더의 우위

- 전문가의 맹점: Einstellung Effect - 익숙한 방법만 사용
- 아웃사이더의 강점: 영역 밖 사고, 먼 유추 사용

InnoCentive 플랫폼

> "문제가 해결자의 전문성에서 멀수록, 해결 가능성이 높음"
>

강력한 예시: John Davis

- 문제: 기름 유출 청소 (초콜릿 무스 같은 기름)
- 화학 지식이 아닌, 여름 건설 아르바이트 경험 회상
- 콘크리트 진동기로 해결
- PhD 화학자들이 수십 년 못 푼 문제를 화학자가 화학 외 방법으로 해결

미발견 공공 지식

Don Swanson: 서로 인용하지 않는 다른 분야 논문들을 교차 참조하여 마그네슘과 편두통 사이의 11가지 연결고리 발견

1. Lateral Thinking with Withered Technology

최첨단 기술 경쟁 대신, 오래되고 싼 기술을 새로운 방식으로 사용

Nintendo Game Boy

- 경쟁사보다 기술적으로 열등 (흑백 화면, 저성능)
- 하지만 "구식" 기술 덕분에:
- 저렴, 내구성, 배터리 효율, 개발 용이
- 결과: 우수한 Sega/Atari를 압도

폴리매스의 가치

Andy Ouderkirk (3M): 전문가 발명가는 1980년대 정점, 폴리매스는 점점 더 가치 있어짐

7. 고슴도치 vs 여우

Hedgehog: 단일 이론으로 세상을 봄 → 예측 정확도 끔찍 (침팬지보다 못함)

Fox: 다양한 관점을 종합 → 예측 정확도 우수

Philip Tetlock의 20년 연구

- Hedgehog: 자신감 넘치지만 틀림, 실패 후에도 믿음 수정 안 함
- Fox: 적극적 열린 마음, 새로운 데이터로 지속적 업데이트

Good Judgment Project

"슈퍼 예측자" (지적인 일반인/Foxes) > 기밀 데이터 가진 정보 분석가 (30% 앞섬)

8. 익숙한 도구 버리기

고압 상황에서 전문가들은 익숙한 도구로 퇴행 - 그 도구가 쓸모없어도

핵심 예시: Challenger 재해

- NASA 엔지니어들은 O-ring 고장 데이터를 가지고 있었음
- 하지만 "정량적이지 않다"는 이유로 무시
- 교훈: 모호한 상황에서 정량적 증명 요구라는 "익숙한 도구"를 버리지 못함

의료 과다 사용

전문가들은 증거가 효과 없다고 보여줘도 익숙한 도구 사용

- Oculostenotic reflex: "망치를 가지면 모든 것이 못으로 보인다"

9. 의도적 아마추어 (Deliberate Amateur)

혁신은 비효율성을 요구 - "dabble"하고, 탐구할 시간

- "금요일 밤 실험" 수행
- 개구리 공중 부양 (Ig Nobel상) → 그래핀 발견 (진짜 Nobel상)
- 5년마다 분야를 바꿈: "깊이 파지 않는다 - 얕게 grazing한다"

보조 예시: Oliver Smithies

"토요일 아침 실험"으로 젤 전기영동법 발견 (어머니가 셔츠에 풀 먹이던 것 기억)

실천 가능한 적용

학습할 때

- Interleaved practice 사용 (섞어서 연습)
- "어려운" 학습 선택 → 장기 보존 최적화

문제 해결 시

- Inside view만 사용하지 말 것
- "이것은 무엇과 유사한가?" 질문
- 완전히 다른 영역에서 유추 찾기

커리어 계획

- 10년 계획 대신 단기 계획
- Match quality가 낮으면 그만두는 것을 두려워하지 말 것
- Test-and-Learn > Plan-and-Implement

혁신 추구

- "금요일 밤 실험" 시간 확보
- 다른 분야의 오래된 해결책 찾기
- 전문 분야 밖을 읽고 배우기

우리가 살고 있는 세상은 대부분 Wicked Environment입니다.

Kind 환경(체스, 골프)의 성공 스토리를 일반화하는 것은 위험합니다.

비즈니스, 의학, 연구, 예술, 그리고 **인생 대부분의 영역**에서는:

- 패턴이 불분명하고
- 피드백이 지연되며
- 규칙이 계속 변합니다

이런 환경에서는 **Range(폭넓은 경험)**가 가장 강력한 무기입니다.

> "뒤처졌다고 느끼지 마라"
>
- 율리우스 카이사르: 알렉산더 동상 앞에서 울었지만, 나중에 세계 정복
- Steve Nash: 13세에 농구 시작 → NBA MVP 두 번
- Sviatoslav Richter: 22세에 정식 레슨 시작 → 20세기 최고의 피아니스트

조기 전문화의 압박을 느끼지 마세요. 다양한 경험, "실패", 커리어 변경은 약점이 아니라 Wicked World에서 성공하기 위한 필수 자산입니다.
2
재능을 알아보는 안목 (The Art of Spotting Talent)

당신은 분야를 막론하고 최고가 된 사람들을 연구하고, 함께 일하고, 경쟁했습니다. 그들에게서 발견한 가장 중요한 공통된 특징은 무엇인가요?

저는 성장과 최고가 되는 것에 관심이 있습니다. 거의 건강하지 않을 정도로 탁월함(excellence)에 집착하죠. 사람을 만나면 10분 안에 제 뇌가 자동으로 스캔해서 같은 분야의 사람, 다른 분야의 사람, 성격이 비슷한 사람들과 비교합니다. 장단점을 다 비교하죠. 예술품을 수집할 때도 마찬가지입니다.

저는 하루에 200개 정도의 이미지를 봅니다. 머신 러닝(ML)처럼 제 뇌에 데이터를 넣는 거죠. 저는 이걸 제 개인적인 AI라고 생각합니다. 당신을 만났을 때도 인터뷰를 아주 잘한다는 걸 알았죠. 책을 읽고 50분 만에 핵심을 요약했잖아요. 그건 재능이 없으면 불가능합니다.

당신은 직관으로 움직이는 것 같지만, 책을 보면 엄청난 준비를 합니다. 우편실에서 일할 때 2시간 일찍 출근해서 70년 치 파일 캐비닛을 읽고, 퇴근 후에도 읽었죠. 록펠러처럼 밭을 갈듯이요. 그런 엄청난 지식 기반 위에 실험과 참조 프레임이 더해져서 직관적인 결정이 나오는 것 같습니다. 분석할 시간도 없이 "이 사람은 특별해, 연결해야 해"라는 식으로요.

네, 하지만 데이비드, 질문을 하나 하죠. 당신은 빽도 없이 우편실에 취직했습니다. 3년짜리 교육 프로그램이죠. 대학 학위는 있지만 멍청하진 않습니다. 다른 대안이 있나요? 선택의 여지가 없어요. 저는 1969년 21살이었고, 인맥과 족벌주의가 판치는 비즈니스에서 저를 돋보이게 해야 했습니다. 동기 20~25명 중에서요. 모두 9시 30분 시작에 맞춰 9시에 왔지만, 저는 아무도 없는 6시 30분에 출근했습니다.

누구보다 빨리 모든 것을 배우겠다고 다짐했고, 내가 뭘 하는지 아무에게도 공유하지 않았습니다. 나중에 제가 회사를 차렸을 때는 정반대로 했죠. 모든 것을 모두와 공유했습니다. 비밀 없이, 정치 없이, 모두가 큰 배를 움직이게 했죠. 하지만 우편실에서는 동기들이 다 경쟁자였습니다.

당신 책에서 "내가 그들보다 똑똑한지는 모르겠지만, 더 열심히 일하는 건 확실하다"고 하셨죠.

저보다 똑똑하고 아이비리그 나온 친구들도 있었습니다. 하지만 저는 경쟁적인 환경에 있었고, 영화 산업의 황금기에 대해 미친 듯이 읽었습니다. CAA를 시작할 때 필독 도서 목록을 만들어 직원들에게 줬죠. 프랭크 카프라, 데이비드 린 같은 거장들에 대해 모르면 영화감독들과 대화할 수 없으니까요.

지식과 호기심의 중요성 (The Importance of Knowledge and Curiosity)

찰리 멍거는 "역사로부터 배우는 것은 레버리지의 한 형태"라고 했습니다. 영화감독들도 영화사에 대해 해박하죠.

지식은 힘입니다. 실용적 지식, 연구 지식, 지적 지식, 그리고 깊은 호기심이 결합되면 이길 수 없는 우위를 점하게 됩니다. 제 책상에는 인터넷, 인스타그램, 구글에서 본 흥미로운 것들에 대한 메모가 20개쯤 있습니다. 매일 밤 저는 관심사에 대해 깊이 파고듭니다.

컴퓨터가 제 인생을 바꿨습니다. 저는 컴퓨터에서 살다시피 합니다. 정보를 얻는 걸 좋아하니까요. CAA 시절에는 컴퓨터가 없어서 잡지 210개를 구독했습니다. 다 읽진 않고 페이지를 넘기며 헤드라인과 사진을 봤죠. 여성 잡지도 읽었는데, 스타일리스트들이 트렌드를 6개월 앞서가기 때문입니다. 그 덕분에 여배우들이나 스타일리스트들과 대화할 수 있었습니다.

폴 뉴먼을 처음 만났을 때, 그가 레이싱 카를 좋아한다는 걸 알고 3시간 동안 차 이야기만 했습니다. 그의 경력 이야기는 한마디도 안 했죠.

마이클 델이나 젠슨 황 같은 사람들은 "깨어 있는 모든 시간이 근무 시간"이라고 합니다. 당신도 책에서 그렇게 썼죠. 하지만 동시에 "10% 덜 일했어도 성공에는 지장이 없었을 것이고 훨씬 더 행복했을 것"이라고도 했습니다. 이 두 가지를 어떻게 받아들여야 할까요?

저는 금전적 목표를 위해 일하는 게 아니라 자기 계발(self-enrichment)을 위해 일합니다. 그것이 결국 경제적 산물로 이어지죠. 제가 더 현명해지고 정보를 많이 알게 되면 다른 사람들에게 조언을 줄 수 있는 사람이 됩니다.

저는 재주가 없습니다. 글도 못 쓰고 연기도 못 하고 그림도 못 그려요. 저는 사람에게 투자합니다. 벤처 캐피털리스트들이 세운 가드레일 같은 건 무시합니다. 창의적인 사람들에게는 가드레일이 없거든요.

누군가 제게 멘토가 누구였냐고 물었을 때, 없었다고 했습니다. 있었으면 좋았을 텐데요. 제가 겪은 고생을 덜어줄 수 있었을 테니까요. 그래서 저는 지금 많은 사람들의 조언자(advisor) 역할을 합니다. 친구라서, 그들에게서 배우니까, 즐거우니까, 그리고 친구들을 보호하고 싶으니까요.

저는 관계에 대해 이분법적입니다. 영화 대사처럼 모래 위에 선을 긋고 "이쪽이냐 저쪽이냐"를 따집니다. 내 편 아니면 적이죠. 저는 최고의 친구가 되어 주지만, 적이 되고 싶지는 않을 겁니다. 하지만 요즘은 적을 만들 에너지도 시간도 없어요.

비즈니스에서의 관계와 진실성 (Building Relationships and Integrity in Business)

저는 진실성과 약속을 지키는 것을 중요하게 생각합니다. CAA를 시작할 때 우리는 돈도 변호사도 없어서 계약서 없이 거래했습니다. 사람들이 약속을 지켜야 했죠. 엔터테인먼트 업계, 특히 영화와 음악 쪽은 거짓말이 많았습니다.

텔레비전은 매주 방송해야 해서 거짓말할 시간이 없었죠. CAA가 혁신적이었던 건 "거짓말하지 않기"였습니다. 모르면 "모르겠습니다. 알아보고 전화드릴게요"라고 했죠. 1974년에는 듣도 보도 못한 방식이었습니다. 우리는 모든 것을 기록했고 집요하게 후속 조치(follow-up)를 했습니다. 후속 조치만 잘해도 똑똑한 것 이상의 점수를 땁니다.

오늘 아침 6시 30분에도 딜을 진행하면서 관련된 모든 사람에게 전화를 걸어 상황을 업데이트해 줬습니다. 굳이 그럴 필요 없었을 수도 있지만, 그렇게 함으로써 모두가 소외감을 느끼지 않고 지지하게 만들었죠. 제 젊은 파트너도 그걸 보고 배웠고요.

자신감과 비판 (Confidence and Criticism)

언제부터 남들의 말을 무시할 수 있는 자신감을 얻으셨나요?

9학년 때 반장 선거에서 졌을 때입니다. 철저히 분석해서 2년 동안 준비했고, 결국 전교 부회장, 회장이 되었죠. 저는 "아무것도 안 해서 비판받지 않는 회장보다, 무언가를 하고 비판받는 회장이 되겠다"고 연설했습니다.

지금 진행 중인 딜에서도 젊은 창업자가 제게 "자신감이 넘치시네요"라고 하더군요. 저는 "전체 그림이 명확하게 보이니까요"라고 했습니다.

나폴레옹이 "식욕은 먹을수록 생긴다"고 했죠. 당신의 야망에는 끝이 없는 것 같습니다.

저는 야망이나 호기심이 끝나는 걸 원치 않습니다. 저는 샌페르난도 밸리로 돌아가는 게 죽기보다 싫었습니다. 실패는 선택지에 없었죠. 성공 아니면 죽음이었습니다.

가끔 메뉴판 가격을 먼저 보는 제 자신을 발견합니다. 돈 걱정할 필요가 없는데도요. 제 안에는 여전히 그 시절의 제가 남아있고, 그게 저를 계속 경쟁하게 하고 이기고 싶게 만듭니다.

파트너십에 대해서

1800년대 후반 프랑스 오지에서 망해가는 가족 공장을 물려받았죠. 동생은 20대 후반, 형은 30대 후반이었습니다. 그들은 거의 무일푼에서, 아니 파산 직전이었으니 마이너스에서 시작해 100년 가는 가족 왕조를 세웠습니다.

그 회사는 130년이 지난 지금도 번창하고 있고 세계 최고의 타이어 회사 중 하나입니다. 그들은 책임 분담을 통해 해냈는데, 방금 마크와 벤에 대해 말씀하신 것과 비슷합니다. 동생은 제품을 만들고 형은 제품을 팔았죠. 둘 다 각자의 분야에서 세계 최고였고 함께했습니다. 둘 다 죽을 때까지 회사를 운영했으니 40~45년 파트너십이었죠.

마크와 벤(a16z)을 보셨을 때 그들이 상호 보완적인 기술을 가졌다고 생각하신 점은 무엇인가요?

사업 파트너십의 근본적인 토대에는 서로의 비즈니스 감각에 대한 존중이 있어야 합니다. 상호 보완적인 성격이어야 하고요. 둘 다 똑같을 순 없습니다. 기질도 상호 보완적이어야 하고, 공유된 비전이 있어야 합니다. 이건 찾기 어렵습니다.
1
하지만 마크와 벤의 경우, 마크는 회사에서 일어나는 모든 일을 알지만 운영은 벤이 합니다. 그리고 마크는 그걸 아주 편하게 생각해요. 마크는 회사에 대한 본능적인 감각이 뛰어나고 벤도 마찬가지입니다.

벤은 여러 사업을 운영하고 매각해 본 경험을 바탕으로 사업을 바라봅니다. 비즈니스의 원칙, 실행 방법, 사람 다루는 법, 리더가 되는 법, 공동 창업자와 지내는 법, 비전을 뒷받침할 지적 프로세스를 갖추는 법, 그리고 비전을 펼치면서 열린 마음을 유지하는 법을 이해하는 리더를 찾기는 매우 어렵습니다.

록펠러와의 인연

저는 젊은 창업자들에게 항상 나이 든 멘토들과 시간을 보내라고 조언합니다. 록펠러가 80세라면 40세보다 두 배 똑똑한 게 아니라 10배의 경험치를 가진 셈이니까요. 모든 거래를 봤고, 모든 사람을 만났고, 세상을 관찰할 시간이 훨씬 많았으니까요.

그가 저를 워싱턴 백악관 출입기자단 만찬에 데려간 적이 있는데, 제 인생 최고의 밤 중 하나였습니다. 그의 리무진과 비행기를 타고 갔죠. 그가 방에 들어서자 모든 사람이 그를 알았습니다. 사람들이 그에게 존경을 표하러 다가왔고, 그는 누구에게나 똑같이 예의 바르게 대했습니다. 진실성이 없는 사람들에게는 아주 짧게 대했지만요. 그와 함께한 모든 점심, 저녁 식사는 대학원 수업 같았습니다.

제 '참조 프레임(Frame of Reference)' 이론입니다. 나이가 들면서 "그때 알았더라면 좋았을 텐데"라고 하는 말은 1000% 맞습니다. 수명이 길어지면 자연스럽게 더 많은 만남과 경험이 생기죠. 참조 프레임이 많을수록 결과를 미리 봤기 때문에 어려운 결정을 내리는 데 더 능숙해집니다.

https://www.youtube.com/watch?v=yhh-J0zVsik
Continuous Learning_Startup & Investment
재능을 알아보는 안목 (The Art of Spotting Talent) 당신은 분야를 막론하고 최고가 된 사람들을 연구하고, 함께 일하고, 경쟁했습니다. 그들에게서 발견한 가장 중요한 공통된 특징은 무엇인가요? 저는 성장과 최고가 되는 것에 관심이 있습니다. 거의 건강하지 않을 정도로 탁월함(excellence)에 집착하죠. 사람을 만나면 10분 안에 제 뇌가 자동으로 스캔해서 같은 분야의 사람, 다른 분야의 사람, 성격이 비슷한 사람들과 비교합니다.…
마이클 오비츠의 CAA에서 커리어를 시작한 아리 이마누엘은 UFC를 사서 키움

Q: 뛰어난 에이전트가 되는 비결은 무엇인가요?

훌륭한 클라이언트를 확보하는 것입니다. 그가 밀로스 포먼이나 알 파치노를 대변했기 때문에 사람들이 전화를 받아줬던 거죠. 저도 안목(taste)을 기르고 훌륭한 클라이언트를 영입함으로써 영향력을 키웠습니다. 초기에는 '심슨 가족'이나 'SNL' 작가들, 하버드 램푼 출신들을 영입했습니다.

Q: 당신의 업무 처리 속도와 커뮤니케이션 방식은 전설적인데, 원칙이 있나요?

A: 저는 전화기를 무기로 사용합니다. 원칙은 간단합니다. 집요한 후속 조치(Relentless Follow-up)와 과잉 소통(Overcommunication)입니다. 상대방이 답이 없으면 계속 연락해야 합니다. 그게 일이니까요. 하루에 수많은 통화를 하는데, 대통령부터 젊은 작가까지 다양합니다.

Q: 제프 베조스가 해준 조언이 있나요?

A: 네, 그는 저에게 "이제 나이도 있으니 **경기장 안에 있을 때(On the field)와 밖에 있을 때(Off the field)를 구분하라**"고 조언했습니다. 저는 항상 '경기장 안'에 있었거든요. 모든 대화에서 전략을 짜고 계산하며 살았습니다. 하지만 이제는 때때로 긴장을 풀고 순수한 호기심으로 대화하는 법을 배우고 있습니다.

Q: UFC를 인수하게 된 배경과 과정은 어땠나요?

A: 제가 UFC를 대리할 때, 시청률은 오르는데 방송권료가 너무 낮다는 걸 알았습니다. 잠재력을 보고 다나 화이트(Dana White)와 퍼티타 형제를 설득해 계약을 맺었고, 스파이크 TV와의 계약금을 1,500만 달러에서 7,500만 달러로 올리고 비디오 게임 계약도 성사시켰습니다. 나중에는 폭스(Fox)와 1억 5천만 달러 계약을 맺었죠.

이후 실버레이크(Silver Lake) 파트너 에곤 더반(Egon Durban)과 함께 IMG를 인수했고, UFC 매각 소식을 듣고 직접 인수하기로 결심했습니다. 당시 경쟁자가 많았지만 제가 방송권료 협상을 통해 레버리지를 일으킬 수 있다는 계산이 있었습니다.

Q: 인수 과정에서 가장 큰 위기는 무엇이었나요?

A: UFC를 40억 달러에 인수했는데, 루퍼트 머독이 폭스를 디즈니에 매각하면서 입찰자가 사라지는 상황이 발생했습니다. 제 계약 만료는 1년 남았고, 아무도 입찰하지 않는 절체절명의 위기였죠. 스트레스로 갑상선에 문제가 생겨 체중이 급격히 빠질 정도였습니다. 다행히 ESPN이 스트리밍 서비스(ESPN+)를 위해 콘텐츠가 필요하다는 점을 파고들어 딜을 성사시켰습니다.

Q: '파이트 아일랜드(Fight Island)'는 어떻게 탄생했나요?

A: 코로나19로 전 세계가 멈췄을 때, 다나 화이트가 경기를 강행하겠다고 했습니다. 저는 그를 지지했고, 아부다비의 파트너에게 연락해 섬 하나를 통째로 빌렸습니다. 비행기, 검역 시스템 등을 갖추고 선수들을 데려와 경기를 치렀죠. 당시 전 세계에 스포츠 경기가 하나도 없어서 시청률이 폭발했습니다.

Q: 다나 화이트의 뛰어난 점은 무엇인가요?

A: 첫째, 그는 격투기를 진심으로 사랑합니다. 둘째, 그는 두려움이 없습니다. 셋째, 그는 엄청난 도박사 기질이 있고 승부사입니다. 그는 끊임없이 일하며 이 분야를 누구보다 잘 알고 있습니다.

미디어 환경의 변화와 미래 (Future of Media & Content)

Q: 콘텐츠와 배급의 권력 구도는 어떻게 변했나요?

A: 과거에는 독립 제작사들이 콘텐츠를 만들어 방송국에 팔고, 2차, 3차 윈도우(케이블, 넷플릭스 등)를 통해 수익을 냈습니다. 하지만 지금은 작가 파업 등으로 패키지 딜이 사라지고, 메이저 스튜디오가 메이저 플랫폼에 공급하는 구조가 되었습니다. AI가 제작 비용을 획기적으로 낮출 것이고, 콘텐츠 공급은 무한해질 것입니다.

Q: 제작 비용이 0에 수렴하면 가치는 어디서 생기나요?

A: 안목(Taste)과 브랜드오래된 IP, 그리고 **라이브 스포츠**의 가치가 더욱 중요해질 것입니다. 누구나 콘텐츠를 만들 수 있게 되면 무엇이 좋은지 가려내는 안목이 핵심 경쟁력이 됩니다. 또한 드웨인 존슨 같은 스타들이 자체적인 배급 채널이 될 것입니다.

Q: AI와 라이브 이벤트의 관계는 어떻게 보시나요?

A: 저는 라이브(Live)가 AI 리스크의 해독제(Antidote)라고 믿습니다. 일론 머스크도 "라이브는 대체될 수 없다"고 했습니다. 사람들은 사회적 동물이라 모여서 경험을 공유하고 싶어 합니다. AI로 콘텐츠가 넘쳐날수록, 희소성 있는 라이브 경험의 가치는 더 올라갈 것입니다. 저는 프리즈(Frieze) 아트 페어, 테니스 대회, 음식 축제 등 전 세계적인 라이브 이벤트 포트폴리오를 구축하고 있습니다.

Q: 프리미엄 경험에 대한 수요는 어떤가요?

A: 엄청납니다. 부유한 사람들은 더 특별한 경험을 원합니다. 슈퍼볼에서 선수들과 입장하거나, UFC 계체량 무대에 서는 등 돈으로 살 수 없던 경험을 파는 비즈니스(On Location)가 성장하고 있습니다. 사람들은 단순 관람을 넘어 특별한 경험과 지위를 사고 싶어 합니다.

인물과 교훈 (People & Lessons)

Q: 에곤 더반(실버레이크 파트너)에게서 배운 점은?

A: 그는 끊임없이 배우려 하고 비판을 수용합니다. 재무적인 엔지니어링 능력이 탁월하며, 대차대조표에서 남들이 못 보는 가치를 봅니다. IMG 인수 때도 경쟁자가 따라오지 못할 압도적인 가격을 제시해 딜을 끝내버리는 전략을 배웠습니다.

Q: 형인 람 이마누엘(Rahm Emanuel)에게 배운 점은?

A: 그는 정치와 글로벌 정세에 대해 누구보다 깊이 이해하고 있습니다. 양자 관계를 넘어 다자간 관계를 꿰뚫어 보는 통찰력이 있고, 저만큼이나 집요하고 추진력이 강합니다.

Q: 당신에게 '좋은 거래(Great Deal)'란 무엇인가요?

A: 양쪽 모두 기분 좋게 느끼는 거래입니다. 때로는 춤을 추듯 조율하고, 때로는 총을 쏘듯 싸워야 합니다. 제가 한 최고의 거래는 윌리엄 모리스와의 합병이었습니다. 적대적인 문화를 가진 회사를 인수해 내부를 정리하고 실버레이크를 끌어들여 지금의 엔데버를 만들었죠.

https://youtu.be/xDuqUlZZ8Vk
Slack Founder Steward Butterfield

Q: 제품에서의 '취향(Taste)'을 어떻게 정의하시나요? 훈련될 수 있는 건가요?

A: 네, 요리사가 훈련을 통해 더 맛있는 음식을 만들 수 있듯이 취향도 훈련될 수 있습니다. 대부분의 사람들이 제품의 디테일에 신경 쓰지 않기 때문에, 여기에 투자하면 큰 경쟁 우위를 점할 수 있습니다. 제프 베조스가 "당신의 마진은 나의 기회다"라고 했듯이, 저는 "당신의 무심함(우산을 기울이지 않는 것)은 나의 기회다"라고 생각합니다.

Q: '거룩한 불만(Divine Discontent)'이라는 개념도 언급하셨는데, 어떤 의미인가요?

A: 사용자들이 제품에 익숙해지면 기대치가 올라갑니다. 그래서 유틸리티 커브의 기준선 자체가 계속 이동합니다. 끊임없이 개선하지 않으면 도태됩니다. 구글 캘린더의 시간대(Time zone) 선택 기능을 예로 들 수 있는데, 전 세계 시간대를 알파벳순으로만 나열해서 사용자가 원하는 시간대를 찾기 너무 어렵게 만들어놨습니다. 이런 사소한 불편함이 쌓이면 사용자는 감정적으로 제품을 싫어하게 됩니다. 반대로 로그인, 비밀번호 찾기 같은 기본적이지만 중요한 기능들을 지속적으로 개선하면 사용자와 긍정적인 감정적 연결을 만들 수 있습니다.

Q: '우산 기울이기(Tilting your umbrella)'라는 비유는 무엇인가요?

A: 비 오는 날 좁은 길을 걸을 때, 마주 오는 사람을 배려해 우산을 살짝 기울여주는 사람이 있고 그렇지 않은 사람이 있습니다. 대부분은 악의가 있어서가 아니라 그저 다른 사람에게 미칠 영향을 인지하지 못해서(oblivious) 그렇습니다. 제품 개발에서도 마찬가지입니다. 사용자의 불편함을 세심하게 배려하고 '우산을 기울여주는' 디테일이 쌓이면 사용자는 감정적인 연결을 느끼고 제품의 팬이 됩니다. 슬랙이 성장할 수 있었던 큰 이유 중 하나입니다.

Q: 슬랙에서 장인 정신을 발휘한 구체적인 사례가 있나요?

A:

1. 매직 링크(Magic Link): 모바일에서 복잡한 비밀번호를 입력하는 고통을 없애기 위해 이메일로 로그인 링크를 보내주는 방식을 도입했습니다.
2. 알림 설정 유도: 초기 사용자들은 메시지 알림을 못 받아서 불편해했습니다. 그래서 기본적으로 모든 알림을 켜두되, 메시지를 일정량 이상 받으면 "알림이 너무 많지 않나요? 추천 설정으로 바꾸시겠어요?"라고 물어보는 팝업을 띄웠습니다.
3. '소리치는 수탉(Shouty Rooster)': @here나 @channel 기능을 남발하는 것을 막기 위해, 많은 사람에게 알림이 갈 경우 "이 메시지는 8개 시간대에 있는 147명에게 알림을 보냅니다. 정말 보내시겠어요?"라고 묻는 수탉 이미지를 띄웠습니다.
4. 방해 금지 모드(Do Not Disturb): 관리자가 조직 전체의 기본 설정(예: 밤 10시~아침 8시 알림 끄기)을 정할 수 있게 하고, 개인이 이를 덮어쓸 수도 있게 하는 등 복잡하지만 섬세한 설정 로직을 구현했습니다.

Q: 마찰(Friction)을 줄이는 것보다 '이해(Comprehension)'를 돕는 게 더 중요하다고 하셨는데, 무슨 뜻인가요?

A: 티켓마스터에서 테일러 스위프트 티켓을 사는 것처럼 사용자의 의도가 확실하고 구체적일 때는 마찰이 있어도 어떻게든 구매합니다. 하지만 슬랙처럼 사용자가 "이게 뭐지?" 하고 호기심에 들어온 경우(의도가 낮은 경우)에는, 회원가입 절차를 빨리 끝내는 것(마찰 제거)보다 **"이 서비스가 무엇이고, 다음에 무슨 일이 일어날지"를 이해시키는 것(Comprehension)**이 훨씬 중요합니다.

클릭 수를 줄이는 것만이 능사가 아닙니다. 사용자가 "생각하지 않게(Don't Make Me Think)" 만드는 것이 핵심입니다. 클릭을 한 번 더 하더라도 각 단계가 명확하고 쉬우면 사용자는 훨씬 편안함을 느낍니다. 반대로 한 화면에 모든 걸 다 때려 박아서 선택장애를 일으키면 그게 더 나쁜 경험입니다.

Q: 구체적인 예시가 있나요?

A: 우버(Uber)의 초기 앱은 "어디로 가시나요?" 하나만 물어보고 나머지 모든 기능은 '기타' 메뉴에 넣었습니다. 사용자의 주된 의도를 정확히 파악하고 나머지를 숨겨서 고민을 없앤 훌륭한 예입니다. 반면, 아이폰 알람 설정의 '수면' 기능은 도대체 뭘 하는 기능인지 알 수가 없어서 대부분의 사용자가 쓰지 않습니다.

조직과 리더십 (Organization & Leadership)

Q: '파킨슨의 법칙(Parkinson's Law)'이 조직 운영에 주는 교훈은 무엇인가요?

A: "일은 그 완수를 위해 사용할 수 있는 시간을 채울 때까지 팽창한다"는 법칙입니다. 조직이 커지면 관리자가 늘어나고, 그들은 또 부하 직원을 뽑으려 합니다. 악의가 있어서가 아니라 조직 내에서 영향력을 키우기 위한 자연스러운 본능입니다. 문제는 이로 인해 '초현실적인 업무 유사 활동(Hyper-realistic work-like activities)'이 늘어난다는 점입니다.

Q: '초현실적인 업무 유사 활동'이란 무엇인가요?

A: 회의를 위한 회의, 보고서를 위한 보고서처럼 겉보기엔 진짜 일 같지만 실제로는 가치를 창출하지 않는 활동입니다. 리더는 구성원들이 이런 가짜 일에 빠지지 않고, '가치가 검증된 진짜 일(Known Valuable Work)'에 집중할 수 있도록 끊임없이 우선순위를 명확히 해줘야 합니다.

Q: "우리는 안장을 팔지 않습니다(We Don't Sell Saddles Here)"라는 메모는 어떤 배경에서 나왔나요?

A: 슬랙 출시 전, 8명 정도의 직원들에게 보낸 내부 메모입니다. 안장(제품 기능) 자체를 파는 게 아니라, 승마의 즐거움(고객이 얻을 결과와 가치)을 팔아야 한다는 내용입니다. 기능 나열이 아니라, 이 제품이 고객의 삶을 어떻게 변화시킬지를 커뮤니케이션해야 한다는 점을 강조했습니다.

Q: 피벗(Pivot)에 대한 조언을 해주신다면?

A: 피벗은 굴욕적이고 고통스러운 과정입니다. 하지만 감정을 배제하고 차갑고 이성적으로 판단해야 합니다. "우리가 가진 모든 합리적인 아이디어를 다 써봤는가?"를 자문해보세요. 글리치(게임)에서 슬랙으로 피벗할 때도, 게임을 살릴 수 있는 모든 방법을 다 써봤지만 안 된다는 결론에 도달했기에 미련 없이 전환할 수 있었습니다.

관대함과 가치 (Generosity & Value)

Q: 당신은 직원과 고객에게 매우 관대한(Generous) 리더로 알려져 있습니다. 의도적인 전략인가요, 천성인가요?

A: 천성적인 부분도 있지만, 게임 이론의 '죄수의 딜레마' 관점에서도 관대함은 유리한 전략입니다. 내가 먼저 협력(관대함)을 보여주면 상대방도 협력할 가능성이 높아지니까요.

슬랙에서는 "장기적으로 우리 성공의 척도는 고객을 위해 창출한 가치의 총량이다"라는 문구를 전사가 외치게 했습니다. 고객을 속이거나 단기 이익을 챙기는 건 결국 망하는 길입니다. 실제로 대규모 장애가 발생했을 때 약관보다 훨씬 큰 보상을 선제적으로 제공하기도 했습니다. 물론 상장 후에는 재무적 영향 때문에 약관을 수정해야 했지만요.

Q: 마지막으로 '주인의 망상(Owner's Delusion)'이란 무엇인가요?

A: 식당 주인이 자기 웹사이트에 감성적인 사진과 음악을 넣고 싶어 하는 것과 같습니다. 정작 고객은 주소, 전화번호, 메뉴, 영업시간만 빨리 알고 싶어 하거든요. 주인이 자기 제품에 너무 심취해서 고객의 실제 상황(급하고, 바쁘고, 정신없는 상태)을 망각하는 현상입니다. 항상 "내가 진짜 바쁜 고객이라면 이게 편할까?"를 자문해야 합니다.

https://youtu.be/kLe-zy5r0Mk
'AI 맨해튼 프로젝트’ 기술 혁명에서 승리한 자가 다음 패권을 지배한다

'AI 맨해튼 프로젝트': 2차 대전 승리의 주역인 맨해튼 프로젝트에 비견되는 시급성과 규모로 국가적 AI 역량을 총동원.
목표: AI를 통한 과학적 발견 가속화, 경제 성장, 국가 안보 강화, 에너지 패권 확보.
제네시스 미션(Genesis Mission): 연방 정부의 방대한 데이터와 민관의 연구 자원을 통합하여 AI 기반 과학 혁신을 추진하는 국가 미션 출범.

주무 부처: 에너지부(DOE)가 미션의 이행 및 자원 통합을 책임짐.
총괄 리더십: 대통령 과학기술 보좌관(APST)이 국가과학기술위원회(NSTC)를 통해 범정부적 조정 및 지휘.

플랫폼 구축: 슈퍼컴퓨터, AI 모델링 도구, 파운데이션 모델, 연방 데이터셋 등을 통합 제공하는 보안 플랫폼 구축.
주요 일정:
90일 내: 가용 자원(컴퓨팅, 네트워크 등) 식별.
120일 내: 초기 데이터 및 모델 자산 식별 및 통합 계획 수립.
240일 내: AI 주도 실험/제조를 위한 로봇 연구소 역량 검토.
270일 내: 플랫폼 초기 운용 능력 시연.

6대 우선 분야: ①첨단 제조, ②생명공학, ③핵심 광물, ④원자력(핵분열/핵융합), ⑤양자 과학, ⑥반도체.
선정 절차: 60일 내 20개 이상의 과제 식별 후 지속적으로 확장 및 매년 업데이트.

https://www.whitehouse.gov/presidential-actions/2025/11/launching-the-genesis-mission/
1. 현대 삶의 가장 위험한 망상

• 진정한 편안함은 지능에서 온다: 대부분의 사람들은 편안함이 소득에서 온다고 생각하지만, 이는 위험한 망상입니다. 돈을 아무리 많이 벌어도 스스로를 통제하지 못하면 결국 파산합니다.
• 어리석음을 능가하는 소득은 없다: 나쁜 소비 습관을 더 높은 수입으로 고칠 수는 없으며, 단지 실수만 더 키우게 될 뿐입니다.
• 절제는 해방이다: 소득 이하로 사는 것은 박탈이 아니라 해방입니다. 지출이 낮으면 시간을 통제하고, 어리석은 상황에서 벗어날 수 있는 능력, 즉 진정한 자유를 얻게 됩니다.
• 자유보다 인정을 원하는 사람들: 사람들은 부유하게 보이는 것을 부유하게 사는 것보다 선호하며, 남들에게 깊은 인상을 주기 위해 수십 년의 평화를 맞바꿉니다.

2. 월 지출의 쳇바퀴에서 벗어나기
• 조용한 덫, 의무의 공장: 현대 생활은 의무를 만들어내는 공장과 같습니다. '합리적'이라고 느껴지는 모든 추가 고정 지출의 합이 결국 재정적 파멸을 가져올 수 있습니다.
• 승리하는 유일한 방법은 멈추는 것: 이 소비의 쳇바퀴에서 이기는 유일한 방법은 내리는 것입니다. 이는 의도적인 단순함(Clarity)을 선택함으로써 가능합니다.
• 안전 마진 구축: 부자들은 안전 마진(Margin of Safety)을 만듭니다. 이를 구축하는 첫 번째 방법은 더 많이 버는 것이 아니라 빚을 덜 지는 것입니다. 지출이 낮으면 인내력이 높아지고, 삶이 어려워질 때 거절할 수 있는 능력이 생깁니다.

3. 지출을 통제하고 부를 축적하는 원칙
• 예산 관리는 자존감이다: 예산 관리는 미래의 자신에게 "내가 당신을 망치지 않을 것"이라고 말하는 자존감입니다.
• 명확한 비전이 절약을 가능하게 한다: 지출을 측정하려 하지 않으면 고칠 수 없습니다. 수입에서 지출을 뺀 간단한 리스트를 만들고, 일단 명확하게 보이면 잔혹할 정도로 불필요한 것을 잘라낼 수 있습니다.
• 잊어버린 구독을 취소하고, 아직 작동하는 물건을 업그레이드하지 마십시오.
• 필요하지 않은 물건에 대한 할인은 여전히 낭비입니다.
• 부를 이루는 간단한 원칙: 덜 쓰고, 나머지를 투자하고, 오랫동안 반복하는 것이 부의 전부입니다. 이는 훈련(Discipline)을 필요로 하기 때문에 쉽지 않을 뿐입니다.
• 복리의 마법: 복리는 세계 8대 불가사의입니다. 수입의 절반으로 생활하고 나머지를 투자하는 규칙을 평생 지키면, 복리로 쌓인 작은 흑자가 결국 큰 월급을 탕진한 사람을 이깁니다.

4. 예상치 못한 돈을 대하는 태도
• 재정적 성숙도를 보여주는 척도: 보너스나 환급금 등 예상치 못한 돈을 처리하는 방식이 당신의 재정적 성숙도를 보여줍니다. 계획 없이 낭비하면 충동적인 것이고, 계획하면 미래를 건설하는 것입니다.
• 조용히 쌓이는 돈 vs. 소란스럽게 사라지는 돈: 성공을 맛본 사람들은 즉시 이를 광고하고 싶어 합니다. 조용한 돈은 복리로 쌓이지만, 시끄러운 돈은 결국 사라집니다.

5. 합리적인 소비와 조사(Research)의 중요성
• 24시간 규칙: 충동적인 구매를 막기 위한 간단한 규칙은 원하는 물건을 그날 사지 않고 24시간을 기다리는 것입니다. 대부분의 욕망은 이성보다 빨리 증발합니다.
• 자신에게 투자하라: 가치가 복리로 쌓이는 교육, 건강, 관계에 투자하십시오. 이 외의 모든 것은 손대는 순간 감가상각됩니다.
• 무지함은 값비싼 사치: 사람들은 시간을 아끼려 하지만, 지능을 편의와 맞바꾸는 것은 돈에 있어서 매우 값비싼 사치입니다.
• 구매는 투자 결정이다: 모든 구매는 투자 결정이며, 가치를 이해하지 못한다면 도박하는 것과 같습니다. 조사를 게을리하면 무지에 대해 돈과 후회로 두 번 비용을 지불합니다.

6. 유지 관리(Maintenance)의 철학
• 진정한 부는 보존에 있다: 진정한 부는 축적이 아니라, 이미 가진 것을 살아있게 유지하는 보존에 관한 것입니다.
• 예방은 수리보다 저렴하다: 예방적 관리는 삶의 모든 영역에서 수리보다 훨씬 저렴합니다.
• 태만은 이자보다 빠르게 복리로 쌓인다: 당신의 일은 끊임없이 새로운 것을 쫓는 것이 아니라, 이미 작동하고 있는 것들이 제 기능을 유지하도록 확실히 하는 것입니다.

7. 합리적인 삶의 핵심: 우선순위
• 빼기에서 평화가 온다: 편안한 삶은 더하는 것이 아니라 빼는 것으로 만들어집니다. 불필요한 것을 빼고, 부러움을 빼고, 소음을 빼십시오. 남는 것이 바로 당신의 평화입니다.
• 당신의 나침반, '가치 있는 다섯 가지': 당신의 삶을 진정으로 개선하는 다섯 가지를 정하십시오. 이 외의 모든 것은 방해 요소입니다.
• 가장 부유한 사람: 세상에서 가장 부유한 사람은 가장 많이 가진 사람이 아니라, 완전히 평온하게 "나는 이미 충분히 가지고 있다"고 말할 수 있는 사람입니다. 그것이 자유이고, 부이며, 합리적인 삶입니다.

https://youtu.be/1ET-_h_y8Ek?si=lcxLsCGZa2nHh42d
4👍2
Frontier Labs들이 거대한 강화학습 체육관과 큰 컴퓨터로 새로운 기능들을 제공하는 것 만으로도 사회에 엄청 큰 변화가 생기고 있다. 12년부터 Ilya는 OpenAI에서 딥러닝의 교주로 Scaling이 돌파구라는 것을 알아냈고 Scaling의 시대가 왔다. 모두가 같은 레이스를 할 때 Ilya는 스케일링 Law가 끝나는 새로운 세상을 보고 있다. 일리아도 안드레도 인간이 학습 혹은 진화로 가지게 된 특별한 능력 (계속 학습할 수 있는 능력, 생존을 위한 가치 함수)을 반영한 시스템은 아직 만들어지지 않았다고 보고 그 무언가를 만들고 있다.

모델의 불균형성

모델들이 경제적 영향력에 비해 겉보기엔 더 똑똑해 보이는 것 같은데요. 평가(evals)에서는 그렇게 잘하는데, 이 사실을 어떻게 받아들여야 할까요?

예를 들어 '바이브 코딩(vibe coding)'으로 뭔가 한다고 칩시다. 버그가 생겼어요. 모델에게 "이 버그 좀 고쳐줄래?"라고 합니다. 모델은 "어머 세상에, 당신 말이 딱 맞아요. 버그가 있네요. 고칠게요."라고 하고선 두 번째 버그를 만듭니다. 그래서 "새로운 두 번째 버그가 생겼어"라고 하면, "어머 세상에, 제가 왜 그랬죠? 또 맞으셨어요"라며 다시 첫 번째 버그를 가져옵니다. 이 둘 사이를 계속 오가죠. 어떻게 이게 가능할까요?

두 가지 가능한 설명이 있습니다. 좀 더 엉뚱한 설명은 강화 학습(RL) 훈련이 모델을 너무 외골수(single-minded)로 만들고 시야를 좁게 만들어서, 어떤 면에서는 똑똑해지지만 기본적이고 뻔한 것들을 인지하지 못하게 만든다는 겁니다.

하지만 다른 설명도 있습니다. 예전에 사전 학습(pre-training)을 할 때는 '어떤 데이터로 훈련할까'에 대한 답이 정해져 있었습니다. 답은 '모든 것'이었으니까요. 사전 학습을 할 때는 모든 데이터가 필요하죠. 그래서 이 데이터냐 저 데이터냐 고민할 필요가 없습니다. 하지만 RL 훈련을 할 때는 생각을 해야 합니다. "이 작업을 위해 이런 RL을, 저 작업을 위해 저런 RL을 해야지"라고요. 듣기로는 모든 회사에 새로운 RL 환경을 만들어 훈련 믹스에 추가하는 팀들이 있다고 합니다. 문제는 그게 뭐냐는 겁니다. 자유도가 너무 높고 만들 수 있는 환경이 너무 다양하죠.

여기서 무심코 행해지는 일 중 하나가 사람들이 '평가(evals)'에서 영감을 얻는 것입니다. "출시 때 모델 성능이 정말 좋았으면 좋겠어. 평가 점수가 잘 나오게 하려면 어떤 RL 훈련이 도움이 될까?"라고 생각하는 거죠. 저는 이런 일이 실제로 일어나고 있고, 이것이 많은 것을 설명해 줄 수 있다고 봅니다.

이것이 모델의 실제 일반화 능력 부족과 결합되면, 평가 점수와 실제 성능 사이의 괴리, 즉 우리가 오늘날 제대로 이해조차 못 하고 있는 이 현상을 설명할 수 있습니다.

Q: 저는 '진짜 보상 해킹(reward hacking)'을 하는 주체가 평가 지표에 너무 집중한 인간 연구자들이라는 아이디어가 마음에 드네요.하나는, 단순히 코딩 대회에서 초인적인 능력을 발휘한다고 해서 모델이 자동으로 코드를 개선하는 데 있어 더 좋은 취향과 판단력을 갖게 되는 건 아니라는 점입니다. 그렇다면 단순히 코딩 대회 성적만 테스트할 게 아니라, X나 Y, Z 같은 애플리케이션을 최적으로 만드는 능력도 테스트할 수 있도록 환경의 종류를 확장해야 합니다. 다른 하나는, 아마 당신이 암시하는 것일 수도 있는데, "애초에 왜 코딩 대회에서 초인적이 되는 것이 전반적으로 더 감각 있는 프로그래머가 되는 것으로 이어지지 않는가?"라고 묻는 것입니다. 어쩌면 환경의 양과 다양성을 계속 쌓을 게 아니라, 한 환경에서 배워서 다른 무언가에서 성능을 향상시키는 접근 방식을 찾아야 할지도 모릅니다.

A: 인간에 빗대어 도움이 될 만한 비유가 있습니다. 언급하신 경쟁 프로그래밍(Competitive Programming)을 예로 들어보죠. 두 학생이 있다고 칩시다. 한 명은 최고의 경쟁 프로그래머가 되기로 결심하고 그 분야에 1만 시간을 투자합니다. 모든 문제를 풀고, 증명 기법을 암기하고, 모든 알고리즘을 빠르고 정확하게 구현하는 데 매우 숙련됩니다. 그렇게 해서 최고 중 하나가 되었습니다. 두 번째 학생은 "오, 경쟁 프로그래밍 멋지네" 하고 100시간 정도만, 훨씬 적게 연습했지만 꽤 잘합니다. 나중에 커리어에서 누가 더 잘할까요?

두 번째 학생이겠죠.

맞습니다. 제 생각엔 지금 벌어지고 있는 일이 기본적으로 그렇습니다. 모델들은 첫 번째 학생과 훨씬 비슷하지만, 그 정도가 더 심합니다. 우리는 "모델이 경쟁 프로그래밍을 잘해야 해. 그러니 모든 경쟁 프로그래밍 문제를 다 가져와. 그리고 데이터 증강(data augmentation)을 해서 더 많은 문제를 만들고 훈련시켜."라고 합니다. 그러면 훌륭한 경쟁 프로그래머가 탄생하죠.

이 비유를 드니 더 직관적이네요. 네, 그렇게 훈련받았다면 모든 알고리즘과 증명 기법이 손끝에 있겠죠. 그리고 이런 수준의 준비 방식으로는 다른 분야로 반드시 일반화되지 않을 것이라는 점도 더 직관적으로 다가옵니다.

Q: 그렇다면 두 번째 학생이 100시간의 미세 조정(fine-tuning)을 하기 전에 하고 있는 것에 해당하는 비유는 무엇인가요?

그들에게는 "그것(it)"이 있습니다. "It" 팩터죠. 제가 학부생일 때 같이 공부하던 학생 중에 그런 친구가 있어서 실제로 존재한다는 걸 압니다.

Q: "그것"을 사전 학습(pre-training)이 하는 역할과 구별하는 게 흥미롭네요. 아까 사전 학습 때는 데이터를 고를 필요가 없다고 하신 말씀을 이해하는 한 가지 방법은, 그것이 사실 1만 시간의 연습과 다르지 않다고 보는 겁니다. 단지 그 1만 시간의 연습이 사전 학습 분포 어딘가에 이미 들어있기 때문에 공짜로 얻는다는 점만 다를 뿐이죠. 하지만 당신은 사전 학습에서 얻는 일반화가 실제로는 그리 크지 않다고 시사하는 건가요? 사전 학습에 데이터가 엄청나게 많지만, 반드시 RL보다 더 나은 일반화를 보장하는 건 아니라고요?

A: 사전 학습의 주된 강점은 A: 양이 엄청나게 많다는 것, B: 어떤 데이터를 넣을지 깊게 고민할 필요가 없다는 것입니다. 매우 자연스러운 데이터이고, 사람들이 하는 많은 것들, 즉 사람들의 생각과 특징들이 포함되어 있습니다. 사람들이 텍스트로 투영한 전 세계와 같은 것이고, 사전 학습은 방대한 데이터를 사용해 그것을 포착하려고 합니다.

사전 학습은 추론하기가 매우 어렵습니다. 모델이 사전 학습 데이터에 의존하는 방식을 이해하기 너무 어렵기 때문입니다. 모델이 실수를 할 때마다, 우연히 사전 학습 데이터에 의해 덜 지지받았기 때문일까요? "사전 학습에 의한 지지"라는 말도 좀 모호한 표현이긴 합니다만. 이 부분에 대해 더 유용한 말을 덧붙일 수 있을지 모르겠네요.
로봇에서도 사람처럼 움직이기 위해서 바로 다음 턴이 아니라 청크로 묶어서 학습시켰더니 자연스럽게 움직이는 연구(ACT)가 있었는데 강화학습 과정에 나오는 궤적을 학습에 사용한다면 그것이 사람이 가진 가치함수를 모방할 수 있지 않을까? 이전에 안드레는 이 과정이 굉장히 복잡하고 어렵다고 이야기했었는데, 일리아는 어렵지만 딥러닝이 못할 건 없다라는 생각을 하고 있고, SSI에서 이 방향의 무언가를 하고 있지 않을까?

감정과 가치함수

Q: 사전 학습에 대한 인간의 유추 대상(analog)은 없다고 생각하시나요? 사람들이 제안한 유추 대상들이 있습니다. 하나는 경제적으로 생산적이지 않지만 세상을 더 잘 이해하게 되는 인간의 첫 18년, 15년, 혹은 13년을 생각하는 것입니다. 다른 하나는 30억 년 동안의 진화 과정이 탐색을 수행하고 그 결과로 인간의 생애라는 인스턴스가 나온다고 보는 것입니다. 이 중 어느 것이 사전 학습과 유사하다고 보시나요? 사전 학습이 아니라면 인간의 평생 학습은 무엇과 같다고 생각하십니까?

A: 둘 다 사전 학습과 어느 정도 유사점이 있고, 사전 학습이 이 두 가지 역할을 모두 수행하려고 한다고 생각합니다. 하지만 큰 차이점들도 있습니다. 사전 학습 데이터의 양은 정말, 정말 엄청납니다.

그런데 인간은 15년 동안 사전 학습 데이터의 아주 작은 부분만 보고도 무언가 훨씬 덜 알긴 하지만, 아는 것에 대해서는 훨씬 더 깊이 있게 압니다. 이미 그 나이에는 우리 AI들이 저지르는 실수를 하지 않죠.

또 다른 점이 있습니다. 진화와 비슷한가? 라고 묻는다면 답은 '아마도'입니다. 하지만 이 경우엔 진화가 더 우위에 있을 수 있습니다.

제가 읽은 사례가 하나 기억나는데요. 신경과학자들이 뇌에 대해 배우는 방법 중 하나는 뇌의 특정 부위가 손상된 사람들을 연구하는 것입니다. 상상할 수 있는 가장 기이한 증상을 가진 사람들이 있는데, 정말 흥미롭습니다. 관련 있는 사례 하나가 떠오릅니다. 어떤 뇌 손상, 뇌졸중이나 사고로 감정 처리 능력을 잃은 사람에 대한 글을 읽었습니다. 그래서 그는 아무런 감정도 느끼지 못하게 됐죠.

그는 여전히 말을 아주 잘하고 작은 퍼즐도 풀 수 있고 테스트상으로는 멀쩡해 보였습니다. 하지만 감정이 없었습니다. 슬픔도, 분노도, 활기도 느끼지 못했죠. 그런데 그는 어떤 결정을 내리는 데 있어 극도로 무능해졌습니다. 어떤 양말을 신을지 결정하는 데 몇 시간이 걸리고, 아주 형편없는 재무 결정을 내리게 되었습니다.

이것은 우리의 타고난 감정이 우리가 생존 가능한 에이전트(viable agent)가 되는 데 어떤 역할을 하는지 말해줍니다. 당신의 사전 학습 질문과 연결하자면, 만약 사전 학습에서 모든 것을 뽑아내는 데 충분히 능숙하다면 그런 것도 얻을 수 있을지도 모릅니다. 하지만 그건... 글쎄요, 사전 학습에서 얻을 수 있을 수도 있고 없을 수도 있습니다.

Q: 그 "무언가"가 무엇인가요? 단순히 감정 그 자체는 아닐 테고요. 어떤 결정에 대한 최종 보상이 무엇이어야 하는지 알려주는, 거의 가치 함수(value function) 같은 것 같아 보이는데요.

네, 그것이 사전 학습에서 암묵적으로 나올 것이라고 생각하지 않으시나요? 나올 수도 있다고 생각합니다. 단지 100% 확실하지 않다는 것뿐입니다.

Q: 하지만 그게 뭐죠? 감정을 어떻게 생각하십니까? 감정에 대한 ML(기계학습)의 유추 대상은 무엇입니까?

일종의 가치 함수 같은 것이어야겠죠. 하지만 훌륭한 ML 유추 대상은 없다고 봅니다. 지금 당장은 사람들이 하는 작업에서 가치 함수가 아주 두드러진 역할을 하지 않기 때문입니다.

Q: 청중을 위해 가치 함수가 무엇인지 정의해 주실 수 있나요?

물론입니다. 기꺼이 설명해 드리죠. 사람들이 강화 학습(RL)을 할 때, 지금 RL이 수행되는 방식, 즉 순진하게(naively) 훈련하는 방식은 이렇습니다. 신경망에 문제를 주고 "풀어봐"라고 합니다. 모델은 수천, 수십만 번의 행동이나 생각 같은 것을 거쳐 해결책을 내놓습니다. 그 해결책이 채점됩니다. 그리고 그 점수는 궤적(trajectory)에 있는 모든 단일 행동에 훈련 신호를 주는 데 사용됩니다.

즉, 해결하는 데 오랜 시간이 걸리는 작업을 훈련한다면, 제안된 해결책이 나올 때까지는 아무런 학습도 일어나지 않는다는 뜻입니다. 이것이 강화 학습이 순진하게 수행되는 방식이고, o1이나 R1이 표면적으로 수행되는 방식입니다.

가치 함수는 "내가 항상은 아니지만 가끔은 네가 잘하고 있는지 못하고 있는지 말해줄 수 있어"라고 하는 것과 같습니다. 가치 함수의 개념은 어떤 영역에서는 다른 영역보다 더 유용합니다. 예를 들어 체스를 둘 때 말을 잃으면, "망했네"라고 알 수 있죠. 게임이 끝날 때까지 갈 필요 없이 방금 한 행동이 나빴고, 그 이전의 행동들도 나빴다는 걸 알 수 있습니다. 가치 함수는 맨 끝까지 기다리는 시간을 단축(short-circuit)시켜 줍니다.

수학이나 프로그래밍 같은 것을 한다고 가정해 봅시다. 특정 해결책이나 방향을 탐색하고 있습니다. 1000단계를 생각한 끝에 이 방향은 가망이 없다고 결론 내렸습니다. 이 결론을 내리자마자, 당신은 이미 1000 타임스텝 전에 이 길을 가기로 결정했을 때에 대한 보상 신호를 얻을 수 있습니다. 실제로 제안된 해결책을 내놓기 훨씬 전에 "다음번엔 비슷한 상황에서 이 길로 가지 말아야지"라고 말할 수 있는 거죠.

Q: 딥시크(DeepSeek) R1 논문에서는 궤적의 공간이 너무 넓어서 중간 궤적에서 가치로 매핑하는 것을 학습하기 어려울 수 있다고 했습니다. 또 코딩에서는 잘못된 아이디어를 냈다가 돌아가서 고치는 과정이 있기도 하고요. 이건 딥러닝에 대한 믿음이 너무 부족한 소리처럼 들리는데요.

물론 어려울 수는 있지만 딥러닝이 못 할 건 없습니다. 제 예상은 가치 함수가 유용해야 한다는 것이고, 이미 사용되고 있지 않다면 앞으로 사용될 것이라 전적으로 기대합니다.

제가 감정 중추가 손상된 사람 이야기를 통해 암시하려던 것은, 인**간의 가치 함수가 진화에 의해 하드코딩된 감정에 의해 중요한 방식으로 조절된다는 것을 시사한다는 점입니다. 그리고 아마도 그것이 사람들이 세상에서 효과적으로 활동하는 데 중요할 것입니다.**

Q: 그게 제가 여쭤보려던 겁니다. 감정이나 가치 함수에 대해 정말 흥미로운 점은, 이해하기엔 꽤 단순하면서도 효용이 엄청나다는 것입니다.

A: 두 가지 답변이 있습니다. 우리가 배우는 것들이나 우리가 이야기하는 AI에 비해 감정이 상대적으로 단순하다는 점에는 동의합니다. 심지어 너무 단순해서 인간이 이해할 수 있는 방식으로 지도화(map out)할 수도 있을 겁니다. 그렇게 하면 멋지겠죠.

하지만 효용 측면에서는 '복잡성-견고성 트레이드오프(complexity-robustness tradeoff)'라는 게 있다고 봅니다. 복잡한 것은 매우 유용할 수 있지만, 단순한 것은 매우 광범위한 상황에서 유용합니다.

우리가 보는 현상을 해석하는 한 가지 방법은, 우리가 포유류 조상으로부터 진화한 감정을 가지고 있고, 호미니드(hominid) 시절에 아주 조금 미세 조정되었다는 것입니다. 포유류에게는 없을 수도 있는 사회적 감정들이 꽤 있지만, 그리 정교하진 않습니다. 그리고 정교하지 않기 때문에 우리가 살던 곳과 매우 다른 이 세상에서도 우리에게 그렇게 잘 봉사하는 것입니다.

물론 실수도 합니다. 예를 들어 배고픔이 감정으로 쳐주는지 논란이 있겠지만, 풍요로운 음식으로 가득 찬 이 세상에서 배고픔이라는 직관적인 느낌은 우리를 올바르게 인도하지 못하고 있습니다.
확장의 시대에서 연구의 시대로

Q: 사람들은 데이터 확장, 파라미터 확장, 컴퓨팅 확장에 대해 이야기해 왔습니다. 확장에 대해 생각하는 더 일반적인 방법이 있을까요? 다른 확장 축은 무엇입니까?

A: 사실일 것 같은 관점이 하나 있습니다. 예전 ML이 작동하던 방식은 사람들이 **그냥 이것저것 만지작거리며(tinker) 흥미로운 결과를 얻으려던 것**이었습니다. 과거엔 그랬죠. 그러다 **'확장(scaling)'의 통찰이 도래**했습니다. 스케일링 법칙(Scaling Laws), GPT-3가 나오면서 갑자기 모두가 확장을 해야 한다는 걸 깨달았습니다.
이건 언어가 사고에 영향을 미치는 예입니다. "확장"은 단 한 단어지만 사람들에게 무엇을 해야 할지 알려주기 때문에 매우 강력한 단어입니다. 사람들은 "확장을 시도해 보자"고 하죠. 그래서 "무엇을 확장하는가?"라고 묻습니다.

확장할 대상은 **'사전 학습'**이었습니다. 그것은 특정한 확장 레시피였죠. 사전 학습의 큰 돌파구는 이 레시피가 좋다는 것을 깨달은 데 있습니다. "이봐, 특정 크기의 신경망에 컴퓨팅과 데이터를 섞으면 결과가 나와. 레시피를 키우기만 하면 더 좋아질 거란 걸 알잖아."라고 하는 거죠.

이건 회사 입장에서도 아주 좋습니다. 자원을 투자할 수 있는 매우 리스크 낮은 방법을 제공하니까요. 연구에 자원을 투자하는 건 훨씬 더 어렵습니다. "연구자들아 가서 연구해서 뭔가 만들어와"라고 하는 것과, "데이터 더 가져오고 컴퓨팅 더 늘려"라고 하는 것의 차이죠. 사전 학습에서는 무언가 나온다는 걸 아니까요.

실제로 트위터 등에서 말하는 걸 보면 제미나이(Gemini) 같은 경우 사전 학습에서 더 많은 것을 얻는 방법을 찾은 것 같기도 합니다. 하지만 언젠가는 사전 학습 데이터가 고갈될 겁니다. 데이터는 명백히 유한하니까요. 그다음엔 무엇을 합니까? 이전에 했던 것과 다른 획기적인 사전 학습을 하거나, RL을 하거나, 아니면 다른 무언가를 해야겠죠.

하지만 이제 컴퓨팅 규모가 커졌습니다. 아주 커졌죠. 어떤 의미에서는 다시 '연구의 시대(age of research)'로 돌아왔습니다.

다르게 표현해 보자면, 2**012년부터 2020년까지는 연구의 시대였습니다. 2020년부터 2025년까지는 확장의 시대였죠(오차 범위는 있겠지만). 사람들은 "이거 놀라워. 더 확장해. 계속 확장해."라고 했으니까요.** '확장'이라는 단어 하나였죠.

하지만 이제 규모가 너무 큽니다. 정말로 "규모가 크지만 100배 더 늘리면 모든 게 달라질 거야"라고 믿나요? 물론 다르긴 하겠지만, "100배 늘리면 모든 게 변혁될 거야"라는 믿음이 진짜일까요? 저는 그렇게 생각하지 않습니다. 그래서 거대한 컴퓨터를 가진 채 다시 연구의 시대로 돌아온 겁니다.

Q: 아주 흥미로운 표현이네요. 그럼 방금 제기하신 질문을 다시 드려보겠습니다. 우리는 무엇을 확장하고 있으며, 레시피를 갖는다는 건 무엇을 의미할까요? 사전 학습에는 데이터나 컴퓨팅, 파라미터와 손실(loss) 사이에 물리학 법칙 같은 깔끔한 관계가 있었습니다. 우리가 찾아야 할 관계는 어떤 종류이며, 이 새로운 레시피는 어떤 모습일까요?

A: 우리는 이미 한 종류의 확장(사전 학습)에서 다른 종류의 확장(RL)으로의 전환을 목격했습니다. 이제 사람들은 RL을 확장하고 있습니다. 트위터 등에서 들리는 바에 따르면, **이 시점에서는 RL이 사전 학습보다 더 많은 컴퓨팅을 소비**한다고 합니다. RL은 꽤 많은 컴퓨팅을 소비할 수 있거든요. 아주 긴 롤아웃(rollout)을 하니까요. 그리고 롤아웃 당 얻는 학습량은 상대적으로 적어서 정말 많은 컴퓨팅을 쓸 수 있습니다.

저는 이걸 확장이라고 부르지 않겠습니다. 저는 "뭐 하고 있어? 네가 하는 일이 가장 생산적인 일이야? 컴퓨팅을 더 생산적으로 쓸 방법은 없어?"**라고 묻고 싶습니다. 아까 가치 함수 이야기를 했었죠. 사**람들이 가치 함수를 잘 다루게 되면 자원을 더 생산적으로 쓰게 될 겁니다.

만약 모델을 훈련하는 완전히 다른 방법을 찾는다면, "이게 확장인가 아니면 그냥 자원을 쓰는 건가?"라고 할 수 있겠죠. 좀 모호해집니다. 예전 연구의 시대에는 "이거 해보자, 저거 해보자. 오, 흥미로운 게 나왔네" 했던 것처럼, 저는 그런 시대로의 회귀가 있을 것이라고 생각합니다.

Q: 다시 연구의 시대로 돌아왔다면, 한 걸음 물러나서 우리가 가장 깊이 생각해야 할 레시피의 부분은 무엇인가요? 가치 함수라고 하면 사람들은 이미 현재 레시피에서 LLM-as-a-Judge 같은 걸 시도하고 있습니다. 하지만 당신은 훨씬 더 근본적인 것을 염두에 두고 있는 것 같습니다. 사전 학습의 끝에 단계를 더 추가하는 게 아니라 사전 학습 자체를 재고해야 할까요?

A: 가치 함수 논의는 흥미로웠습니다. 가치 함수는 RL을 더 효율적으로 만들어 줄 것이고 그게 차이를 만들겠지만, 가치 함수로 할 수 있는 건 없어도 (더 느리겠지만) 할 수는 있다는 점을 강조하고 싶습니다.

제가 가장 근본적이라고 생각하는 것은, 이 모델들이 인간보다 극적으로 일반화를 못한다는 점입니다. 아주 명백하죠. 이게 매우 근본적인 문제 같습니다.
왜 인간이 모델보다 일반화를 더 잘하는가 (Why humans generalize better than models)

Q: 그러니까 핵심은 일반화(generalization)군요. 두 가지 하위 질문이 있습니다. 하나는 표본 효율성(sample efficiency)에 관한 것입니다. 왜 모델은 인간보다 배우는 데 훨씬 더 많은 데이터가 필요할까요? 두 번째는 데이터 양과 별개로, 왜 모델에게 우리가 원하는 것을 가르치기가 인간보다 훨씬 어려울까요? 인간의 경우, 검증 가능한 보상이 반드시 필요하지 않습니다. 당신이 지금 연구자들을 멘토링하고 있다고 칩시다. 대화를 나누고, 코드를 보여주고, 생각하는 방식을 보여주면 그들은 당신의 사고방식과 연구 방법을 배웁니다. "자, 커리큘럼 다음 단계는 이거야. 어라 훈련이 불안정하네" 같은 번거로운 과정이나 검증 가능한 보상 설정이 필요 없죠.

인간의 표본 효율성에 대한 한 가지 가능한 설명으로 진화를 고려해야 합니다. 진화는 우리에게 가장 유용한 정보를 소량 제공했습니다. 시각, 청각, 움직임 같은 것에 대해서는 진화가 우리에게 많은 것을 주었다는 강력한 근거가 있습니다. 예를 들어 인간의 손재주(dexterity)는... 로봇도 시뮬레이션에서 엄청난 훈련을 시키면 손재주가 좋아질 수 있습니다. 하지만 현실 세계에서 로봇이 사람처럼 새로운 기술을 빨리 배우도록 훈련하는 건 요원해 보입니다.

이런 경우엔 "그래, 움직임. 우리 조상인 다람쥐들은 움직임이 중요했지. 그러니 엄청난 사전 지식(prior)을 갖고 있을 거야"라고 할 수 있습니다. 시각에 대해서도 같은 말을 할 수 있죠. 얀 르쿤(Yann LeCun)이 아이들은 10시간 연습하면 운전을 배운다는 점을 지적했는데, 사실입니다. 하지만 우리의 시각은 정말 좋습니다. 저만 해도 5살 때 자동차에 열광했는데, 그때 이미 자동차 인식 능력은 운전하기에 충분했을 겁니다. 5살 때는 데이터를 그렇게 많이 보지도 못하죠. 부모님 집에만 있으니 데이터 다양성도 낮고요. 그러니 그건 진화 덕분일 수 있습니다.

하지만 언어, 수학, 코딩은요? 아마 아닐 겁니다.

Q: 그래도 모델보다는 더 나은 것 같아요. 분명히 모델들은 언어, 수학, 코딩에서 평균적인 인간보다 더 잘해요. 하지만 학습에 있어서 평균적인 인간보다 더 나은가요?

물론입니다. 제가 하려던 말은 언어, 수학, 코딩, 특히 수학과 코딩의 경우, 인간이 학습을 잘하게 만드는 무언가는 복잡한 사전 지식이라기보다는 뭔가 더 근본적인 것일 가능성이 높다는 것입니다.

A: 인간이 어떤 기술에서 엄청난 신뢰성을 보인다고 칩시다. 만약 그 기술이 수억 년 동안 우리 조상들에게 매우 유용했던 것이라면, 인간이 진화적 사전 지식 덕분에 잘한다고 주장할 수 있습니다. 비록 그게 어떻게 인코딩되어 있는지는 명확하지 않더라도요.

하지만 최근까지 존재하지 않았던 영역(수학, 코딩 등)에서 인간이 뛰어난 능력, 신뢰성, 견고성, 학습 능력을 보인다면, 이는 인간이 그저 '더 나은 기계 학습(machine learning)' 능력을 가지고 있다는 징후에 가깝습니다.

Q: 그게 무엇인지 어떻게 생각해야 할까요? ML 유추 대상은 무엇입니까? 더 적은 표본을 쓰고, 더 비지도(unsupervised) 방식이고... 아이가 운전을 배우는 건, 정확히 말해 10대가 운전을 배우는 건 미리 만들어진 검증 가능한 보상을 받는 게 아닙니다. 기계와 환경과의 상호작용에서 오죠. 표본도 훨씬 적게 들고, 더 비지도적이고, 더 견고해 보입니다.

A: 인간의 견고성은 정말 엄청나죠.

Q: 이 모든 일이 동시에 일어나는 이유를 통합적으로 생각하는 방법이 있나요? 이를 실현할 수 있는 ML 유추 대상은 무엇입니까?

A: 당신이 질문한 것 중 하나는 "어떻게 10대 운전자가 외부 교사 없이 스스로 교정하고 경험에서 배울 수 있는가"입니다. 답은 그**들이 '가치 함수'를 가지고 있다**는 것입니다. 그들은 일반적인 감각을 가지고 있는데, 인간의 경우 이것이 매우 견고합니다. 중독 같은 몇 가지 예외를 빼면 인간의 가치 함수는 매우 견고합니다.

그래서 운전을 배우는 10대의 경우, 운전을 시작하자마자 자신이 어떻게 운전하고 있는지, 얼마나 못하는지, 얼마나 불안한지 즉시 감을 잡습니다. 그리고 "오케이" 하고 보죠. 물론 10대들의 학습 속도는 너무 빨라서 10시간이면 충분하죠.

Q: 인간은 어떤 해결책을 가진 것 같은데, 어떻게 하는 건지, 왜 기계에게는 그게 그렇게 어려운지 궁금합니다. 이런 걸 가능하게 하려면 모델 훈련 방식을 어떻게 재개념화해야 할까요?

A: 아주 훌륭한 질문이고, 저도 많은 의견을 가지고 있습니다. 하지만 불행히도 우리는 모든 머신러닝 아이디어를 자유롭게 논의할 수 있는 세상에 살고 있지 않습니다. ㅠㅠ 이것도 그중 하나죠.

아마 방법이 있을 겁니다. 할 수 있다고 생각합니다. 사람들이 그렇게 한다는 사실 자체가 가능하다는 증거죠.

물론 장애물이 하나 있을 수 있습니다. 인간의 뉴런이 우리가 생각하는 것보다 더 많은 계산을 수행할 가능성입니다. 만약 그게 사실이고 중요한 역할을 한다면 일이 더 어려워질 수 있습니다. 하지만 그렇다 하더라도 저는 이것이 제가 의견을 가지고 있는 어떤 머신러닝 원리의 존재를 가리킨다고 생각합니다. 하지만 안타깝게도 상황상 자세히 논의하기는 어렵습니다.

Q: 아무도 이 팟캐스트 안 들어요, 일리야. ㅠㅠ