“중국 정부는 헝다그룹 같은 곳을 부도낼 만큼 강력한 부동산 통제정책을 썼다”면서 “중국이 10년간 부동산을 억제하고 기술굴기하는 동안 한국은 정책과 자본 모두 부동산 담론에 갇혀 있었다”
“중국의 내수 경기가 굉장히 안 좋은데 기술기업들의 실적은 좋게 나온다”면서 “출장에서 만난 중국 기업인들은 여기서 자신감을 얻고 미국에 뒤지지 않는 기술투자에 나서려고 한다”
https://www.mk.co.kr/news/stock/11271376
“중국의 내수 경기가 굉장히 안 좋은데 기술기업들의 실적은 좋게 나온다”면서 “출장에서 만난 중국 기업인들은 여기서 자신감을 얻고 미국에 뒤지지 않는 기술투자에 나서려고 한다”
https://www.mk.co.kr/news/stock/11271376
매일경제
박현주 미래에셋 회장 단독 인터뷰 “AI 다음은 뷰티테크, 암치료 기업” - 매일경제
박현주 미래에셋 회장 단독 인터뷰 전세계 돌아보니 新차이나쇼크 충격적 중국은 AI시대 준비해 딥시크 내놔 한국은 알파고 이후 10년간 공회전 대담=박용범 매일경제 증권부장
❤2
Forwarded from 전종현의 인사이트
내가 틀렸다. 역시 젠슨황은 큰 뜻이 있었다.
1. The Power Constraint
“블랙웰(Blackwell)은 호퍼(Hopper)보다 훨씬 훨씬 더 좋습니다. 게다가, 이것은 칩(칩 개수)이 동일한 상황이 아니라 동일 전력(iso power) 하에서의 비교입니다. 이것이야말로 궁극적인 무어의 법칙(Moore’s Law)입니다. 과거 무어의 법칙이 추구하던 것이 결국 이것이었는데, 이번 세대에 동일 전력 대비 25배 성능을 달성한 것이죠. 동일 칩 수도, 동일 트랜지스터 수도 아닌, 동일 ‘전력’이 결정적입니다. 데이터센터에 들어갈 수 있는 에너지(전력)에는 한계가 있잖아요.”
2. The Pareto Frontier
"추론 프로세스에서, 특히 ‘Reasoning’ 모델의 경우, 서로 다른 단계(연구·사고 단계 vs. 토큰 생성 단계)가 요구하는 자원 특성이 다릅니다. 예컨대 “Deep Research”가 필요한 시점에는 ‘프리필(prefill)’이라 부르는 과정에서 모델의 FLOPS 연산이 집중적으로 쓰이고, 실제로 방대한 양의 웹사이트나 PDF 내용을 읽고 요약할 때 이 부분이 바쁩니다. 반면, 사용자와 계속 대화하는(토큰을 계속 생성하는) 상황에서는 대역폭(메모리/네트워킹) 중심의 리소스가 중시됩니다(‘디코드(decode)’ 단계)."
"ASIC은 결국 특정 지점(특정 목적)에 최적화되어야 합니다. 그런데 GPU는 전체 스펙트럼에서 활동할 수 있습니다. 사고(프리필) 비중이 큰 작업에도, 토큰 생성(디코드) 비중이 큰 작업에도, 상황에 따라 유연하게 대처할 수 있습니다."
-> “이 동적 운영(dynamic operation)은 정말 어렵습니다. 제가 방금 설명한 파이프라인 병렬, 텐서 병렬, 전문가 병렬(expert parallel), 인플라이트 배칭(in-flight batching), 분리형 추론(dis-aggregated inferencing), 워크로드 매니지먼트, KV 캐시 라우팅 등등의 모든 것을 관리하는 소프트웨어가 필요합니다. 그래서 오늘 엔비디아 다이너모(Nvidia Dynamo)를 발표하는 것입니다. 다이너모는 이 모든 것을 해결하는, 본질적으로 ‘AI 공장의 운영체제(OS)’ 역할을 합니다.”
-> 이는 소프트웨어로 GPU의 활용도를 극대화하여 하드웨어 자체 이상의 성능을 끌어올리는 전형적인 엔비디아 전략입니다. 그래서 황은 다음 슬라이드에서 다이너모가 이른바 ‘파레토 프런티어(Pareto Frontier)’를 바깥으로 확장(push out)한다고 설명합니다. 즉, “같은 하드웨어라도 어떻게 병렬화·배치·메모리 관리를 하느냐에 따라, 토큰 처리량과 응답 속도 간의 트레이드오프에서 최적점을 더 높은 수준으로 끌어올릴 수 있다”는 논리입니다.
결국 황의 요점은 “이렇게 동적으로 할당하고 조정할 수 있는 GPU 솔루션이야말로, 이유를 불문하고 ASIC보다 훨씬 범용적이면서 효율적”이라는 것입니다. 그리고 그렇게 하려면, 네트워킹부터 소프트웨어까지 긴밀하게 통합된 생태계가 필요한데, 현재는 이를 ‘온전히’ 해낼 수 있는 곳이 엔비디아 말고는 없다는 것이죠.
https://stratechery.com/2025/nvidia-gtc-and-asics-the-power-constraint-the-pareto-frontier/
1. The Power Constraint
“블랙웰(Blackwell)은 호퍼(Hopper)보다 훨씬 훨씬 더 좋습니다. 게다가, 이것은 칩(칩 개수)이 동일한 상황이 아니라 동일 전력(iso power) 하에서의 비교입니다. 이것이야말로 궁극적인 무어의 법칙(Moore’s Law)입니다. 과거 무어의 법칙이 추구하던 것이 결국 이것이었는데, 이번 세대에 동일 전력 대비 25배 성능을 달성한 것이죠. 동일 칩 수도, 동일 트랜지스터 수도 아닌, 동일 ‘전력’이 결정적입니다. 데이터센터에 들어갈 수 있는 에너지(전력)에는 한계가 있잖아요.”
2. The Pareto Frontier
"추론 프로세스에서, 특히 ‘Reasoning’ 모델의 경우, 서로 다른 단계(연구·사고 단계 vs. 토큰 생성 단계)가 요구하는 자원 특성이 다릅니다. 예컨대 “Deep Research”가 필요한 시점에는 ‘프리필(prefill)’이라 부르는 과정에서 모델의 FLOPS 연산이 집중적으로 쓰이고, 실제로 방대한 양의 웹사이트나 PDF 내용을 읽고 요약할 때 이 부분이 바쁩니다. 반면, 사용자와 계속 대화하는(토큰을 계속 생성하는) 상황에서는 대역폭(메모리/네트워킹) 중심의 리소스가 중시됩니다(‘디코드(decode)’ 단계)."
"ASIC은 결국 특정 지점(특정 목적)에 최적화되어야 합니다. 그런데 GPU는 전체 스펙트럼에서 활동할 수 있습니다. 사고(프리필) 비중이 큰 작업에도, 토큰 생성(디코드) 비중이 큰 작업에도, 상황에 따라 유연하게 대처할 수 있습니다."
-> “이 동적 운영(dynamic operation)은 정말 어렵습니다. 제가 방금 설명한 파이프라인 병렬, 텐서 병렬, 전문가 병렬(expert parallel), 인플라이트 배칭(in-flight batching), 분리형 추론(dis-aggregated inferencing), 워크로드 매니지먼트, KV 캐시 라우팅 등등의 모든 것을 관리하는 소프트웨어가 필요합니다. 그래서 오늘 엔비디아 다이너모(Nvidia Dynamo)를 발표하는 것입니다. 다이너모는 이 모든 것을 해결하는, 본질적으로 ‘AI 공장의 운영체제(OS)’ 역할을 합니다.”
-> 이는 소프트웨어로 GPU의 활용도를 극대화하여 하드웨어 자체 이상의 성능을 끌어올리는 전형적인 엔비디아 전략입니다. 그래서 황은 다음 슬라이드에서 다이너모가 이른바 ‘파레토 프런티어(Pareto Frontier)’를 바깥으로 확장(push out)한다고 설명합니다. 즉, “같은 하드웨어라도 어떻게 병렬화·배치·메모리 관리를 하느냐에 따라, 토큰 처리량과 응답 속도 간의 트레이드오프에서 최적점을 더 높은 수준으로 끌어올릴 수 있다”는 논리입니다.
결국 황의 요점은 “이렇게 동적으로 할당하고 조정할 수 있는 GPU 솔루션이야말로, 이유를 불문하고 ASIC보다 훨씬 범용적이면서 효율적”이라는 것입니다. 그리고 그렇게 하려면, 네트워킹부터 소프트웨어까지 긴밀하게 통합된 생태계가 필요한데, 현재는 이를 ‘온전히’ 해낼 수 있는 곳이 엔비디아 말고는 없다는 것이죠.
https://stratechery.com/2025/nvidia-gtc-and-asics-the-power-constraint-the-pareto-frontier/
Stratechery by Ben Thompson
Nvidia GTC and ASICs, The Power Constraint, The Pareto Frontier
Jensen Huang’s GTC keynote was a compelling argument in favor of Nvidia’s position relative to ASICs when it comes to inference.
❤1
1. 기본 물리 원리: 데이터센터에서 왜 열이 발생하는가?
IT 장비의 전력 소비 = 열 발생
- 서버, 스위치, 스토리지 등 모든 IT 장비는 전력(W)을 사용 → 동일한 양만큼 열(kW, BTU 등)로 전환됨(에너지 보존법칙).
- 예: 1kW 전력 소모 = 1kW 열 발생.
더욱 증가하는 칩 전력(TDP)
- AI/고성능 컴퓨팅(HPC) 칩은 수백 W에서 앞으로 1000~1500W까지 증가 예상.
- 서버 한 대, 랙 단위, 데이터홀 전체 등 여러 수준에서 열 부하가 폭증.
열을 제거하지 않으면?
- 서버 온도가 상승 → 부품 수명 단축, 성능 저하(쓰로틀링), 심하면 물리적 손상.
- 데이터센터 신뢰도에 치명적.
- 따라서 ‘열제거(쿨링)’는 필수 인프라.
2. 열 관리의 목적: “최적의 온도 유지 vs 에너지/비용 최소화”
왜 냉각이 중요한가?
- 데이터센터 총 소모전력 중 냉각이 차지하는 비중이 매우 큼(비IT 장비 전력의 60~80% 이상일 수 있음).
- CSP(Cloud Service Provider)는 전력 비용을 크게 절감해야 수익 개선 가능.
- 냉각 설비 자체의 CapEx(초기 투자비)와 OpEx(운영비)도 크므로, 효율적 시스템 설계가 핵심.
PUE(Power Usage Effectiveness)
- 전제: 데이터센터 전체 전력 ÷ IT 로드 전력
- 예: PUE=1.5 → IT부하 1W당 냉각 등 부수 장비로 0.5W 추가 소모.
- 하이퍼스케일러(구글, 메타 등)는 1.1~1.15 수준까지 달성.
WUE(Water Usage Effectiveness)
- 수냉식(쿨링 타워 등)에서 물 소비량이 문제되는 경우 ‘리터/ kWh’로 표시.
- 일부 지역(애리조나 등)에서는 물 부족이 심각하므로 중요 지표.
3. 데이터센터 냉각의 전통적 방식: 공냉(Air-Cooled)
공랭의 원리
- 서버 팬이 뜨거운 공기를 데이터홀로 배출 → CRAC/CRAH 등으로 공기를 냉각 → 밖으로 열을 방출.
- 과거 사무실용 HVAC를 강화하여 적용하던 방식에서 발전.
데이터홀 구조 & 공기흐름
- 뜨거운 공기와 차가운 공기가 섞이지 않도록 ‘Hot Aisle/Cold Aisle’ 설계 & 컨테인먼트로 혼합 최소화.
- 공기 순환(Delta T) 및 팬 전력 최적화: Fan 속도를 낮추면(예: -10%) 전력은 세제곱(약 -27%)으로 감소.
CRAC/CRAH/Fan Wall
- CRAC: 냉매 직접 순환(소형, 레거시), CRAH: 냉수(칠러수) 순환, Fan Wall: 대규모(500kW~수MW) 대응.
- 데이터홀 내부나 옥외(건물 옆/지붕) 설치해 냉각수 또는 공기로 열 교환.
에어컨(Chiller) & 쿨링 타워
- 냉동 사이클(압축, 응축, 팽창)로 물을 차갑게 만들어 순환.
- 물-공기 열교환(쿨링 타워) or 물-물 열교환(수냉식 칠러 + 냉각탑).
- ‘물’ 사용을 많이 하면(Wet Cooling Tower) 냉각효율 좋지만, 물 부족·규제 문제가 발생.
4. 열 부하 증가와 한계: 고밀도 랙 및 새로운 요구사항
1. 점점 증가하는 랙 전력(10~20kW → 100kW 이상)
- AI/딥러닝 훈련용 GPU·가속기의 급증.
- 전통적 공냉만으로는 열을 충분히 제거하기 어려운 한계점 도달.
2. 데이터센터 운영 온도 상향
- ASHRAE 권장: 18~27℃ (최대 45℃까지 허용하는 등급도 존재).
- 서버 공기 유입 온도를 높이면, 칠러 가동 감소로 에너지 절약.
- 하이퍼스케일러는 30℃ 이상으로 설정하기도 함.
3. Inlet/Outlet Delta T, Fan Law
- 들어가는 공기 온도와 나오는 공기 온도가 클수록(=열 교환 잘됨) 팬 전력이 줄어듦(선형 관계).
- 팬 속도↓ → 소비전력은 세제곱으로 줄어듦.
5. 고밀도 대안: 액냉(Liquid Cooling)과 하이브리드 접근
Direct-to-Chip Liquid Cooling(DLC)
- 칩 위에 냉각수 블록 장착해 열 직접 회수(예: Nvidia GB200 NVL72 등).
- 서버 팬 전력 감소, 고발열(1kW~1.5kW/칩)도 대응 가능.
- 기존엔 슈퍼컴 HPC 등에 제한적이었으나, AI 대중화로 빠른 확산 예상.
Immersion(액침냉각)
- 전체 서버를 불활성 액체에 담가 열을 제거.
- 열 제거 효율 높으나, 유지보수·호환성·비용 이슈로 아직 제한적.
RDHx(Rear-Door Heat Exchanger)
- 랙 뒤에 냉각 코일 설치해 공기 배출 직후 열을 흡수.
- 공냉과 액냉의 중간적 솔루션.
- 30~50kW급 랙 냉각 가능, 일부 AI 인프라에서 활용(xAI 등).
6. 하이퍼스케일러 사례: 마이크로소프트, 메타, 구글, AWS
마이크로소프트
- ‘Ballard’ 레퍼런스 디자인(48MW), 공냉(직접 증발 냉각) + 외기 활용(Free Air Cooling).
- 물 사용량은 지역별 기후(건조 vs 습윤)에 따라 달라짐. 애리조나→WUE>2.0 등.
메타(Meta)의 “H” 디자인
- 고온 인렛+낮은 전력밀도로 PUE=1.08, WUE=0.20 달성.
- 건물 자체가 큰 3단 구조로 공기흐름 최적화.
- 완공 시간 길어, 최근 AI 수요 급증에 맞춰 “H” 폐기→새 AI 설계로 교체.
구글
- 다양한 방식(물 많이 쓰는 에바포레이티브, 시워터 프리쿨링 등).
- 대표적으로 ‘워터사이드 이코노마이저’(chiller loop + heat exchanger loop)로 외기 조건 좋을 시 냉동 사이클 off.
- PUE=1.10, WUE>1.0 (물 사용 집중).
AWS
- 상대적으로 정보 비공개.
- 유사하게 외기 냉각 + 증발 기법 조합으로 추정(루버+팬).
7. 미래 관점: AI 시대 데이터센터 냉각 재설계
AI 트레이닝(고발열) vs 추론(저발열?)
- 일부는 “추론(Serving)은 저전력으로 공냉 가능” 주장,
- 하지만 모델 크기·성능 요구↑ → 결론적으로 대규모 액냉 인프라 필요성 증대.
Nvidia 및 주요 고객 로드맵
- Nvidia H100차세대 GPU 랙에서 100kW120kW 이상(직접 칩 액냉) 필수.
- 전 세계적 AI 클러스터 수요 폭발 → 냉각인프라 공급망(쿨링 피팅, Quick Disconnect, CDU 등)도 병목 현상.
“Bridge” 솔루션 증가
- 완벽한 액냉 전환까지 ‘RDHx+공냉’ 등 임시 하이브리드 방식이 확산.
- 장기적으로는 Immersion 같은 ‘극단적’ 액냉도 가능성.
https://semianalysis.com/2025/02/13/datacenter-anatomy-part-2-cooling-systems/
IT 장비의 전력 소비 = 열 발생
- 서버, 스위치, 스토리지 등 모든 IT 장비는 전력(W)을 사용 → 동일한 양만큼 열(kW, BTU 등)로 전환됨(에너지 보존법칙).
- 예: 1kW 전력 소모 = 1kW 열 발생.
더욱 증가하는 칩 전력(TDP)
- AI/고성능 컴퓨팅(HPC) 칩은 수백 W에서 앞으로 1000~1500W까지 증가 예상.
- 서버 한 대, 랙 단위, 데이터홀 전체 등 여러 수준에서 열 부하가 폭증.
열을 제거하지 않으면?
- 서버 온도가 상승 → 부품 수명 단축, 성능 저하(쓰로틀링), 심하면 물리적 손상.
- 데이터센터 신뢰도에 치명적.
- 따라서 ‘열제거(쿨링)’는 필수 인프라.
2. 열 관리의 목적: “최적의 온도 유지 vs 에너지/비용 최소화”
왜 냉각이 중요한가?
- 데이터센터 총 소모전력 중 냉각이 차지하는 비중이 매우 큼(비IT 장비 전력의 60~80% 이상일 수 있음).
- CSP(Cloud Service Provider)는 전력 비용을 크게 절감해야 수익 개선 가능.
- 냉각 설비 자체의 CapEx(초기 투자비)와 OpEx(운영비)도 크므로, 효율적 시스템 설계가 핵심.
PUE(Power Usage Effectiveness)
- 전제: 데이터센터 전체 전력 ÷ IT 로드 전력
- 예: PUE=1.5 → IT부하 1W당 냉각 등 부수 장비로 0.5W 추가 소모.
- 하이퍼스케일러(구글, 메타 등)는 1.1~1.15 수준까지 달성.
WUE(Water Usage Effectiveness)
- 수냉식(쿨링 타워 등)에서 물 소비량이 문제되는 경우 ‘리터/ kWh’로 표시.
- 일부 지역(애리조나 등)에서는 물 부족이 심각하므로 중요 지표.
3. 데이터센터 냉각의 전통적 방식: 공냉(Air-Cooled)
공랭의 원리
- 서버 팬이 뜨거운 공기를 데이터홀로 배출 → CRAC/CRAH 등으로 공기를 냉각 → 밖으로 열을 방출.
- 과거 사무실용 HVAC를 강화하여 적용하던 방식에서 발전.
데이터홀 구조 & 공기흐름
- 뜨거운 공기와 차가운 공기가 섞이지 않도록 ‘Hot Aisle/Cold Aisle’ 설계 & 컨테인먼트로 혼합 최소화.
- 공기 순환(Delta T) 및 팬 전력 최적화: Fan 속도를 낮추면(예: -10%) 전력은 세제곱(약 -27%)으로 감소.
CRAC/CRAH/Fan Wall
- CRAC: 냉매 직접 순환(소형, 레거시), CRAH: 냉수(칠러수) 순환, Fan Wall: 대규모(500kW~수MW) 대응.
- 데이터홀 내부나 옥외(건물 옆/지붕) 설치해 냉각수 또는 공기로 열 교환.
에어컨(Chiller) & 쿨링 타워
- 냉동 사이클(압축, 응축, 팽창)로 물을 차갑게 만들어 순환.
- 물-공기 열교환(쿨링 타워) or 물-물 열교환(수냉식 칠러 + 냉각탑).
- ‘물’ 사용을 많이 하면(Wet Cooling Tower) 냉각효율 좋지만, 물 부족·규제 문제가 발생.
4. 열 부하 증가와 한계: 고밀도 랙 및 새로운 요구사항
1. 점점 증가하는 랙 전력(10~20kW → 100kW 이상)
- AI/딥러닝 훈련용 GPU·가속기의 급증.
- 전통적 공냉만으로는 열을 충분히 제거하기 어려운 한계점 도달.
2. 데이터센터 운영 온도 상향
- ASHRAE 권장: 18~27℃ (최대 45℃까지 허용하는 등급도 존재).
- 서버 공기 유입 온도를 높이면, 칠러 가동 감소로 에너지 절약.
- 하이퍼스케일러는 30℃ 이상으로 설정하기도 함.
3. Inlet/Outlet Delta T, Fan Law
- 들어가는 공기 온도와 나오는 공기 온도가 클수록(=열 교환 잘됨) 팬 전력이 줄어듦(선형 관계).
- 팬 속도↓ → 소비전력은 세제곱으로 줄어듦.
5. 고밀도 대안: 액냉(Liquid Cooling)과 하이브리드 접근
Direct-to-Chip Liquid Cooling(DLC)
- 칩 위에 냉각수 블록 장착해 열 직접 회수(예: Nvidia GB200 NVL72 등).
- 서버 팬 전력 감소, 고발열(1kW~1.5kW/칩)도 대응 가능.
- 기존엔 슈퍼컴 HPC 등에 제한적이었으나, AI 대중화로 빠른 확산 예상.
Immersion(액침냉각)
- 전체 서버를 불활성 액체에 담가 열을 제거.
- 열 제거 효율 높으나, 유지보수·호환성·비용 이슈로 아직 제한적.
RDHx(Rear-Door Heat Exchanger)
- 랙 뒤에 냉각 코일 설치해 공기 배출 직후 열을 흡수.
- 공냉과 액냉의 중간적 솔루션.
- 30~50kW급 랙 냉각 가능, 일부 AI 인프라에서 활용(xAI 등).
6. 하이퍼스케일러 사례: 마이크로소프트, 메타, 구글, AWS
마이크로소프트
- ‘Ballard’ 레퍼런스 디자인(48MW), 공냉(직접 증발 냉각) + 외기 활용(Free Air Cooling).
- 물 사용량은 지역별 기후(건조 vs 습윤)에 따라 달라짐. 애리조나→WUE>2.0 등.
메타(Meta)의 “H” 디자인
- 고온 인렛+낮은 전력밀도로 PUE=1.08, WUE=0.20 달성.
- 건물 자체가 큰 3단 구조로 공기흐름 최적화.
- 완공 시간 길어, 최근 AI 수요 급증에 맞춰 “H” 폐기→새 AI 설계로 교체.
구글
- 다양한 방식(물 많이 쓰는 에바포레이티브, 시워터 프리쿨링 등).
- 대표적으로 ‘워터사이드 이코노마이저’(chiller loop + heat exchanger loop)로 외기 조건 좋을 시 냉동 사이클 off.
- PUE=1.10, WUE>1.0 (물 사용 집중).
AWS
- 상대적으로 정보 비공개.
- 유사하게 외기 냉각 + 증발 기법 조합으로 추정(루버+팬).
7. 미래 관점: AI 시대 데이터센터 냉각 재설계
AI 트레이닝(고발열) vs 추론(저발열?)
- 일부는 “추론(Serving)은 저전력으로 공냉 가능” 주장,
- 하지만 모델 크기·성능 요구↑ → 결론적으로 대규모 액냉 인프라 필요성 증대.
Nvidia 및 주요 고객 로드맵
- Nvidia H100차세대 GPU 랙에서 100kW120kW 이상(직접 칩 액냉) 필수.
- 전 세계적 AI 클러스터 수요 폭발 → 냉각인프라 공급망(쿨링 피팅, Quick Disconnect, CDU 등)도 병목 현상.
“Bridge” 솔루션 증가
- 완벽한 액냉 전환까지 ‘RDHx+공냉’ 등 임시 하이브리드 방식이 확산.
- 장기적으로는 Immersion 같은 ‘극단적’ 액냉도 가능성.
https://semianalysis.com/2025/02/13/datacenter-anatomy-part-2-cooling-systems/
SemiAnalysis
Datacenter Anatomy Part 2 – Cooling Systems
Cluster deployments are an order of magnitude larger in scale with Gigawatt-scale datacenters coming online at full capacity much faster than most believe. As such, there are considerable desi…
“세계가 지속가능한 에너지로 전환되도록 가속한다.”
테슬라가 진입한 시장(전기차, 에너지 저장, 로봇, 자율주행 등)은 결국 에너지 효율과 기술 혁신을 통해 “모두가 풍족한 삶을 누리는 미래”를 현실화한다는 비전을 갖는다.
“단순히 만족(satisfied)이 아닌, 사랑(love)하게 만들어야 사람들은 자발적으로 홍보한다.”
“가능하면 5초에 1대씩 생산”하는 미래를 목표로, ‘물리적 한계’를 실험한다(“50,000톤짜리 기계를 만들어서 한번에 5대 캐스팅?”).
최근 테슬라 성과
1. Cybertruck
- “불가능하다”던 전기 대형 트럭 성공 양산
- 혁신적인 생산공정(초고속·하이테크 라인) 도입
- 장기적으로 수백만~수천만 대 목표
2. 배터리·에너지
- 메가팩(Megapack) 및 파워월(3세대 Powerwall) 생산 증가
- 상하이 메가팩 공장 빠른 속도로 가동
- 배터리 셀 내제화: “세계에서 가장 저비용·고효율 셀”
- 배터리 공급망(리튬정제, 양극재 등) 통합 투자
자율주행과 AI
1. Autopilot HW4
- 현재 테슬라 차량에 탑재되는 강력한 Inference(추론) 칩
- 향후 HW5, HW6 등 계속해서 개선 예정
“10만 대 이상, 수백만 대 차를 소프트웨어 업데이트로 가치를 5~10배 끌어올릴 수 있다.”
2. FSD(Full Self-Driving)
- 이미 무인(무인 주차, 공장 내 주행 등) 기능 부분 시범 적용
- 5년 내 글로벌 규제 승인 전망 → 대규모 보급
- “소프트웨어 업데이트만으로 차량 가치가 5~10배 상승 가능” → 유례없는 사례
3. Dojo 슈퍼컴퓨터
- 자율주행 AI 학습용 자체 슈퍼컴(dojo 1~2) 개발
- 기존 GPU 클러스터와 함께 대규모 데이터 트레이닝 수행
4. Optimus 로봇
- 22자유도(팔·손부) 등 지속 업그레이드 → “세계 최고 수준 휴머노이드”
- 전기차 모터·배터리·AI·생산기술 등 테슬라가 가진 핵심 역량을 집약
- “장기적으로 인류 역사상 가장 큰 제품(수요·규모) 될 것”
- 2024년 하반기~ 이후, 우선 테슬라 직원에게 공급 → 일반인 구매 가능성
- 2023년엔 최대 5,000대 수준 시범생산(“로마 군단 규모”), 2024년엔 50,000대 예측
5. 서비스 및 슈퍼차저:
전 세계적 슈퍼차저 네트워크 확대, 고속 충전 기능 강화(V4 슈퍼차저 최대 500kW, 세미 1.2MW)
서비스 품질 향상을 통한 사용자 만족도 제고 (차량 판매뿐 아니라 장기 관점에서 중요)
“물리적 전력망 확대 없이도, 배터리로 피크 타임 재분배해 전력 사용량 2배 이상 늘릴 수 있다.”
테슬라 조직
“본질적으로, 회사란 사람들의 집합이며, 그 사람들이 만들어내는 가치가 곧 회사의 존재 이유이다.”
“모두가 어느 정도는 틀릴 수 있다. 매일 조금씩 덜 틀리는(team less wrong) 방향으로 나아가자.”
“프로세스를 자동화하기 전에, 먼저 요구사항을 단순화·삭제하고, 그 뒤에 최적화·속도 개선을 하라.”
1. 전 세계에서 가장 많은 지원자: 소수만 채용, 뛰어난 인재들이 자발적으로 몰려듦
2. 빠른 내부 승진·기회: 회사가 급성장 중이므로 성장 기회가 많음
3. Elon의 경영 철학
- “모두가 어느 정도 틀릴 수 있음 → 끊임없이 자기비판하고 개선해야”
- “회사의 존재 이유는 ‘고객이 사랑하는 제품/서비스 생산’이다.”
테슬라 = 단순 ‘전기차 회사’ 아님
자율주행, 로봇, 에너지, AI 슈퍼컴 등 종합 테크 기업
“지속가능한 풍요”
자율주행차 + 휴머노이드 + 재생에너지 + 배터리 = 인류가 풍족한 삶을 누리는 미래
궁극적으로 우주 진출(스페이스X)과도 시너지 기대
계속되는 혁신
사이버트럭, Optimus, 차세대 공장(초고속 자동화), AI 하드웨어·소프트웨어 등 전방위 확장
“가장 혁신적이고 사랑받는 제품을 계속 만들어 나갈 것”
https://youtu.be/QGJysv_Qzkw
테슬라가 진입한 시장(전기차, 에너지 저장, 로봇, 자율주행 등)은 결국 에너지 효율과 기술 혁신을 통해 “모두가 풍족한 삶을 누리는 미래”를 현실화한다는 비전을 갖는다.
“단순히 만족(satisfied)이 아닌, 사랑(love)하게 만들어야 사람들은 자발적으로 홍보한다.”
“가능하면 5초에 1대씩 생산”하는 미래를 목표로, ‘물리적 한계’를 실험한다(“50,000톤짜리 기계를 만들어서 한번에 5대 캐스팅?”).
최근 테슬라 성과
1. Cybertruck
- “불가능하다”던 전기 대형 트럭 성공 양산
- 혁신적인 생산공정(초고속·하이테크 라인) 도입
- 장기적으로 수백만~수천만 대 목표
2. 배터리·에너지
- 메가팩(Megapack) 및 파워월(3세대 Powerwall) 생산 증가
- 상하이 메가팩 공장 빠른 속도로 가동
- 배터리 셀 내제화: “세계에서 가장 저비용·고효율 셀”
- 배터리 공급망(리튬정제, 양극재 등) 통합 투자
자율주행과 AI
1. Autopilot HW4
- 현재 테슬라 차량에 탑재되는 강력한 Inference(추론) 칩
- 향후 HW5, HW6 등 계속해서 개선 예정
“10만 대 이상, 수백만 대 차를 소프트웨어 업데이트로 가치를 5~10배 끌어올릴 수 있다.”
2. FSD(Full Self-Driving)
- 이미 무인(무인 주차, 공장 내 주행 등) 기능 부분 시범 적용
- 5년 내 글로벌 규제 승인 전망 → 대규모 보급
- “소프트웨어 업데이트만으로 차량 가치가 5~10배 상승 가능” → 유례없는 사례
3. Dojo 슈퍼컴퓨터
- 자율주행 AI 학습용 자체 슈퍼컴(dojo 1~2) 개발
- 기존 GPU 클러스터와 함께 대규모 데이터 트레이닝 수행
4. Optimus 로봇
- 22자유도(팔·손부) 등 지속 업그레이드 → “세계 최고 수준 휴머노이드”
- 전기차 모터·배터리·AI·생산기술 등 테슬라가 가진 핵심 역량을 집약
- “장기적으로 인류 역사상 가장 큰 제품(수요·규모) 될 것”
- 2024년 하반기~ 이후, 우선 테슬라 직원에게 공급 → 일반인 구매 가능성
- 2023년엔 최대 5,000대 수준 시범생산(“로마 군단 규모”), 2024년엔 50,000대 예측
5. 서비스 및 슈퍼차저:
전 세계적 슈퍼차저 네트워크 확대, 고속 충전 기능 강화(V4 슈퍼차저 최대 500kW, 세미 1.2MW)
서비스 품질 향상을 통한 사용자 만족도 제고 (차량 판매뿐 아니라 장기 관점에서 중요)
“물리적 전력망 확대 없이도, 배터리로 피크 타임 재분배해 전력 사용량 2배 이상 늘릴 수 있다.”
테슬라 조직
“본질적으로, 회사란 사람들의 집합이며, 그 사람들이 만들어내는 가치가 곧 회사의 존재 이유이다.”
“모두가 어느 정도는 틀릴 수 있다. 매일 조금씩 덜 틀리는(team less wrong) 방향으로 나아가자.”
“프로세스를 자동화하기 전에, 먼저 요구사항을 단순화·삭제하고, 그 뒤에 최적화·속도 개선을 하라.”
1. 전 세계에서 가장 많은 지원자: 소수만 채용, 뛰어난 인재들이 자발적으로 몰려듦
2. 빠른 내부 승진·기회: 회사가 급성장 중이므로 성장 기회가 많음
3. Elon의 경영 철학
- “모두가 어느 정도 틀릴 수 있음 → 끊임없이 자기비판하고 개선해야”
- “회사의 존재 이유는 ‘고객이 사랑하는 제품/서비스 생산’이다.”
테슬라 = 단순 ‘전기차 회사’ 아님
자율주행, 로봇, 에너지, AI 슈퍼컴 등 종합 테크 기업
“지속가능한 풍요”
자율주행차 + 휴머노이드 + 재생에너지 + 배터리 = 인류가 풍족한 삶을 누리는 미래
궁극적으로 우주 진출(스페이스X)과도 시너지 기대
계속되는 혁신
사이버트럭, Optimus, 차세대 공장(초고속 자동화), AI 하드웨어·소프트웨어 등 전방위 확장
“가장 혁신적이고 사랑받는 제품을 계속 만들어 나갈 것”
https://youtu.be/QGJysv_Qzkw
YouTube
Tesla All-Hands | Q1 2025
Company-wide all-hands keynote for Q1 2025
❤2
기업용 소프트웨어·솔루션 분야에서 반복 창업가(Repeat Entrepreneurs)는 “황금 티켓(golden ticket)”처럼 평가됨.
- 이미 다수의 Go-to-Market(시장 진출) 경험과 노하우를 축적 → 성공 패턴을 재현할 가능성이 큼.
- 기술 환경이 크게 변할 때, 이를 기회로 삼아 신규 사업자가 기존 플레이어를 교란(disrupt)할 수 있음.
ChatGPT vs. 경쟁 제품들(Grock, Deepseek, Gemini 등)
App Store 순위
- ChatGPT: 꾸준히 1위 유지
- Deepseek/Grock: 잠시 상위권(Top2~Top5)에 올랐다가 하위권으로 떨어짐 (60~100위 밖)
승자독식(winner-take-most)
- 과거 구글·페이스북 사례처럼, 초기 선점과 네트워크 효과가 매우 커 쉽게 뒤집히기 어려움
- 시장 점유율이 이미 큰 OpenAI(ChatGPT)를 넘어서는 것은 “10배 이상 낫거나 하는 극적 혁신이 필요”
- Meta/Google 등 대형기업도 계속 추격 중이나, 당장 소비자 시장에서 ChatGPT를 압도하는 징후는 적음
2.2 현재 수요·인프라 부족
- OpenAI, 자체 인프라 외에 오라클·Coreweave와 텍사스에 대규모 데이터센터(Abilene/Denton) 건설
- 제품(기능) 출시 대기 중이나, GPU·컴퓨트 리소스(서빙 인프라)가 부족해 공급 제약
- Anthropic, 구글 Gemini, Grock 등도 공격적 확장, 그러나 ChatGPT의 사용량/인기와의 격차는 존재
“AI 비용 구조”와 기초 경제학
3.1 Contribution Margin(기여 이익) 문제
Contribution Margin: 매출(Revenue)에서 변동비(모델 서빙 비용, 트래픽 획득 비용 등)를 뺀 값.
예) Anthropic이 AWS를 통해 엔터프라이즈 API를 판매한다면, AWS에게 지급하는 비용(일종의 TAC, Traffic Acquisition Cost) + 모델 inference 비용이 큼
만약 이 변동비가 너무 높으면 사실상 “0 또는 음(陰)의 마진”일 수도
OpenAI는 직접 소비자 상대(중간채널 없이) → TAC 등의 비용이 상대적으로 적고, 단 유·무료 모델 서빙 비용은 큼
3.2 “음(陰)의 마진 AI” 가설(Girly Negative Gross Margin AI Theory)
Bill Gurley(“Girly"로 언급)가 제시한 가설: AI 비즈니스들이 고착화한 선점 효과와 거대한 VC 투자금에 기대어, 실제로는 판매 단가 < 서비스 비용인 상태로 시장점유율을 위해 돈을 태우고(underpricing) 있을 가능성
과거 인터넷 시절과 비교
- 구글/페이스북은 소규모 투자금으로 시작해도 “고마진(near-zero marginal cost) 모델”을 구축 → 높은 이익률로 빠르게 자립
- 반면 AI는 고비용(서빙용 GPU, 클라우드비 등) + 가격 경쟁 → 손해를 감수하며 점유율을 쌓는 업체 많을 수 있음(“e-commerce 초창기 때처럼, 1달러 매출 위해 1달러 이상 쓰는 상황”)
3.3 대형 업체와의 비교
구글·메타·아마존·애플 등은 자체 대규모 수익원(검색광고, 소셜광고, 클라우드, iPhone 등)을 통해 자금 조달 가능 → 신기술/시장에 장기 투자
- OpenAI는 MS 파트너십, 엘론이 이끄는 Grock/X.ai, 또다른 거대 자본 지원받는 Anthropic 등은 “자금력 + 기술력” 동시에 보유
- 결과적으로 쉽게 “단기 승부”로 끝나지 않을 것이고, 장기전에 따른 많은 변동 가능성
https://youtu.be/ymEtsnDif5M
- 이미 다수의 Go-to-Market(시장 진출) 경험과 노하우를 축적 → 성공 패턴을 재현할 가능성이 큼.
- 기술 환경이 크게 변할 때, 이를 기회로 삼아 신규 사업자가 기존 플레이어를 교란(disrupt)할 수 있음.
ChatGPT vs. 경쟁 제품들(Grock, Deepseek, Gemini 등)
App Store 순위
- ChatGPT: 꾸준히 1위 유지
- Deepseek/Grock: 잠시 상위권(Top2~Top5)에 올랐다가 하위권으로 떨어짐 (60~100위 밖)
승자독식(winner-take-most)
- 과거 구글·페이스북 사례처럼, 초기 선점과 네트워크 효과가 매우 커 쉽게 뒤집히기 어려움
- 시장 점유율이 이미 큰 OpenAI(ChatGPT)를 넘어서는 것은 “10배 이상 낫거나 하는 극적 혁신이 필요”
- Meta/Google 등 대형기업도 계속 추격 중이나, 당장 소비자 시장에서 ChatGPT를 압도하는 징후는 적음
2.2 현재 수요·인프라 부족
- OpenAI, 자체 인프라 외에 오라클·Coreweave와 텍사스에 대규모 데이터센터(Abilene/Denton) 건설
- 제품(기능) 출시 대기 중이나, GPU·컴퓨트 리소스(서빙 인프라)가 부족해 공급 제약
- Anthropic, 구글 Gemini, Grock 등도 공격적 확장, 그러나 ChatGPT의 사용량/인기와의 격차는 존재
“AI 비용 구조”와 기초 경제학
3.1 Contribution Margin(기여 이익) 문제
Contribution Margin: 매출(Revenue)에서 변동비(모델 서빙 비용, 트래픽 획득 비용 등)를 뺀 값.
예) Anthropic이 AWS를 통해 엔터프라이즈 API를 판매한다면, AWS에게 지급하는 비용(일종의 TAC, Traffic Acquisition Cost) + 모델 inference 비용이 큼
만약 이 변동비가 너무 높으면 사실상 “0 또는 음(陰)의 마진”일 수도
OpenAI는 직접 소비자 상대(중간채널 없이) → TAC 등의 비용이 상대적으로 적고, 단 유·무료 모델 서빙 비용은 큼
3.2 “음(陰)의 마진 AI” 가설(Girly Negative Gross Margin AI Theory)
Bill Gurley(“Girly"로 언급)가 제시한 가설: AI 비즈니스들이 고착화한 선점 효과와 거대한 VC 투자금에 기대어, 실제로는 판매 단가 < 서비스 비용인 상태로 시장점유율을 위해 돈을 태우고(underpricing) 있을 가능성
과거 인터넷 시절과 비교
- 구글/페이스북은 소규모 투자금으로 시작해도 “고마진(near-zero marginal cost) 모델”을 구축 → 높은 이익률로 빠르게 자립
- 반면 AI는 고비용(서빙용 GPU, 클라우드비 등) + 가격 경쟁 → 손해를 감수하며 점유율을 쌓는 업체 많을 수 있음(“e-commerce 초창기 때처럼, 1달러 매출 위해 1달러 이상 쓰는 상황”)
3.3 대형 업체와의 비교
구글·메타·아마존·애플 등은 자체 대규모 수익원(검색광고, 소셜광고, 클라우드, iPhone 등)을 통해 자금 조달 가능 → 신기술/시장에 장기 투자
- OpenAI는 MS 파트너십, 엘론이 이끄는 Grock/X.ai, 또다른 거대 자본 지원받는 Anthropic 등은 “자금력 + 기술력” 동시에 보유
- 결과적으로 쉽게 “단기 승부”로 끝나지 않을 것이고, 장기전에 따른 많은 변동 가능성
https://youtu.be/ymEtsnDif5M
YouTube
NVDA GTC, M&A Wiz / Goog $32 B Deal, April 2 Tariff Uncertainty; Huawei Belt & Road; ChatGPT | BG2
Open Source bi-weekly convo w/ Bill Gurley and Brad Gerstner on all things tech, markets, investing & capitalism. This week they discuss market uncertainty, globalism and tariffs, M&A, Wiz and GOOG, NVDA GTC, consumer AI demand, AI unit economics, & more.…
Agility Robotics Leadership https://youtu.be/qjf28ZBnn3k
클라우드 자동화 플랫폼
Peggy Johnson (CEO):
- 로봇 배치 증가에 따라 플릿 관리를 위한 엔터프라이즈 소프트웨어 필요성 대두.
- 로봇 관리자가 된 전 작업자들에게 디지털 경력 경로 제공. (12:48)
Melanie Wise (CPO): (13:27)
- Agility Arc는 단순 플릿 관리를 넘어선 클라우드 자동화 플랫폼.
- 목표: Digit뿐만 아니라 솔루션 중심의 전체 자동화 생태계 지휘(Orchestration). (13:49)
- 기능: WMS, 컨베이어, 충전 도크, AMR 등 다양한 시스템 연결 및 통합 관리. 고객에게 완전한 패키지 솔루션 제공.
- 구현 방식: 표준 커넥터 (Manhattan 등), 사용하기 쉬운 인터페이스 (PLC 컨트롤러 등), 시각적 프로그래밍 언어 (Blockly 기반), 스케줄링, 메트릭스, 성능 추적, Tier 1/2 지원, 문서화, 알림 등 단일 창(Single Pane of Glass) 제공. (15:40)
- 고객 가치: 최종적으로 고객이 중시하는 처리량(Throughput), 신뢰성(Reliability), 가동 시간(Uptime) 보장. (16:09)
Digit의 '두뇌': AI 및 학습 전략
Melanie Wise (CPO):
AI/ML 수준: (17:06)
- 물리적 지능 (Physical Intelligence): 제어 아키텍처, 로봇의 고유한 물리적 속성(다리 구조 등), 모델링 용이성.
- 의미론적 지능 (Semantic Intelligence): LLM, LMM 등 활용. 자연어 작업 지시 변환 (가장 유망한 초기 사용 사례). (18:46) (예: "Put Wall에서 주문 가져와서 긴급도에 따라 행동해")
- 집합적 지능 (Collective Intelligence): 클라우드 기반 시스템, 데이터 수집/활용 (Arc 플랫폼), 로봇 데이터 기반 미래 모델 훈련 (특화 LLM 등). (19:59)
Nvidia 파트너십: (18:00) Digit 아키텍처의 물리적 특성 덕분에 Sim-to-Real 전환 용이.
LLM 적용 과제: 범용 LLM을 공장/물류 시설 같은 고도로 특화된 환경에 맞게 조정 필요.
안전성: AI/학습 기반 접근 방식 도입 시 안전성 확보가 핵심 과제. (20:44) 단계적 적용 및 산업 안전 요구사항 준수 필요.
협업 안전 목표: 향후 2-3년 내 완전한 협업 안전(Collaborative Safety) 달성 목표. (21:05)
단기 목표 및 확장 계획
- 현재 로봇 수: 수십 대 -> 내년 수백 대 -> 내후년 수천 대 목표.
- 차별점: 지금 당장 배치(Deploy) 가능 (AI에 제약받지 않음).
- 데이터 활용: 3년간 축적된 고객 데이터(Data Lake)를 활용하여 Digit에게 새로운 기술 학습.
- 산업 확장: 물류에서 얻은 학습을 운송(Transportation), 소매(Retail - 예: 대형 식료품 체인 야간 작업 지원) 등 다른 분야로 확장.
- 엔드 이펙터 (손): 교체 가능한(Swappable) 손 설계. 특정 작업에 맞는 특수 그리퍼나 도구 장착 가능. 현재 작업에 반드시 5개 손가락이 필요한 것은 아니며, 복잡성 고려.
비즈니스 모델 및 자금 조달
자금: 약 2년 전 Series B 1억 5천만 달러 유치 완료. 현재 운영 자금(Runway) 확보. 향후 추가 자금 조달 계획 있음. (25:44)
수익 창출: 로봇 배치에 따른 수익 발생 시작. 곧 수익 계약 발표 예정. (26:05)
비즈니스 모델: (26:10)
- CapEx + SaaS: 고객이 로봇 초기 구매 + 지속적인 SaaS 요금 (Arc 플랫폼 사용 등). (ROI 약 2년 미만)
- RaaS (Robots as a Service): 월 단위 구독형. 고객 진입 장벽 낮춤 (소프트웨어, 유지보수 포함). 중소규모 고객 실험 용이.
- 가격 정책: 공개 불가하나, 일반적으로 **인간 노동자 비용과 비슷한 수준(on par)**으로 책정하여 고객 ROI 충족 목표. (27:19)
Q&A
1. AR을 사용하는게 ROI가 있나?
GXO 사례 등에서 ROI 충족, 즉 '유용한 작업' 수행 중. 피크 타임 외 비수기에도 비용 효율성 있음
2. 다리 vs. 바퀴
AMR은 특정 문제에 좋지만, 복잡한 작업(특히 높은 곳/깊은 곳의 무거운 물체 조작) 시 안정성 한계 (Tippy). 공간 제약(좁은 통로) 고려 시 다리가 유리.
Digit은 동적 안정성으로 깊은 선반 등 접근 용이. 안전 문제(넘어짐 등)는 해결 과제지만, 협업 안전 가능성 보고 Agility 합류
현재 많은 애플리케이션에서 Digit이 AMR의 가장 친한 친구(best friend) 역할 수행 (AMR이 운반 -> Digit이 상하차/적재)
3. 로봇 스펙
- 초기 4축 -> 현재 7축 팔(3-1-3 관절 구조). 특정 어깨 디자인 선호보다는 작업 공간(Manipulation Workspace) 확보 및 작업 수행 능력(좁은 공간 접근, 기계 조작 등) 극대화
4. 안전성
- 완전한 협업 안전(Full Collaborative Safety) 달성 시점으로 예상 (향후 2-3년). 현재는 동적 안정 로봇 표준 부재로 워크셀(Work Cell) 내 운영. 안전성 확보가 핵심.
- 디자인은 비용 효율성 및 안전성 고려. 다리 끼임 등은 오용(Misuse)에 가깝지만, 위험 평가 기반으로 회피 가능성(Avoidability) 높이고 심각성(Severity) 낮추는 방식으로 설계 중
5. 손?
- 5개 손가락 손 배제는 아님. 다양한 종류의 손/도구 부착 가능. 지난 60년간 산업 로봇 역사가 증명하듯, 대부분의 물류/제조 작업에 5개 손가락 불필요.
- 오히려 자동차 조립 라인 등에서 인간이 사용하는 특수 공구(스크류 건, 리벳 건 등)를 로봇 팔 끝에 직접 장착하는 것이 더 효율적일 수 있음 (복잡한 5지 손 제어 불필요, 전원 공급 용이).
6. 액추에이터
- 싸이클로이드(Cycloidal) 및 하모닉 드라이브(Harmonic Drive) 기술 혼합 사용. 맞춤 설계(Custom Design). 일부 자체 생산, 일부 외주 생산. 투명성(Transparency) 높고 제어 용이한 싸이클로이드 기술 선호도 증가.
- 궁극적으로는 고객 문제 해결 및 ROI 달성에 최적인 기술/가격을 선택할 것
- 추가하고 싶은 관절 1개?: Melanie: 허리 회전(Waist Rotation) 관절. (손의 작업 공간 확장 목적)
- 제거해야 하는 관절 1개?: Melanie: 발목(Ankle) 또는 엉덩이(Hip) 관절. 팔 관절(7축)은 작업 수행에 필수적이라 제거 불가. (현재 시장인 평평한 바닥 환경 고려 시 가격 절감을 위해)
7. 비용 구조
- 액추에이터보다 센서 및 안전 시스템이 현재 가장 큰 비용 차지. 안전 인증 시간/비용, 시장 경쟁 부족 때문. 액추에이터는 장기적으로 원자재 비용(bare metal cost)으로 수렴 경향.
- 대량 생산 시(수만 대 이상) 알루미늄, 강철 등 원자재 비용이 최종 한계.
8. 현재 가장 큰 병목은?
- AI 훈련이나 제조 스케일업보다는 신속한 고객 현장 배치(Deployment). (49:36) 기존 대규모 자동화 시스템은 배치에 수개월 소요. Agility는 현재 1주~1.5주 소요, 장기 목표는 72시간 이내.
9. Digit이 궁극적으로 Digit 자체를 100% 생산하게 될 것인가?
- 이미 Agility의 부품 수령 구역(receiving area)에서 Digit이 도움을 줄 계획이 있다. (즉, 초기 단계의 부분적인 자가 생산 기여는 계획 중)
- 멜라니(Melanie)가 지적했듯이, 기계에 부품을 로딩/언로딩하는 작업은 현재 인간이 하거나 산업용 로봇으로 자동화되지만, 장기적으로 Digit이 이러한 역할을 수행하는 것이 목표이다.
- 이 목표 달성의 핵심 요소는 **교체 가능한 엔드 이펙터(손)**이다.
클라우드 자동화 플랫폼
Peggy Johnson (CEO):
- 로봇 배치 증가에 따라 플릿 관리를 위한 엔터프라이즈 소프트웨어 필요성 대두.
- 로봇 관리자가 된 전 작업자들에게 디지털 경력 경로 제공. (12:48)
Melanie Wise (CPO): (13:27)
- Agility Arc는 단순 플릿 관리를 넘어선 클라우드 자동화 플랫폼.
- 목표: Digit뿐만 아니라 솔루션 중심의 전체 자동화 생태계 지휘(Orchestration). (13:49)
- 기능: WMS, 컨베이어, 충전 도크, AMR 등 다양한 시스템 연결 및 통합 관리. 고객에게 완전한 패키지 솔루션 제공.
- 구현 방식: 표준 커넥터 (Manhattan 등), 사용하기 쉬운 인터페이스 (PLC 컨트롤러 등), 시각적 프로그래밍 언어 (Blockly 기반), 스케줄링, 메트릭스, 성능 추적, Tier 1/2 지원, 문서화, 알림 등 단일 창(Single Pane of Glass) 제공. (15:40)
- 고객 가치: 최종적으로 고객이 중시하는 처리량(Throughput), 신뢰성(Reliability), 가동 시간(Uptime) 보장. (16:09)
Digit의 '두뇌': AI 및 학습 전략
Melanie Wise (CPO):
AI/ML 수준: (17:06)
- 물리적 지능 (Physical Intelligence): 제어 아키텍처, 로봇의 고유한 물리적 속성(다리 구조 등), 모델링 용이성.
- 의미론적 지능 (Semantic Intelligence): LLM, LMM 등 활용. 자연어 작업 지시 변환 (가장 유망한 초기 사용 사례). (18:46) (예: "Put Wall에서 주문 가져와서 긴급도에 따라 행동해")
- 집합적 지능 (Collective Intelligence): 클라우드 기반 시스템, 데이터 수집/활용 (Arc 플랫폼), 로봇 데이터 기반 미래 모델 훈련 (특화 LLM 등). (19:59)
Nvidia 파트너십: (18:00) Digit 아키텍처의 물리적 특성 덕분에 Sim-to-Real 전환 용이.
LLM 적용 과제: 범용 LLM을 공장/물류 시설 같은 고도로 특화된 환경에 맞게 조정 필요.
안전성: AI/학습 기반 접근 방식 도입 시 안전성 확보가 핵심 과제. (20:44) 단계적 적용 및 산업 안전 요구사항 준수 필요.
협업 안전 목표: 향후 2-3년 내 완전한 협업 안전(Collaborative Safety) 달성 목표. (21:05)
단기 목표 및 확장 계획
- 현재 로봇 수: 수십 대 -> 내년 수백 대 -> 내후년 수천 대 목표.
- 차별점: 지금 당장 배치(Deploy) 가능 (AI에 제약받지 않음).
- 데이터 활용: 3년간 축적된 고객 데이터(Data Lake)를 활용하여 Digit에게 새로운 기술 학습.
- 산업 확장: 물류에서 얻은 학습을 운송(Transportation), 소매(Retail - 예: 대형 식료품 체인 야간 작업 지원) 등 다른 분야로 확장.
- 엔드 이펙터 (손): 교체 가능한(Swappable) 손 설계. 특정 작업에 맞는 특수 그리퍼나 도구 장착 가능. 현재 작업에 반드시 5개 손가락이 필요한 것은 아니며, 복잡성 고려.
비즈니스 모델 및 자금 조달
자금: 약 2년 전 Series B 1억 5천만 달러 유치 완료. 현재 운영 자금(Runway) 확보. 향후 추가 자금 조달 계획 있음. (25:44)
수익 창출: 로봇 배치에 따른 수익 발생 시작. 곧 수익 계약 발표 예정. (26:05)
비즈니스 모델: (26:10)
- CapEx + SaaS: 고객이 로봇 초기 구매 + 지속적인 SaaS 요금 (Arc 플랫폼 사용 등). (ROI 약 2년 미만)
- RaaS (Robots as a Service): 월 단위 구독형. 고객 진입 장벽 낮춤 (소프트웨어, 유지보수 포함). 중소규모 고객 실험 용이.
- 가격 정책: 공개 불가하나, 일반적으로 **인간 노동자 비용과 비슷한 수준(on par)**으로 책정하여 고객 ROI 충족 목표. (27:19)
Q&A
1. AR을 사용하는게 ROI가 있나?
GXO 사례 등에서 ROI 충족, 즉 '유용한 작업' 수행 중. 피크 타임 외 비수기에도 비용 효율성 있음
2. 다리 vs. 바퀴
AMR은 특정 문제에 좋지만, 복잡한 작업(특히 높은 곳/깊은 곳의 무거운 물체 조작) 시 안정성 한계 (Tippy). 공간 제약(좁은 통로) 고려 시 다리가 유리.
Digit은 동적 안정성으로 깊은 선반 등 접근 용이. 안전 문제(넘어짐 등)는 해결 과제지만, 협업 안전 가능성 보고 Agility 합류
현재 많은 애플리케이션에서 Digit이 AMR의 가장 친한 친구(best friend) 역할 수행 (AMR이 운반 -> Digit이 상하차/적재)
3. 로봇 스펙
- 초기 4축 -> 현재 7축 팔(3-1-3 관절 구조). 특정 어깨 디자인 선호보다는 작업 공간(Manipulation Workspace) 확보 및 작업 수행 능력(좁은 공간 접근, 기계 조작 등) 극대화
4. 안전성
- 완전한 협업 안전(Full Collaborative Safety) 달성 시점으로 예상 (향후 2-3년). 현재는 동적 안정 로봇 표준 부재로 워크셀(Work Cell) 내 운영. 안전성 확보가 핵심.
- 디자인은 비용 효율성 및 안전성 고려. 다리 끼임 등은 오용(Misuse)에 가깝지만, 위험 평가 기반으로 회피 가능성(Avoidability) 높이고 심각성(Severity) 낮추는 방식으로 설계 중
5. 손?
- 5개 손가락 손 배제는 아님. 다양한 종류의 손/도구 부착 가능. 지난 60년간 산업 로봇 역사가 증명하듯, 대부분의 물류/제조 작업에 5개 손가락 불필요.
- 오히려 자동차 조립 라인 등에서 인간이 사용하는 특수 공구(스크류 건, 리벳 건 등)를 로봇 팔 끝에 직접 장착하는 것이 더 효율적일 수 있음 (복잡한 5지 손 제어 불필요, 전원 공급 용이).
6. 액추에이터
- 싸이클로이드(Cycloidal) 및 하모닉 드라이브(Harmonic Drive) 기술 혼합 사용. 맞춤 설계(Custom Design). 일부 자체 생산, 일부 외주 생산. 투명성(Transparency) 높고 제어 용이한 싸이클로이드 기술 선호도 증가.
- 궁극적으로는 고객 문제 해결 및 ROI 달성에 최적인 기술/가격을 선택할 것
- 추가하고 싶은 관절 1개?: Melanie: 허리 회전(Waist Rotation) 관절. (손의 작업 공간 확장 목적)
- 제거해야 하는 관절 1개?: Melanie: 발목(Ankle) 또는 엉덩이(Hip) 관절. 팔 관절(7축)은 작업 수행에 필수적이라 제거 불가. (현재 시장인 평평한 바닥 환경 고려 시 가격 절감을 위해)
7. 비용 구조
- 액추에이터보다 센서 및 안전 시스템이 현재 가장 큰 비용 차지. 안전 인증 시간/비용, 시장 경쟁 부족 때문. 액추에이터는 장기적으로 원자재 비용(bare metal cost)으로 수렴 경향.
- 대량 생산 시(수만 대 이상) 알루미늄, 강철 등 원자재 비용이 최종 한계.
8. 현재 가장 큰 병목은?
- AI 훈련이나 제조 스케일업보다는 신속한 고객 현장 배치(Deployment). (49:36) 기존 대규모 자동화 시스템은 배치에 수개월 소요. Agility는 현재 1주~1.5주 소요, 장기 목표는 72시간 이내.
9. Digit이 궁극적으로 Digit 자체를 100% 생산하게 될 것인가?
- 이미 Agility의 부품 수령 구역(receiving area)에서 Digit이 도움을 줄 계획이 있다. (즉, 초기 단계의 부분적인 자가 생산 기여는 계획 중)
- 멜라니(Melanie)가 지적했듯이, 기계에 부품을 로딩/언로딩하는 작업은 현재 인간이 하거나 산업용 로봇으로 자동화되지만, 장기적으로 Digit이 이러한 역할을 수행하는 것이 목표이다.
- 이 목표 달성의 핵심 요소는 **교체 가능한 엔드 이펙터(손)**이다.
YouTube
EXCLUSIVE Interview w/ Tesla Bot Rival Agility Robotics | Peggy Johnson CEO
A special interview with CEO Peggy Johnson and Chief Product Officer Melonee Wise as they reveal the impressive features of Agility Robotics humanoid robot, Digit, tailored for real-world productivity.
They also discuss Agility's collaborations with industry…
They also discuss Agility's collaborations with industry…
10. RoboFab의 현재 역할 및 공급망
- 현재 RoboFab(Agility의 공장)은 주로 조립(Assembly)과 테스트(Test)에 집중한다.
- 금속 가공(벤딩, 머시닝)과 같은 작업은 제3자 제작업체(third-party fabricators)를 이용한다.
- 모든 하위 부품(subcomponents)이 공장으로 들어오면 Agility가 이를 조립한다.
- Agility가 공급업체를 이용하므로, 반대로 Agility가 그 공급업체들에게 Digit을 판매하여 그들의 공정을 자동화할 수도 있다. (새로운 사업 기회 가능성)
11. 경쟁사를 어떻게 보나? 누가 성공하고 누가 실패할까? Agility의 성공/생존 요건은 무엇인가(자금 규모, 목표 - 수백만 대?)? 이것은 경주인가?
- 이것은 경주(race)이며, Agility는 현재 앞서 있다(ahead). 그리고 계속 앞서 나갈 목표를 가지고 있다.
- Agility는 전문성, 실제 환경에 대한 지식, 고객의 안전 기준 충족 능력 등을 보유하고 있다.
- 지속적인 혁신을 추구할 것이다.
- 협업 안전(Collaborative Safety) 달성 시 새로운 시장(궁극적으로 소비자 시장 포함)이 열릴 것이다. 이것이 Agility의 비전이자 계획이다.
- Agility의 (비교적) 작은 팀은 그 규모 이상의 성과(punched above its weight)를 내왔다.
- 실제로 작동하는 로봇을 보유하고 있으며, 고객들이 그 가치를 인정했다는 것은 매우 중요한 성과(milestone)이다.
- 수익(Revenue)을 창출하기 시작했으며, 곧 발표될 수익 발생 계약들은 실제 비즈니스의 선순환(flywheel)을 시작할 것이다.
12. 어떤 회사들이 왜 실패할까?
- 가장 큰 실수: 로봇의 물리적 측면, 즉 물리적 지능(physical intelligence)을 가장 중요하게(paramount) 생각하지 않는 것.
- AI는 물리적 지능 위에 덧붙여져야(layered on top) 하는 것이지, AI만으로 로봇을 제어하려는 것은 현재 AI 단계에서는 너무 이르다.
- Agility는 AI를 효과적인 보조 수단(aid)으로 사용하지만, 로봇 배포의 핵심 기반으로 의존하지는 않는다.
- AI만이 답이라고 기대하는 경쟁사들은, 물리적 지능과 의미론적 지능(semantic intelligence)이 함께 해결되어야 한다는 점을 간과하여 위험에 처할 수 있다.
13. 실제 환경에서 1000대 이상의 로봇 데이터를 수집해야 진정한 AI 훈련이 가능하다는 의견에 동의하는가?
- 복잡하다 (Yes and No).
- 일부 유형의 훈련은 대규모 데이터 없이도 가능하다.
- 하지만 더 복잡하고 흥미로운 AI/ML 작업은 로봇 군집(Fleet) 규모가 600~800대 이상이 될 때 가능해진다 (과거 회사 경험 기반).
- (과거 회사 경험) 로봇 한 대당 하루 30GB의 데이터를 생성하는 매우 큰 데이터 레이크(Data Lake)를 활용하여 흥미로운 AI 작업을 수행했다.
- Agility도 포괄적인 데이터 레이크/레이크하우스를 구축할 것이다.
- Digit은 AMR보다 훨씬 더 많은 데이터(하루 3~5배)를 생성한다.
- 결론적으로 '1000대'라는 숫자는 단정적이며, 필요한 데이터 양은 해결하려는 특정 문제와 데이터 사용 목적에 따라 다르다. Agility는 데이터 필요성에 대해 매우 실용적으로(pragmatic) 접근할 것이다.
- 현재 RoboFab(Agility의 공장)은 주로 조립(Assembly)과 테스트(Test)에 집중한다.
- 금속 가공(벤딩, 머시닝)과 같은 작업은 제3자 제작업체(third-party fabricators)를 이용한다.
- 모든 하위 부품(subcomponents)이 공장으로 들어오면 Agility가 이를 조립한다.
- Agility가 공급업체를 이용하므로, 반대로 Agility가 그 공급업체들에게 Digit을 판매하여 그들의 공정을 자동화할 수도 있다. (새로운 사업 기회 가능성)
11. 경쟁사를 어떻게 보나? 누가 성공하고 누가 실패할까? Agility의 성공/생존 요건은 무엇인가(자금 규모, 목표 - 수백만 대?)? 이것은 경주인가?
- 이것은 경주(race)이며, Agility는 현재 앞서 있다(ahead). 그리고 계속 앞서 나갈 목표를 가지고 있다.
- Agility는 전문성, 실제 환경에 대한 지식, 고객의 안전 기준 충족 능력 등을 보유하고 있다.
- 지속적인 혁신을 추구할 것이다.
- 협업 안전(Collaborative Safety) 달성 시 새로운 시장(궁극적으로 소비자 시장 포함)이 열릴 것이다. 이것이 Agility의 비전이자 계획이다.
- Agility의 (비교적) 작은 팀은 그 규모 이상의 성과(punched above its weight)를 내왔다.
- 실제로 작동하는 로봇을 보유하고 있으며, 고객들이 그 가치를 인정했다는 것은 매우 중요한 성과(milestone)이다.
- 수익(Revenue)을 창출하기 시작했으며, 곧 발표될 수익 발생 계약들은 실제 비즈니스의 선순환(flywheel)을 시작할 것이다.
12. 어떤 회사들이 왜 실패할까?
- 가장 큰 실수: 로봇의 물리적 측면, 즉 물리적 지능(physical intelligence)을 가장 중요하게(paramount) 생각하지 않는 것.
- AI는 물리적 지능 위에 덧붙여져야(layered on top) 하는 것이지, AI만으로 로봇을 제어하려는 것은 현재 AI 단계에서는 너무 이르다.
- Agility는 AI를 효과적인 보조 수단(aid)으로 사용하지만, 로봇 배포의 핵심 기반으로 의존하지는 않는다.
- AI만이 답이라고 기대하는 경쟁사들은, 물리적 지능과 의미론적 지능(semantic intelligence)이 함께 해결되어야 한다는 점을 간과하여 위험에 처할 수 있다.
13. 실제 환경에서 1000대 이상의 로봇 데이터를 수집해야 진정한 AI 훈련이 가능하다는 의견에 동의하는가?
- 복잡하다 (Yes and No).
- 일부 유형의 훈련은 대규모 데이터 없이도 가능하다.
- 하지만 더 복잡하고 흥미로운 AI/ML 작업은 로봇 군집(Fleet) 규모가 600~800대 이상이 될 때 가능해진다 (과거 회사 경험 기반).
- (과거 회사 경험) 로봇 한 대당 하루 30GB의 데이터를 생성하는 매우 큰 데이터 레이크(Data Lake)를 활용하여 흥미로운 AI 작업을 수행했다.
- Agility도 포괄적인 데이터 레이크/레이크하우스를 구축할 것이다.
- Digit은 AMR보다 훨씬 더 많은 데이터(하루 3~5배)를 생성한다.
- 결론적으로 '1000대'라는 숫자는 단정적이며, 필요한 데이터 양은 해결하려는 특정 문제와 데이터 사용 목적에 따라 다르다. Agility는 데이터 필요성에 대해 매우 실용적으로(pragmatic) 접근할 것이다.
임상의, 백오피스 직원, 환자, 문제에 대한 관점을 가진 모든 사람들과 이야기를 나누며 이 공간을 파헤치기 시작했습니다...
우리가 계속 반복해서 들었던 문구는 "사전 승인"이었습니다.
사전 승인은 의사가 치료 전에 보험사에 확인하여 보험 적용 여부와 필요성을 확인하는 간단한 절차이지만 실제로는 보험사의 인센티브와 의료 제공자의 인센티브가 충돌하는 도가니입니다
환자는 그 사이에 끼어들게 됩니다.
임상 문서를 가져오고, 양식을 작성하고, 후속 조치를 취하고, 중환자 치료를 위해 환자를 신속하게 승인하는 등 임상의가 있는 곳에서 임상의를 지원하는 플랫폼을 구축하기 위해 노력해 왔습니다.
몇 시간이 걸리는 프로세스를 30초의 승인 흐름으로 전환합니다.
보험사가 새로운 양식을 출시하면 AI가 내용을 이해하고 임상 문서를 활용하여 양식을 작성하는 등 각 보험사 프로세스의 미묘한 차이를 기본적으로 처리하고 자동화할 수 있는 플랫폼을 구축했습니다
이미 전국적으로 약 1000개의 보험사를 지원하고 있습니다.
저희는 사무 프로세스를 자동화하면서 보험사가 치료를 거부하는 이유에 대한 인사이트를 구축합니다. 보험사의 답변을 몇 주씩 기다리지 않고 환자가 정보에 입각한 결정을 내릴 수 있도록 실시간 보험 적용 여부 결정을 위해 노력하고 있습니다
보험사 프로세스로 인해 환자 치료가 지연되어서는 안 됩니다.
미국 헬스케어 AI회사 $27m 투자유치
https://x.com/Pavel_Asparagus/status/1904554522313175256
우리가 계속 반복해서 들었던 문구는 "사전 승인"이었습니다.
사전 승인은 의사가 치료 전에 보험사에 확인하여 보험 적용 여부와 필요성을 확인하는 간단한 절차이지만 실제로는 보험사의 인센티브와 의료 제공자의 인센티브가 충돌하는 도가니입니다
환자는 그 사이에 끼어들게 됩니다.
임상 문서를 가져오고, 양식을 작성하고, 후속 조치를 취하고, 중환자 치료를 위해 환자를 신속하게 승인하는 등 임상의가 있는 곳에서 임상의를 지원하는 플랫폼을 구축하기 위해 노력해 왔습니다.
몇 시간이 걸리는 프로세스를 30초의 승인 흐름으로 전환합니다.
보험사가 새로운 양식을 출시하면 AI가 내용을 이해하고 임상 문서를 활용하여 양식을 작성하는 등 각 보험사 프로세스의 미묘한 차이를 기본적으로 처리하고 자동화할 수 있는 플랫폼을 구축했습니다
이미 전국적으로 약 1000개의 보험사를 지원하고 있습니다.
저희는 사무 프로세스를 자동화하면서 보험사가 치료를 거부하는 이유에 대한 인사이트를 구축합니다. 보험사의 답변을 몇 주씩 기다리지 않고 환자가 정보에 입각한 결정을 내릴 수 있도록 실시간 보험 적용 여부 결정을 위해 노력하고 있습니다
보험사 프로세스로 인해 환자 치료가 지연되어서는 안 됩니다.
미국 헬스케어 AI회사 $27m 투자유치
https://x.com/Pavel_Asparagus/status/1904554522313175256
👍2
로봇에게 특정 작업(예: 병뚜껑 잠그기, 주걱 사용)을 훈련시키는 것은 가능했으나, 일반화(Generalization), 즉 다양한 시나리오와 객체에서 해당 작업을 수행하게 하는 것이 주요 난제임을 인식.
연구 초점: 더 광범위한 데이터셋 구축 방법, 다양한 학습 접근법(강화학습, 모방학습, 비디오 예측 등), 지식 이전 방법론 개발에 집중.
Physical Intelligence (PI): 즉, 어떤 로봇이든, 어떤 작업이든, 어디서든 제어할 수 있는 대규모 신경망 모델 개발.
- 가능한 모든 데이터를 활용하는 것이 중요하다고 믿음. 이는 다양한 로봇 형태(Embodiments)(다른 관절 수, 팔 개수 등)의 데이터를 포함. 이기종 하드웨어 간에도 상당한 지식 이전이 가능하며, 이는 로봇 플랫폼 반복 개발 시 데이터 손실을 방지함.
- "로봇 동작의 인터넷" 같은 것이 없기 때문에, **원격 조작(Teleoperation, "puppeteering")**을 통한 실세계 로봇 데이터 확장이 핵심("bread and butter"). 다른 데이터 소스도 탐색 중.
현재 R&D 초점:
- 언어 상호작용: 사용자가 자연어 프롬프트와 상황적 수정(situated corrections) (예: "채식 샌드위치 만들어줘, 피클 빼고")으로 로봇과 상호작용 가능하게 함.
- 일반화: 단일 환경을 넘어 다양한 환경, 객체, 작업을 처리하도록 함. 이를 위해 훨씬 더 다양한 데이터 수집(다양한 장소, 객체, 작업)이 최우선 과제(#1 priority).
- 모델 아키텍처: 트랜스포머(Transformers) 사용 및 사전 훈련된 비전-언어 모델(Vision-Language Models, VLMs) 활용하여 인터넷의 방대한 지식 통합 (예: 로봇 훈련 데이터에 없던 테일러 스위프트 인식).
주요 병목: 충분히 다양한 로봇 데이터의 부족. 다양한 실제 장소에서 데이터를 수집하는 것이 매우 중요함.
기타 요인: 사람 비디오 활용, 웹 데이터 활용, 사전 훈련 모델 활용, 기본 추론 능력(예: 샌드위치 만들 때 알레르기 이해) 탐색.
메모리: 현재 정책(policy)은 메모리가 없음. 새로운 센서 추가보다 모델에 메모리를 추가하는 것이 더 높은 우선순위.
오픈소스 철학:PI는 모델 가중치, 기술 논문, 심지어 로봇 디자인까지 하드웨어 회사와 공유하는 등 상당히 개방적인 태도를 취함.
- 분야가 초기 단계이므로 개방성이 커뮤니티 발전과 미래 모델 수용 준비에 도움.
- 개방성과 학문적 기여를 중시하는 최고 수준의 연구 인재 유치.
- 가장 큰 위험은 경쟁이 아니라, 일반적인 물리적 지능이라는 근본 문제가 해결되지 않는 것. 로보틱스는 본질적으로 어렵고 오류 허용 범위가 낮음.
휴머노이드는 흥미롭지만, 현재 단계에서는 잠재적으로 **과대평가(overrated)**됨.
- 데이터 수집 반론: 휴머노이드 원격 조작은 실제로는 더 단순한 로봇보다 더 어려워서 데이터 수집 효율성을 저해함. PI는 데이터 수집의 용이성과 속도를 위해 더 저렴하고 단순한 로봇 사용을 우선시함.
- 미래 예측: 단일 지배적 형태보다는, 특정 작업(예: 주방 가전)에 최적화된 **매우 다양한 로봇 플랫폼("캄브리아기 대폭발")**이 공존하는 미래를 예상함.
핵심 연구 전환점
- SayCan: 상위 수준 계획에 LLM 사용 + 하위 수준 정책 결합.
- RT-2 (VLM 연구): 웹 규모 지식(VLM 경유)을 로봇 작업으로 이전 가능성 입증.
- RT-X: 다양한 로봇 하드웨어 전반에 걸쳐 모델 훈련 성공, 데이터 통합의 이점 증명.
- Aloha/Mobile Aloha: 원격 조작을 통해 복잡하고 정교한 조작 작업 훈련 가능성 시연.
계층적 상호작용 로봇 (H-Robot - 최근 PI 연구)
- 개념: 장기적 작업(long-horizon tasks)과 자연어 상호작용을 다루는 시스템.
- 계층 구조: 상위 모델이 프롬프트를 해석하고 중간 단계를 출력, 하위 모델이 해당 단계를 모터 명령으로 실행.
- 상호작용: 사용자가 작업 실행 중 미묘한 지침과 수정 사항을 제공할 수 있음.
- 시연: 프롬프트에 따라 다른 샌드위치 만들기, 장보기, 테이블 청소 등.
센서:
- 현재: RGB 비전(기본 및 손목 장착 카메라)에 크게 의존하며 성공적으로 활용 중.
- 요구: 피부와 같은 촉각 센서가 필요하지만, 현재 옵션은 내구성 부족, 고비용, 저해상도 등의 하드웨어적 한계가 있음. 손목 카메라가 일부 대체 정보 제공.
- 미래: 다른 센서(오디오, 냄새, 열)는 중복성을 통해 견고성을 높일 수 있지만, 현재의 병목 현상은 아님. 메모리 추가가 더 중요함.
로보틱스 vs. 자율주행: 로보틱스는 상업적 생존을 위해 초기 전체 분포 해결 필요성이 낮을 수 있으나, 제어 복잡성은 더 높음. 자율주행의 통합 사례는 초기 시작이 너무 빨랐음을 시사할 수 있으며, 딥러닝 성숙도를 고려할 때 로보틱스의 현재 타이밍이 더 나을 수 있음.
https://youtu.be/AzqsJk1f12k?si=CDNHUQ_5XwlxchWk
연구 초점: 더 광범위한 데이터셋 구축 방법, 다양한 학습 접근법(강화학습, 모방학습, 비디오 예측 등), 지식 이전 방법론 개발에 집중.
Physical Intelligence (PI): 즉, 어떤 로봇이든, 어떤 작업이든, 어디서든 제어할 수 있는 대규모 신경망 모델 개발.
- 가능한 모든 데이터를 활용하는 것이 중요하다고 믿음. 이는 다양한 로봇 형태(Embodiments)(다른 관절 수, 팔 개수 등)의 데이터를 포함. 이기종 하드웨어 간에도 상당한 지식 이전이 가능하며, 이는 로봇 플랫폼 반복 개발 시 데이터 손실을 방지함.
- "로봇 동작의 인터넷" 같은 것이 없기 때문에, **원격 조작(Teleoperation, "puppeteering")**을 통한 실세계 로봇 데이터 확장이 핵심("bread and butter"). 다른 데이터 소스도 탐색 중.
현재 R&D 초점:
- 언어 상호작용: 사용자가 자연어 프롬프트와 상황적 수정(situated corrections) (예: "채식 샌드위치 만들어줘, 피클 빼고")으로 로봇과 상호작용 가능하게 함.
- 일반화: 단일 환경을 넘어 다양한 환경, 객체, 작업을 처리하도록 함. 이를 위해 훨씬 더 다양한 데이터 수집(다양한 장소, 객체, 작업)이 최우선 과제(#1 priority).
- 모델 아키텍처: 트랜스포머(Transformers) 사용 및 사전 훈련된 비전-언어 모델(Vision-Language Models, VLMs) 활용하여 인터넷의 방대한 지식 통합 (예: 로봇 훈련 데이터에 없던 테일러 스위프트 인식).
주요 병목: 충분히 다양한 로봇 데이터의 부족. 다양한 실제 장소에서 데이터를 수집하는 것이 매우 중요함.
기타 요인: 사람 비디오 활용, 웹 데이터 활용, 사전 훈련 모델 활용, 기본 추론 능력(예: 샌드위치 만들 때 알레르기 이해) 탐색.
메모리: 현재 정책(policy)은 메모리가 없음. 새로운 센서 추가보다 모델에 메모리를 추가하는 것이 더 높은 우선순위.
오픈소스 철학:PI는 모델 가중치, 기술 논문, 심지어 로봇 디자인까지 하드웨어 회사와 공유하는 등 상당히 개방적인 태도를 취함.
- 분야가 초기 단계이므로 개방성이 커뮤니티 발전과 미래 모델 수용 준비에 도움.
- 개방성과 학문적 기여를 중시하는 최고 수준의 연구 인재 유치.
- 가장 큰 위험은 경쟁이 아니라, 일반적인 물리적 지능이라는 근본 문제가 해결되지 않는 것. 로보틱스는 본질적으로 어렵고 오류 허용 범위가 낮음.
휴머노이드는 흥미롭지만, 현재 단계에서는 잠재적으로 **과대평가(overrated)**됨.
- 데이터 수집 반론: 휴머노이드 원격 조작은 실제로는 더 단순한 로봇보다 더 어려워서 데이터 수집 효율성을 저해함. PI는 데이터 수집의 용이성과 속도를 위해 더 저렴하고 단순한 로봇 사용을 우선시함.
- 미래 예측: 단일 지배적 형태보다는, 특정 작업(예: 주방 가전)에 최적화된 **매우 다양한 로봇 플랫폼("캄브리아기 대폭발")**이 공존하는 미래를 예상함.
핵심 연구 전환점
- SayCan: 상위 수준 계획에 LLM 사용 + 하위 수준 정책 결합.
- RT-2 (VLM 연구): 웹 규모 지식(VLM 경유)을 로봇 작업으로 이전 가능성 입증.
- RT-X: 다양한 로봇 하드웨어 전반에 걸쳐 모델 훈련 성공, 데이터 통합의 이점 증명.
- Aloha/Mobile Aloha: 원격 조작을 통해 복잡하고 정교한 조작 작업 훈련 가능성 시연.
계층적 상호작용 로봇 (H-Robot - 최근 PI 연구)
- 개념: 장기적 작업(long-horizon tasks)과 자연어 상호작용을 다루는 시스템.
- 계층 구조: 상위 모델이 프롬프트를 해석하고 중간 단계를 출력, 하위 모델이 해당 단계를 모터 명령으로 실행.
- 상호작용: 사용자가 작업 실행 중 미묘한 지침과 수정 사항을 제공할 수 있음.
- 시연: 프롬프트에 따라 다른 샌드위치 만들기, 장보기, 테이블 청소 등.
센서:
- 현재: RGB 비전(기본 및 손목 장착 카메라)에 크게 의존하며 성공적으로 활용 중.
- 요구: 피부와 같은 촉각 센서가 필요하지만, 현재 옵션은 내구성 부족, 고비용, 저해상도 등의 하드웨어적 한계가 있음. 손목 카메라가 일부 대체 정보 제공.
- 미래: 다른 센서(오디오, 냄새, 열)는 중복성을 통해 견고성을 높일 수 있지만, 현재의 병목 현상은 아님. 메모리 추가가 더 중요함.
로보틱스 vs. 자율주행: 로보틱스는 상업적 생존을 위해 초기 전체 분포 해결 필요성이 낮을 수 있으나, 제어 복잡성은 더 높음. 자율주행의 통합 사례는 초기 시작이 너무 빨랐음을 시사할 수 있으며, 딥러닝 성숙도를 고려할 때 로보틱스의 현재 타이밍이 더 나을 수 있음.
https://youtu.be/AzqsJk1f12k?si=CDNHUQ_5XwlxchWk
YouTube
No Priors Ep. 107 | With Physical Intelligence Co-Founder Chelsea Finn
This week on No Priors, Elad speaks with Chelsea Finn, cofounder of Physical Intelligence and currently Associate Professor at Stanford, leading the Intelligence through Learning and Interaction Lab. They dive into how robots learn, the challenges of training…
수십 년 동안 기술 업계에서는 마크 저커버그나 빌 게이츠와 같은 대학 중퇴 창업자를 낭만적으로 묘사해 왔지만, 실제로는 대부분의 자금력을 갖춘 창업자들은 전통적으로 나이가 많았으며, 풍부한 네트워크와 업계 경험을 활용하여 엔터프라이즈 소프트웨어에 진출했습니다.
AI가 이를 바꾸고 있습니다.
AI는 경쟁의 장을 평준화하여 젊은 창업자들이 수십 년의 경험 없이도 기회를 파악하고 빠르게 구축하며 기업 고객을 확보하기가 더 쉬워졌습니다.
세 가지 주요 변화가 이러한 변화를 주도하고 있습니다.
1. AI는 워크플로우의 비효율성을 제거하여 창업자가 업계에 대한 깊은 지식 없이도 업무를 자동화할 수 있도록 지원합니다.
2. 경험보다 속도가 우선: AI 네이티브 제품은 빠른 반복을 선호합니다. AI 네이티브 제품은 '모범 사례'보다 빠른 반복을 선호합니다.
3. 엔터프라이즈 AI 도입으로 유통 장벽이 낮아져 기존 네트워크 없이도 고객을 확보하기가 그 어느 때보다 쉬워졌습니다.
결과는? 최근 졸업생과 중퇴자가 그 어느 때보다 더 많이 회사를 설립하고 있습니다.
AI가 이를 바꾸고 있습니다.
AI는 경쟁의 장을 평준화하여 젊은 창업자들이 수십 년의 경험 없이도 기회를 파악하고 빠르게 구축하며 기업 고객을 확보하기가 더 쉬워졌습니다.
세 가지 주요 변화가 이러한 변화를 주도하고 있습니다.
1. AI는 워크플로우의 비효율성을 제거하여 창업자가 업계에 대한 깊은 지식 없이도 업무를 자동화할 수 있도록 지원합니다.
2. 경험보다 속도가 우선: AI 네이티브 제품은 빠른 반복을 선호합니다. AI 네이티브 제품은 '모범 사례'보다 빠른 반복을 선호합니다.
3. 엔터프라이즈 AI 도입으로 유통 장벽이 낮아져 기존 네트워크 없이도 고객을 확보하기가 그 어느 때보다 쉬워졌습니다.
결과는? 최근 졸업생과 중퇴자가 그 어느 때보다 더 많이 회사를 설립하고 있습니다.
❤1
현재 미디어에서 간과되지만, 미래의 역사가들이 연구할 만한 주제는 무엇인가?
Naval Ravikant는 다음과 같은 세 가지 주요 영역을 지적합니다.
1. 현대 의학 및 생물학의 현주소 (석기 시대 수준):
미디어 간과: 사람들은 현대 의학을 과도하게 신뢰하지만, 실제로는 매우 초기 단계에 머물러 있다.
근본 문제:
- 최선의 치료법이 여전히 '절제(수술)'인 경우가 많다 (예: 담낭, 충수, 편도). 이는 인체가 매우 효율적이며 불필요한 기관은 없다는 사실을 간과한다.
- 생물학 분야에 근본적인 설명 이론이 부족하다 (세균 이론, 진화론, 세포 이론, 유전학 외에는 대부분 경험적 규칙과 암기에 의존). A가 B에 영향을 미치고... 연쇄 반응은 알지만 근본 원리는 모른다.
- 인명 피해 위험 때문에 충분한 실험이 이루어지지 않고, 규제 기관에 의해 많은 잠재적 치료법이 금지되어 혁신이 부족하다.
미래 전망: 미래 세대는 현재의 생물학/의학 수준을 보고 경악할 것이다. 브라이언 존슨(Bryan Johnson)처럼 더 극단적이고 실험적인 접근(N of 1 실험)이 필요하지만, 보충제 과다 복용 등 특정 방법론에는 동의하지 않는다 (자연 상태의 음식 섭취 강조).
핵심 인사이트: 생물학과 의학은 아직 근본적인 이해가 부족한 '암흑기'에 있으며, 혁신을 위한 더 과감한 실험과 접근 방식이 필요하다.
2. 드론 전쟁의 미래 (전장의 완전한 변화):
미디어 간과: 드론의 중요성이 여전히 과소평가되고 있다.
궁극적 형태: 미래 전쟁은 완전히 드론으로만 이루어질 것이다. 드론의 최종 형태는 단순 유도탄이 아닌 '자율적 총알(Autonomous Bullets)', 즉 스스로 목표를 설정하고 공격하는 형태가 될 것이다.
전장 변화: 자율적 총알 시대에는 항공모함, 탱크, 보병 등 기존의 군사력은 의미를 잃게 된다. 전쟁은 각자의 자율적 총알들이 싸우고, 승리한 쪽이 결정되면 끝나는 형태가 될 것이다.
핵심 인사이트: 드론 기술, 특히 자율성은 전쟁의 양상을 근본적으로 바꿀 것이며, 기존의 군사 체계는 무용지물이 될 것이다.
3. GLP-1 작용제 (획기적인 신약의 파급 효과):
미디어 간과: GLP-1 약물(비만/당뇨 치료제)의 잠재력이 과소평가되고 있으며, 주로 부작용이나 특정 집단의 반발에 초점이 맞춰지는 경향이 있다.
획기적인 약물: 항생제 이후 가장 획기적인 약물이며, 스타틴보다 더 중요할 수 있다.
- 단순 체중 감량 이상의 효과: 중독 차단 (음식, 흡연, 심지어 헤로인/오피오이드까지), 다양한 암 위험 감소, 신진대사 개선을 통한 노화 역전 효과, 치매/알츠하이머/심혈관 질환 예방 등 엄청난 잠재적 이점.
- 부작용은 이점에 비해 미미하다. (암 유발 주장은 사실과 다름, 근육/뼈 손실은 고단백 섭취와 운동으로 관리 가능)
사회적/경제적 영향:
- 의료 비용 곡선을 크게 꺾을 잠재력 (비만 관련 질환 예방).
- 높은 약값 문제: 미국 내 높은 가격과 해외의 저렴한 가격/접근성 사이의 격차가 큰 사회적 문제로 대두될 것이다. (버니 샌더스가 "GLP-1 무료화"를 공약으로 내걸어야 한다고 제안)
- 사회적 저항: 비만을 도덕적 실패로 간주하거나, 자신의 '노력'으로 얻은 건강/체형의 가치(Status)가 희석되는 것을 우려하는 사람들의 반발이 존재한다. ("부작용 모른다", "암 유발한다" 등의 주장)
- 신체 긍정성 운동(Body Positivity Movement)의 종말: 효과적인 체중 관리 약물의 등장은 이 운동의 기반을 약화시킬 것이다.
핵심 인사이트: GLP-1은 단순히 비만 치료제를 넘어 사회 전반의 건강, 의료비, 심지어 중독 문제까지 해결할 수 있는 잠재력을 가진 '기적의 약'이다. 높은 약값과 사회적 저항에도 불구하고, 그 광범위한 이점으로 인해 사회적 요구가 폭발적으로 증가할 것이며, 이를 해결하는 정치적 리더십이 중요해질 것이다.
https://youtu.be/RLGLEaAhVJQ
Naval Ravikant는 다음과 같은 세 가지 주요 영역을 지적합니다.
1. 현대 의학 및 생물학의 현주소 (석기 시대 수준):
미디어 간과: 사람들은 현대 의학을 과도하게 신뢰하지만, 실제로는 매우 초기 단계에 머물러 있다.
근본 문제:
- 최선의 치료법이 여전히 '절제(수술)'인 경우가 많다 (예: 담낭, 충수, 편도). 이는 인체가 매우 효율적이며 불필요한 기관은 없다는 사실을 간과한다.
- 생물학 분야에 근본적인 설명 이론이 부족하다 (세균 이론, 진화론, 세포 이론, 유전학 외에는 대부분 경험적 규칙과 암기에 의존). A가 B에 영향을 미치고... 연쇄 반응은 알지만 근본 원리는 모른다.
- 인명 피해 위험 때문에 충분한 실험이 이루어지지 않고, 규제 기관에 의해 많은 잠재적 치료법이 금지되어 혁신이 부족하다.
미래 전망: 미래 세대는 현재의 생물학/의학 수준을 보고 경악할 것이다. 브라이언 존슨(Bryan Johnson)처럼 더 극단적이고 실험적인 접근(N of 1 실험)이 필요하지만, 보충제 과다 복용 등 특정 방법론에는 동의하지 않는다 (자연 상태의 음식 섭취 강조).
핵심 인사이트: 생물학과 의학은 아직 근본적인 이해가 부족한 '암흑기'에 있으며, 혁신을 위한 더 과감한 실험과 접근 방식이 필요하다.
2. 드론 전쟁의 미래 (전장의 완전한 변화):
미디어 간과: 드론의 중요성이 여전히 과소평가되고 있다.
궁극적 형태: 미래 전쟁은 완전히 드론으로만 이루어질 것이다. 드론의 최종 형태는 단순 유도탄이 아닌 '자율적 총알(Autonomous Bullets)', 즉 스스로 목표를 설정하고 공격하는 형태가 될 것이다.
전장 변화: 자율적 총알 시대에는 항공모함, 탱크, 보병 등 기존의 군사력은 의미를 잃게 된다. 전쟁은 각자의 자율적 총알들이 싸우고, 승리한 쪽이 결정되면 끝나는 형태가 될 것이다.
핵심 인사이트: 드론 기술, 특히 자율성은 전쟁의 양상을 근본적으로 바꿀 것이며, 기존의 군사 체계는 무용지물이 될 것이다.
3. GLP-1 작용제 (획기적인 신약의 파급 효과):
미디어 간과: GLP-1 약물(비만/당뇨 치료제)의 잠재력이 과소평가되고 있으며, 주로 부작용이나 특정 집단의 반발에 초점이 맞춰지는 경향이 있다.
획기적인 약물: 항생제 이후 가장 획기적인 약물이며, 스타틴보다 더 중요할 수 있다.
- 단순 체중 감량 이상의 효과: 중독 차단 (음식, 흡연, 심지어 헤로인/오피오이드까지), 다양한 암 위험 감소, 신진대사 개선을 통한 노화 역전 효과, 치매/알츠하이머/심혈관 질환 예방 등 엄청난 잠재적 이점.
- 부작용은 이점에 비해 미미하다. (암 유발 주장은 사실과 다름, 근육/뼈 손실은 고단백 섭취와 운동으로 관리 가능)
사회적/경제적 영향:
- 의료 비용 곡선을 크게 꺾을 잠재력 (비만 관련 질환 예방).
- 높은 약값 문제: 미국 내 높은 가격과 해외의 저렴한 가격/접근성 사이의 격차가 큰 사회적 문제로 대두될 것이다. (버니 샌더스가 "GLP-1 무료화"를 공약으로 내걸어야 한다고 제안)
- 사회적 저항: 비만을 도덕적 실패로 간주하거나, 자신의 '노력'으로 얻은 건강/체형의 가치(Status)가 희석되는 것을 우려하는 사람들의 반발이 존재한다. ("부작용 모른다", "암 유발한다" 등의 주장)
- 신체 긍정성 운동(Body Positivity Movement)의 종말: 효과적인 체중 관리 약물의 등장은 이 운동의 기반을 약화시킬 것이다.
핵심 인사이트: GLP-1은 단순히 비만 치료제를 넘어 사회 전반의 건강, 의료비, 심지어 중독 문제까지 해결할 수 있는 잠재력을 가진 '기적의 약'이다. 높은 약값과 사회적 저항에도 불구하고, 그 광범위한 이점으로 인해 사회적 요구가 폭발적으로 증가할 것이며, 이를 해결하는 정치적 리더십이 중요해질 것이다.
https://youtu.be/RLGLEaAhVJQ
YouTube
The World Is About To Change In 3 Huge Ways - Naval Ravikant
Chris and Naval Ravikant discuss the big ideas the media continues to ignore.
Get $350 off the Pod 4 Ultra at https://eightsleep.com/modernwisdom (use code MODERNWISDOM)
-
Get access to every episode 10 hours before YouTube by subscribing for free on Spotify…
Get $350 off the Pod 4 Ultra at https://eightsleep.com/modernwisdom (use code MODERNWISDOM)
-
Get access to every episode 10 hours before YouTube by subscribing for free on Spotify…
👍3
저희는 OpenAI, Anthropic, Suno, Perplexity, Midjourney, Cognition, ElevenLabs, LangChain, Pinecone, Mistral, Cohere, Sierra, Decagon, Invideo를 포함하여 빠르게 성장하는 비즈니스를 가진 수많은 회사와 파트너 관계를 맺고 있습니다. 또한 아직은 잘 알려지지 않았지만 (언제든 그렇게 될 수 있는) 수많은 다른 기업들과도 협력하고 있습니다. 저희의 2024년 데이터는 이들 스타트업이 기록적인 속도로 비즈니스를 구축하고 있음을 보여줍니다.
SaaS가 수평적으로 시작하여 수직적으로 확장된 것처럼 (처음에는 Salesforce, 그 다음에는 Toast처럼), 우리는 AI에서도 유사한 역학이 펼쳐지는 것을 보고 있습니다. 우리는 ChatGPT로 시작했지만, 이제는 산업별 특화 도구들이 확산되는 것을 목격하고 있습니다. 어떤 사람들은 이러한 스타트업들을 "LLM 래퍼(wrapper)"라고 불렀지만, 그들은 요점을 놓치고 있습니다. 경제학의 O-링 모델은 상호 의존적인 작업으로 이루어진 프로세스에서 전체 결과물이나 생산성은 단순히 비용 측면뿐만 아니라 전체 시스템의 성공 측면에서도 가장 비효율적인 구성 요소에 의해 제한된다는 것을 보여줍니다. 비슷한 맥락에서, 우리는 이러한 새로운 산업별 특화 AI 도구들이 개별 산업이 LLM의 경제적 영향을 제대로 실현할 수 있도록 보장하며, 문맥(contextual), 데이터, 워크플로우 통합이 지속적으로 가치 있다는 것을 증명할 것으로 봅니다.
이러한 맥락의 예로는 의료 분야의 Abridge Nabla DeepScribe 등이 있으며, 한편 Studeo는 부동산 기업이 자산을 마케팅하는 방식을 재편하고 있습니다. 건축가들은 간단한 텍스트 프롬프트로 즉시 디자인을 렌더링하기 위해 Sketch Pro을 사용하고 있으며, 레스토랑은 Slang AI전화 예약을 사용하고 있고, 부동산 관리자들은 HostAI를 통해 고객 지원을 통합하고 있습니다. Harvey 법률 비서는 많은 Fortune 500 기업에서 사용되고 있으며, 2024년에는 매출이 4배 증가했습니다.
AI는 온라인 상거래의 기본적인 방식까지도 변화시킬 것입니다. 우리는 오랫동안 인간을 위해 결제 과정을 최적화해왔지만, 이제는 AI 에이전트를 위해서도 동일한 작업을 수행하고 있습니다. 지난 11월에 출시된 저희의 Agent 를 시작으로 말입니다. 우리는 또한 Stripe Issuing을 통해 생성된 가상 카드로 에이전트가 쉽게 돈을 쓸 수 있도록 하고 있습니다. 이를 통해 사용자는 프로그래밍 방식으로 승인을 허가하거나 거부할 수 있어, 에이전트가 사용자가 원하는 것만 구매하도록 보장합니다. (그리고 네, 지출 통제 기능이 내장되어 있습니다: 아무도 T-1000이 가족 신용카드로 난동을 부리는 것을 원하지 않으니까요.)
Stripe Annual Letter 2024
SaaS가 수평적으로 시작하여 수직적으로 확장된 것처럼 (처음에는 Salesforce, 그 다음에는 Toast처럼), 우리는 AI에서도 유사한 역학이 펼쳐지는 것을 보고 있습니다. 우리는 ChatGPT로 시작했지만, 이제는 산업별 특화 도구들이 확산되는 것을 목격하고 있습니다. 어떤 사람들은 이러한 스타트업들을 "LLM 래퍼(wrapper)"라고 불렀지만, 그들은 요점을 놓치고 있습니다. 경제학의 O-링 모델은 상호 의존적인 작업으로 이루어진 프로세스에서 전체 결과물이나 생산성은 단순히 비용 측면뿐만 아니라 전체 시스템의 성공 측면에서도 가장 비효율적인 구성 요소에 의해 제한된다는 것을 보여줍니다. 비슷한 맥락에서, 우리는 이러한 새로운 산업별 특화 AI 도구들이 개별 산업이 LLM의 경제적 영향을 제대로 실현할 수 있도록 보장하며, 문맥(contextual), 데이터, 워크플로우 통합이 지속적으로 가치 있다는 것을 증명할 것으로 봅니다.
이러한 맥락의 예로는 의료 분야의 Abridge Nabla DeepScribe 등이 있으며, 한편 Studeo는 부동산 기업이 자산을 마케팅하는 방식을 재편하고 있습니다. 건축가들은 간단한 텍스트 프롬프트로 즉시 디자인을 렌더링하기 위해 Sketch Pro을 사용하고 있으며, 레스토랑은 Slang AI전화 예약을 사용하고 있고, 부동산 관리자들은 HostAI를 통해 고객 지원을 통합하고 있습니다. Harvey 법률 비서는 많은 Fortune 500 기업에서 사용되고 있으며, 2024년에는 매출이 4배 증가했습니다.
AI는 온라인 상거래의 기본적인 방식까지도 변화시킬 것입니다. 우리는 오랫동안 인간을 위해 결제 과정을 최적화해왔지만, 이제는 AI 에이전트를 위해서도 동일한 작업을 수행하고 있습니다. 지난 11월에 출시된 저희의 Agent 를 시작으로 말입니다. 우리는 또한 Stripe Issuing을 통해 생성된 가상 카드로 에이전트가 쉽게 돈을 쓸 수 있도록 하고 있습니다. 이를 통해 사용자는 프로그래밍 방식으로 승인을 허가하거나 거부할 수 있어, 에이전트가 사용자가 원하는 것만 구매하도록 보장합니다. (그리고 네, 지출 통제 기능이 내장되어 있습니다: 아무도 T-1000이 가족 신용카드로 난동을 부리는 것을 원하지 않으니까요.)
Stripe Annual Letter 2024
❤1
개개인들이 GPT를 통해서 하던 행동들이 하나의 Product로 녹아져나오고 있음. Cursor가 개인을 위한 제품이라면 팀을 위한 제품들이 개발직군쪽에서도 빠르게 성장중.
이런 제품들은 고객의 Workflow에서 발생하는 데이터, 이전에 시행착오를 겪었던 데이터를 가지고 원하는 의도를 잘 파악해서 원하는 결과물을 줄 수 있음(이상적으로).
General하게 여러분야에서 쓸수 있던지 아니면 특정 워크 플로우를 완결성있게 해결해주는 플레이어들로 기존 개발 Stack도 크게 바뀔 예정.
https://www.qodo.ai/
2. 고객의 문제 (Customer Problem):
- 시간 부족: 개발자 중 58%가 철저한 코드 리뷰를 할 시간이 부족합니다. 이로 인해 코드 리뷰가 소홀해지거나 생략될 수 있습니다.
- 버그 발생: 평균적으로 코드 1,000줄당 15개의 버그가 고객에게 전달됩니다. 이는 코드 리뷰가 충분히 효과적이지 않다는 것을 의미합니다.
- Pull Request(PR) 설명 부족: 1/3 이상의 PR에 설명이 누락되어 있어, 리뷰어가 변경 사항을 이해하고 검토하기 어렵습니다.
- 리뷰 일관성 부족: 팀 전체에 걸쳐 일관된 코드 리뷰 표준을 적용하기 어렵습니다.
- 수동적이고 비효율적인 리뷰 프로세스: 기존의 코드 리뷰 방식은 시간이 많이 걸리고, 중요한 문제를 놓칠 수 있습니다.
- 코드 품질 저하: 시간 부족, 비효율적인 프로세스 등으로 인해 최종 제품의 코드 품질이 저하될 위험이 있습니다.
- 코드 변경 사항 추적 및 이해의 어려움: 복잡한 변경 사항이나 테스트되지 않은 코드를 파악하기 어렵습니다.
3. Qodo Merge의 해결책 (Product Solution):
AI 기반 코드 리뷰 자동화: Qodo Merge는 코드 리뷰 워크플로우를 자동화하고 AI를 활용하여 코드 분석, 제안, 직접적인 AI 채팅 기능을 Git 환경(특히 Pull Request) 내에서 제공하는 코드 리뷰 도구입니다.
주요 기능:
- 자동 PR 설명 생성 (/describe): 코드 변경 사항을 기반으로 PR 설명을 자동으로 생성하여 리뷰어가 변경 내용을 쉽게 파악하도록 돕습니다.
- 이슈 및 버그 탐지/우선순위 지정 (/review): 코드 내의 잠재적인 버그, 이슈, 보안 취약점을 식별하고 우선순위를 지정해줍니다.
- 요구사항 준수 확인: 코드가 관련 티켓의 요구사항을 준수하는지 확인합니다.
- 상황 인식 코드 제안 (/improve): 코드베이스에 맞춰진 구체적이고 실행 가능한 코드 개선 제안을 제공하며, 노이즈를 최소화합니다. (수락된 제안을 학습하여 더 정확해짐)
- PR 내 직접 AI 채팅: Chrome 확장 프로그램을 통해 PR 내에서 코드에 대해 질문하거나, 사전 설정된/사용자 정의 명령(commands)을 실행하여 리뷰 워크플로우를 자동화할 수 있습니다. (/ask, /implement, /analyze, /add_docs 등)
- 일관된 표준 적용: 팀의 코딩 표준 및 모범 사례에 맞게 사용자 정의하여 일관된 리뷰 기준을 쉽게 적용할 수 있도록 지원합니다.
- 유연한 배포: 자체 호스팅(Self-hosted) 또는 완전 관리형(fully-managed) 옵션을 제공합니다.
- 다중 AI 모델 활용: Claude Sonnet 3.5, OpenAI o1 등 최고의 AI 모델의 강점을 활용합니다.
4. 고객에게 주는 가치 (Value Proposition):
- 시간 절약 및 효율성 증대: PR 설명 자동 생성, 자동 분석 등으로 개발자와 리뷰어의 시간을 절약하고 리뷰 프로세스를 효율화합니다 ("Give reviewers a short cut").
- 코드 품질 향상: AI가 잠재적 버그, 보안 문제, 개선점을 조기에 발견하여 최종 제품의 품질을 높이고 고객에게 전달되는 버그 수를 줄입니다 ("tough on bugs", "most effective line of defense").
- 리뷰 일관성 확보: 팀 전체에 걸쳐 일관된 코딩 표준과 리뷰 기준을 적용하기 쉬워집니다.
- 리뷰 집중도 향상: 중요한 이슈에 집중할 수 있도록 도와주어 리뷰의 실효성을 높입니다 ("Keep code reviews in focus").
- 개발 생산성 향상: 리뷰 프로세스 개선을 통해 개발자가 코딩 자체에 더 집중할 수 있게 합니다.
- 커밋/머지에 대한 신뢰도 증가: 자동화된 검증과 AI 제안을 통해 코드 변경 사항에 대한 신뢰도를 높입니다 ("Confidence in every commit").
- 팀 맞춤 설정 가능: 워크플로우, 인프라, 코딩 표준에 맞게 AI 리뷰 방식을 유연하게 조정할 수 있습니다.
이런 제품들은 고객의 Workflow에서 발생하는 데이터, 이전에 시행착오를 겪었던 데이터를 가지고 원하는 의도를 잘 파악해서 원하는 결과물을 줄 수 있음(이상적으로).
General하게 여러분야에서 쓸수 있던지 아니면 특정 워크 플로우를 완결성있게 해결해주는 플레이어들로 기존 개발 Stack도 크게 바뀔 예정.
https://www.qodo.ai/
2. 고객의 문제 (Customer Problem):
- 시간 부족: 개발자 중 58%가 철저한 코드 리뷰를 할 시간이 부족합니다. 이로 인해 코드 리뷰가 소홀해지거나 생략될 수 있습니다.
- 버그 발생: 평균적으로 코드 1,000줄당 15개의 버그가 고객에게 전달됩니다. 이는 코드 리뷰가 충분히 효과적이지 않다는 것을 의미합니다.
- Pull Request(PR) 설명 부족: 1/3 이상의 PR에 설명이 누락되어 있어, 리뷰어가 변경 사항을 이해하고 검토하기 어렵습니다.
- 리뷰 일관성 부족: 팀 전체에 걸쳐 일관된 코드 리뷰 표준을 적용하기 어렵습니다.
- 수동적이고 비효율적인 리뷰 프로세스: 기존의 코드 리뷰 방식은 시간이 많이 걸리고, 중요한 문제를 놓칠 수 있습니다.
- 코드 품질 저하: 시간 부족, 비효율적인 프로세스 등으로 인해 최종 제품의 코드 품질이 저하될 위험이 있습니다.
- 코드 변경 사항 추적 및 이해의 어려움: 복잡한 변경 사항이나 테스트되지 않은 코드를 파악하기 어렵습니다.
3. Qodo Merge의 해결책 (Product Solution):
AI 기반 코드 리뷰 자동화: Qodo Merge는 코드 리뷰 워크플로우를 자동화하고 AI를 활용하여 코드 분석, 제안, 직접적인 AI 채팅 기능을 Git 환경(특히 Pull Request) 내에서 제공하는 코드 리뷰 도구입니다.
주요 기능:
- 자동 PR 설명 생성 (/describe): 코드 변경 사항을 기반으로 PR 설명을 자동으로 생성하여 리뷰어가 변경 내용을 쉽게 파악하도록 돕습니다.
- 이슈 및 버그 탐지/우선순위 지정 (/review): 코드 내의 잠재적인 버그, 이슈, 보안 취약점을 식별하고 우선순위를 지정해줍니다.
- 요구사항 준수 확인: 코드가 관련 티켓의 요구사항을 준수하는지 확인합니다.
- 상황 인식 코드 제안 (/improve): 코드베이스에 맞춰진 구체적이고 실행 가능한 코드 개선 제안을 제공하며, 노이즈를 최소화합니다. (수락된 제안을 학습하여 더 정확해짐)
- PR 내 직접 AI 채팅: Chrome 확장 프로그램을 통해 PR 내에서 코드에 대해 질문하거나, 사전 설정된/사용자 정의 명령(commands)을 실행하여 리뷰 워크플로우를 자동화할 수 있습니다. (/ask, /implement, /analyze, /add_docs 등)
- 일관된 표준 적용: 팀의 코딩 표준 및 모범 사례에 맞게 사용자 정의하여 일관된 리뷰 기준을 쉽게 적용할 수 있도록 지원합니다.
- 유연한 배포: 자체 호스팅(Self-hosted) 또는 완전 관리형(fully-managed) 옵션을 제공합니다.
- 다중 AI 모델 활용: Claude Sonnet 3.5, OpenAI o1 등 최고의 AI 모델의 강점을 활용합니다.
4. 고객에게 주는 가치 (Value Proposition):
- 시간 절약 및 효율성 증대: PR 설명 자동 생성, 자동 분석 등으로 개발자와 리뷰어의 시간을 절약하고 리뷰 프로세스를 효율화합니다 ("Give reviewers a short cut").
- 코드 품질 향상: AI가 잠재적 버그, 보안 문제, 개선점을 조기에 발견하여 최종 제품의 품질을 높이고 고객에게 전달되는 버그 수를 줄입니다 ("tough on bugs", "most effective line of defense").
- 리뷰 일관성 확보: 팀 전체에 걸쳐 일관된 코딩 표준과 리뷰 기준을 적용하기 쉬워집니다.
- 리뷰 집중도 향상: 중요한 이슈에 집중할 수 있도록 도와주어 리뷰의 실효성을 높입니다 ("Keep code reviews in focus").
- 개발 생산성 향상: 리뷰 프로세스 개선을 통해 개발자가 코딩 자체에 더 집중할 수 있게 합니다.
- 커밋/머지에 대한 신뢰도 증가: 자동화된 검증과 AI 제안을 통해 코드 변경 사항에 대한 신뢰도를 높입니다 ("Confidence in every commit").
- 팀 맞춤 설정 가능: 워크플로우, 인프라, 코딩 표준에 맞게 AI 리뷰 방식을 유연하게 조정할 수 있습니다.
Qodo
[DS] Homepage
Qodo is an agentic code integrity platform for reviewing, testing, and writing code, integrating AI across development workflows to strengthen code quality at every stage.
❤2
달러 인플레이션 = 글로벌 세금: 미국이 2020년 이후 약 6조 달러를 발행했지만, 이 부담이 미국인 3억 3천만 명에게만 집중된 것이 아니라 전 세계 80억 명 이상에게 분산되었기에 1인당 부담액이 (2만 달러가 아닌) 1천 달러 미만으로 낮아졌고 구매력 하락도 완화되었다. 이는 달러가 기축 통화이기 때문에 가능한 사실상의 '글로벌 세금'이다.
MAGA의 근본적 오류: MAGA 지지자들은 마우이 재난 지원금(700달러)과 우크라이나 지원금(1000억 달러 이상)을 비교하며 미국인이 세계로부터 착취당한다고 생각하지만, 이는 달러 인플레이션을 통한 미국의 '보이지 않는 이익'을 간과한 잘못된 결론이다.
'미국 제국'과 현명한 경로: 현실적으로 미국은 달러 인플레이션을 통해 전 세계에 영향력을 행사하는 '미국 제국'이다. 따라서 MAGA가 추구해야 할 현명한 경로는 관세와 무역 전쟁으로 제국 전체를 파괴하는 것(이는 결국 중국에게 이익을 넘겨주는 결과 초래)이 아니라, 유럽의 보수/자유주의자 지원, 국내 규제 완화, 최소한의 적 만들기, 발행된 돈의 흐름 재조정 등을 통해 제국을 점진적으로 수정하고 관리하는 것이다.
제국의 규모와 급격한 해체의 위험: 미국은 역사상 가장 거대한 제국(전 세계 750개 군사 기지 등)이며, 이를 다른 나라와 같은 단순한 '국가'로 착각하고 급격히 해체하면 제국의 중심부에 있는 이들에게 단기적, 중기적으로 막대한 피해를 줄 것이다.
유럽/독일의 시각 (답변 1): 유럽에서는 많은 미국인(자유주의자/보수주의자)들이 미국 중심의 세계 질서(20세기 건축물)가 자국에 가져다주는 이익의 규모를 이해하지 못하고 비용에만 집중하는 것을 미국의 쇠퇴 원인으로 본다. 독일 등 수혜국들은 미국의 쇠퇴에 영향을 받겠지만 결국 적응하고 미국에서 벗어나는 전환을 할 것이며, 이는 유럽/아시아/아프리카가 유라시아 중심으로 재편되는 연쇄 반응을 일으킬 수 있다.
환상을 믿게 된 후계자들 (답변 2): 미국 제국을 설계한 세대는 그 현실을 의도적으로 숨겼고, 그 후계자들은 미국이 여전히 단순한 '민주주의 국가'이며 생활 수준 저하 없이 과거(제국 이전) 상태로 돌아갈 수 있다는 환상을 믿게 되었다. 하지만 군사 기지, UN 본부, 델라웨어 기반 다국적 기업, 글로벌 대학, 규제 조화, 달러 기축 통화 등은 모두 미국이 제조업 수출이 아닌 '화폐 제국(monetary empire)'이라는 비즈니스 모델을 가졌음을 보여준다.
https://x.com/balajis/status/1904830270135820757
관세 전쟁은 미국의 달러 패권을 약화시킬수 있다.
1. 글로벌 시스템 약화: 관세 전쟁은 수십 년간 미국이 구축해 온 자유 무역 질서와 동맹 관계를 훼손합니다. 이는 달러의 기축 통화 지위와 미국의 영향력을 뒷받침하는 기반을 약화시킵니다. 동맹국들이 미국 중심 시스템에서 벗어나 대안을 찾게 만들 수 있습니다.
2. 달러 패권 약화: 무역 분쟁과 예측 불가능성은 달러의 안정성에 대한 의문을 제기하고, 각국이 외환 보유고 다변화(달러 비중 축소)나 역내 통화 결제 시스템 강화를 모색하게 만들 수 있습니다. 이는 미국의 '글로벌 세금' 징수 능력을 약화시킵니다.
3. 중국의 기회: 미국이 스스로 만든 공백을 중국이 파고들 수 있습니다. 중국은 일대일로 등을 통해 미국과 멀어진 국가들과의 경제적, 정치적 유대를 강화하고 위안화 국제화를 추진하며 영향력을 확대할 기회를 얻게 됩니다. 미국이 고립주의로 돌아서면 중국이 글로벌 리더십의 빈자리를 채우려 할 가능성이 높습니다.
- 중국 위안화는 저평가, 미국 달러는 고평가되어 있습니다.
- 이 때문에 금융 지표로는 미국이 여전히 1위지만, 실질적인 생활 수준이나 생산 능력(물가/생활비, 제조업, 구매력평가 기준 GDP-PPP) 측면에서는 중국이 이미 오래 전에 미국을 추월했습니다.
- 중국의 낮은 물가는 명목 GDP 수치만으로는 파악할 수 없는 훨씬 높은 실질 생활 수준을 의미합니다. (예시: 미국 대비 훨씬 저렴한 중국 식료품 가격)
- 중국은 더 이상 가난한 나라가 아니며, 거대한 인구가 마치 '스텔스 모드'처럼 조용히 부상하고 있습니다. 이는 "힘을 숨기고 때를 기다린다 (韜光養晦)"는 덩샤오핑의 전략과 일치합니다.
- 미국이 항상 최고일 것이라는 (피터 제이한 등으로 대표되는) 서구의 관점이 오히려 중국의 이러한 조용한 부상을 간과하게 만들며 도움을 주었습니다.
4. 네거티브 섬 게임: 관세 전쟁은 상호 보복을 유발하여 세계 경제 전체를 위축시키는 '네거티브 섬(negative-sum)' 게임이 될 수 있습니다. 이는 미국의 경제에도 타격을 주어 국력을 소모시키고, 상대적으로 중국에게 유리한 환경을 조성할 수 있습니다.
반대 관점
1. 중국의 한계: 중국 또한 과도한 부채, 인구 구조 문제, 기술 자립의 어려움 등 내부적인 도전에 직면해 있습니다. 미국의 관세 전쟁은 중국 경제에도 상당한 타격을 주며, 중국이 미국의 빈자리를 즉시 채울 만큼의 역량과 준비가 되었는지는 불확실합니다.
2. 미국 패권의 견고함: 달러의 기축 통화 지위, 압도적인 군사력, 동맹 네트워크, 기술 혁신 능력, 소프트 파워 등 미국의 패권 기반은 단순히 관세 전쟁만으로 쉽게 무너지지 않을 정도로 견고합니다. 많은 국가들은 여전히 중국보다는 미국과의 관계를 선호할 수 있습니다.
3. 선택적 디커플링: 모든 무역 관계를 단절하는 전면적인 무역 전쟁보다는, 첨단 기술 등 특정 전략 분야에서의 '선택적 디커플링(decoupling)'을 통해 안보 위협을 관리하면서도 글로벌 시스템의 이점을 유지하려는 시도일 수 있습니다. 이는 제국 전체의 파괴와는 다릅니다.
4. 달러 외 대안 부재: 현재로서는 달러를 대체할 만한 안정성과 유동성, 신뢰도를 갖춘 기축 통화가 마땅치 않습니다. 위안화는 자본 통제 등의 문제로 아직 갈 길이 멉니다.
5. 무역 전쟁의 목적: 관세 전쟁 지지자들은 이것이 중국의 불공정 무역 관행(지식재산권 침해, 보조금 등)을 바로잡고 미국의 제조업을 부활시키기 위한 notwendige(필요한) 조치라고 주장합니다. 단기적 혼란이 있더라도 장기적으로는 미국의 경제 안보와 경쟁력을 강화하여 패권을 유지하는 데 도움이 될 수 있다고 봅니다.
MAGA의 근본적 오류: MAGA 지지자들은 마우이 재난 지원금(700달러)과 우크라이나 지원금(1000억 달러 이상)을 비교하며 미국인이 세계로부터 착취당한다고 생각하지만, 이는 달러 인플레이션을 통한 미국의 '보이지 않는 이익'을 간과한 잘못된 결론이다.
'미국 제국'과 현명한 경로: 현실적으로 미국은 달러 인플레이션을 통해 전 세계에 영향력을 행사하는 '미국 제국'이다. 따라서 MAGA가 추구해야 할 현명한 경로는 관세와 무역 전쟁으로 제국 전체를 파괴하는 것(이는 결국 중국에게 이익을 넘겨주는 결과 초래)이 아니라, 유럽의 보수/자유주의자 지원, 국내 규제 완화, 최소한의 적 만들기, 발행된 돈의 흐름 재조정 등을 통해 제국을 점진적으로 수정하고 관리하는 것이다.
제국의 규모와 급격한 해체의 위험: 미국은 역사상 가장 거대한 제국(전 세계 750개 군사 기지 등)이며, 이를 다른 나라와 같은 단순한 '국가'로 착각하고 급격히 해체하면 제국의 중심부에 있는 이들에게 단기적, 중기적으로 막대한 피해를 줄 것이다.
유럽/독일의 시각 (답변 1): 유럽에서는 많은 미국인(자유주의자/보수주의자)들이 미국 중심의 세계 질서(20세기 건축물)가 자국에 가져다주는 이익의 규모를 이해하지 못하고 비용에만 집중하는 것을 미국의 쇠퇴 원인으로 본다. 독일 등 수혜국들은 미국의 쇠퇴에 영향을 받겠지만 결국 적응하고 미국에서 벗어나는 전환을 할 것이며, 이는 유럽/아시아/아프리카가 유라시아 중심으로 재편되는 연쇄 반응을 일으킬 수 있다.
환상을 믿게 된 후계자들 (답변 2): 미국 제국을 설계한 세대는 그 현실을 의도적으로 숨겼고, 그 후계자들은 미국이 여전히 단순한 '민주주의 국가'이며 생활 수준 저하 없이 과거(제국 이전) 상태로 돌아갈 수 있다는 환상을 믿게 되었다. 하지만 군사 기지, UN 본부, 델라웨어 기반 다국적 기업, 글로벌 대학, 규제 조화, 달러 기축 통화 등은 모두 미국이 제조업 수출이 아닌 '화폐 제국(monetary empire)'이라는 비즈니스 모델을 가졌음을 보여준다.
https://x.com/balajis/status/1904830270135820757
관세 전쟁은 미국의 달러 패권을 약화시킬수 있다.
1. 글로벌 시스템 약화: 관세 전쟁은 수십 년간 미국이 구축해 온 자유 무역 질서와 동맹 관계를 훼손합니다. 이는 달러의 기축 통화 지위와 미국의 영향력을 뒷받침하는 기반을 약화시킵니다. 동맹국들이 미국 중심 시스템에서 벗어나 대안을 찾게 만들 수 있습니다.
2. 달러 패권 약화: 무역 분쟁과 예측 불가능성은 달러의 안정성에 대한 의문을 제기하고, 각국이 외환 보유고 다변화(달러 비중 축소)나 역내 통화 결제 시스템 강화를 모색하게 만들 수 있습니다. 이는 미국의 '글로벌 세금' 징수 능력을 약화시킵니다.
3. 중국의 기회: 미국이 스스로 만든 공백을 중국이 파고들 수 있습니다. 중국은 일대일로 등을 통해 미국과 멀어진 국가들과의 경제적, 정치적 유대를 강화하고 위안화 국제화를 추진하며 영향력을 확대할 기회를 얻게 됩니다. 미국이 고립주의로 돌아서면 중국이 글로벌 리더십의 빈자리를 채우려 할 가능성이 높습니다.
- 중국 위안화는 저평가, 미국 달러는 고평가되어 있습니다.
- 이 때문에 금융 지표로는 미국이 여전히 1위지만, 실질적인 생활 수준이나 생산 능력(물가/생활비, 제조업, 구매력평가 기준 GDP-PPP) 측면에서는 중국이 이미 오래 전에 미국을 추월했습니다.
- 중국의 낮은 물가는 명목 GDP 수치만으로는 파악할 수 없는 훨씬 높은 실질 생활 수준을 의미합니다. (예시: 미국 대비 훨씬 저렴한 중국 식료품 가격)
- 중국은 더 이상 가난한 나라가 아니며, 거대한 인구가 마치 '스텔스 모드'처럼 조용히 부상하고 있습니다. 이는 "힘을 숨기고 때를 기다린다 (韜光養晦)"는 덩샤오핑의 전략과 일치합니다.
- 미국이 항상 최고일 것이라는 (피터 제이한 등으로 대표되는) 서구의 관점이 오히려 중국의 이러한 조용한 부상을 간과하게 만들며 도움을 주었습니다.
4. 네거티브 섬 게임: 관세 전쟁은 상호 보복을 유발하여 세계 경제 전체를 위축시키는 '네거티브 섬(negative-sum)' 게임이 될 수 있습니다. 이는 미국의 경제에도 타격을 주어 국력을 소모시키고, 상대적으로 중국에게 유리한 환경을 조성할 수 있습니다.
반대 관점
1. 중국의 한계: 중국 또한 과도한 부채, 인구 구조 문제, 기술 자립의 어려움 등 내부적인 도전에 직면해 있습니다. 미국의 관세 전쟁은 중국 경제에도 상당한 타격을 주며, 중국이 미국의 빈자리를 즉시 채울 만큼의 역량과 준비가 되었는지는 불확실합니다.
2. 미국 패권의 견고함: 달러의 기축 통화 지위, 압도적인 군사력, 동맹 네트워크, 기술 혁신 능력, 소프트 파워 등 미국의 패권 기반은 단순히 관세 전쟁만으로 쉽게 무너지지 않을 정도로 견고합니다. 많은 국가들은 여전히 중국보다는 미국과의 관계를 선호할 수 있습니다.
3. 선택적 디커플링: 모든 무역 관계를 단절하는 전면적인 무역 전쟁보다는, 첨단 기술 등 특정 전략 분야에서의 '선택적 디커플링(decoupling)'을 통해 안보 위협을 관리하면서도 글로벌 시스템의 이점을 유지하려는 시도일 수 있습니다. 이는 제국 전체의 파괴와는 다릅니다.
4. 달러 외 대안 부재: 현재로서는 달러를 대체할 만한 안정성과 유동성, 신뢰도를 갖춘 기축 통화가 마땅치 않습니다. 위안화는 자본 통제 등의 문제로 아직 갈 길이 멉니다.
5. 무역 전쟁의 목적: 관세 전쟁 지지자들은 이것이 중국의 불공정 무역 관행(지식재산권 침해, 보조금 등)을 바로잡고 미국의 제조업을 부활시키기 위한 notwendige(필요한) 조치라고 주장합니다. 단기적 혼란이 있더라도 장기적으로는 미국의 경제 안보와 경쟁력을 강화하여 패권을 유지하는 데 도움이 될 수 있다고 봅니다.
X (formerly Twitter)
Balaji (@balajis) on X
Dollar inflation is global taxation.
If the ~$6T printed since 2020 was spread across just 330M Americans rather than 8B+ globally, you'd go from printing <$1k/head to almost $20k/head. And purchasing power would drop accordingly.
If the ~$6T printed since 2020 was spread across just 330M Americans rather than 8B+ globally, you'd go from printing <$1k/head to almost $20k/head. And purchasing power would drop accordingly.
딥마인드 설립 (2010): 당시 AI 연구가 활발하지 않았음에도, 범용 인공지능(AGI) 구축을 목표로 '아폴로 프로그램'처럼 시작.
- 딥마인드 미션: 1단계: 지능 문제 해결 (Solve Intelligence) → 2단계: 해결된 지능으로 다른 모든 문제 해결 (Use it to solve everything else). 당시에는 매우 파격적이었으나, 현재는 AI의 잠재력에 대한 인식이 확산됨. 과학적 발견, 의학, 우주 이해 등을 가속화하는 것이 목표.
AI 구축 방식:
- 전문가 시스템 (Expert Systems): 과거 방식 (예: 딥블루). 사전에 프로그래밍된 지식 기반. 예상치 못한 상황에 대처 불가. 경직되고 취약함. 일반 지능으로 확장 불가.
- 학습 시스템 (Learning Systems): 현대 방식. 경험/데이터로부터 스스로 학습. 신경과학에서 영감. 프로그래머의 지식을 뛰어넘는 발견 가능. 과학적 발견에 특히 유용.
게임 AI: AI 훈련의 시험장:
게임의 역할: AI 시스템 훈련을 위한 완벽한 시험장. (아타리 게임 → 바둑 → 체스 등)
DQN (Deep Q-Network, 2013년경): 아타리 게임 마스터. 최초로 원시 데이터(픽셀)로부터 직접 학습하는 종단간(end-to-end) 학습 시스템.
알파고 (AlphaGo):
- 바둑의 복잡성 (경우의 수: 10^170, 우주 원자 수보다 많음) → 무작위 탐색(brute-force) 불가.
- 2016년 이세돌 9단과의 대국 승리 (전 세계 2억 명 시청).
- 새로운 전략 발견: 수천 년간 연구된 바둑에서 독창적인 수(특히 게임 2의 '37수') 발견. 이는 AI가 인간의 지식을 넘어서는 새로운 지식을 창조할 수 있음을 시사.
알파고 제로 / 알파제로 (AlphaZero):
- 바둑뿐 아니라 체스, 쇼기 등 2인 제로섬 게임을 규칙만으로 학습하여 마스터.
- 기존 최강 체스 프로그램(스톡피쉬) 격파.
- 새로운 스타일 발견: 인간 최고수들이 아름답고 효과적이라고 평가하는 역동적인 플레이 스타일(기물 희생을 통한 기동성 확보 등) 발견. (카스파로프: "알파제로의 스타일은 진실을 반영한다", 칼슨: "알파제로에게 영향을 받았다")
알파 시리즈의 작동 원리 (자기 대국 및 탐색):
- 무작위 플레이 버전에서 시작하여 자기 자신과의 수많은 대국(self-play)을 통해 점진적으로 성능 향상.
- 신경망을 이용해 방대한 탐색 공간(search space)을 효율적으로 탐색하고 유망한 수 예측.
게임 AI를 넘어 과학적 발견으로:
적용 기준: 게임 AI 알고리즘을 실제 문제에 적용하기 위한 세 가지 기준:
1. 거대한 조합 탐색 공간 (Massive combinatorial search space): 무작위 탐색이 불가능할 정도로 복잡하지만, 학습 가능한 구조 존재.
2. 명확한 목표 함수/지표 (Clear objective function): 최적화할 수 있는 측정 가능한 목표 설정 가능. (게임: 승리, 점수 최대화)
3 충분한 데이터 또는 시뮬레이터 (Data or Simulator): 학습에 필요한 실제 데이터 또는 정확하고 효율적인 시뮬레이터를 통한 합성 데이터 생성 가능.
1. 단백질 접힘 문제 (Protein Folding Problem):
- 중요성: 생명체의 기본 구성 요소, 거의 모든 생체 기능 수행.
- 문제 정의: 1차원 아미노산 서열로부터 3차원 단백질 구조 예측. (구조 → 기능 결정에 중요)
- 어려움 (레빈탈의 역설): 단백질이 취할 수 있는 형태는 천문학적(10^300)이지만, 자연에서는 밀리초 단위로 접힘. 계산적으로 해결 가능할 것이라는 희망.
- CASP 대회: 단백질 구조 예측 올림픽. 실험적으로 규명된 미발표 구조를 예측하는 블라인드 테스트. 알파폴드 개발의 중요한 이정표.
알파폴드 (AlphaFold):
- 개발: 2016년 알파고 성공 직후 시작. 게임에서 개발된 기법을 실제 과학 문제에 적용.
- AlphaFold 1 (2018, CASP13): 최초로 머신러닝 기법을 주요 요소로 도입하여 대회 우승. 이전 10년간 정체되었던 정확도 크게 향상.
- AlphaFold 2 (2020, CASP14): 원자 수준 정확도(atomic accuracy) 달성. 문제 해결 선언. (실험 방법과 경쟁력 있는 수준)
- 작동 방식: 반복적인 프로세스를 통해 아미노산 덩어리에서 시작하여 점진적으로 정확한 3차원 구조 구축.
알파폴드의 영향:
- 대규모 구조 예측 및 공개: 알려진 거의 모든 단백질(2억 개 이상) 구조 예측하여 EMBL-EBI와 협력, 데이터베이스 무료 공개. (수십억 년 분량의 박사 연구를 1년 만에 완료)
- 과학 연구 가속화: 구조 정보가 부족했던 유기체(식물 등) 연구 촉진, 종간 구조 비교 등 새로운 연구 분야 개척.
- 광범위한 활용: 200만 명 이상의 연구자가 사용, 3만 회 이상 인용. 생물학 연구의 표준 도구로 자리매김.
- 활용 사례: 플라스틱 분해 효소 개발, 항생제 내성 연구, 소외 질병(말라리아 등) 치료제 개발 가속화, 세포 핵공 복합체 구조 규명, 약물 전달 시스템 설계, 생식 메커니즘 연구 등 생물학/의학 전반.
- 안전성 고려: 개발 초기부터 생물 보안/윤리 전문가와 협의하여 위험보다 이익이 크도록 노력.
알파폴드 최신 개발:
- AlphaFold 3 (2024): 단백질-단백질, 단백질-DNA/RNA, 단백질-리간드(약물 후보 등) 상호작용 예측으로 확장.
- 알파폴디오 (AlphaFoldio - 가칭, 관련 연구): 역방향 문제. 원하는 기능을 가진 특정 구조를 만들기 위한 아미노산 서열 설계. (신약, 항체 설계 등)
AI와 과학의 미래:
- 디지털 생물학 (Digital Biology): 생물학을 근본적으로 정보 처리 시스템으로 간주. AI는 복잡하고 동적인 생물학 시스템을 이해하고 설명하는 데 이상적인 언어. 알파폴드가 그 증거.
- 아이소모픽 랩스 (Isomorphic Labs): 알파폴드 기술 기반 신약 개발 스핀아웃. AI를 이용해 신약 개발 기간(평균 10년)과 비용(수십억 달러)을 획기적으로 단축 목표. (디지털 속도로 과학하기)
- 가상 세포 (Virtual Cell): 궁극적으로 효모 세포 등 간단한 세포의 계산 모델을 만들어, 실험실 실험(wet lab)을 줄이고 예측/검증 중심으로 전환하는 꿈.
- 다양한 과학 분야 적용: 생물학 외에도 신소재 발견, 핵융합 플라즈마 제어, 알고리즘 최적화(행렬 곱셈 등), 날씨 예측, 양자 컴퓨팅 오류 수정 등 광범위한 분야에서 AI 활용 및 성과. 학제간 연구 중요성 강조.
AGI 경로와 안전성:
범용 모델 개발:
- 월드 모델 (World Models): 세상에 대한 일반적인 이해를 갖춘 모델.
- Veo: 최첨단 비디오 생성 모델 (텍스트 설명/정지 이미지 → 비디오 생성). 물리 법칙, 객체 상호작용 등을 학습함을 시사.
- Genie: 텍스트 설명으로 플레이 가능한 게임 월드 생성 모델. 현실 세계 상호작용 및 물리 이해 심화.
안전성과 책임:
- 딥마인드 창립 초기부터 AI의 성공 가능성을 염두에 두고 안전하고 책임감 있는 개발 및 배포 고민.
- SynthID: AI 생성 콘텐츠(이미지, 오디오, 비디오)에 인간이 감지 못하는 워터마크 삽입/탐지 기술. 진위 구별 중요성 증대.
- 사회적 논의와 협력: 기술자뿐 아니라 사회 전체(정부, 학계, 시민사회 등)가 AI 개발 방향 논의에 참여해야 함. 국제 AI 정상회의 등 긍정적.
- 실리콘밸리 문화 비판: '빠르게 움직이고 부숴라(move fast and break things)' 방식은 AI와 같은 변혁적 기술에 부적합. 대신 과학적 방법론에 기반한 겸손함, 존중, 신중함, 예측 필요.
미래 전망:
- 차세대 AI 모델 (제미나이 시리즈): 다양한 모델의 장점을 통합한 대규모 멀티모달 모델 (Gemini 2.0 등).
- 프로젝트 아스트라 (Project Astra): 휴대폰/안경 등을 통해 현실 세계에서 사용자에게 도움을 주는 범용 AI 비서.
- 에이전트 기반 AI: 알파고와 같은 탐색/계획 능력을 제미나이와 같은 월드 모델과 결합. 현실 세계에서 목표를 달성하는 로보틱스 등에 핵심적 역할 예상 (향후 2-3년 내 큰 발전 기대).
- 딥마인드 미션: 1단계: 지능 문제 해결 (Solve Intelligence) → 2단계: 해결된 지능으로 다른 모든 문제 해결 (Use it to solve everything else). 당시에는 매우 파격적이었으나, 현재는 AI의 잠재력에 대한 인식이 확산됨. 과학적 발견, 의학, 우주 이해 등을 가속화하는 것이 목표.
AI 구축 방식:
- 전문가 시스템 (Expert Systems): 과거 방식 (예: 딥블루). 사전에 프로그래밍된 지식 기반. 예상치 못한 상황에 대처 불가. 경직되고 취약함. 일반 지능으로 확장 불가.
- 학습 시스템 (Learning Systems): 현대 방식. 경험/데이터로부터 스스로 학습. 신경과학에서 영감. 프로그래머의 지식을 뛰어넘는 발견 가능. 과학적 발견에 특히 유용.
게임 AI: AI 훈련의 시험장:
게임의 역할: AI 시스템 훈련을 위한 완벽한 시험장. (아타리 게임 → 바둑 → 체스 등)
DQN (Deep Q-Network, 2013년경): 아타리 게임 마스터. 최초로 원시 데이터(픽셀)로부터 직접 학습하는 종단간(end-to-end) 학습 시스템.
알파고 (AlphaGo):
- 바둑의 복잡성 (경우의 수: 10^170, 우주 원자 수보다 많음) → 무작위 탐색(brute-force) 불가.
- 2016년 이세돌 9단과의 대국 승리 (전 세계 2억 명 시청).
- 새로운 전략 발견: 수천 년간 연구된 바둑에서 독창적인 수(특히 게임 2의 '37수') 발견. 이는 AI가 인간의 지식을 넘어서는 새로운 지식을 창조할 수 있음을 시사.
알파고 제로 / 알파제로 (AlphaZero):
- 바둑뿐 아니라 체스, 쇼기 등 2인 제로섬 게임을 규칙만으로 학습하여 마스터.
- 기존 최강 체스 프로그램(스톡피쉬) 격파.
- 새로운 스타일 발견: 인간 최고수들이 아름답고 효과적이라고 평가하는 역동적인 플레이 스타일(기물 희생을 통한 기동성 확보 등) 발견. (카스파로프: "알파제로의 스타일은 진실을 반영한다", 칼슨: "알파제로에게 영향을 받았다")
알파 시리즈의 작동 원리 (자기 대국 및 탐색):
- 무작위 플레이 버전에서 시작하여 자기 자신과의 수많은 대국(self-play)을 통해 점진적으로 성능 향상.
- 신경망을 이용해 방대한 탐색 공간(search space)을 효율적으로 탐색하고 유망한 수 예측.
게임 AI를 넘어 과학적 발견으로:
적용 기준: 게임 AI 알고리즘을 실제 문제에 적용하기 위한 세 가지 기준:
1. 거대한 조합 탐색 공간 (Massive combinatorial search space): 무작위 탐색이 불가능할 정도로 복잡하지만, 학습 가능한 구조 존재.
2. 명확한 목표 함수/지표 (Clear objective function): 최적화할 수 있는 측정 가능한 목표 설정 가능. (게임: 승리, 점수 최대화)
3 충분한 데이터 또는 시뮬레이터 (Data or Simulator): 학습에 필요한 실제 데이터 또는 정확하고 효율적인 시뮬레이터를 통한 합성 데이터 생성 가능.
1. 단백질 접힘 문제 (Protein Folding Problem):
- 중요성: 생명체의 기본 구성 요소, 거의 모든 생체 기능 수행.
- 문제 정의: 1차원 아미노산 서열로부터 3차원 단백질 구조 예측. (구조 → 기능 결정에 중요)
- 어려움 (레빈탈의 역설): 단백질이 취할 수 있는 형태는 천문학적(10^300)이지만, 자연에서는 밀리초 단위로 접힘. 계산적으로 해결 가능할 것이라는 희망.
- CASP 대회: 단백질 구조 예측 올림픽. 실험적으로 규명된 미발표 구조를 예측하는 블라인드 테스트. 알파폴드 개발의 중요한 이정표.
알파폴드 (AlphaFold):
- 개발: 2016년 알파고 성공 직후 시작. 게임에서 개발된 기법을 실제 과학 문제에 적용.
- AlphaFold 1 (2018, CASP13): 최초로 머신러닝 기법을 주요 요소로 도입하여 대회 우승. 이전 10년간 정체되었던 정확도 크게 향상.
- AlphaFold 2 (2020, CASP14): 원자 수준 정확도(atomic accuracy) 달성. 문제 해결 선언. (실험 방법과 경쟁력 있는 수준)
- 작동 방식: 반복적인 프로세스를 통해 아미노산 덩어리에서 시작하여 점진적으로 정확한 3차원 구조 구축.
알파폴드의 영향:
- 대규모 구조 예측 및 공개: 알려진 거의 모든 단백질(2억 개 이상) 구조 예측하여 EMBL-EBI와 협력, 데이터베이스 무료 공개. (수십억 년 분량의 박사 연구를 1년 만에 완료)
- 과학 연구 가속화: 구조 정보가 부족했던 유기체(식물 등) 연구 촉진, 종간 구조 비교 등 새로운 연구 분야 개척.
- 광범위한 활용: 200만 명 이상의 연구자가 사용, 3만 회 이상 인용. 생물학 연구의 표준 도구로 자리매김.
- 활용 사례: 플라스틱 분해 효소 개발, 항생제 내성 연구, 소외 질병(말라리아 등) 치료제 개발 가속화, 세포 핵공 복합체 구조 규명, 약물 전달 시스템 설계, 생식 메커니즘 연구 등 생물학/의학 전반.
- 안전성 고려: 개발 초기부터 생물 보안/윤리 전문가와 협의하여 위험보다 이익이 크도록 노력.
알파폴드 최신 개발:
- AlphaFold 3 (2024): 단백질-단백질, 단백질-DNA/RNA, 단백질-리간드(약물 후보 등) 상호작용 예측으로 확장.
- 알파폴디오 (AlphaFoldio - 가칭, 관련 연구): 역방향 문제. 원하는 기능을 가진 특정 구조를 만들기 위한 아미노산 서열 설계. (신약, 항체 설계 등)
AI와 과학의 미래:
- 디지털 생물학 (Digital Biology): 생물학을 근본적으로 정보 처리 시스템으로 간주. AI는 복잡하고 동적인 생물학 시스템을 이해하고 설명하는 데 이상적인 언어. 알파폴드가 그 증거.
- 아이소모픽 랩스 (Isomorphic Labs): 알파폴드 기술 기반 신약 개발 스핀아웃. AI를 이용해 신약 개발 기간(평균 10년)과 비용(수십억 달러)을 획기적으로 단축 목표. (디지털 속도로 과학하기)
- 가상 세포 (Virtual Cell): 궁극적으로 효모 세포 등 간단한 세포의 계산 모델을 만들어, 실험실 실험(wet lab)을 줄이고 예측/검증 중심으로 전환하는 꿈.
- 다양한 과학 분야 적용: 생물학 외에도 신소재 발견, 핵융합 플라즈마 제어, 알고리즘 최적화(행렬 곱셈 등), 날씨 예측, 양자 컴퓨팅 오류 수정 등 광범위한 분야에서 AI 활용 및 성과. 학제간 연구 중요성 강조.
AGI 경로와 안전성:
범용 모델 개발:
- 월드 모델 (World Models): 세상에 대한 일반적인 이해를 갖춘 모델.
- Veo: 최첨단 비디오 생성 모델 (텍스트 설명/정지 이미지 → 비디오 생성). 물리 법칙, 객체 상호작용 등을 학습함을 시사.
- Genie: 텍스트 설명으로 플레이 가능한 게임 월드 생성 모델. 현실 세계 상호작용 및 물리 이해 심화.
안전성과 책임:
- 딥마인드 창립 초기부터 AI의 성공 가능성을 염두에 두고 안전하고 책임감 있는 개발 및 배포 고민.
- SynthID: AI 생성 콘텐츠(이미지, 오디오, 비디오)에 인간이 감지 못하는 워터마크 삽입/탐지 기술. 진위 구별 중요성 증대.
- 사회적 논의와 협력: 기술자뿐 아니라 사회 전체(정부, 학계, 시민사회 등)가 AI 개발 방향 논의에 참여해야 함. 국제 AI 정상회의 등 긍정적.
- 실리콘밸리 문화 비판: '빠르게 움직이고 부숴라(move fast and break things)' 방식은 AI와 같은 변혁적 기술에 부적합. 대신 과학적 방법론에 기반한 겸손함, 존중, 신중함, 예측 필요.
미래 전망:
- 차세대 AI 모델 (제미나이 시리즈): 다양한 모델의 장점을 통합한 대규모 멀티모달 모델 (Gemini 2.0 등).
- 프로젝트 아스트라 (Project Astra): 휴대폰/안경 등을 통해 현실 세계에서 사용자에게 도움을 주는 범용 AI 비서.
- 에이전트 기반 AI: 알파고와 같은 탐색/계획 능력을 제미나이와 같은 월드 모델과 결합. 현실 세계에서 목표를 달성하는 로보틱스 등에 핵심적 역할 예상 (향후 2-3년 내 큰 발전 기대).
❤1
고전 컴퓨팅과 AI의 잠재력 (튜링의 후예):
- 알파폴드 사례는 양자 시스템인 단백질 구조 예측을 고전 컴퓨터 기반 AI로 근사할 수 있음을 시사.
- 가설: 자연에서 생성되거나 발견될 수 있는 패턴(물리적 구조를 가진)은 고전적 학습 알고리즘(AI)으로 효율적으로 발견/모델링될 수 있다.
- 이는 P vs NP 문제, 양자 컴퓨팅의 필요성, 나아가 기초 물리학 및 현실의 본질에 대한 이해에 큰 영향을 줄 수 있음.
- 궁극적 목표: AGI는 우주와 그 안에서의 우리 위치를 이해하기 위한 궁극적인 범용 도구가 될 수 있다는 믿음.
https://youtu.be/hHooQmmzG4k
- 알파폴드 사례는 양자 시스템인 단백질 구조 예측을 고전 컴퓨터 기반 AI로 근사할 수 있음을 시사.
- 가설: 자연에서 생성되거나 발견될 수 있는 패턴(물리적 구조를 가진)은 고전적 학습 알고리즘(AI)으로 효율적으로 발견/모델링될 수 있다.
- 이는 P vs NP 문제, 양자 컴퓨팅의 필요성, 나아가 기초 물리학 및 현실의 본질에 대한 이해에 큰 영향을 줄 수 있음.
- 궁극적 목표: AGI는 우주와 그 안에서의 우리 위치를 이해하기 위한 궁극적인 범용 도구가 될 수 있다는 믿음.
https://youtu.be/hHooQmmzG4k
YouTube
Accelerating Scientific Discovery with AI - lecture by Sir Demis Hassabis
On a visit to Cambridge in March 2025, Sir Demis Hassabis - who in 2024 became our first alumnus to receive a Nobel Prize - gave this talk on 'Accelerating Scientific Discovery with AI'.
The co-founder and CEO of Google DeepMind, Demis was awarded the 2024…
The co-founder and CEO of Google DeepMind, Demis was awarded the 2024…
고객: 정보 집약적인 산업의 지식 노동자(Knowledge Workers). 이들은 대량의 문서(보고서, 계약서, 논문, 뉴스, 이메일 등)를 분석하여 인사이트를 도출하고 의사결정을 내려야 하는 전문가들
산업 분야
- 금융: 투자 은행, 헤지 펀드, 사모 펀드, 자산 운용사 등의 애널리스트, 포트폴리오 매니저 (실적 보고서, 공시 자료, 시장 조사 보고서, 뉴스 분석 등)
- 법률: 로펌 변호사, 기업 법무팀 (계약서 검토, 법률 리서치, 증거 개시(e-discovery) 등)
- 컨설팅: 경영 컨설턴트 (시장 분석, 경쟁사 조사, 실사 보고서 분석 등)
- R&D 및 연구: 제약, 생명과학, 기술 기업의 연구원 (논문 검색, 특허 분석, 임상 시험 데이터 분석 등)
제품
복잡하고 방대한 문서 더미(수천, 수만 페이지)에서 사용자가 자연어 질문을 통해 필요한 정보를 정확하고 빠르게 찾고, 요약하고, 비교 분석할 수 있도록 지원하는 AI 기반 검색 및 분석 플랫폼. "문서를 위한 신경망 검색 엔진" 또는 "AI 리서치 어시스턴트"
- AI 기반 검색: 키워드 검색을 넘어, 의미 기반의 자연어 질문으로 여러 문서에 걸쳐 관련된 내용 검색.
- 정보 추출 및 요약: 문서 내 특정 데이터 포인트(숫자, 이름, 조건 등) 자동 추출, 긴 내용을 핵심만 요약.
- 문서 간 비교 및 종합: 여러 문서의 내용을 비교 분석하고, 관련된 정보를 종합하여 새로운 인사이트 제공.
- 질의응답: 문서 내용을 기반으로 사용자의 질문에 직접 답변. (답변의 근거가 되는 원문 제시)
- 다양한 포맷 지원: PDF, Word, PPT, 이메일, 웹페이지 등 다양한 형태의 정형/비정형 데이터 처리.
- 워크플로우 통합 (잠재적): 특정 산업(금융 실사, 법률 검토 등)에 최적화된 워크플로우 제공 가능성.
가치
- 압도적인 시간 절약: 수작업으로 수 시간, 수일이 걸리던 문서 검토 및 정보 검색 시간을 분 단위로 단축.
- 정확성 및 신뢰도 향상: 사람이 하기 쉬운 정보 누락, 오독, 데이터 추출 오류 등을 AI가 최소화하여 분석의 정확성과 신뢰도 제고. (특히 금융, 법률 등 높은 정확성이 요구되는 분야에서 중요)
- 심층적인 인사이트 발굴: 방대한 문서 간의 숨겨진 연관성이나 패턴을 발견하여 사람이 놓칠 수 있는 깊이 있는 인사이트 제공.
- 더 나은 의사결정 지원: 필요한 정보를 적시에 정확하고 포괄적으로 제공하여 데이터 기반의 신속하고 현명한 의사결정 지원.
- 생산성 향상 및 비용 절감: 지식 노동자가 단순 반복적인 문서 작업에서 벗어나 더 고부가가치 업무에 집중할 수 있도록 하며, 대규모 문서 검토팀 운영 비용 절감.
직접 경쟁사 (AI 지식 플랫폼):
- Glean: 기업 내부 정보(Slack, 이메일, 문서 등) 전반을 검색하고 요약하는 데 강점. Hebbia보다 더 넓은 범위의 일반 기업 대상일 수 있음.
- Vectara: 개발자 친화적인 API 중심의 의미 검색 플랫폼.
대형 플랫폼 기업:
- Microsoft (Copilot): M365 생태계 내 통합, 방대한 기업 고객 기반, Copilot Studio를 통한 맞춤형 AI 구축 지원. SharePoint Syntex 등 문서 이해 기술 보유.
- Google (Vertex AI Search): 강력한 검색 기술과 AI 인프라 기반.
Hebbia의 차별점 (Differentiation):
Chat GPT와의 차이점:
- Chat GPT는 시 쓰기, 숙제 등 단일 작업에는 뛰어나지만, 여러 단계가 필요하거나 차별화된 결과를 요구하는 복잡한 작업에는 한계 ("As a large language model, I can't do that").
- Chat GPT는 공개 데이터만 학습. 금융/법률 등 지식 노동에 중요한 것은 비공개, 비정형 정보(offline unstructured information).
- Chat GPT로 투자 메모 초안을 작성하면 모든 VC가 거의 동일한 결과를 얻음 (차별성, 맞춤 프로세스 부재, 알파 없음).
Hebbia의 접근 방식:
- 금융 서비스의 특성: 정확한 정보, 올바른 결과, 맞춤형 프로세스, 투명성(지식 작업 수행)이 가장 중요.
- 목표: 투자자의 삶과 워크플로우를 개선하는, 근본적으로 변혁적인 AI 도구 구축.
- 차별점: 단순한 AI 인터페이스가 아니라, AI/AGI가 작업을 수행하기 위해 선택할 만한 도구를 지향. (AGI가 직접 모든 것을 처리하는 대신, Hebbia 같은 특화된 도구를 활용하는 것이 더 효율적)
- 비공개 데이터 활용: 고객의 투자 메모, 계약서 등 비공개 데이터를 업로드하여 웹 검색만으로는 불가능한 맞춤형 분석 및 비교 제공. (예: 과거 딜과의 비교 분석)
- 인터페이스: 챗봇 인터페이스를 넘어, 사용자를 강화(empower)하고 작업을 효율화하는 새로운 인터페이스 탐색. (컴퓨터 사용, 추론 능력 통합)
가치 제안:
- 시간 절약 (Faster Speed): 문서 검토, 정보 검색 등 수 시간이 걸리던 작업을 분 단위로 단축.
- 새로운 결과 창출 (Net New Results): 사람이었다면 불가능했거나 놓쳤을 분석 및 통찰력 제공. (예: 방대한 데이터 속에서 숨겨진 연관성 발견, 가설 검증 등)
주요 사용 사례 (금융 - 바이사이드):
- 스크리닝 (Screening): 마케팅 자료(SIM 등)를 플랫폼에 업로드하면, 과거 딜 및 투자 기준과 비교하여 Go/No-Go 결정 지원. (무의미한 노동 제거, 중요한 딜에 집중) 스크리닝 처리량 137% 증가.
- 실사 (Diligence): 방대한 문서(데이터룸, 신용 계약서, 전문가 네트워크 콜 등)에서 인사이트 즉시 추출 및 종합. (수백 페이지 읽는 시간 절약)
- 템플릿 활용: 1,000개 이상의 템플릿(신용 계약 에이전트, 실적 발표 에이전트 등) 제공으로 빠른 가치 실현(Time to Value) 지원.
주요 사용 사례 (금융 - 어드바이저): 고객 자료 및 외부 정보 분석을 통한 더 나은 피칭 자료 제작, 실사 질문(DDQ) 답변 자동화.
주요 사용 사례 (법률): 과거 협상 계약 라이브러리 분석을 통한 실시간 협상 지원 (시장 조건 파악, 더 나은 조건 제시).
고위험/복잡 문서 처리 전문성: 금융 보고서(10-K, 실적 발표), 법률 계약서, 과학 논문 등 미묘한 차이와 극도의 정확성이 요구되는 복잡한 문서 처리에 대한 깊은 이해와 특화된 모델 성능. (환각 현상 최소화 및 근거 제시 강조)
ROI (투자 수익률):
- 2025년 이후 AI 투자는 실험 단계를 넘어 실질적인 P&L 영향(ROI) 증명이 중요해짐.
- Hebbia는 명확한 가치 사례(Value Cases)를 통해 ROI 입증. (예: 외부 변호사 비용 절감, 고객 온보딩 시간 단축, 포트폴리오 벤치마킹 효율 향상 등)
가격 정책: 현재는 사용자 기반(per seat) 가격 책정 (사용 장려 목적). 향후 AI 에이전트별 급여/소비량 기반 과금 등 다양한 모델 가능성 있으나, 아직은 시기상조 (채택 및 사용 확산 우선).
UI/UX 철학: 고객 요구사항을 반영하되, 단순히 기능을 추가하는 방식(Salesforce 방식)이 아닌, 전체 소프트웨어를 하나의 구성(composition)으로 보고 지속적으로 재설계(redesign)하여 통합적이고 직관적인 경험 제공 추구.
https://www.hebbia.com/
https://youtu.be/IfuMoOciTPo
산업 분야
- 금융: 투자 은행, 헤지 펀드, 사모 펀드, 자산 운용사 등의 애널리스트, 포트폴리오 매니저 (실적 보고서, 공시 자료, 시장 조사 보고서, 뉴스 분석 등)
- 법률: 로펌 변호사, 기업 법무팀 (계약서 검토, 법률 리서치, 증거 개시(e-discovery) 등)
- 컨설팅: 경영 컨설턴트 (시장 분석, 경쟁사 조사, 실사 보고서 분석 등)
- R&D 및 연구: 제약, 생명과학, 기술 기업의 연구원 (논문 검색, 특허 분석, 임상 시험 데이터 분석 등)
제품
복잡하고 방대한 문서 더미(수천, 수만 페이지)에서 사용자가 자연어 질문을 통해 필요한 정보를 정확하고 빠르게 찾고, 요약하고, 비교 분석할 수 있도록 지원하는 AI 기반 검색 및 분석 플랫폼. "문서를 위한 신경망 검색 엔진" 또는 "AI 리서치 어시스턴트"
- AI 기반 검색: 키워드 검색을 넘어, 의미 기반의 자연어 질문으로 여러 문서에 걸쳐 관련된 내용 검색.
- 정보 추출 및 요약: 문서 내 특정 데이터 포인트(숫자, 이름, 조건 등) 자동 추출, 긴 내용을 핵심만 요약.
- 문서 간 비교 및 종합: 여러 문서의 내용을 비교 분석하고, 관련된 정보를 종합하여 새로운 인사이트 제공.
- 질의응답: 문서 내용을 기반으로 사용자의 질문에 직접 답변. (답변의 근거가 되는 원문 제시)
- 다양한 포맷 지원: PDF, Word, PPT, 이메일, 웹페이지 등 다양한 형태의 정형/비정형 데이터 처리.
- 워크플로우 통합 (잠재적): 특정 산업(금융 실사, 법률 검토 등)에 최적화된 워크플로우 제공 가능성.
가치
- 압도적인 시간 절약: 수작업으로 수 시간, 수일이 걸리던 문서 검토 및 정보 검색 시간을 분 단위로 단축.
- 정확성 및 신뢰도 향상: 사람이 하기 쉬운 정보 누락, 오독, 데이터 추출 오류 등을 AI가 최소화하여 분석의 정확성과 신뢰도 제고. (특히 금융, 법률 등 높은 정확성이 요구되는 분야에서 중요)
- 심층적인 인사이트 발굴: 방대한 문서 간의 숨겨진 연관성이나 패턴을 발견하여 사람이 놓칠 수 있는 깊이 있는 인사이트 제공.
- 더 나은 의사결정 지원: 필요한 정보를 적시에 정확하고 포괄적으로 제공하여 데이터 기반의 신속하고 현명한 의사결정 지원.
- 생산성 향상 및 비용 절감: 지식 노동자가 단순 반복적인 문서 작업에서 벗어나 더 고부가가치 업무에 집중할 수 있도록 하며, 대규모 문서 검토팀 운영 비용 절감.
직접 경쟁사 (AI 지식 플랫폼):
- Glean: 기업 내부 정보(Slack, 이메일, 문서 등) 전반을 검색하고 요약하는 데 강점. Hebbia보다 더 넓은 범위의 일반 기업 대상일 수 있음.
- Vectara: 개발자 친화적인 API 중심의 의미 검색 플랫폼.
대형 플랫폼 기업:
- Microsoft (Copilot): M365 생태계 내 통합, 방대한 기업 고객 기반, Copilot Studio를 통한 맞춤형 AI 구축 지원. SharePoint Syntex 등 문서 이해 기술 보유.
- Google (Vertex AI Search): 강력한 검색 기술과 AI 인프라 기반.
Hebbia의 차별점 (Differentiation):
Chat GPT와의 차이점:
- Chat GPT는 시 쓰기, 숙제 등 단일 작업에는 뛰어나지만, 여러 단계가 필요하거나 차별화된 결과를 요구하는 복잡한 작업에는 한계 ("As a large language model, I can't do that").
- Chat GPT는 공개 데이터만 학습. 금융/법률 등 지식 노동에 중요한 것은 비공개, 비정형 정보(offline unstructured information).
- Chat GPT로 투자 메모 초안을 작성하면 모든 VC가 거의 동일한 결과를 얻음 (차별성, 맞춤 프로세스 부재, 알파 없음).
Hebbia의 접근 방식:
- 금융 서비스의 특성: 정확한 정보, 올바른 결과, 맞춤형 프로세스, 투명성(지식 작업 수행)이 가장 중요.
- 목표: 투자자의 삶과 워크플로우를 개선하는, 근본적으로 변혁적인 AI 도구 구축.
- 차별점: 단순한 AI 인터페이스가 아니라, AI/AGI가 작업을 수행하기 위해 선택할 만한 도구를 지향. (AGI가 직접 모든 것을 처리하는 대신, Hebbia 같은 특화된 도구를 활용하는 것이 더 효율적)
- 비공개 데이터 활용: 고객의 투자 메모, 계약서 등 비공개 데이터를 업로드하여 웹 검색만으로는 불가능한 맞춤형 분석 및 비교 제공. (예: 과거 딜과의 비교 분석)
- 인터페이스: 챗봇 인터페이스를 넘어, 사용자를 강화(empower)하고 작업을 효율화하는 새로운 인터페이스 탐색. (컴퓨터 사용, 추론 능력 통합)
가치 제안:
- 시간 절약 (Faster Speed): 문서 검토, 정보 검색 등 수 시간이 걸리던 작업을 분 단위로 단축.
- 새로운 결과 창출 (Net New Results): 사람이었다면 불가능했거나 놓쳤을 분석 및 통찰력 제공. (예: 방대한 데이터 속에서 숨겨진 연관성 발견, 가설 검증 등)
주요 사용 사례 (금융 - 바이사이드):
- 스크리닝 (Screening): 마케팅 자료(SIM 등)를 플랫폼에 업로드하면, 과거 딜 및 투자 기준과 비교하여 Go/No-Go 결정 지원. (무의미한 노동 제거, 중요한 딜에 집중) 스크리닝 처리량 137% 증가.
- 실사 (Diligence): 방대한 문서(데이터룸, 신용 계약서, 전문가 네트워크 콜 등)에서 인사이트 즉시 추출 및 종합. (수백 페이지 읽는 시간 절약)
- 템플릿 활용: 1,000개 이상의 템플릿(신용 계약 에이전트, 실적 발표 에이전트 등) 제공으로 빠른 가치 실현(Time to Value) 지원.
주요 사용 사례 (금융 - 어드바이저): 고객 자료 및 외부 정보 분석을 통한 더 나은 피칭 자료 제작, 실사 질문(DDQ) 답변 자동화.
주요 사용 사례 (법률): 과거 협상 계약 라이브러리 분석을 통한 실시간 협상 지원 (시장 조건 파악, 더 나은 조건 제시).
고위험/복잡 문서 처리 전문성: 금융 보고서(10-K, 실적 발표), 법률 계약서, 과학 논문 등 미묘한 차이와 극도의 정확성이 요구되는 복잡한 문서 처리에 대한 깊은 이해와 특화된 모델 성능. (환각 현상 최소화 및 근거 제시 강조)
ROI (투자 수익률):
- 2025년 이후 AI 투자는 실험 단계를 넘어 실질적인 P&L 영향(ROI) 증명이 중요해짐.
- Hebbia는 명확한 가치 사례(Value Cases)를 통해 ROI 입증. (예: 외부 변호사 비용 절감, 고객 온보딩 시간 단축, 포트폴리오 벤치마킹 효율 향상 등)
가격 정책: 현재는 사용자 기반(per seat) 가격 책정 (사용 장려 목적). 향후 AI 에이전트별 급여/소비량 기반 과금 등 다양한 모델 가능성 있으나, 아직은 시기상조 (채택 및 사용 확산 우선).
UI/UX 철학: 고객 요구사항을 반영하되, 단순히 기능을 추가하는 방식(Salesforce 방식)이 아닌, 전체 소프트웨어를 하나의 구성(composition)으로 보고 지속적으로 재설계(redesign)하여 통합적이고 직관적인 경험 제공 추구.
https://www.hebbia.com/
https://youtu.be/IfuMoOciTPo
Hebbia
Hebbia | AI for Finance
The leading AI platform for finance, used by the world's leading asset managers, investment banks, law firms and Fortune 500 companies.
Continuous Learning_Startup & Investment
https://manus.im/ 보험 정책 비교: https://manus.im/share/1ICnnOiC9L3HMK07vG0iDn?replay=1 운동량 보존 법칙 설명: https://manus.im/share/pAdLIvlktJmV945593mFio?replay=1 일본 여행 계획: https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1 매트릭스 가격 조사: https://zvgzsafz.manus.space/…
첫 번째 제품: Monica (모니카):
- Chat GPT 출시 1주 전에 시작된 크롬 브라우저 확장 프로그램.
- 문제 인식: 앱 간 전환, 텍스트/이미지 복사/붙여넣기 등 LLM 사용의 번거로움.
- 핵심 기능: 웹페이지 내에서 바로 LLM 기능 사용 (긴 글 요약 아닌 '간소화', 유튜브 요약/팟캐스트 변환, Arxiv 논문 요약/확장, Gmail 초안 작성 등).
- 성과: 해당 카테고리 최고 제품. 월 사용자 2천만 명, 연 매출 5천만 달러 달성 및 성장 중.
두 번째 시도: AI 브라우저 (미출시):
- 동기: 브라우저 확장 프로그램의 한계(크롬/브라우저 사용자 제한, 확장 프로그램 인지도 부족) 극복.
- 개발 (1년 전 시작, 6개월간 집중): 브라우저 곳곳에 AI 기능 내장, 브라우저용 소형 모델 파인튜닝, 자체 브라우저 유닛 구축(페이지를 엑셀로 내보내기 등), AI 기반 탭 관리 대시보드, 이미지/비디오 업스케일링, 링크 미리보기/요약, 웹 자동화 등.
- 중단 이유 (작년 9월):
1. 단일 사용자 사용의 한계: AI가 브라우저를 제어하는 동안 사용자는 키보드/마우스에서 손을 떼고 기다려야 함 (매우 답답함). 작업 완료 시점 예측 불가. 다른 작업 불가.
2. 브라우저 전환의 어려움: 사용자는 기존 브라우저(크롬 등) 기능에 익숙하여, AI 기능 이전에 기본적인 브라우저 완성도를 높게 요구함. 스타트업으로서 감당하기 어려움.
- 극적인 순간: AI 브라우저 프로젝트 중단 결정 직후, Arc 브라우저 창업자 Josh Miller가 Arc 브라우저 중단 및 다음 단계 이동 발표 영상을 봄. (같은 결론 도달)
AI 브라우저 개발로부터 얻은 교훈:
1. AI는 '자신의' 브라우저를 사용해야 한다 (사용자 브라우저 X): AI는 인간보다 웹 기술(단축키 등)을 훨씬 잘 알고 활용할 수 있음. AI가 사용자의 브라우저를 점유하면 사용자는 다른 작업을 할 수 없음.
2. AI는 클라우드에 있어야 한다: 사용자가 계속 지켜볼 필요 없이 백그라운드에서 작업 수행 후 알림.
3. 브라우저 전환 설득은 매우 어렵다: AI 기능 이전에 완벽한 기본 브라우저를 만들어야 함.
영감을 준 Cursor:
- 코딩을 모르는 동료들이 Cursor를 사용하는 방식 관찰.
- 핵심 발견: 코딩 비전문가들은 왼쪽 코드 패널보다 오른쪽 챗 패널(결과)에 더 집중. 코드를 이해하거나 수정하기보다 단순히 '수락'하며 데이터 시각화, 파일 처리 등 다른 목적으로 활용.
- 아이디어 전환: Cursor의 왼쪽(코드) 패널을 숨기고, 오른쪽(챗/결과) 패널을 클라우드로 옮기자! → Manus AI의 탄생 (작년 10월).
4. Manus AI의 기술적 구성 (3가지 핵심 + 근본 철학):
1. AI에게 컴퓨터 제공:
- e2b 활용: 각 Manus 작업마다 클라우드 가상 머신(VM) 할당. (단순 컨테이너보다 완전한 기능의 컴퓨터 제공이 장기적으로 중요)
- 현재 제공 기능: VM 터미널, VS Code, 브라우저 접근.
- 미래: 다른 소프트웨어 사용 지원 (Windows, Android 등 다양한 OS 환경 지원 가능성).
2. 데이터 접근 권한 부여:
- 모든 정보가 공개 인터넷에 있는 것은 아님 (내부 데이터, 유료 데이터 등).
- API 통합: Manus AI가 직접 일부 유료 API(주식 시세, 트위터/링크드인 검색 등)를 사전 구매/통합하여 사용자가 신경 쓰지 않도록 함. (향후 더 많은 API 통합 예정)
3. AI에게 '훈련' 제공 (사용자 맞춤 설정):
- 문제 인식: 인턴을 처음 고용했을 때처럼, AI도 사용자의 선호(작업 방식, 결과 포맷 등)를 처음에는 모름.
- 지식 시스템(Knowledge System): 사용자가 Manus와 상호작용하며 선호도를 가르칠 수 있는 기능. (예: "다음부터 이력서 스크리닝 결과는 문서 말고 스프레드시트로 줘", "특정 인물 조사 시 이런 점을 강조해줘") Manus는 이를 학습하고 기억함.
가장 중요한 것: 근본 철학 (범용성 추구):
- 목표: 평균적인 일반 사용자를 위한 범용 에이전트 구축. (코딩 에이전트가 아님)
- 접근 방식: 사전 정의된 워크플로우(predefined workflows) 방식 지양. (수백 개의 워크플로우를 미리 만드는 것은 불가능)
- 핵심: LLM의 '생각'을 통제하려 하기보다, **LLM에게 더 많은 컨텍스트와 강력한 '손'(실행 환경, 도구, 데이터)**을 제공하여 스스로 작업을 수행하도록 함. (환경 구축에 집중)
Manus 개선 방식: 사용자 피드백 기반. 모든 피드백을 해결하진 않음(지나치게 어려운 요구 제외). 의미 있는 작업 실패 시, (1) 도구 추가/개선 (최근 이미지 읽기 기능 추가), (2) 데이터 API 추가를 통해 시스템 능력 향상. + 파운데이션 모델 자체의 발전 기대.
긴 컨텍스트 처리: 파운데이션 모델의 컨텍스트 길이 증가로 해결되는 부분 + 자체적인 컨텍스트 분할(splitting) 및 관리 기술 적용.
자체 파운데이션 모델 개발 계획: 없음. 모델 훈련 비용은 스타트업에게 너무 부담스러움. 장기적으로 에이전트 능력은 여러 모델에서 상품화(commoditized)될 것으로 예상.
유료/로그인 데이터 접근:
- 현재 가장 큰 장애물은 Cloudflare 등 보안 솔루션의 에이전트 차단.
- 단기 해결책: 주거용 IP(residential IP) 등 우회 방법 사용.
- 중장기 해결책: (1) 에이전트 사용이 보편화되면 Cloudflare 등 보안 업체와 협력하여 합법적인 에이전트 트래픽 허용 추진. (2) Manus AI가 사용자 대신 유료 콘텐츠 비용 지불 (소비량 기반 요금제와 연계).
결론: Manus AI는 강력한 LLM에게 실제 작업을 수행할 수 있는 '손'(컴퓨터 환경, 도구, 데이터 접근, 사용자 선호 학습)을 제공하는 범용 AI 에이전트 플랫폼이다. 실패한 AI 브라우저 프로젝트와 Cursor 사용 행태 관찰을 통해 얻은 교훈을 바탕으로, 사전 정의된 워크플로우가 아닌 LLM의 자율적인 문제 해결 능력을 극대화하는 데 집중한다. GAIA 벤치마크에서 높은 성능과 비용 효율성을 보였으며, 일반 사용자를 위한 다양한 작업 수행 능력을 목표로 한다.
https://youtu.be/Xtw6Og7fNG0
- Chat GPT 출시 1주 전에 시작된 크롬 브라우저 확장 프로그램.
- 문제 인식: 앱 간 전환, 텍스트/이미지 복사/붙여넣기 등 LLM 사용의 번거로움.
- 핵심 기능: 웹페이지 내에서 바로 LLM 기능 사용 (긴 글 요약 아닌 '간소화', 유튜브 요약/팟캐스트 변환, Arxiv 논문 요약/확장, Gmail 초안 작성 등).
- 성과: 해당 카테고리 최고 제품. 월 사용자 2천만 명, 연 매출 5천만 달러 달성 및 성장 중.
두 번째 시도: AI 브라우저 (미출시):
- 동기: 브라우저 확장 프로그램의 한계(크롬/브라우저 사용자 제한, 확장 프로그램 인지도 부족) 극복.
- 개발 (1년 전 시작, 6개월간 집중): 브라우저 곳곳에 AI 기능 내장, 브라우저용 소형 모델 파인튜닝, 자체 브라우저 유닛 구축(페이지를 엑셀로 내보내기 등), AI 기반 탭 관리 대시보드, 이미지/비디오 업스케일링, 링크 미리보기/요약, 웹 자동화 등.
- 중단 이유 (작년 9월):
1. 단일 사용자 사용의 한계: AI가 브라우저를 제어하는 동안 사용자는 키보드/마우스에서 손을 떼고 기다려야 함 (매우 답답함). 작업 완료 시점 예측 불가. 다른 작업 불가.
2. 브라우저 전환의 어려움: 사용자는 기존 브라우저(크롬 등) 기능에 익숙하여, AI 기능 이전에 기본적인 브라우저 완성도를 높게 요구함. 스타트업으로서 감당하기 어려움.
- 극적인 순간: AI 브라우저 프로젝트 중단 결정 직후, Arc 브라우저 창업자 Josh Miller가 Arc 브라우저 중단 및 다음 단계 이동 발표 영상을 봄. (같은 결론 도달)
AI 브라우저 개발로부터 얻은 교훈:
1. AI는 '자신의' 브라우저를 사용해야 한다 (사용자 브라우저 X): AI는 인간보다 웹 기술(단축키 등)을 훨씬 잘 알고 활용할 수 있음. AI가 사용자의 브라우저를 점유하면 사용자는 다른 작업을 할 수 없음.
2. AI는 클라우드에 있어야 한다: 사용자가 계속 지켜볼 필요 없이 백그라운드에서 작업 수행 후 알림.
3. 브라우저 전환 설득은 매우 어렵다: AI 기능 이전에 완벽한 기본 브라우저를 만들어야 함.
영감을 준 Cursor:
- 코딩을 모르는 동료들이 Cursor를 사용하는 방식 관찰.
- 핵심 발견: 코딩 비전문가들은 왼쪽 코드 패널보다 오른쪽 챗 패널(결과)에 더 집중. 코드를 이해하거나 수정하기보다 단순히 '수락'하며 데이터 시각화, 파일 처리 등 다른 목적으로 활용.
- 아이디어 전환: Cursor의 왼쪽(코드) 패널을 숨기고, 오른쪽(챗/결과) 패널을 클라우드로 옮기자! → Manus AI의 탄생 (작년 10월).
4. Manus AI의 기술적 구성 (3가지 핵심 + 근본 철학):
1. AI에게 컴퓨터 제공:
- e2b 활용: 각 Manus 작업마다 클라우드 가상 머신(VM) 할당. (단순 컨테이너보다 완전한 기능의 컴퓨터 제공이 장기적으로 중요)
- 현재 제공 기능: VM 터미널, VS Code, 브라우저 접근.
- 미래: 다른 소프트웨어 사용 지원 (Windows, Android 등 다양한 OS 환경 지원 가능성).
2. 데이터 접근 권한 부여:
- 모든 정보가 공개 인터넷에 있는 것은 아님 (내부 데이터, 유료 데이터 등).
- API 통합: Manus AI가 직접 일부 유료 API(주식 시세, 트위터/링크드인 검색 등)를 사전 구매/통합하여 사용자가 신경 쓰지 않도록 함. (향후 더 많은 API 통합 예정)
3. AI에게 '훈련' 제공 (사용자 맞춤 설정):
- 문제 인식: 인턴을 처음 고용했을 때처럼, AI도 사용자의 선호(작업 방식, 결과 포맷 등)를 처음에는 모름.
- 지식 시스템(Knowledge System): 사용자가 Manus와 상호작용하며 선호도를 가르칠 수 있는 기능. (예: "다음부터 이력서 스크리닝 결과는 문서 말고 스프레드시트로 줘", "특정 인물 조사 시 이런 점을 강조해줘") Manus는 이를 학습하고 기억함.
가장 중요한 것: 근본 철학 (범용성 추구):
- 목표: 평균적인 일반 사용자를 위한 범용 에이전트 구축. (코딩 에이전트가 아님)
- 접근 방식: 사전 정의된 워크플로우(predefined workflows) 방식 지양. (수백 개의 워크플로우를 미리 만드는 것은 불가능)
- 핵심: LLM의 '생각'을 통제하려 하기보다, **LLM에게 더 많은 컨텍스트와 강력한 '손'(실행 환경, 도구, 데이터)**을 제공하여 스스로 작업을 수행하도록 함. (환경 구축에 집중)
Manus 개선 방식: 사용자 피드백 기반. 모든 피드백을 해결하진 않음(지나치게 어려운 요구 제외). 의미 있는 작업 실패 시, (1) 도구 추가/개선 (최근 이미지 읽기 기능 추가), (2) 데이터 API 추가를 통해 시스템 능력 향상. + 파운데이션 모델 자체의 발전 기대.
긴 컨텍스트 처리: 파운데이션 모델의 컨텍스트 길이 증가로 해결되는 부분 + 자체적인 컨텍스트 분할(splitting) 및 관리 기술 적용.
자체 파운데이션 모델 개발 계획: 없음. 모델 훈련 비용은 스타트업에게 너무 부담스러움. 장기적으로 에이전트 능력은 여러 모델에서 상품화(commoditized)될 것으로 예상.
유료/로그인 데이터 접근:
- 현재 가장 큰 장애물은 Cloudflare 등 보안 솔루션의 에이전트 차단.
- 단기 해결책: 주거용 IP(residential IP) 등 우회 방법 사용.
- 중장기 해결책: (1) 에이전트 사용이 보편화되면 Cloudflare 등 보안 업체와 협력하여 합법적인 에이전트 트래픽 허용 추진. (2) Manus AI가 사용자 대신 유료 콘텐츠 비용 지불 (소비량 기반 요금제와 연계).
결론: Manus AI는 강력한 LLM에게 실제 작업을 수행할 수 있는 '손'(컴퓨터 환경, 도구, 데이터 접근, 사용자 선호 학습)을 제공하는 범용 AI 에이전트 플랫폼이다. 실패한 AI 브라우저 프로젝트와 Cursor 사용 행태 관찰을 통해 얻은 교훈을 바탕으로, 사전 정의된 워크플로우가 아닌 LLM의 자율적인 문제 해결 능력을 극대화하는 데 집중한다. GAIA 벤치마크에서 높은 성능과 비용 효율성을 보였으며, 일반 사용자를 위한 다양한 작업 수행 능력을 목표로 한다.
https://youtu.be/Xtw6Og7fNG0
YouTube
Building Manus AI (first ever Manus Meetup)
Manus cofounder Tao Zhang explains the origins and secrets behind Manus, which took the AI world by storm this month as a new Operator competitor.
https://manus.im/
https://manus.im/