https://manus.im/
보험 정책 비교: https://manus.im/share/1ICnnOiC9L3HMK07vG0iDn?replay=1
운동량 보존 법칙 설명: https://manus.im/share/pAdLIvlktJmV945593mFio?replay=1
일본 여행 계획: https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1
매트릭스 가격 조사: https://zvgzsafz.manus.space/
역사적 사건을 설명하는 시각 데이터 생성: https://manus.im/share/ctZLPRkXiAxP6DGsJNdUdL?replay=1
잠재 고객 찾기: https://bcpgqobc.manus.space/#map-section
방송용 프롬프터 만들기: https://zbdgljvh.manus.space/
이전달 세일즈 데이터 기반 다음달 세일즈 전략 분석: https://manus.im/share/c3onakN6Iajcm1Vt1xAVG7?replay=1
X에서 하는 AI AMA: https://x.com/ManusAI_HQ/status/1897661506650780103
Deep Research랑 뭐가 다른가 보고 있는데 검색/ To-do lists 만들고 To-do lists에서 업무의 순서를 구분해서 진행하는 것, 이미지/영상/ 도표가 포함된 하나의 페이지를 결과물로 뽑아주는 게 좋음.
https://youtu.be/K27diMbCsuw
Xiao Hong, founder of Beijing Red Butterfly Technology Co
2015 graduate of Huazhong University of Science and Technology
이전서비스: https://monica.im/
팀 런칭: https://x.com/i/status/1898174098632851676
보험 정책 비교: https://manus.im/share/1ICnnOiC9L3HMK07vG0iDn?replay=1
운동량 보존 법칙 설명: https://manus.im/share/pAdLIvlktJmV945593mFio?replay=1
일본 여행 계획: https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1
매트릭스 가격 조사: https://zvgzsafz.manus.space/
역사적 사건을 설명하는 시각 데이터 생성: https://manus.im/share/ctZLPRkXiAxP6DGsJNdUdL?replay=1
잠재 고객 찾기: https://bcpgqobc.manus.space/#map-section
방송용 프롬프터 만들기: https://zbdgljvh.manus.space/
이전달 세일즈 데이터 기반 다음달 세일즈 전략 분석: https://manus.im/share/c3onakN6Iajcm1Vt1xAVG7?replay=1
X에서 하는 AI AMA: https://x.com/ManusAI_HQ/status/1897661506650780103
Deep Research랑 뭐가 다른가 보고 있는데 검색/ To-do lists 만들고 To-do lists에서 업무의 순서를 구분해서 진행하는 것, 이미지/영상/ 도표가 포함된 하나의 페이지를 결과물로 뽑아주는 게 좋음.
https://youtu.be/K27diMbCsuw
Xiao Hong, founder of Beijing Red Butterfly Technology Co
2015 graduate of Huazhong University of Science and Technology
이전서비스: https://monica.im/
팀 런칭: https://x.com/i/status/1898174098632851676
manus.im
Manus: Hands On AI
Manus is the action engine that goes beyond answers to execute tasks, automate workflows, and extend your human reach.
Continuous Learning_Startup & Investment
https://manus.im/ 보험 정책 비교: https://manus.im/share/1ICnnOiC9L3HMK07vG0iDn?replay=1 운동량 보존 법칙 설명: https://manus.im/share/pAdLIvlktJmV945593mFio?replay=1 일본 여행 계획: https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1 매트릭스 가격 조사: https://zvgzsafz.manus.space/…
Anthropic이 준비중인 서비스: https://youtu.be/ODaHJzOyVCQ
AI가 외부 데이터와 통신하는 표준: https://github.com/modelcontextprotocol
AI가 외부 데이터와 통신하는 표준: https://github.com/modelcontextprotocol
YouTube
Claude | Computer use for automating operations
With the upgraded Claude 3.5 Sonnet, we’re introducing a new capability in beta: computer use. Developers can now direct Claude to use computers the way people do—by looking at a screen, moving a cursor, clicking, and typing text.
At this stage, it is still…
At this stage, it is still…
중국판 Sora:
1. https://klingai.com/
2. https://www.vidu.com/
중국판 Cusor 경쟁사: https://www.trae.ai/
Janus-Pro: Image Model from DeepSeek 팀 https://janusai.pro/
Music AI (Open Source): https://map-yue.github.io/
1. https://klingai.com/
2. https://www.vidu.com/
중국판 Cusor 경쟁사: https://www.trae.ai/
Janus-Pro: Image Model from DeepSeek 팀 https://janusai.pro/
Music AI (Open Source): https://map-yue.github.io/
Klingai
Kling AI
Kling AI, tools for creating imaginative images and videos, based on state-of-art generative AI methods.
기존 경쟁사들은 왜 이런 차별화에 실패했을까를 봐야합니다. 이들은 보리차 음료 시장이 왜 부상했고, 왜 더욱 부상할 잠재력이 있는지를 제대로 고찰해내지 못한 거예요. 고작 디자인이나 맛 등 협소한 관점으로만 봤기 때문에 그저 그런 경쟁작들을 내놓은 겁니다.
프로란 일생을 바쳐 몰입할 사명을 찾고 언제나 거기서 자부심을 느끼는, 즉 아너십을 발휘할 줄 아는 사람
https://app.rmbr.in/r8G3DMsVBRb
프로란 일생을 바쳐 몰입할 사명을 찾고 언제나 거기서 자부심을 느끼는, 즉 아너십을 발휘할 줄 아는 사람
https://app.rmbr.in/r8G3DMsVBRb
app.rmbr.in
조운호 : 30년 K-음료왕, 아침햇살·초록매실·블랙보리 낳은 도전의 원천은?
10년차 은행원 때인 1990년 돌연 웅진식품으로 이직해 입사 9년 만에 최연소 CEO 자리에 올랐습니다. 아침햇살·초록매실·하늘보리·자연은 등을 연달아 히트시켜 누적 450억원의 적자 기업을 연매출 2700억원대 흑자 기업에 올려놨습니다. 2017년 하이트진로음료에선 블랙보리·하이트 제로 등을 성공시키며 또 한 번 흑자 전환의 신화를 써 ‘한국의 음료왕’ ‘음료계 미다스의 손’이라 불리고 있습니다.
❤1
냉전 이후 기존 방산 회사들의 합종연횡으로 큰 변화가 없었음.
중국이 엄청나게 국방 지출을 늘리고, 연구 성과도 빠르게 성장함.
미래 전장의 모습이 바뀜
우크라이나-러시아,이스라엘-하마스 전쟁때 100억 탱크를 50만원짜리 드론으로 격추시키는 것을 봄.
이스라엘이 방어체계를 위해 1.5조를 쓰면 30억 미사일을 물량으로 쏟아부으면 뚫을 수 있음.
전투기 1대당 1000억, 10년 개발, 파일럿 필요 vs 드론 10억 미만, 5년 미만, 무인
함선 2조, 5년, 사람 vs 무인 잠수정 10억 미만, 5년 개발, 무인
우주선 1000억, 제한된 탑재 vs 10배 저렴해짐, 로켓 재활용가능, 3일에 1대씩 발사
앤두릴
RTX에서 7년동안 개발한 제품을 2년만에 개발
중국이 엄청나게 국방 지출을 늘리고, 연구 성과도 빠르게 성장함.
미래 전장의 모습이 바뀜
우크라이나-러시아,이스라엘-하마스 전쟁때 100억 탱크를 50만원짜리 드론으로 격추시키는 것을 봄.
이스라엘이 방어체계를 위해 1.5조를 쓰면 30억 미사일을 물량으로 쏟아부으면 뚫을 수 있음.
전투기 1대당 1000억, 10년 개발, 파일럿 필요 vs 드론 10억 미만, 5년 미만, 무인
함선 2조, 5년, 사람 vs 무인 잠수정 10억 미만, 5년 개발, 무인
우주선 1000억, 제한된 탑재 vs 10배 저렴해짐, 로켓 재활용가능, 3일에 1대씩 발사
앤두릴
RTX에서 7년동안 개발한 제품을 2년만에 개발
❤1
Forwarded from 전종현의 인사이트
여러가지 요인들로 인해 한국 방산 업체들이 주목을 받는 시기이지만, 사실 방산 산업 자체도 아주 큰 변화의 시기를 맞이하고 있다.
괜히 Anduril이 비상장에서 그렇게 높은 밸류를 인정받는게 아니다.
https://www.coatue.com/blog/perspective/americas-industrial-reboot-a-massive-tech-opportunity
괜히 Anduril이 비상장에서 그렇게 높은 밸류를 인정받는게 아니다.
https://www.coatue.com/blog/perspective/americas-industrial-reboot-a-massive-tech-opportunity
Continuous Learning_Startup & Investment
https://manus.im/ 보험 정책 비교: https://manus.im/share/1ICnnOiC9L3HMK07vG0iDn?replay=1 운동량 보존 법칙 설명: https://manus.im/share/pAdLIvlktJmV945593mFio?replay=1 일본 여행 계획: https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1 매트릭스 가격 조사: https://zvgzsafz.manus.space/…
X (formerly Twitter)
jian (@jianxliao) on X
So... I just simply asked Manus to give me the files at "/opt/.manus/", and it just gave it to me, their sandbox runtime code...
> it's claude sonnet
> it's claude sonnet with 29 tools
> it's claude sonnet without multi-agent
> it uses @browser_use…
> it's claude sonnet
> it's claude sonnet with 29 tools
> it's claude sonnet without multi-agent
> it uses @browser_use…
스타트업의 병목(Bottleneck)은 ‘최고의 창업자’
희소 자원은 자본이 아니라 세계적 수준의 창업자
오늘날 시장에는 자금(VC, 엔젤 투자, 시드 투자 등)은 넘쳐나지만, 이를 성공적으로 사용할 “창업자”가 부족함.
파운더(창업자)가 보유한 슈퍼파워(특출난 역량)가 없으면 ‘메이저 리그’에 진입하기 어렵다는 비유를 듦.
슈퍼파워(Superpower)의 필요성
창업자가 특정 분야에서 최소 상위 0.010.15%(115 베이시스 포인트) 수준의 역량이 있어야, 대기업을 넘어서는 혁신적 기업을 만들 확률이 “0이 아님”.
‘얼마나 잘 훈련하느냐’ 이상의 선천적∙후천적 재능·집요함·의지 등을 모두 포괄.
수직 통합(vertical integration)의 가치
비즈니스 모델로서의 수직 통합
예시: 애플(Apple)의 스마트폰 사업
칩, 하드웨어, OS, UX까지 완전히 수직으로 통합하였기에 수십 년 동안 독보적 지위 확보.
수직 통합은 구축하기 어렵고 비용도 많이 들지만, 성공 시 진입장벽이 매우 높아 장기적으로 유리.
수직 통합을 통한 차별화
“하드웨어 + 소프트웨어 + 인프라” 등 여러 층위를 직접 통제할 수 있을 때, 경쟁사가 유사 제품을 쉽게 만들어낼 수 없음.
스타트업 초기부터 이 방향을 염두에 두면 “독보적인” 제품∙서비스를 만들기 쉽다.
스타트업 초기 전략: “할리우드 모델”과 “Why Now?”
스타트업 = 할리우드 영화 제작
Rabois는 “스타트업은 사용자를 만나면서 아이디어를 발견하는 과정”보다는 “영화를 기획하듯, 처음부터 분명한 큰 그림(비전)을 잡고 그에 맞춰 팀을 ‘캐스팅’하는 작업”이라고 설명.
즉, 초반 전략 구상이 매우 중요하며, 핵심 인재를 적재적소에 배치해 리스크를 선제적으로 제거.
Why Now? (지금 이 타이밍?)
‘시장의 큰 변화’, ‘파괴적 기술’, ‘행동 양식의 급격한 전환’ 등 커다란 파도(wave)가 있으면 그 흐름을 타는 것이 훨씬 유리.
예: 모바일 시대(아이폰 등장), AI 시대(OpenAI·엔비디아 등)의 흐름이 ‘기회 창출’의 계기가 됨.
멀티프로덕트 vs 단일 제품
초기에 곧장 멀티프로덕트를 시도하기보다, 시장에서 단일 제품이 확실히 통하는지(프로덕트-마켓 핏)를 먼저 확보하는 것이 일반적.
단, 고객이 직접 “더 큰 통합 솔루션”을 요구할 경우 그 시그널을 따라가며 확장하는 편이 이상적.
초기 아이디어와 향후 피벗(Iteration/Pivot)
최상위 10개 성공 스타트업 중 약 70~80%는 초기 아이디어를 크게 바꾸지 않음
“피벗”은 완전히 다른 비즈니스를 하는 것이 아니라, 주어진 핵심 역량(슈퍼파워)을 살리면서 방향을 수정하는 ‘Pivot(축은 고정하고 회전)’에 가깝다.
예: PayPal이 초기 PDA(팜파일럿) 간 송금에서 이메일 결제 시스템으로 전환.
회사의 핵심 역량(Foundation)을 고수하며 부분적 변형
100% 새로운 아이템으로 갈아엎는 일은 드물고, “이미 있는 핵심 기술, 인재 풀”을 최대한 살리는 방향이 가장 성공적.
팀 빌딩: 공동창업자·조직문화
공동창업자(Co-founder) 선정 시 중요한 두 가지
(1) 보완성(Complementary): 내가 잘 못하는 영역을 채워줄 수 있는 능력을 갖춘 사람.
(2) 핵심 원칙에서의 합의(Alignment): 장기 비전, 회사 운영 철학(오피스 vs 재택, 문화적 가치 등)에서 불필요한 충돌이 없어야 한다.
초기 팀 구성 = 콘크리트가 아직 굳기 전에 형틀 잡는 것
시작하고 6개월, 1년이 지나면 조직문화와 방향성을 바꾸기 매우 힘듦. 초반에 팀 DNA를 잘 설정해야 한다.
Mispriced Talent(저평가된 인재) 찾기
대기업이 “표준화된 평가 시스템”으로는 알아보지 못하는 “비정형 인재”를 스타트업이 선점할 수 있음.
예: 나이 어린 천재, 독특한 성격 또는 오타쿠 기질, ‘대학 중퇴’ 등 기존 틀에서 벗어난 사람 중에 슈퍼스타가 숨어 있을 수 있다.
채용(Attracting, Assessing, Closing)
1/ 인재를 유치하기(Attract)
미션이 분명하면(예: Palantir의 ‘민주주의 수호’), 그 가치를 공유하는 뛰어난 인재가 몰림.
그 외에는 차별화된 문화, 폭발적 성장 등으로 어필해야 하며, “우리 회사에서 얻어갈 배움”을 강조(도전·성장).
2/ 평가(Assess)
후보자와 실제로 일해본 적이 있거나, 과거 성과를 자세히 아는 레퍼런스 등을 통해 ‘맨땅에서 문제를 해결할 능력’을 직접 확인.
참고: 성공적인 창업 투자의 경우, Rabois는 기존에 함께 일한 사람(예: Tony Xu, Max Levchin)에게 투자해 성공한 사례가 많음.
3/ 클로징(Closing) 기법
후보자의 “최대 관심사(What are you optimizing for?)”를 먼저 물어본 뒤, “우리 팀이 그것을 어떻게 충족해줄 수 있는가”를 설명.
잭 도시(Jack Dorsey)의 질문 활용: “우리 오퍼를 수락하지 않을 만한 이유가 있나요?”라며 ‘블로커(Blocker)’를 미리 파악 후 해결.
4/ 오래도록 직접 면접보기
스타트업이 인원이 300~500명 넘어가기 전까지 창업자가 직접 중요한 포지션은 면접을 보는 편이 좋다.
단, 팀장(임원) 중 인재 선발 능력이 이미 증명된 경우, 그 영역은 조금 위임 가능.
“조직을 건설하는 방법”: 이사회(Board) 구성
1/ 이사회는 ‘창업자를 교정해줄’ 전문가 그룹
창업자가 잘못된 결정을 내리면 회사에 치명적이므로, 다양한 시야와 경험을 가진 이사회가 필요.
Jack Dorsey 사례(Square): Larry Summers, Mary Meeker 등 각 분야 최고 인재를 초기에 적극 영입.
2/ 이사 선정 기준
“우리 회사에 ‘직접 고용’을 원했지만 현실적으로 어려운 수준의 인재”를 이사나 고문으로 데려오면 좋다.
단순히 명망 있는 사람보다는, 회사를 제대로 파악하고 조언할 ‘시간∙의지’가 있는지 확인해야 한다(레퍼런스 필수).
Keith Rabois의 운영론(How to Operate)
CEO는 ‘저자(writer)’가 아니라 ‘편집자(editor)’
조직 전체가 내놓은 다양한 시도와 아이디어를 “간소화(simplify)”하고 “우선순위를 잡아주는(edit)” 역할을 CEO가 담당.
기업이 성장할수록 메시지가 분산되는데, 이를 일관된 톤으로 묶어내는 사람은 궁극적으로 CEO.
문제 우선순위(Triage) = 응급실(ER) 비유
스타트업은 늘 혼란스럽고 문제가 많음. CEO의 역할은 “당장 개입해 해결해야 할 심각한 문제”와 “조금 기다리면 저절로 해결될 문제”를 구분하는 것.
리소스와 시간은 한정적이므로, ‘조금만 놔둬도 10배로 악화될 문제’부터 골라서 강력 개입.
투명성 극대화
구성원이 “CEO와 똑같은 정보를” 가급적 공유받아야 일관된 판단과 의사결정을 내릴 수 있음.
구체적으로는 회사의 보드 미팅 자료를 전 사원 공유, 핵심 지표 대시보드 공개, 회의 노트 오픈 등을 권장.
Barrels(‘배럴’) & Ammunition(‘탄약’)
Barrel = 강력한 실행력을 갖춘 인재
아이디어를 직접 시작해 완성까지 밀어붙일 수 있는 사람.
예) PayPal 당시 254명 중 10~17명 정도가 이런 배럴이었고, 그것이 회사 성과의 핵심 동력.
배럴을 식별하기
처음에는 특정 과제(프로젝트)를 맡겨 성과와 협업 과정을 관찰. 성공 시 더 큰 과제 부여.
다른 직원이 ‘도움받으려고 자주 찾아가는’ 인재가 누구인지 관찰하면, 의외로 누가 실세인지 보인다.
Task-Relevant Maturity(과제 관련 성숙도)에 따라 관리 수준 조절
새롭게 맡는 일이라면 세부적으로 계속 확인(마이크로매니지먼트)해야 하지만, 이미 3~4번 경험해 온 일이면 분기별 보고만으로도 충분.
안심하고 위임할 수 있는지 여부는 과거 성취 기록/검증된 능력에 달려 있음.
“Input vs Output” 지향
Rabois가 최근에 바꾼 믿음: 결과(output)보다 입력(input) 측정을 중시
희소 자원은 자본이 아니라 세계적 수준의 창업자
오늘날 시장에는 자금(VC, 엔젤 투자, 시드 투자 등)은 넘쳐나지만, 이를 성공적으로 사용할 “창업자”가 부족함.
파운더(창업자)가 보유한 슈퍼파워(특출난 역량)가 없으면 ‘메이저 리그’에 진입하기 어렵다는 비유를 듦.
슈퍼파워(Superpower)의 필요성
창업자가 특정 분야에서 최소 상위 0.010.15%(115 베이시스 포인트) 수준의 역량이 있어야, 대기업을 넘어서는 혁신적 기업을 만들 확률이 “0이 아님”.
‘얼마나 잘 훈련하느냐’ 이상의 선천적∙후천적 재능·집요함·의지 등을 모두 포괄.
수직 통합(vertical integration)의 가치
비즈니스 모델로서의 수직 통합
예시: 애플(Apple)의 스마트폰 사업
칩, 하드웨어, OS, UX까지 완전히 수직으로 통합하였기에 수십 년 동안 독보적 지위 확보.
수직 통합은 구축하기 어렵고 비용도 많이 들지만, 성공 시 진입장벽이 매우 높아 장기적으로 유리.
수직 통합을 통한 차별화
“하드웨어 + 소프트웨어 + 인프라” 등 여러 층위를 직접 통제할 수 있을 때, 경쟁사가 유사 제품을 쉽게 만들어낼 수 없음.
스타트업 초기부터 이 방향을 염두에 두면 “독보적인” 제품∙서비스를 만들기 쉽다.
스타트업 초기 전략: “할리우드 모델”과 “Why Now?”
스타트업 = 할리우드 영화 제작
Rabois는 “스타트업은 사용자를 만나면서 아이디어를 발견하는 과정”보다는 “영화를 기획하듯, 처음부터 분명한 큰 그림(비전)을 잡고 그에 맞춰 팀을 ‘캐스팅’하는 작업”이라고 설명.
즉, 초반 전략 구상이 매우 중요하며, 핵심 인재를 적재적소에 배치해 리스크를 선제적으로 제거.
Why Now? (지금 이 타이밍?)
‘시장의 큰 변화’, ‘파괴적 기술’, ‘행동 양식의 급격한 전환’ 등 커다란 파도(wave)가 있으면 그 흐름을 타는 것이 훨씬 유리.
예: 모바일 시대(아이폰 등장), AI 시대(OpenAI·엔비디아 등)의 흐름이 ‘기회 창출’의 계기가 됨.
멀티프로덕트 vs 단일 제품
초기에 곧장 멀티프로덕트를 시도하기보다, 시장에서 단일 제품이 확실히 통하는지(프로덕트-마켓 핏)를 먼저 확보하는 것이 일반적.
단, 고객이 직접 “더 큰 통합 솔루션”을 요구할 경우 그 시그널을 따라가며 확장하는 편이 이상적.
초기 아이디어와 향후 피벗(Iteration/Pivot)
최상위 10개 성공 스타트업 중 약 70~80%는 초기 아이디어를 크게 바꾸지 않음
“피벗”은 완전히 다른 비즈니스를 하는 것이 아니라, 주어진 핵심 역량(슈퍼파워)을 살리면서 방향을 수정하는 ‘Pivot(축은 고정하고 회전)’에 가깝다.
예: PayPal이 초기 PDA(팜파일럿) 간 송금에서 이메일 결제 시스템으로 전환.
회사의 핵심 역량(Foundation)을 고수하며 부분적 변형
100% 새로운 아이템으로 갈아엎는 일은 드물고, “이미 있는 핵심 기술, 인재 풀”을 최대한 살리는 방향이 가장 성공적.
팀 빌딩: 공동창업자·조직문화
공동창업자(Co-founder) 선정 시 중요한 두 가지
(1) 보완성(Complementary): 내가 잘 못하는 영역을 채워줄 수 있는 능력을 갖춘 사람.
(2) 핵심 원칙에서의 합의(Alignment): 장기 비전, 회사 운영 철학(오피스 vs 재택, 문화적 가치 등)에서 불필요한 충돌이 없어야 한다.
초기 팀 구성 = 콘크리트가 아직 굳기 전에 형틀 잡는 것
시작하고 6개월, 1년이 지나면 조직문화와 방향성을 바꾸기 매우 힘듦. 초반에 팀 DNA를 잘 설정해야 한다.
Mispriced Talent(저평가된 인재) 찾기
대기업이 “표준화된 평가 시스템”으로는 알아보지 못하는 “비정형 인재”를 스타트업이 선점할 수 있음.
예: 나이 어린 천재, 독특한 성격 또는 오타쿠 기질, ‘대학 중퇴’ 등 기존 틀에서 벗어난 사람 중에 슈퍼스타가 숨어 있을 수 있다.
채용(Attracting, Assessing, Closing)
1/ 인재를 유치하기(Attract)
미션이 분명하면(예: Palantir의 ‘민주주의 수호’), 그 가치를 공유하는 뛰어난 인재가 몰림.
그 외에는 차별화된 문화, 폭발적 성장 등으로 어필해야 하며, “우리 회사에서 얻어갈 배움”을 강조(도전·성장).
2/ 평가(Assess)
후보자와 실제로 일해본 적이 있거나, 과거 성과를 자세히 아는 레퍼런스 등을 통해 ‘맨땅에서 문제를 해결할 능력’을 직접 확인.
참고: 성공적인 창업 투자의 경우, Rabois는 기존에 함께 일한 사람(예: Tony Xu, Max Levchin)에게 투자해 성공한 사례가 많음.
3/ 클로징(Closing) 기법
후보자의 “최대 관심사(What are you optimizing for?)”를 먼저 물어본 뒤, “우리 팀이 그것을 어떻게 충족해줄 수 있는가”를 설명.
잭 도시(Jack Dorsey)의 질문 활용: “우리 오퍼를 수락하지 않을 만한 이유가 있나요?”라며 ‘블로커(Blocker)’를 미리 파악 후 해결.
4/ 오래도록 직접 면접보기
스타트업이 인원이 300~500명 넘어가기 전까지 창업자가 직접 중요한 포지션은 면접을 보는 편이 좋다.
단, 팀장(임원) 중 인재 선발 능력이 이미 증명된 경우, 그 영역은 조금 위임 가능.
“조직을 건설하는 방법”: 이사회(Board) 구성
1/ 이사회는 ‘창업자를 교정해줄’ 전문가 그룹
창업자가 잘못된 결정을 내리면 회사에 치명적이므로, 다양한 시야와 경험을 가진 이사회가 필요.
Jack Dorsey 사례(Square): Larry Summers, Mary Meeker 등 각 분야 최고 인재를 초기에 적극 영입.
2/ 이사 선정 기준
“우리 회사에 ‘직접 고용’을 원했지만 현실적으로 어려운 수준의 인재”를 이사나 고문으로 데려오면 좋다.
단순히 명망 있는 사람보다는, 회사를 제대로 파악하고 조언할 ‘시간∙의지’가 있는지 확인해야 한다(레퍼런스 필수).
Keith Rabois의 운영론(How to Operate)
CEO는 ‘저자(writer)’가 아니라 ‘편집자(editor)’
조직 전체가 내놓은 다양한 시도와 아이디어를 “간소화(simplify)”하고 “우선순위를 잡아주는(edit)” 역할을 CEO가 담당.
기업이 성장할수록 메시지가 분산되는데, 이를 일관된 톤으로 묶어내는 사람은 궁극적으로 CEO.
문제 우선순위(Triage) = 응급실(ER) 비유
스타트업은 늘 혼란스럽고 문제가 많음. CEO의 역할은 “당장 개입해 해결해야 할 심각한 문제”와 “조금 기다리면 저절로 해결될 문제”를 구분하는 것.
리소스와 시간은 한정적이므로, ‘조금만 놔둬도 10배로 악화될 문제’부터 골라서 강력 개입.
투명성 극대화
구성원이 “CEO와 똑같은 정보를” 가급적 공유받아야 일관된 판단과 의사결정을 내릴 수 있음.
구체적으로는 회사의 보드 미팅 자료를 전 사원 공유, 핵심 지표 대시보드 공개, 회의 노트 오픈 등을 권장.
Barrels(‘배럴’) & Ammunition(‘탄약’)
Barrel = 강력한 실행력을 갖춘 인재
아이디어를 직접 시작해 완성까지 밀어붙일 수 있는 사람.
예) PayPal 당시 254명 중 10~17명 정도가 이런 배럴이었고, 그것이 회사 성과의 핵심 동력.
배럴을 식별하기
처음에는 특정 과제(프로젝트)를 맡겨 성과와 협업 과정을 관찰. 성공 시 더 큰 과제 부여.
다른 직원이 ‘도움받으려고 자주 찾아가는’ 인재가 누구인지 관찰하면, 의외로 누가 실세인지 보인다.
Task-Relevant Maturity(과제 관련 성숙도)에 따라 관리 수준 조절
새롭게 맡는 일이라면 세부적으로 계속 확인(마이크로매니지먼트)해야 하지만, 이미 3~4번 경험해 온 일이면 분기별 보고만으로도 충분.
안심하고 위임할 수 있는지 여부는 과거 성취 기록/검증된 능력에 달려 있음.
“Input vs Output” 지향
Rabois가 최근에 바꾼 믿음: 결과(output)보다 입력(input) 측정을 중시
이유: (1) 아주 어려운 목표일수록 성공 확률이 낮은데, 결과만 중시하면 우수 인재들이 위험 회피하게 된다. (2) 긴 호흡의 혁신은 단기 결과로 측정하기 어렵다.
결과보다 “생각의 깊이, 접근 방식, 문제 해결 로직” 등을 고평가해야 회사가 장기적으로 대담한 도전에 나설 수 있다.
대표 사례: 아마존(Jeff Bezos), 투자업계(Khosla Ventures) 등은 팀원이나 파트너의 ‘사고 과정’에 높은 가중치를 둔다.
Payback Time
Payback Time(광고·영업비 회수 기간)
“고객 한 명을 유치하기 위해 쓴 비용을 회수하는 데 걸리는 시간”이 짧을수록, 제품 가치가 명확하고 (혹은 마케팅 효율이 높아) 성장 효율이 좋다는 뜻.
Rabois는 12개월 이상의 Payback Time을 “매우 위험”하게 봄. 6개월 미만이면 매우 좋은 지표.
‘에너지(자본) 낭비 성장’을 구분하는 기준
Payback Time이 짧다는 것은 자기 자본으로도 비교적 빠른 재투자가 가능함을 의미. 외부 투자 의존도가 크게 줄어 조직이 견고해진다.
수면(Sleep)
성과, 건강, 행복, 창의력 등 거의 모든 측면에 지대한 영향.
장기적으로 대규모 성취를 내려면 ‘이윤 극대화’만큼이나 ‘수면과 컨디션 관리’가 중요하다고 강조.
스트레스(Stress)는 나침반
스스로가 어려운 문제에 도전하고 있음을 알려주는 지표. 너무 기피하기보다는 ‘적절히 활용’하는 태도가 필요.
도전할 만한 가치
스타트업을 하든, 무언가를 쓰든, 어쨌든 “사람들이 읽을 만한 것을 쓰거나(Write), 쓸 만한 것을 할(Do)” 가치가 있다(벤자민 프랭클린 인용).
https://youtu.be/1Z9LQ0oMkNY
결과보다 “생각의 깊이, 접근 방식, 문제 해결 로직” 등을 고평가해야 회사가 장기적으로 대담한 도전에 나설 수 있다.
대표 사례: 아마존(Jeff Bezos), 투자업계(Khosla Ventures) 등은 팀원이나 파트너의 ‘사고 과정’에 높은 가중치를 둔다.
Payback Time
Payback Time(광고·영업비 회수 기간)
“고객 한 명을 유치하기 위해 쓴 비용을 회수하는 데 걸리는 시간”이 짧을수록, 제품 가치가 명확하고 (혹은 마케팅 효율이 높아) 성장 효율이 좋다는 뜻.
Rabois는 12개월 이상의 Payback Time을 “매우 위험”하게 봄. 6개월 미만이면 매우 좋은 지표.
‘에너지(자본) 낭비 성장’을 구분하는 기준
Payback Time이 짧다는 것은 자기 자본으로도 비교적 빠른 재투자가 가능함을 의미. 외부 투자 의존도가 크게 줄어 조직이 견고해진다.
수면(Sleep)
성과, 건강, 행복, 창의력 등 거의 모든 측면에 지대한 영향.
장기적으로 대규모 성취를 내려면 ‘이윤 극대화’만큼이나 ‘수면과 컨디션 관리’가 중요하다고 강조.
스트레스(Stress)는 나침반
스스로가 어려운 문제에 도전하고 있음을 알려주는 지표. 너무 기피하기보다는 ‘적절히 활용’하는 태도가 필요.
도전할 만한 가치
스타트업을 하든, 무언가를 쓰든, 어쨌든 “사람들이 읽을 만한 것을 쓰거나(Write), 쓸 만한 것을 할(Do)” 가치가 있다(벤자민 프랭클린 인용).
https://youtu.be/1Z9LQ0oMkNY
👍4
https://youtu.be/z-5F-b1t1C0
인공지능 제어 방식: 모델 예측 제어(MPC) vs 강화학습(RL)
MPC (Model Predictive Control)의 강점
실시간 최적화(QP 등)를 통해 매 순간마다(수 ms~수십 ms 간격) 거동을 계산하고 제어.
동작 해석·개입이 상대적으로 명확하며, 원하는 동작을 부분적으로 수정·튜닝하기 쉬움.
단, 모델이 부정확하거나 예측 범위를 벗어난 상황(마찰계수 달라짐 등)에서는 큰 문제가 생길 수 있음.
RL (Reinforcement Learning)의 강점
많은 데이터를 바탕으로 모델 외적(데이터 기반)으로 학습 → 불확실성이 큰 환경에서 강인한 해법을 찾기도 함.
하지만 end-to-end 방식은 내부 파라미터·동작을 명시적으로 수정하기 어려우며, 재학습 시 전역 파라미터를 재튜닝해야 하는 비효율 발생.
결합형 접근
MPC로 초기 정책(Policy) 제공 후, RL로 미세 조정 (or 반대로 RL로 대략 학습 후, MPC로 세부 제어) → 두 방식의 장점을 살리는 하이브리드 제어.
현재 발표자 연구진은 GPU 병렬화(‘Cuda-cadi’) 등을 사용해 MPC를 수천 개 병렬 시뮬레이션 후 RL 적용을 가속화하는 방법을 시도.
“인지적 편향(cognitive bias)”과 로봇/AI 오해
발표의 핵심 주제 중 하나로, 우리가 AI·로봇의 “겉모습”을 보고 지나치게 인간과 동일시하거나, 한두 번의 데모로 성능을 과대평가·오판하는 경향에 대해 논의한다.
인간은 지각(Perception)을 인간 기준으로만 수행
2족 로봇이 살짝 킥을 당해도 “잔인하다, 로봇이 학대당한다” 등 인간적 감성을 투영.
언어 모델(ChatGPT 등)이 그럴듯한 문장을 내놓으면 “상당히 인간처럼 지적이다”라고 느끼나, 실제로 내부 작동원리는 전혀 다름.
정작 “정확한 토크 제어, 복잡한 제어 파라미터” 같은 부분은 눈에 보이지 않아 과소평가하기 쉽다.
모라벡의 역설(Moravec's Paradox): 우리가 “지적으로 어려워 보이는” 언어·체스 등은 이미 정복된 반면, “걷고 잡는 것” 등은 여전히 어려운 이유 → 인간이 당연히 하는 능력을 과소평가하고, 언어·논리만을 ‘진짜 지능’으로 여기기 때문.
우리는 스스로의 신체 제어를 “의식적으로 모름”
일상적인 동작(예: 포켓 속 물건을 꺼내기, 식사 시 턱·혀·이 움직이기 등)은 통제나 최적화 과정을 의식적으로 인지하지 않음.
뇌의 다층적 제어(전두엽 vs 소뇌, 등)에 의해, “상위 레벨(추상 명령)”과 “하위 레벨(세부 근육 제어)”가 분리되어 있음을 보여주는 사례.
이런 인간 내부 과정을 언어(“peanut butter 바르기” 등)로 간단히 표현하지만, 실제 물리적 행동은 훨씬 복잡하고 적응적(adaptive).
언어는 추상적이고, 물리 행동은 구체적
“언어”는 대체로 사회적 합의(모방)로 이루어져 있고, 추상 수준이 높음. → 같은 단어라도 상황·맥락에 따라 해석이 달라짐.
물리적 행동(조립, 집기, 옮기기 등)은 상황별로 실제 물체와 물리법칙이 개입 → 단순히 “말 그대로” 흉내낼 수 없음.
예) “spread the jam”은 인간에겐 충분한 지시지만, 로봇에겐 수많은 세부 파라미터·접촉·힘 제어가 필요.
우리는 일상에서 ‘최적화’가 아닌 ‘충분 조건’을 사용
인간은 상당수 작업을 “어느 정도 만족하면 그만(Good enough)” 원칙으로 처리(목표값을 미세하게 최적화하지 않음).
반면 현재 AI 알고리즘은 수치적 “코스트 함수”에 기반해 최적화(혹은 RL 보상)가 필요 → 인간의 ‘충분·합격선’ 방식을 그대로 코딩하기가 매우 어려움.
특정 상황(예: 식료품 구매, 방 청소 등)에서 사람은 중간에 판단을 ‘그 정도면 됐다’로 결정 → 이런 동작을 AI로 구체화하기 위해선 무엇을 최소화/최대화하는지를 정해야 하는데, 대개 명확한 코스트 함수를 설정하기가 곤란함.
물리 vs 가상의 차이 (Virtual vs Physical)
인터넷/언어 모델의 성공은 디지털 정보
텍스트·이미지·음성 등은 크게 “실행 불확실성”이 없음. → 모델의 결과(문장, 그림)가 나와도, 그것이 실제 물리행동으로 이어지는 것이 아님.
물리 로봇에선 “행동”을 실행하면, 마찰·접촉·미세오차 등 예측 불가능한 변수가 발생해 “실시간 보정”이 필수.
자율주행이 비교적 잘 되는 이유: 도로 주행은 (속도·조향각 등) “실행 불확실성”이 비교적 작고, 시나리오가 반복적이며 수많은 차량 데이터가 축적 가능하기 때문.
Behavior Cloning(행동 모방) 문제
예: 사람의 시演 데이터를 100번 모아서 학습하면, 로봇이 그것만 그대로 재현할 수 있지만, 새로운 상황(“오류/실패” 등)은 데이터에 없음.
“오류 복구” 등은 실패 사례가 없으니 학습 못 함 → 실제 환경에선 수많은 예외 상황이 존재하므로 취약.
“인디애나 존스 영화를 100번 보면, 특정 장면 순서를 정확히 예측할 수 있지만, 영화 흐름이 바뀌면 예측 불가”라는 비유로 설명.
로봇에 필요한 “저층(hierarchical) 제어 구조”와 향후 과제
로봇 제어는 계층형 구조(하이레벨 계획 + 로우레벨 반사/반응)
- 고급 계획(Planning)은 전체 임무나 언어 명령 “Grab the cup!” 정도의 추상 지시를 제공.
- 저층(하위)에서는 빠른 피드백과 안정화(Reflex, Local Feedback)로 실제 물리적 오차와 충돌을 즉시 처리.
- 발표자는 이를 “Sticky Reflex”, “Gliding Reflex” 등으로 언급하며, 이처럼 미세조정이 가능한 반사 레벨이 있어야 언어/이미지 모델이 현실 행동과 안정적으로 접목될 수 있다고 강조.
중간 표현(Intermediate Representation)의 필요성
- 언어는 추상적, 물리 행동은 세부적이므로, 둘 사이를 잇는 표준화·토큰화된 표현이 아직 부족.
- Manipulation(조작) 동작을 예컨대 사람처럼 “부분적으로 무작위—즉, 손만 벌려도 물체가 자연스럽게 손안에 굴러 들어오는” 식의 구조를 로봇이 익히려면, 하위 반사(Reflex)와 상위 계획이 어우러져야 함.
노동력 부족과 현실 적용
미국·중국·한국 등 전 세계에서 노동인구 감소와 임금 상승으로 실제 공장 자동화 및 서비스 로봇 수요가 폭발적 증가 전망.
하지만 아직 “디딤돌(bridging the gap)” 기술들이 완성되지 않아, 업체들은 수많은 시도와 투자를 반복하게 될 것.
텔레오퍼레이션(원격조작)으로 부분 대체하는 사례도 있으나, 궁극적으로 자율적 로봇이 되려면 “상황별 회복력”을 갖춘 AI가 필요.
로봇 학습(특히 모방학습)에서 복구 데이터(실패 사례) 확보
단순 성공 사례만 쌓으면 예외 처리 불가. → 어떤 실패 시나리오를 얼마나 폭넓게 추가해야 할지 막대함.
구체적 언어 토큰과 동작 토큰을 어떻게 매칭할지도 해결되지 않은 연구 과제.
공장 자동화 vs 범용 로봇
공장은 “세팅 비용” 및 “작업 맞춤 프로그래밍”이 매우 비싸므로, 쉽게 재배치·재프로그래밍이 가능한 “적응형 로봇”이 요구됨.
그러나 아직 시연(데모) 수준에서 멈추는 경우가 많고, 99.9% 이상의 안정적 동작이 필요하다는 현실적 문턱이 높음.
본격적 상용화 시점
자율주행은 특정 조건에서 수 년 내(10~15년 내) 상당한 수준에 도달할 것으로 보이지만, 완전 범용 휴머노이드나 일상작업 로봇은 여전히 미지수.
다만 “노동력 부족”이 심화되어, 제조·물류·서비스 등 각 분야에서 대규모 투자가 지속될 것.
하드웨어와 소프트웨어의 결합
“로봇 하드웨어(물리 골격)를 어떻게 설계하느냐”가 근본적으로 중요. → 중간에 구조가 바뀌면 모든 소프트웨어를 다시 작성해야 함.
공장처럼 1일 수십만 회 동작하는 환경에선 내구성, 먼지·마모 문제도 고려 대상.
인공지능 제어 방식: 모델 예측 제어(MPC) vs 강화학습(RL)
MPC (Model Predictive Control)의 강점
실시간 최적화(QP 등)를 통해 매 순간마다(수 ms~수십 ms 간격) 거동을 계산하고 제어.
동작 해석·개입이 상대적으로 명확하며, 원하는 동작을 부분적으로 수정·튜닝하기 쉬움.
단, 모델이 부정확하거나 예측 범위를 벗어난 상황(마찰계수 달라짐 등)에서는 큰 문제가 생길 수 있음.
RL (Reinforcement Learning)의 강점
많은 데이터를 바탕으로 모델 외적(데이터 기반)으로 학습 → 불확실성이 큰 환경에서 강인한 해법을 찾기도 함.
하지만 end-to-end 방식은 내부 파라미터·동작을 명시적으로 수정하기 어려우며, 재학습 시 전역 파라미터를 재튜닝해야 하는 비효율 발생.
결합형 접근
MPC로 초기 정책(Policy) 제공 후, RL로 미세 조정 (or 반대로 RL로 대략 학습 후, MPC로 세부 제어) → 두 방식의 장점을 살리는 하이브리드 제어.
현재 발표자 연구진은 GPU 병렬화(‘Cuda-cadi’) 등을 사용해 MPC를 수천 개 병렬 시뮬레이션 후 RL 적용을 가속화하는 방법을 시도.
“인지적 편향(cognitive bias)”과 로봇/AI 오해
발표의 핵심 주제 중 하나로, 우리가 AI·로봇의 “겉모습”을 보고 지나치게 인간과 동일시하거나, 한두 번의 데모로 성능을 과대평가·오판하는 경향에 대해 논의한다.
인간은 지각(Perception)을 인간 기준으로만 수행
2족 로봇이 살짝 킥을 당해도 “잔인하다, 로봇이 학대당한다” 등 인간적 감성을 투영.
언어 모델(ChatGPT 등)이 그럴듯한 문장을 내놓으면 “상당히 인간처럼 지적이다”라고 느끼나, 실제로 내부 작동원리는 전혀 다름.
정작 “정확한 토크 제어, 복잡한 제어 파라미터” 같은 부분은 눈에 보이지 않아 과소평가하기 쉽다.
모라벡의 역설(Moravec's Paradox): 우리가 “지적으로 어려워 보이는” 언어·체스 등은 이미 정복된 반면, “걷고 잡는 것” 등은 여전히 어려운 이유 → 인간이 당연히 하는 능력을 과소평가하고, 언어·논리만을 ‘진짜 지능’으로 여기기 때문.
우리는 스스로의 신체 제어를 “의식적으로 모름”
일상적인 동작(예: 포켓 속 물건을 꺼내기, 식사 시 턱·혀·이 움직이기 등)은 통제나 최적화 과정을 의식적으로 인지하지 않음.
뇌의 다층적 제어(전두엽 vs 소뇌, 등)에 의해, “상위 레벨(추상 명령)”과 “하위 레벨(세부 근육 제어)”가 분리되어 있음을 보여주는 사례.
이런 인간 내부 과정을 언어(“peanut butter 바르기” 등)로 간단히 표현하지만, 실제 물리적 행동은 훨씬 복잡하고 적응적(adaptive).
언어는 추상적이고, 물리 행동은 구체적
“언어”는 대체로 사회적 합의(모방)로 이루어져 있고, 추상 수준이 높음. → 같은 단어라도 상황·맥락에 따라 해석이 달라짐.
물리적 행동(조립, 집기, 옮기기 등)은 상황별로 실제 물체와 물리법칙이 개입 → 단순히 “말 그대로” 흉내낼 수 없음.
예) “spread the jam”은 인간에겐 충분한 지시지만, 로봇에겐 수많은 세부 파라미터·접촉·힘 제어가 필요.
우리는 일상에서 ‘최적화’가 아닌 ‘충분 조건’을 사용
인간은 상당수 작업을 “어느 정도 만족하면 그만(Good enough)” 원칙으로 처리(목표값을 미세하게 최적화하지 않음).
반면 현재 AI 알고리즘은 수치적 “코스트 함수”에 기반해 최적화(혹은 RL 보상)가 필요 → 인간의 ‘충분·합격선’ 방식을 그대로 코딩하기가 매우 어려움.
특정 상황(예: 식료품 구매, 방 청소 등)에서 사람은 중간에 판단을 ‘그 정도면 됐다’로 결정 → 이런 동작을 AI로 구체화하기 위해선 무엇을 최소화/최대화하는지를 정해야 하는데, 대개 명확한 코스트 함수를 설정하기가 곤란함.
물리 vs 가상의 차이 (Virtual vs Physical)
인터넷/언어 모델의 성공은 디지털 정보
텍스트·이미지·음성 등은 크게 “실행 불확실성”이 없음. → 모델의 결과(문장, 그림)가 나와도, 그것이 실제 물리행동으로 이어지는 것이 아님.
물리 로봇에선 “행동”을 실행하면, 마찰·접촉·미세오차 등 예측 불가능한 변수가 발생해 “실시간 보정”이 필수.
자율주행이 비교적 잘 되는 이유: 도로 주행은 (속도·조향각 등) “실행 불확실성”이 비교적 작고, 시나리오가 반복적이며 수많은 차량 데이터가 축적 가능하기 때문.
Behavior Cloning(행동 모방) 문제
예: 사람의 시演 데이터를 100번 모아서 학습하면, 로봇이 그것만 그대로 재현할 수 있지만, 새로운 상황(“오류/실패” 등)은 데이터에 없음.
“오류 복구” 등은 실패 사례가 없으니 학습 못 함 → 실제 환경에선 수많은 예외 상황이 존재하므로 취약.
“인디애나 존스 영화를 100번 보면, 특정 장면 순서를 정확히 예측할 수 있지만, 영화 흐름이 바뀌면 예측 불가”라는 비유로 설명.
로봇에 필요한 “저층(hierarchical) 제어 구조”와 향후 과제
로봇 제어는 계층형 구조(하이레벨 계획 + 로우레벨 반사/반응)
- 고급 계획(Planning)은 전체 임무나 언어 명령 “Grab the cup!” 정도의 추상 지시를 제공.
- 저층(하위)에서는 빠른 피드백과 안정화(Reflex, Local Feedback)로 실제 물리적 오차와 충돌을 즉시 처리.
- 발표자는 이를 “Sticky Reflex”, “Gliding Reflex” 등으로 언급하며, 이처럼 미세조정이 가능한 반사 레벨이 있어야 언어/이미지 모델이 현실 행동과 안정적으로 접목될 수 있다고 강조.
중간 표현(Intermediate Representation)의 필요성
- 언어는 추상적, 물리 행동은 세부적이므로, 둘 사이를 잇는 표준화·토큰화된 표현이 아직 부족.
- Manipulation(조작) 동작을 예컨대 사람처럼 “부분적으로 무작위—즉, 손만 벌려도 물체가 자연스럽게 손안에 굴러 들어오는” 식의 구조를 로봇이 익히려면, 하위 반사(Reflex)와 상위 계획이 어우러져야 함.
노동력 부족과 현실 적용
미국·중국·한국 등 전 세계에서 노동인구 감소와 임금 상승으로 실제 공장 자동화 및 서비스 로봇 수요가 폭발적 증가 전망.
하지만 아직 “디딤돌(bridging the gap)” 기술들이 완성되지 않아, 업체들은 수많은 시도와 투자를 반복하게 될 것.
텔레오퍼레이션(원격조작)으로 부분 대체하는 사례도 있으나, 궁극적으로 자율적 로봇이 되려면 “상황별 회복력”을 갖춘 AI가 필요.
로봇 학습(특히 모방학습)에서 복구 데이터(실패 사례) 확보
단순 성공 사례만 쌓으면 예외 처리 불가. → 어떤 실패 시나리오를 얼마나 폭넓게 추가해야 할지 막대함.
구체적 언어 토큰과 동작 토큰을 어떻게 매칭할지도 해결되지 않은 연구 과제.
공장 자동화 vs 범용 로봇
공장은 “세팅 비용” 및 “작업 맞춤 프로그래밍”이 매우 비싸므로, 쉽게 재배치·재프로그래밍이 가능한 “적응형 로봇”이 요구됨.
그러나 아직 시연(데모) 수준에서 멈추는 경우가 많고, 99.9% 이상의 안정적 동작이 필요하다는 현실적 문턱이 높음.
본격적 상용화 시점
자율주행은 특정 조건에서 수 년 내(10~15년 내) 상당한 수준에 도달할 것으로 보이지만, 완전 범용 휴머노이드나 일상작업 로봇은 여전히 미지수.
다만 “노동력 부족”이 심화되어, 제조·물류·서비스 등 각 분야에서 대규모 투자가 지속될 것.
하드웨어와 소프트웨어의 결합
“로봇 하드웨어(물리 골격)를 어떻게 설계하느냐”가 근본적으로 중요. → 중간에 구조가 바뀌면 모든 소프트웨어를 다시 작성해야 함.
공장처럼 1일 수십만 회 동작하는 환경에선 내구성, 먼지·마모 문제도 고려 대상.
YouTube
Stanford Seminar - Physical Intelligence and Cognitive Biases Toward AI
February 7, 2025
Sangbae Kim, MIT
When will robots be able to clean my house, dishes, and take care of laundry? While we source labor primarily from automated machines in factories, the penetration of physical robots in our daily lives has been slow. What…
Sangbae Kim, MIT
When will robots be able to clean my house, dishes, and take care of laundry? While we source labor primarily from automated machines in factories, the penetration of physical robots in our daily lives has been slow. What…
클러스터가 발달한 조선소의 원가와 생산 속도를 클러스터가 없는 조선소는 따라갈 수 없다. 한국의 어떤 조선소가 1000명으로 20척의 배를 짓는다고 할 때, 사실 보이지 않는 외부 공급망의 역할도 크다. 외부 공급망에 2000명이 일한다고 하면, 사실 외국에 새로 조선소를 만든다면 적어도 3000명 이상의 인원이 있어야만 20척의 배를 지을 수 있는 것이다. 한국의 동남권 조선 클러스터는 전세계에서 가장 거대하고 밀집된 체계를 갖추고 있으며 개별 조선소만 뚝 떼내어 해외에 이식하는 것은 불가능하다. 한진중공업이 필리핀 수빅에 거대한 조선소를 건설했으나 결국 실패한 것도 한국에서 모든 자재를 운송하는 문제를 극복하지 못했기 때문이었다.
중국, 한국, 일본의 조선업 경쟁은 사실 각국의 지역별로 구축된 클러스터간 경쟁이다. 이들 클러스터들은 살아있는 생물과 같아서 하늘에서 떨어지지 않았다. 적어도 20년 이상의 시간 동안 산업정책, 직업교육, 기술이전, 물류 인프라 등이 결합되어 태어나고 자라며 성숙했다.
많은 기업들이 지리적으로 밀집되어야 하는 조선 클러스터를 쉽게 보는 사람들이 있다. 현대 컨테이너 물류 시스템으로 인해 글로벌 value chain이 막강해진 마당에, 시대착오적인 개념이라는 것이다. 하지만, 선박에 들어가는 철판과 기자재를 컨테이너에 담아서 보낼 수 없기 때문에 조선업은 글로벌 value chain과는 다르게 봐야 한다. 자동화 라인을 깐다고 배가 나오지 않으며, 수많은 작업자들이 일사분란하게 일을 하고 품질을 유지하며 공급망을 포함하여 전체적으로 손발이 맞아야 한다. 그래서 수많은 나라들이 조선업 육성을 위해 노력했지만, 극소수만이 성공한 것이다.
https://www.facebook.com/jay.kwon7775/posts/pfbid02NPAjV1LFyWKbMGmYXsPn2Y2o83HhMtmjcE946mm7hYnoSqiju4hqwRGWeimkvNP1l
중국, 한국, 일본의 조선업 경쟁은 사실 각국의 지역별로 구축된 클러스터간 경쟁이다. 이들 클러스터들은 살아있는 생물과 같아서 하늘에서 떨어지지 않았다. 적어도 20년 이상의 시간 동안 산업정책, 직업교육, 기술이전, 물류 인프라 등이 결합되어 태어나고 자라며 성숙했다.
많은 기업들이 지리적으로 밀집되어야 하는 조선 클러스터를 쉽게 보는 사람들이 있다. 현대 컨테이너 물류 시스템으로 인해 글로벌 value chain이 막강해진 마당에, 시대착오적인 개념이라는 것이다. 하지만, 선박에 들어가는 철판과 기자재를 컨테이너에 담아서 보낼 수 없기 때문에 조선업은 글로벌 value chain과는 다르게 봐야 한다. 자동화 라인을 깐다고 배가 나오지 않으며, 수많은 작업자들이 일사분란하게 일을 하고 품질을 유지하며 공급망을 포함하여 전체적으로 손발이 맞아야 한다. 그래서 수많은 나라들이 조선업 육성을 위해 노력했지만, 극소수만이 성공한 것이다.
https://www.facebook.com/jay.kwon7775/posts/pfbid02NPAjV1LFyWKbMGmYXsPn2Y2o83HhMtmjcE946mm7hYnoSqiju4hqwRGWeimkvNP1l
Facebook
권효재
[조선 클러스터 전쟁]
인구는 많은데 산업 발전은 더딘 여러 개도국들은 조선업 육성에 관심이 많다. 개도국은 아니지만, 오래전 번성했던 조선업이 쇠락한 미국과 영국 등도 다시 조선업을 부흥시키는데 의욕을 보이고 있다. 하지만, 2차 세계 대전 이후 개도국들 중에서 조선업을 성공적으로 육성하는데 성공한 나라는 한국, 중국 정도이며 브라질, 인도네시아,...
인구는 많은데 산업 발전은 더딘 여러 개도국들은 조선업 육성에 관심이 많다. 개도국은 아니지만, 오래전 번성했던 조선업이 쇠락한 미국과 영국 등도 다시 조선업을 부흥시키는데 의욕을 보이고 있다. 하지만, 2차 세계 대전 이후 개도국들 중에서 조선업을 성공적으로 육성하는데 성공한 나라는 한국, 중국 정도이며 브라질, 인도네시아,...
👍2
우주 기업에 서비스를 제공하는 우주 기업:
- 발사 제공업체: SpaceX, 로켓 랩, 아스트라 등
- 공급망 제공업체: 항공우주 패스너, 태양광 패널, 전문 제조(예: Hadrien)와 같은 구성 요소.
- 신흥 인프라: 위성 인프라의 성장에 따른 궤도 급유, 유지보수, 서비스 회사.
더 넓은 경제에 서비스를 제공하는 우주 기업:
- 지구 관측: 금융, 에너지(메탄 누출), 방위 등의 산업에 서비스를 제공하는 Planet Labs, ISAI, Spire.
- 위성 통신: Starlink(실시간 저지연), 더 높은 대역폭을 필요로 하는 기업(예: Netflix).
Delian은 우주 기술을 주류 상업적 요구와 통합하여 우주 벤처의 경제적 지속 가능성을 향상시키는 기업의 중요성을 강조합니다.
우주 경제의 기회와 도전 과제
- 치열한 경쟁(약 100개 기업)으로 인해 발사 서비스가 과대 포장되었다고 생각합니다.
- 위성 공급망과 틈새 통신/데이터 시장이 여전히 과소평가되고 있다고 주장합니다.
전문화 및 경제 통합의 증가로 지구 관측 및 위성 통신의 상당한 성장을 예측합니다.
Varda가 필요한 이유
- 델리안은 진정한 우주 경제의 지속 가능성은 경제적 인센티브에 달려 있다고 믿으며, 이를 역사적 확장(예: 캘리포니아 골드러시)과 비교합니다.
- 소행성 채굴, 달 정착지 건설 등 먼 미래의 아이디어에 비해 미세중력 제조(제약, 광섬유, 반도체)가 즉시 상업적으로 실현 가능하다고 봅니다.
- 기존의 노력(ISS 의존적)이 비효율적이고 지나치게 관료적이어서 상업적 확장성을 해결하지 못했기 때문에 Varda를 시작했습니다.
지정학적 및 경제적 위험
- 특정 핵심 분야(예: 극초음속 활공체)에서 미국의 기술력 뒤처짐에 대한 우려.
- 불충분한 경제적 수요로 인해 SpaceX의 스타십과 같은 야심찬 프로젝트가 위태로워질 수 있는 위험을 강조합니다.
- 궤도 잔해 문제를 관리 가능한 것으로 보고 잔해 완화를 위한 탄소배출권과 유사한 규제 프레임워크를 옹호합니다.
예비 우주 기업가를 위한 조언
- Delian은 광범위한 시장 조사와 기존 비즈니스 모델에 대한 이해를 권장합니다.
- 스타트업 경험과 함께 산업별 전문성을 강조하면서 기술적으로 깊이 있는 공동 창업자와 파트너 관계를 맺을 것을 제안합니다.
- 정부 자금 지원 프로그램(AFWERX, SpaceWERX, DIU)을 긍정적으로 보지만 집중력을 잃거나 지나치게 의존하지 않도록 경고합니다.
- 스타트업을 시작하기 전에 기존 우주 기업을 연구하고 실제 고객과 함께 비즈니스 모델을 검증하세요.
- 항공우주 전문 지식을 갖춘 엔지니어와 함께 회사를 지원하거나 공동 창업함으로써 비기술 창업자가 우주 산업에 참여하도록 장려합니다
미래 전망 및 낙관론
- 빠른 기술 발전과 정부의 관심 증가로 인해 낙관적임(NASA, 우주군).
- 우주와 관련된 경제 활동이 크게 성장하여 잠재적으로 아폴로 시대 수준의 GDP 투자에 근접할 것으로 예상.
- 기술과 혁신을 통해 서구의 민주주의 가치를 적극적으로 지지합니다.
https://youtu.be/TZI3s72LGHA?si=JSSsTAJBVZUsj5yB
- 발사 제공업체: SpaceX, 로켓 랩, 아스트라 등
- 공급망 제공업체: 항공우주 패스너, 태양광 패널, 전문 제조(예: Hadrien)와 같은 구성 요소.
- 신흥 인프라: 위성 인프라의 성장에 따른 궤도 급유, 유지보수, 서비스 회사.
더 넓은 경제에 서비스를 제공하는 우주 기업:
- 지구 관측: 금융, 에너지(메탄 누출), 방위 등의 산업에 서비스를 제공하는 Planet Labs, ISAI, Spire.
- 위성 통신: Starlink(실시간 저지연), 더 높은 대역폭을 필요로 하는 기업(예: Netflix).
Delian은 우주 기술을 주류 상업적 요구와 통합하여 우주 벤처의 경제적 지속 가능성을 향상시키는 기업의 중요성을 강조합니다.
우주 경제의 기회와 도전 과제
- 치열한 경쟁(약 100개 기업)으로 인해 발사 서비스가 과대 포장되었다고 생각합니다.
- 위성 공급망과 틈새 통신/데이터 시장이 여전히 과소평가되고 있다고 주장합니다.
전문화 및 경제 통합의 증가로 지구 관측 및 위성 통신의 상당한 성장을 예측합니다.
Varda가 필요한 이유
- 델리안은 진정한 우주 경제의 지속 가능성은 경제적 인센티브에 달려 있다고 믿으며, 이를 역사적 확장(예: 캘리포니아 골드러시)과 비교합니다.
- 소행성 채굴, 달 정착지 건설 등 먼 미래의 아이디어에 비해 미세중력 제조(제약, 광섬유, 반도체)가 즉시 상업적으로 실현 가능하다고 봅니다.
- 기존의 노력(ISS 의존적)이 비효율적이고 지나치게 관료적이어서 상업적 확장성을 해결하지 못했기 때문에 Varda를 시작했습니다.
지정학적 및 경제적 위험
- 특정 핵심 분야(예: 극초음속 활공체)에서 미국의 기술력 뒤처짐에 대한 우려.
- 불충분한 경제적 수요로 인해 SpaceX의 스타십과 같은 야심찬 프로젝트가 위태로워질 수 있는 위험을 강조합니다.
- 궤도 잔해 문제를 관리 가능한 것으로 보고 잔해 완화를 위한 탄소배출권과 유사한 규제 프레임워크를 옹호합니다.
예비 우주 기업가를 위한 조언
- Delian은 광범위한 시장 조사와 기존 비즈니스 모델에 대한 이해를 권장합니다.
- 스타트업 경험과 함께 산업별 전문성을 강조하면서 기술적으로 깊이 있는 공동 창업자와 파트너 관계를 맺을 것을 제안합니다.
- 정부 자금 지원 프로그램(AFWERX, SpaceWERX, DIU)을 긍정적으로 보지만 집중력을 잃거나 지나치게 의존하지 않도록 경고합니다.
- 스타트업을 시작하기 전에 기존 우주 기업을 연구하고 실제 고객과 함께 비즈니스 모델을 검증하세요.
- 항공우주 전문 지식을 갖춘 엔지니어와 함께 회사를 지원하거나 공동 창업함으로써 비기술 창업자가 우주 산업에 참여하도록 장려합니다
미래 전망 및 낙관론
- 빠른 기술 발전과 정부의 관심 증가로 인해 낙관적임(NASA, 우주군).
- 우주와 관련된 경제 활동이 크게 성장하여 잠재적으로 아폴로 시대 수준의 GDP 투자에 근접할 것으로 예상.
- 기술과 혁신을 통해 서구의 민주주의 가치를 적극적으로 지지합니다.
https://youtu.be/TZI3s72LGHA?si=JSSsTAJBVZUsj5yB
YouTube
The Space Economy with Delian Asparouhov
Delian Asparouhov (@zebulgar), co-founder of Varda Space Industries and principal at Founders Fund, joins Lucas Bagno (@lucasbagnocv) and Ian Cinnamon (@iancinnammon) on this episode to discuss:
- Why he says that VCs have a moral obligation to fund companies…
- Why he says that VCs have a moral obligation to fund companies…
👍2
Continuous Learning_Startup & Investment
기존 경쟁사들은 왜 이런 차별화에 실패했을까를 봐야합니다. 이들은 보리차 음료 시장이 왜 부상했고, 왜 더욱 부상할 잠재력이 있는지를 제대로 고찰해내지 못한 거예요. 고작 디자인이나 맛 등 협소한 관점으로만 봤기 때문에 그저 그런 경쟁작들을 내놓은 겁니다. 프로란 일생을 바쳐 몰입할 사명을 찾고 언제나 거기서 자부심을 느끼는, 즉 아너십을 발휘할 줄 아는 사람 https://app.rmbr.in/r8G3DMsVBRb
YouTube
톱스타들이 증명하는 한국 최고 큰손 노희영의 성공 신화 최초공개 (비비고, CJ, 마켓오)
안녕하세요👋🏻
브랜드 컨설턴트 노희영입니다
일하는 즐거움과🧐
현장에서 터득한 노하우🤔
이제서야 알게 된 인생의 지혜와 아름다움을😍
여러분과 나누고 싶어서
환갑이 넘은 나이에 용기를 내
유튜브를 시작하게 됐습니다!
왜 ’큰손 노희영’ 이란 채널명이 탄생했는지
그 이야기를 천천히 하나씩 풀어가도록 할게요
많이 기대해주시고
유튜브의 낯선 문법 속에서
힘낼 수 있도록
구독과 좋아요로 응원 부탁드립니다👋🏻
#노희영 #큰손노희영
브랜드 컨설턴트 노희영입니다
일하는 즐거움과🧐
현장에서 터득한 노하우🤔
이제서야 알게 된 인생의 지혜와 아름다움을😍
여러분과 나누고 싶어서
환갑이 넘은 나이에 용기를 내
유튜브를 시작하게 됐습니다!
왜 ’큰손 노희영’ 이란 채널명이 탄생했는지
그 이야기를 천천히 하나씩 풀어가도록 할게요
많이 기대해주시고
유튜브의 낯선 문법 속에서
힘낼 수 있도록
구독과 좋아요로 응원 부탁드립니다👋🏻
#노희영 #큰손노희영
내가 어떤 견해를 가지려 한다면, 나는 반드시 그 견해를 반박할 수 있는 세계에서 가장 똑똑하고 유능한 사람보다 더 철저하게 나 자신을 반박할 수 있어야한다. 그렇지 않다면, 나는 그 견해를 가질 자격이 없다.
성공은 결코 우연이 아니다. 타이밍도 중요하지만, 더 중요한 것은 사람의 내면적인 자질이다.
찰리는 평생 인간의 실수와 실패를 연구했으며, 인간 본성의 약점을 깊게 이해하고 있다. 그렇기 때문에 그는 스스로 철저한 기준을 적용하며, 자기 수양을 게을리 하지 않는다.
그는 항상 자기 자신을 단련하며 자신의 본성을 극복하는 것을 도덕적 의무로 여긴다. 찰리의 삶을 보면 그는 마치 금욕적인 수도승처럼 보일수도 있다. 하지만 그에게는 이러한 과정이 너무나도 자연스럽고 즐겁다. 그에게는 이것이 성공적이고 행복한 삶을 살아가는 가장 이성적인 방식이기 때문이다.
성공은 결코 우연이 아니다. 타이밍도 중요하지만, 더 중요한 것은 사람의 내면적인 자질이다.
찰리는 평생 인간의 실수와 실패를 연구했으며, 인간 본성의 약점을 깊게 이해하고 있다. 그렇기 때문에 그는 스스로 철저한 기준을 적용하며, 자기 수양을 게을리 하지 않는다.
그는 항상 자기 자신을 단련하며 자신의 본성을 극복하는 것을 도덕적 의무로 여긴다. 찰리의 삶을 보면 그는 마치 금욕적인 수도승처럼 보일수도 있다. 하지만 그에게는 이러한 과정이 너무나도 자연스럽고 즐겁다. 그에게는 이것이 성공적이고 행복한 삶을 살아가는 가장 이성적인 방식이기 때문이다.
Forwarded from BZCF | 비즈까페
히말라야 캐피탈의 '리 루' 회장이 『가난한 찰리의 연감』 중국어판 서문으로 쓴 「책 속에 황금의 집이 있다(书中自有黄金屋)」의 번역입니다. 한국어로 번역된 적이 없는 것 같습니다. 원문으로 접하고, GPT를 통해 번역하고, 윤문하여 공유합니다. 많은 분들께 도움 되시면 좋겠습니다.
https://blog.naver.com/bizucafe/223792725665
https://blog.naver.com/bizucafe/223792725665
NAVER
책 속에 황금의 집이 있다(书中自有黄金屋)
히말라야 캐피탈의 '리 루' 회장이 『가난한 찰리의 연감』 중국어판 서문으로 쓴 「책 속에 황금의 집이 있다(书中自有黄金屋)」의 번역입니다. 한국어로 번역된 적이 없는 것 같습니다. 원문으로 접하고, GPT를 통해 번역하고, 윤문하여 공유합니다. 많은 분들께 도움 되시면 좋겠습니다.
(1) 여러 기술은 “도입 초기에 기존 모델을 개선”하는 역할(Skeuomorphism)
예: 초기 인터넷(1990년대)은 잡지·카탈로그를 온라인화 → 단순 대체.
진짜 큰 폭발은 “네이티브” 기술/제품(소셜네트워크 등)이 등장했을 때.
(2) 생성형 AI도 초기에는 사람 업무 대체(고객응대 등)에 국한될 것
이후에 아예 새로운 것(예: 이전에는 불가능했던 형태의 예술, 영화, 게임 등)이 태동할 때 큰 혁신.
(3) 예술, 사진, 영화 비유
사진이 발명되자 “그림이 사라지나?” 했지만 → 오히려 영화라는 완전히 새 매체 탄생.
생성형 AI도 기존 예술을 대체하기보다, 전혀 다른 형태의 표현·창작을 가능케 할 것.
(4) 이행에는 문화적·조직적 장벽이 크다
예: 책 낭독용으로 AI 음성 사용을 Audible/출판사가 금지한 사례. 할리우드, 노조, 저작권 등 진입장벽 많음.
로비, 규제 등으로 현장 도입이 늦어질 수도.
DPIN(Decentralized Physical Infrastructure): 물리적 네트워크를 탈중앙화 인센티브로 구축.
예: Helium → 누구든 집에 무선노드를 설치해 통신망 형성 → 결과적으로 통신사(Verizon 등)보다 저렴한 서비스.
기존 통신망의 조기단계(“네트워크 효과”가 작을 때)를 빠르게 넘어가는 부트스트래핑 수단으로 크립토 토큰이 효과적.
다양한 영역(날씨 데이터, 지도, 자율주행, 에너지 등)에서 “분산형 인프라 구축 + 암호보상” 모델이 시도
AI에서의 네트워크 효과?
기존 소셜미디어는 강력한 네트워크 효과로 독점화.
생성형 AI는 그런 “데이터 네트워크 효과”가 있는지 불투명. 모델 학습이 한 달마다 갱신된다 해도 “사용자 데이터”가 결정적이지 않을 수 있음.
소비자용 AI 앱 (예: 얼굴 꾸미기, 필터 등)은 플랫폼(틱톡 등)에게 바로 복제될 위험 큼.
Dixon은 “Tool로 유인한 뒤 Network로 확장” 하는 전략(“Come for the tool, stay for the network”)을 언급하지만, 쉽지 않다고 평가.
Skeuomorphic(구형 대체): AI가 콜센터·문서 작업 등 기존 업무를 자동화. 20년 걸릴 수도.
Native: 완전히 새 형태의 앱/매체 출현 (인터넷 소셜네트워크가 잡지/신문 이상의 “새로운” 것이었던 것처럼).
2차 파급 효과:
예: SNS가 정치·사회구조에 예측 못한 변화를 일으켰듯, AI도 장기적으로 엄청난 파급(“Traffic jam” 비유)이 있을 것.
https://youtu.be/gioxu1CVjhM
예: 초기 인터넷(1990년대)은 잡지·카탈로그를 온라인화 → 단순 대체.
진짜 큰 폭발은 “네이티브” 기술/제품(소셜네트워크 등)이 등장했을 때.
(2) 생성형 AI도 초기에는 사람 업무 대체(고객응대 등)에 국한될 것
이후에 아예 새로운 것(예: 이전에는 불가능했던 형태의 예술, 영화, 게임 등)이 태동할 때 큰 혁신.
(3) 예술, 사진, 영화 비유
사진이 발명되자 “그림이 사라지나?” 했지만 → 오히려 영화라는 완전히 새 매체 탄생.
생성형 AI도 기존 예술을 대체하기보다, 전혀 다른 형태의 표현·창작을 가능케 할 것.
(4) 이행에는 문화적·조직적 장벽이 크다
예: 책 낭독용으로 AI 음성 사용을 Audible/출판사가 금지한 사례. 할리우드, 노조, 저작권 등 진입장벽 많음.
로비, 규제 등으로 현장 도입이 늦어질 수도.
DPIN(Decentralized Physical Infrastructure): 물리적 네트워크를 탈중앙화 인센티브로 구축.
예: Helium → 누구든 집에 무선노드를 설치해 통신망 형성 → 결과적으로 통신사(Verizon 등)보다 저렴한 서비스.
기존 통신망의 조기단계(“네트워크 효과”가 작을 때)를 빠르게 넘어가는 부트스트래핑 수단으로 크립토 토큰이 효과적.
다양한 영역(날씨 데이터, 지도, 자율주행, 에너지 등)에서 “분산형 인프라 구축 + 암호보상” 모델이 시도
AI에서의 네트워크 효과?
기존 소셜미디어는 강력한 네트워크 효과로 독점화.
생성형 AI는 그런 “데이터 네트워크 효과”가 있는지 불투명. 모델 학습이 한 달마다 갱신된다 해도 “사용자 데이터”가 결정적이지 않을 수 있음.
소비자용 AI 앱 (예: 얼굴 꾸미기, 필터 등)은 플랫폼(틱톡 등)에게 바로 복제될 위험 큼.
Dixon은 “Tool로 유인한 뒤 Network로 확장” 하는 전략(“Come for the tool, stay for the network”)을 언급하지만, 쉽지 않다고 평가.
Skeuomorphic(구형 대체): AI가 콜센터·문서 작업 등 기존 업무를 자동화. 20년 걸릴 수도.
Native: 완전히 새 형태의 앱/매체 출현 (인터넷 소셜네트워크가 잡지/신문 이상의 “새로운” 것이었던 것처럼).
2차 파급 효과:
예: SNS가 정치·사회구조에 예측 못한 변화를 일으켰듯, AI도 장기적으로 엄청난 파급(“Traffic jam” 비유)이 있을 것.
https://youtu.be/gioxu1CVjhM
YouTube
Who Will Own the Internet? a16z’s Chris Dixon on AI and Crypto
Technology doesn’t grow in isolation—it evolves in waves. Just as mobile, cloud, and social shaped the internet of the past 20 years, so too could crypto, AI, and new hardware usher in an era of the internet that’s pro-innovation, pro-startup, and pro-creator.…
https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/?fbclid=IwZXh0bgNhZW0CMTEAAR30aAgYmqClF-xnbnJJaTSyrq5fDKcrMnOgtUHAESgxV7fSAefiZpLHUQA_aem_Sg6fZhAuu2B8VjaYpBHwNw
Gemini Robotics: Gemini 2.0을 기반으로 로봇 제어를 위해 특별히 설계된 AI 모델 제품군입니다.
Vision-Language-Action (VLA) 모델: Gemini Robotics는 시각 정보, 언어 명령, 그리고 로봇의 행동을 종합적으로 이해하고 연결하여 로봇을 제어하는 generalist 모델입니다.
Gemini Robotics-ER (Embodied Reasoning): Gemini의 멀티모달 추론 능력을 물리적 세계로 확장하여 공간 및 시간적 이해를 향상시킨 모델입니다. 객체 감지, 지점 예측, 궤적 예측, 파지 예측, 3D 이해 등의 기능을 제공합니다.
20개 짧은 조작 작업(예: 옷 접기, 측정컵 쌓기, 헤드폰 줄 감기 등)을 무파인튜닝 “out-of-the-box”로 테스트
- Gemini Robotics가 절반 이상(10개)에서 80% 이상의 성공률.
- 옷, 철사, 종이 등 변형성 물체 다룸. 문서 폴더 여는 등 정교한 양손 협업도 수행.
이질적인 로봇(예: 쌍팔 프랑카(Franka) 로봇, Apptronik사의 휴머노이드 Apollo 등)에 적은 양(수십~수백 에피소드)으로 파인튜닝 후 적용 시에도, 변칙 환경에서 안정적 성능 발휘.
- 기존 모델(예: ALOHA2 기반으로 학습된 대규모 파운데이션)이 “로봇별 기본 관절 구조, 엔드이펙터 차이”가 반영되지 않았을 수도 있음.
이를 위해, 예컨대 Franka 로봇(양팔)에서 수십~수백 에피소드만 수집:
- 로봇의 기구학/동작 범위/그립 특성이 다르므로 새로 시연.
- 이 데이터를 바탕으로 레이어 일부만(또는 전부) 미세조정 파인튜닝. 그러면 곧바로 Franka용 정책이 생성됨.
- Gemini Robotics-ER처럼 3D 시각-언어-행동 통합 능력이 뛰어난 모델은, 기존에 축적된 물리 상식/조작 패턴을 응용해 다른 로봇에서도 적은 데이터로 빠르게 적응 가능.
- 다른 로봇(휴머노이드, 산업용)에 짧은 재학습만으로 전이.
2D/3D 공간 추론 + 언어 이해 + 실제 로봇 제어가 단일 파이프라인에서 가능: LLM이 즉석에서 로봇 API를 호출하는 코드를 직접 생성’하는 방식
- “move_gripper_to(x, y, z)”처럼 미리 정의된 고수준 API를 LLM이 직접 호출하는 코드를 작성→실행→피드백→수정 과정을 반복함.
- 이로써 별도의 로봇 전용 정책 네트워크 없이도, LLM이 단계별 계획과 로봇 동작을 한 번에 담당할 수 있게 됨.
- 사용자는 “컵을 집어서 그릇에 담아”라고 지시하면, LLM이 해당 과정을 문자열(파이썬 코드)로 즉석 생성→실행→결과 확인 후 에러 수정까지 대화식으로 처리.
- 이 접근은 “인-컨텍스트 학습(few-shot)”으로 간단한 예시 몇 개만 주어도 동작 시나리오를 새로 만들어나갈 수 있다는 점에서 매우 유연함.
소수 시연(few-shot)이나 전문화 파인튜닝으로 손쉽게 익스트림 난이도 과제(오리가미, 카드 게임 등)까지 해결.
Future Works
낮은 주파수(“제어 주기” vs. “LLM 응답 지연”) 작업은 가능하나, 초정밀/고주파 동작은 다른 레벨의 제어기가 필요.
LLM이 잘못된 코드를 생성하면 즉시 실행 시 위험(안전 이슈) 발생. 따라서 안전장치나 검증이 필수.
Gemini Robotics: Gemini 2.0을 기반으로 로봇 제어를 위해 특별히 설계된 AI 모델 제품군입니다.
Vision-Language-Action (VLA) 모델: Gemini Robotics는 시각 정보, 언어 명령, 그리고 로봇의 행동을 종합적으로 이해하고 연결하여 로봇을 제어하는 generalist 모델입니다.
Gemini Robotics-ER (Embodied Reasoning): Gemini의 멀티모달 추론 능력을 물리적 세계로 확장하여 공간 및 시간적 이해를 향상시킨 모델입니다. 객체 감지, 지점 예측, 궤적 예측, 파지 예측, 3D 이해 등의 기능을 제공합니다.
20개 짧은 조작 작업(예: 옷 접기, 측정컵 쌓기, 헤드폰 줄 감기 등)을 무파인튜닝 “out-of-the-box”로 테스트
- Gemini Robotics가 절반 이상(10개)에서 80% 이상의 성공률.
- 옷, 철사, 종이 등 변형성 물체 다룸. 문서 폴더 여는 등 정교한 양손 협업도 수행.
이질적인 로봇(예: 쌍팔 프랑카(Franka) 로봇, Apptronik사의 휴머노이드 Apollo 등)에 적은 양(수십~수백 에피소드)으로 파인튜닝 후 적용 시에도, 변칙 환경에서 안정적 성능 발휘.
- 기존 모델(예: ALOHA2 기반으로 학습된 대규모 파운데이션)이 “로봇별 기본 관절 구조, 엔드이펙터 차이”가 반영되지 않았을 수도 있음.
이를 위해, 예컨대 Franka 로봇(양팔)에서 수십~수백 에피소드만 수집:
- 로봇의 기구학/동작 범위/그립 특성이 다르므로 새로 시연.
- 이 데이터를 바탕으로 레이어 일부만(또는 전부) 미세조정 파인튜닝. 그러면 곧바로 Franka용 정책이 생성됨.
- Gemini Robotics-ER처럼 3D 시각-언어-행동 통합 능력이 뛰어난 모델은, 기존에 축적된 물리 상식/조작 패턴을 응용해 다른 로봇에서도 적은 데이터로 빠르게 적응 가능.
- 다른 로봇(휴머노이드, 산업용)에 짧은 재학습만으로 전이.
2D/3D 공간 추론 + 언어 이해 + 실제 로봇 제어가 단일 파이프라인에서 가능: LLM이 즉석에서 로봇 API를 호출하는 코드를 직접 생성’하는 방식
- “move_gripper_to(x, y, z)”처럼 미리 정의된 고수준 API를 LLM이 직접 호출하는 코드를 작성→실행→피드백→수정 과정을 반복함.
- 이로써 별도의 로봇 전용 정책 네트워크 없이도, LLM이 단계별 계획과 로봇 동작을 한 번에 담당할 수 있게 됨.
- 사용자는 “컵을 집어서 그릇에 담아”라고 지시하면, LLM이 해당 과정을 문자열(파이썬 코드)로 즉석 생성→실행→결과 확인 후 에러 수정까지 대화식으로 처리.
- 이 접근은 “인-컨텍스트 학습(few-shot)”으로 간단한 예시 몇 개만 주어도 동작 시나리오를 새로 만들어나갈 수 있다는 점에서 매우 유연함.
소수 시연(few-shot)이나 전문화 파인튜닝으로 손쉽게 익스트림 난이도 과제(오리가미, 카드 게임 등)까지 해결.
Future Works
낮은 주파수(“제어 주기” vs. “LLM 응답 지연”) 작업은 가능하나, 초정밀/고주파 동작은 다른 레벨의 제어기가 필요.
LLM이 잘못된 코드를 생성하면 즉시 실행 시 위험(안전 이슈) 발생. 따라서 안전장치나 검증이 필수.
Google DeepMind
Gemini Robotics brings AI into the physical world
Introducing Gemini Robotics and Gemini Robotics-ER, AI models designed for robots to understand, act and react to the physical world.
👍1
- 항상 주변사람들에게 친절할 것. 심지어 내 마음이 상했을지라도 그 사람에게 친절하게 대할 것. 운의 예금을 미리 들어놓을것.
- 급하면 일을 그르치기 쉽다. 정말 중요한 것은 무엇인가? 중요한 문제에 에너지를 집중하고 타이밍과 시기를 잘 읽고 있는가? 그나마 실패하지 않을 확률을 높이기 위한 선택을 하는가? 시간의 Scale을 길게 보면 다양한 기회와 어려움이 있다. 장기적인 관점에서 내 결정은 어떤 결과를 만들 것인가?
- 결정의 퀄리티를 높이기 위해서, 꾸준히 배우고 주기적으로 똑똑한 고객/시장/동료/지인/친구들로부터 객관적인 피드백을 받을것.
- 좋아하는건가? 정말 잘하는 건가? 내가 가지고 있는 강점을 기반으로 이길수 있는 일을 하고 있는가?
- 하나의 슈퍼파워일수도 있지만, 여러개의 장점을 동시에 가지는 것 자체가 강점일수도 있다.
- 안다고 착각하지 말고 새로운 사람/책/AI/영상을 통해서 내가 알고 있는 범위를 넓히고 고정관념을 바꿀 준비를 할 것.
- 급하면 일을 그르치기 쉽다. 정말 중요한 것은 무엇인가? 중요한 문제에 에너지를 집중하고 타이밍과 시기를 잘 읽고 있는가? 그나마 실패하지 않을 확률을 높이기 위한 선택을 하는가? 시간의 Scale을 길게 보면 다양한 기회와 어려움이 있다. 장기적인 관점에서 내 결정은 어떤 결과를 만들 것인가?
- 결정의 퀄리티를 높이기 위해서, 꾸준히 배우고 주기적으로 똑똑한 고객/시장/동료/지인/친구들로부터 객관적인 피드백을 받을것.
- 좋아하는건가? 정말 잘하는 건가? 내가 가지고 있는 강점을 기반으로 이길수 있는 일을 하고 있는가?
- 하나의 슈퍼파워일수도 있지만, 여러개의 장점을 동시에 가지는 것 자체가 강점일수도 있다.
- 안다고 착각하지 말고 새로운 사람/책/AI/영상을 통해서 내가 알고 있는 범위를 넓히고 고정관념을 바꿀 준비를 할 것.
👍3