Forwarded from 우산 X NNN의 아이디어
■ DeepSeek는 AI Super Cycle을 가속화 시킬 뿐(1/27, NH투자증권 임지용)
[요약]
- DeepSeek는 엔비디아 H800 칩을 사용해 비교적 저렴한 비용으로 개발되어 미국의 대중국 수출 통제 조치의 효과에 의문이 제기되고 있음
- DeepSeek의 비용 효율적인 접근 방식은 AI 개발에 필요한 컴퓨팅 파워와 비용에 대한 재평가를 촉발
- 사전 훈련 클러스터에 대한 정보는 전혀 검증되지 않았기에 이를 두고 단순히 비용 효율 측면에서 우위에 있다고 결론 내리기에는 무리가 있음
- DeepSeek로 인해 미국 빅테크의 AI 투자가 과도하다는 주장은 어불성설. AGI가 중요. LLM은 여러 AI 모델 중 하나일 뿐
- DeepSeek 덕분에 OpenAI 플러스 유저도 최고 성능 모델인 o3 Mini를 곧 사용할 수 있게 됐다는 사실은 긍정적. 경쟁이 소비자 효용과 후생을 확대시키는 결과를 낳는 중
- MSFT와 Meta는 Capex를 상향함. AI Super Cycle의 파동은 더욱 진폭을 키우며 전개될 것. 보다 큰 변동성을 내포한 채로 AI Core Infra 기업들의 주가 우상향 진행될 것으로 예상. Color는 변해도 Core는 변하지 않음
[첨언]
오늘 하루 종일 DeepSeek 이슈가 부각되면서 휴일에도 제도권 애널리스트의 긴급 이슈 리포트가 나올 정도입니다.
개인적인 생각을 조금 담아보면 분명 단기적으로 미국의 AI 패권에 대한 스크레치가 날 수 있는 이슈는 분명해 보입니다. 하지만 그 결론이 비용효율화를 위한 투자 감소로 이어질 수 있다는 것에는 당장 동의하기는 어렵습니다.
스포츠에 관심이 많아 스포츠에 비유를 해보자면, 상대적으로 약팀으로 평가를 받던 팀이 상대적으로 몸값이 낮은 선수들을 가지고도 참신한 전략을 통해 매우 좋은 성적을 거둔다고 해서 돈이 많은 기존의 강팀이 선수 영입에 돈을 덜 쓴다는 결론으로 가기는 어렵습니다. 현재 벌어지고 있는 AI 패권 전쟁은 마치 스포츠처럼 당장의 승리가 매우 중요하기 때문에 오히려 더욱 강한 투자가 진행될 가능성도 매우 높아 보입니다.
해당 이슈에 대해 아직 더 밝혀져야 할 것도 많으며 깊이 있게 기술적으로 알지는 못하기 때문에 좀 더 상황을 지켜볼 필요가 있어 보입니다. 다만 너무 과한 우려는 오히려 기회가 될 수 있기에 그러한 관점에서 계속 추적해보도록 하겠습니다.
[요약]
- DeepSeek는 엔비디아 H800 칩을 사용해 비교적 저렴한 비용으로 개발되어 미국의 대중국 수출 통제 조치의 효과에 의문이 제기되고 있음
- DeepSeek의 비용 효율적인 접근 방식은 AI 개발에 필요한 컴퓨팅 파워와 비용에 대한 재평가를 촉발
- 사전 훈련 클러스터에 대한 정보는 전혀 검증되지 않았기에 이를 두고 단순히 비용 효율 측면에서 우위에 있다고 결론 내리기에는 무리가 있음
- DeepSeek로 인해 미국 빅테크의 AI 투자가 과도하다는 주장은 어불성설. AGI가 중요. LLM은 여러 AI 모델 중 하나일 뿐
- DeepSeek 덕분에 OpenAI 플러스 유저도 최고 성능 모델인 o3 Mini를 곧 사용할 수 있게 됐다는 사실은 긍정적. 경쟁이 소비자 효용과 후생을 확대시키는 결과를 낳는 중
- MSFT와 Meta는 Capex를 상향함. AI Super Cycle의 파동은 더욱 진폭을 키우며 전개될 것. 보다 큰 변동성을 내포한 채로 AI Core Infra 기업들의 주가 우상향 진행될 것으로 예상. Color는 변해도 Core는 변하지 않음
[첨언]
오늘 하루 종일 DeepSeek 이슈가 부각되면서 휴일에도 제도권 애널리스트의 긴급 이슈 리포트가 나올 정도입니다.
개인적인 생각을 조금 담아보면 분명 단기적으로 미국의 AI 패권에 대한 스크레치가 날 수 있는 이슈는 분명해 보입니다. 하지만 그 결론이 비용효율화를 위한 투자 감소로 이어질 수 있다는 것에는 당장 동의하기는 어렵습니다.
스포츠에 관심이 많아 스포츠에 비유를 해보자면, 상대적으로 약팀으로 평가를 받던 팀이 상대적으로 몸값이 낮은 선수들을 가지고도 참신한 전략을 통해 매우 좋은 성적을 거둔다고 해서 돈이 많은 기존의 강팀이 선수 영입에 돈을 덜 쓴다는 결론으로 가기는 어렵습니다. 현재 벌어지고 있는 AI 패권 전쟁은 마치 스포츠처럼 당장의 승리가 매우 중요하기 때문에 오히려 더욱 강한 투자가 진행될 가능성도 매우 높아 보입니다.
해당 이슈에 대해 아직 더 밝혀져야 할 것도 많으며 깊이 있게 기술적으로 알지는 못하기 때문에 좀 더 상황을 지켜볼 필요가 있어 보입니다. 다만 너무 과한 우려는 오히려 기회가 될 수 있기에 그러한 관점에서 계속 추적해보도록 하겠습니다.
우산 X NNN의 아이디어
NH투자증권_주식_해외시황_20250127193845.pdf
DeepSeek에 대한 올바른 해석은 오픈 소스 모델이 독점 모델보다 더 발전 가능성이 높으며 오픈 리서치와 오픈소스 시스템이 채택될 가능성이 더 높다는 의미. 또한 AI 타임라인이 가속화되고 중소 후발주자들도 새로운 가능성을 보여줌으로써 추가 수요를 더 창출할 수 있다는 것이 핵심.
LLM은 결국 커머디티화될 가능성이 높았고 메타가 오픈소스 전략을 취했을 때부터 어느정도 예견됐던 방향.
DeepSeek 모델로 인해 미국 빅테크의 AI 투자가 과도하다는 주장은 어불성설. AGI가 중요함. LLM은 여러 AI 모델 중 하나일 뿐이며, OpenAI의 미션 변경과 초지능을 향한 Next Step 등을 감안하면 AI Super Cycle에 대한 회의는 사치.
동의합니다
Gromit 공부방
https://m.blog.naver.com/hardark/223740892036
결국 이게 핵심이라 생각하는데 몇달 뒤 되돌아보면 결국 세콰이어 60b 퀘스천 시즌2에 지나지 않을 것이라는 생각
금요일까지 미장 컬러 지금과 같이 유지되면 또 AI HW 팔고 SW 사자 시즌2인데, 그럼 네이버 더존비죤 카페24 이스트소프트 이런 거 주워담아야 하는 건가.. HW는 그나마 살 때 일종의 죄책감(?)은 없는데 국내에서 AI(?) SW를 산다는 게 참 기분이 그럼. 뭐 하나 제대로 하는 곳이 있나.. 근데 이런 알량한 마인드로 주식하면 안 되니까 일단 뇌 빼고 목요일까지 미장 지켜본 후 시장에 순응할 생각.
Forwarded from 엄브렐라리서치 Jay의 주식투자교실
로봇 학습의 잠재적 적용 및 가속화 외에도, LLM 영역에서 광범위한 지속적인 성장이 덜 분명해지고 투자자들이 점점 더 실행할 여지가 있는 스토리를 다른 곳에서 찾게 되면서, 물리적 AI가 점점 더 많은 관심을 끌 것으로 예상
다시 말해, 디지털 AI 스토리를 다루는 모든 기업의 두 자릿수 수익률에 더 이상 의존할 수 없게 되면 휴머노이드부터 eVTOL, AMR, AV에 이르기까지 구체화된 AI의 초기 단계 기회가 점점 더 매력적으로 보일 것으로 예상
공감이 되는 부분..
투자자들의 AI에 대한 열망은 어딘가로 또다시 분출될것..
Forwarded from [하나 Global ETF] 박승진 (박승진 하나증권)
» OpenAI는 미국 정부 전용 AI 플랫폼인 ChatGPT Gov를 발표
» 이 플랫폼은 Microsoft의 지원을 받아 기존 ChatGPT Enterprise보다 보안 수준을 강화한 버전으로 개발되었으며, 미국 연방 및 지방 정부 기관들이 민감한 비공개 정보를 안전하게 활용할 수 있도록 설계
» 특히 정부 기관들은 Microsoft Azure 상업용 클라우드 또는 Azure 정부용 커뮤니티 클라우드에서 ChatGPT Gov를 운영하여 보안, 프라이버시, 규정 준수 요건을 직접 관리 가능
» 2024년 초부터 미국 연방, 주, 지방 정부 기관의 9만 명 이상의 직원이 ChatGPT를 활용하고 있으며, 현재까지 1,800만 개 이상의 프롬프트가 생성
» 주요 사용 사례로는 문서 번역 및 요약, 정책 메모 작성 및 초안 생성, 코드 작성 및 애플리케이션 개발, 법률 및 규정 준수 업무 자동화 등이 포함
» 정부 기관들이 AI 기술을 통해 업무 효율성을 높이고 행정 절차를 간소화하는 데 기여할 전망
» 일부 상원의원들은 OpenAI가 트럼프 행정부에 지나치게 협력하며 규제 완화를 도모하는 것 아니냐는 우려를 표명
» 이 플랫폼은 Microsoft의 지원을 받아 기존 ChatGPT Enterprise보다 보안 수준을 강화한 버전으로 개발되었으며, 미국 연방 및 지방 정부 기관들이 민감한 비공개 정보를 안전하게 활용할 수 있도록 설계
» 특히 정부 기관들은 Microsoft Azure 상업용 클라우드 또는 Azure 정부용 커뮤니티 클라우드에서 ChatGPT Gov를 운영하여 보안, 프라이버시, 규정 준수 요건을 직접 관리 가능
» 2024년 초부터 미국 연방, 주, 지방 정부 기관의 9만 명 이상의 직원이 ChatGPT를 활용하고 있으며, 현재까지 1,800만 개 이상의 프롬프트가 생성
» 주요 사용 사례로는 문서 번역 및 요약, 정책 메모 작성 및 초안 생성, 코드 작성 및 애플리케이션 개발, 법률 및 규정 준수 업무 자동화 등이 포함
» 정부 기관들이 AI 기술을 통해 업무 효율성을 높이고 행정 절차를 간소화하는 데 기여할 전망
» 일부 상원의원들은 OpenAI가 트럼프 행정부에 지나치게 협력하며 규제 완화를 도모하는 것 아니냐는 우려를 표명
Forwarded from [하나 Global ETF] 박승진 (박승진 하나증권)
» Chevron, AI Data Center를 위한 천연가스 발전소 건설 계획 발표. 전통 에너지 기업들도 AI 산업에 연결되는 모습
» Chevron은 투자사 Engine No. 1 및 GE Vernova와 협력하여 AI 데이터 센터를 위한 천연가스 발전소를 건설할 계획. 이들은 AI의 급증하는 전력 수요를 충족하기 위해 데이터 센터 인근에 발전소를 세우고, 2027년까지 최대 4GW의 전력을 생산할 목표를 수립
» Chevron은 미국 남동부, 서부, 중서부 지역에 발전소를 건설할 계획. 초기에는 기존 전력망을 우회하여 직접 데이터 센터에 전력을 공급하고 이후에 전력망에 연결할 예정. GE Vernova의 천연가스 터빈 7기를 사용할 계획으로, 발전소 건설 비용은 GW당 약 20억 달러로 추정
» 미국 내 데이터 센터 전력 수요는 5년 내 16% 증가할 것으로 예상되며, 이는 작년 예상치보다 3배 높은 수준. 그러나 중국 AI 기업 DeepSeek의 전력 효율성이 높은 AI 모델이 전력 수요 예측을 뒤흔들고 있고, 이에 대한 우려로 전력 관련 주식이 하락하는 등 시장에 영향을 미치고 있는 상황
» Chevron의 이번 발표는 Exxon Mobil이 탄소 포집 기술을 갖춘 대형 가스 발전소를 활용해 데이터 센터에 무배출 전력을 공급하겠다고 발표한 지 한 달 만에 나온 것으로, AI Data Center와 에너지 기업 간 상관관계가 높아질 가능성 시사
» Chevron은 투자사 Engine No. 1 및 GE Vernova와 협력하여 AI 데이터 센터를 위한 천연가스 발전소를 건설할 계획. 이들은 AI의 급증하는 전력 수요를 충족하기 위해 데이터 센터 인근에 발전소를 세우고, 2027년까지 최대 4GW의 전력을 생산할 목표를 수립
» Chevron은 미국 남동부, 서부, 중서부 지역에 발전소를 건설할 계획. 초기에는 기존 전력망을 우회하여 직접 데이터 센터에 전력을 공급하고 이후에 전력망에 연결할 예정. GE Vernova의 천연가스 터빈 7기를 사용할 계획으로, 발전소 건설 비용은 GW당 약 20억 달러로 추정
» 미국 내 데이터 센터 전력 수요는 5년 내 16% 증가할 것으로 예상되며, 이는 작년 예상치보다 3배 높은 수준. 그러나 중국 AI 기업 DeepSeek의 전력 효율성이 높은 AI 모델이 전력 수요 예측을 뒤흔들고 있고, 이에 대한 우려로 전력 관련 주식이 하락하는 등 시장에 영향을 미치고 있는 상황
» Chevron의 이번 발표는 Exxon Mobil이 탄소 포집 기술을 갖춘 대형 가스 발전소를 활용해 데이터 센터에 무배출 전력을 공급하겠다고 발표한 지 한 달 만에 나온 것으로, AI Data Center와 에너지 기업 간 상관관계가 높아질 가능성 시사
뺀지뤼의 SKLab.(스크랩)
OpenAI(ChatGPT), DeepSeek 관계
- David Sacks는 중국 AI 기업 DeepSeek이 OpenAI 모델의 데이터를 활용해 자신들의 AI 모델을 훈련시켰다는 “증거”가 있다고 주장.
- Sacks는 이를 “증류(distillation)“라고 표현하며, OpenAI 모델의 응답 데이터를 수집해 DeepSeek의 모델 훈련에 사용했을 가능성이 있다고 지적.
- 그는 Fox 인터뷰에서 OpenAI가 이에 대해 “매우 불쾌해할 것”이라고 언급했지만, 증거의 출처는 명시하지 않았음.
- DeepSeek은 최근 무료 채팅 앱과 고성능 AI 모델을 공개하며 큰 주목을 받았음. 특히, Apple App Store에서 OpenAI의 ChatGPT를 제치고 다운로드 1위를 기록.
- 이로 인해 DeepSeek은 미국 정부의 높은 감시를 받고 있으며, Reuters에 따르면 국가안전보장회의(NSC)가 DeepSeek의 앱과 관련된 잠재적 영향력을 검토 중이라고 보도.
- 미국 해군은 DeepSeek의 AI 사용을 금지했으며, 이유로 “보안 및 윤리적 문제”를 언급.
source: TechCrunch
- Sacks는 이를 “증류(distillation)“라고 표현하며, OpenAI 모델의 응답 데이터를 수집해 DeepSeek의 모델 훈련에 사용했을 가능성이 있다고 지적.
- 그는 Fox 인터뷰에서 OpenAI가 이에 대해 “매우 불쾌해할 것”이라고 언급했지만, 증거의 출처는 명시하지 않았음.
- DeepSeek은 최근 무료 채팅 앱과 고성능 AI 모델을 공개하며 큰 주목을 받았음. 특히, Apple App Store에서 OpenAI의 ChatGPT를 제치고 다운로드 1위를 기록.
- 이로 인해 DeepSeek은 미국 정부의 높은 감시를 받고 있으며, Reuters에 따르면 국가안전보장회의(NSC)가 DeepSeek의 앱과 관련된 잠재적 영향력을 검토 중이라고 보도.
- 미국 해군은 DeepSeek의 AI 사용을 금지했으며, 이유로 “보안 및 윤리적 문제”를 언급.
source: TechCrunch
TechCrunch
David Sacks claims there's 'substantial evidence' that DeepSeek used OpenAI's models to train its own | TechCrunch
David Sacks said there's evidence that DeepSeek 'distilled' knowledge from OpenAI's models, a process that Sacks equated to theft.
Forwarded from 루팡
마이크로소프트, DeepSeek 관련 그룹이 OpenAI 데이터를 부적절하게 획득했는지 조사 중
마이크로소프트(Microsoft)와 오픈AI(OpenAI)는 중국 인공지능 스타트업 DeepSeek과 연관된 그룹이 OpenAI의 기술에서 생성된 데이터를 무단으로 획득했는지 조사 중이라고 사안에 정통한 소식통들이 전했다.
소식통들에 따르면, 마이크로소프트의 보안 연구원들은 작년 가을, DeepSeek과 관련이 있는 것으로 보이는 인물들이 OpenAI의 응용 프로그램 프로그래밍 인터페이스(API)를 이용해 대량의 데이터를 유출하는 정황을 포착했다. API는 소프트웨어 개발자들이 OpenAI의 독점 AI 모델을 자체 애플리케이션에 통합할 수 있도록 라이선스를 구매해 사용하는 방식이다.
마이크로소프트는 이러한 활동을 감지한 후 OpenAI에 이를 알렸으며, 해당 활동이 OpenAI의 서비스 약관을 위반했을 가능성이 있거나, 해당 그룹이 OpenAI의 데이터 획득 제한을 우회하려 했을 수도 있다고 소식통들은 전했다.
트럼프 행정부 AI 담당관 "DeepSeek, OpenAI 기술 활용 가능성"
도널드 트럼프 전 대통령의 AI 정책 담당관인 데이비드 색스(David Sacks)는 화요일 Fox News와의 인터뷰에서 DeepSeek이 OpenAI 모델의 출력을 활용해 자체 기술을 개발했다는 '상당한 증거'가 있다고 주장했다.
그는 "디스틸레이션(distillation)"이라는 기법을 언급하며, 한 AI 모델이 다른 AI 모델의 출력을 이용해 훈련하면서 유사한 능력을 개발할 수 있다고 설명했다.
"DeepSeek이 OpenAI 모델에서 정보를 추출해 AI를 개발한 것은 명백해 보이며, OpenAI는 이에 대해 불쾌해할 것"이라고 말했다. 그러나 그는 구체적인 증거를 제시하지는 않았다.
OpenAI "중국 기업들, 미국 AI 모델을 추출하려 한다"
이에 대해 OpenAI는 색스의 발언에 직접적으로 대응하지 않았으나, 성명을 통해 "중국(PRC) 기반 기업들과 기타 경쟁자들이 미국 AI 기업들의 모델을 추출하려는 시도를 지속적으로 하고 있다"고 밝혔다.
OpenAI 대변인은 "우리는 지적 재산을 보호하기 위해 여러 방어 조치를 취하고 있으며, 출시하는 모델에서 어떤 최첨단 기능을 포함할지 신중하게 결정하고 있다"고 말했다.
또한, "미국 정부와 긴밀히 협력하여 AI 기술을 보호하는 것이 매우 중요하다"고 강조했다.
https://www.bloomberg.com/news/articles/2025-01-29/microsoft-probing-if-deepseek-linked-group-improperly-obtained-openai-data
마이크로소프트(Microsoft)와 오픈AI(OpenAI)는 중국 인공지능 스타트업 DeepSeek과 연관된 그룹이 OpenAI의 기술에서 생성된 데이터를 무단으로 획득했는지 조사 중이라고 사안에 정통한 소식통들이 전했다.
소식통들에 따르면, 마이크로소프트의 보안 연구원들은 작년 가을, DeepSeek과 관련이 있는 것으로 보이는 인물들이 OpenAI의 응용 프로그램 프로그래밍 인터페이스(API)를 이용해 대량의 데이터를 유출하는 정황을 포착했다. API는 소프트웨어 개발자들이 OpenAI의 독점 AI 모델을 자체 애플리케이션에 통합할 수 있도록 라이선스를 구매해 사용하는 방식이다.
마이크로소프트는 이러한 활동을 감지한 후 OpenAI에 이를 알렸으며, 해당 활동이 OpenAI의 서비스 약관을 위반했을 가능성이 있거나, 해당 그룹이 OpenAI의 데이터 획득 제한을 우회하려 했을 수도 있다고 소식통들은 전했다.
트럼프 행정부 AI 담당관 "DeepSeek, OpenAI 기술 활용 가능성"
도널드 트럼프 전 대통령의 AI 정책 담당관인 데이비드 색스(David Sacks)는 화요일 Fox News와의 인터뷰에서 DeepSeek이 OpenAI 모델의 출력을 활용해 자체 기술을 개발했다는 '상당한 증거'가 있다고 주장했다.
그는 "디스틸레이션(distillation)"이라는 기법을 언급하며, 한 AI 모델이 다른 AI 모델의 출력을 이용해 훈련하면서 유사한 능력을 개발할 수 있다고 설명했다.
"DeepSeek이 OpenAI 모델에서 정보를 추출해 AI를 개발한 것은 명백해 보이며, OpenAI는 이에 대해 불쾌해할 것"이라고 말했다. 그러나 그는 구체적인 증거를 제시하지는 않았다.
OpenAI "중국 기업들, 미국 AI 모델을 추출하려 한다"
이에 대해 OpenAI는 색스의 발언에 직접적으로 대응하지 않았으나, 성명을 통해 "중국(PRC) 기반 기업들과 기타 경쟁자들이 미국 AI 기업들의 모델을 추출하려는 시도를 지속적으로 하고 있다"고 밝혔다.
OpenAI 대변인은 "우리는 지적 재산을 보호하기 위해 여러 방어 조치를 취하고 있으며, 출시하는 모델에서 어떤 최첨단 기능을 포함할지 신중하게 결정하고 있다"고 말했다.
또한, "미국 정부와 긴밀히 협력하여 AI 기술을 보호하는 것이 매우 중요하다"고 강조했다.
https://www.bloomberg.com/news/articles/2025-01-29/microsoft-probing-if-deepseek-linked-group-improperly-obtained-openai-data
Bloomberg.com
Microsoft Probing If DeepSeek-Linked Group Improperly Obtained OpenAI Data
Microsoft Corp. and OpenAI are investigating whether data output from OpenAI’s technology was obtained in an unauthorized manner by a group linked to Chinese artificial intelligence startup DeepSeek, according to people familiar with the matter.
Bernstein, 「U.S. Semiconductors: Is DeepSeek doomsday for AI buildouts? We don't think so」 (1/27)
via X @BigBullCap
via X @BigBullCap
Gromit 공부방
Bernstein, 「U.S. Semiconductors: Is DeepSeek doomsday for AI buildouts? We don't think so」 (1/27) via X @BigBullCap
번스타인의 분석에 따르면, DeepSeek의 AI 모델이 혁신적인 것은 맞지만, 시장에서의 반응이 과장된 몇 가지 이유가 있음.
1️⃣ “500만 달러로 OpenAI를 구축했다”는 오해
💡 오해
‒ 많은 사람들이 “DeepSeek이 단 500만 달러로 GPT-4 수준의 모델을 만들었다”고 생각했음.
‒ 하지만 이 숫자는 DeepSeek이 실제 사용한 전체 비용이 아니라, GPU 임대료만을 기준으로 추정한 값임.
💡 사실
‒ DeepSeek은 2048개의 NVIDIA H800 GPU를 사용해 약 2개월간 훈련(약 270~280만 GPU 시간).
‒ “500만 달러”라는 숫자는 GPU 시간당 2달러라는 가정하에 계산한 것이지, 실제 개발 비용이 아님.
‒ 데이터 구축, 연구, 실험, 인프라 비용 등은 포함되지 않음.
▶ 즉, OpenAI 수준의 AI를 단 500만 달러로 구축했다는 건 과장된 주장임.
2️⃣ R1 모델의 “증류(Distillation)“와 과대평가된 성능
💡 오해
‒ 일부 사람들은 DeepSeek의 R1 모델이 GPT-4와 동등하거나 더 나은 성능을 가진다고 착각했음.
💡 사실
‒ DeepSeek R1은 V3 모델을 기반으로 “증류(Distillation)” 기법을 사용하여 작은 모델로 변환한 것임.
‒ GPT-4 추론과 비교했을 때 성능이 뛰어나지만, 훈련 과정이나 전체 모델의 성능을 GPT-4와 1:1로 비교하는 것은 어려움.
‒ R1 모델의 전체 개발 비용도 공개되지 않았기 때문에, 실제 비용 절감 효과가 얼마나 큰지는 불분명함.
▶ 즉, R1 모델이 GPT-4와 동급이라고 단정짓기는 어려움.
3️⃣ DeepSeek 모델이 AI 인프라의 종말을 의미하지는 않음
💡 오해
‒ 일부 사람들은 DeepSeek이 기존 AI 인프라(예: 엔비디아, 브로드컴 등의 반도체 기업)를 대체할 것이라고 오해했음.
‒ “DeepSeek이 10배 더 효율적인 모델을 만들었으니, 더 이상 막대한 AI 인프라 투자가 필요 없을 것”이라는 시각이 나왔음.
💡 사실
‒ DeepSeek의 MoE(Mixture-of-Experts) 모델은 효율적이지만, 모든 AI 모델이 MoE 방식으로 갈 수 있는 것은 아님.
‒ 기존의 대형 밀집(Dense) 모델 대비 비용 효율성이 높긴 하지만, 이런 최적화는 어디까지나 AI 기술 발전의 일부일 뿐, AI 인프라 자체가 필요 없어진다는 것은 사실이 아님.
‒ META, 중국 정부 등이 AI 투자를 오히려 확대하고 있음.
• META: 자본 지출(CapEx) 증가 발표
• 중국: 1조 위안(약 1400억 달러) 규모 AI 투자 계획 발표
1️⃣ “500만 달러로 OpenAI를 구축했다”는 오해
💡 오해
‒ 많은 사람들이 “DeepSeek이 단 500만 달러로 GPT-4 수준의 모델을 만들었다”고 생각했음.
‒ 하지만 이 숫자는 DeepSeek이 실제 사용한 전체 비용이 아니라, GPU 임대료만을 기준으로 추정한 값임.
💡 사실
‒ DeepSeek은 2048개의 NVIDIA H800 GPU를 사용해 약 2개월간 훈련(약 270~280만 GPU 시간).
‒ “500만 달러”라는 숫자는 GPU 시간당 2달러라는 가정하에 계산한 것이지, 실제 개발 비용이 아님.
‒ 데이터 구축, 연구, 실험, 인프라 비용 등은 포함되지 않음.
▶ 즉, OpenAI 수준의 AI를 단 500만 달러로 구축했다는 건 과장된 주장임.
2️⃣ R1 모델의 “증류(Distillation)“와 과대평가된 성능
💡 오해
‒ 일부 사람들은 DeepSeek의 R1 모델이 GPT-4와 동등하거나 더 나은 성능을 가진다고 착각했음.
💡 사실
‒ DeepSeek R1은 V3 모델을 기반으로 “증류(Distillation)” 기법을 사용하여 작은 모델로 변환한 것임.
‒ GPT-4 추론과 비교했을 때 성능이 뛰어나지만, 훈련 과정이나 전체 모델의 성능을 GPT-4와 1:1로 비교하는 것은 어려움.
‒ R1 모델의 전체 개발 비용도 공개되지 않았기 때문에, 실제 비용 절감 효과가 얼마나 큰지는 불분명함.
▶ 즉, R1 모델이 GPT-4와 동급이라고 단정짓기는 어려움.
3️⃣ DeepSeek 모델이 AI 인프라의 종말을 의미하지는 않음
💡 오해
‒ 일부 사람들은 DeepSeek이 기존 AI 인프라(예: 엔비디아, 브로드컴 등의 반도체 기업)를 대체할 것이라고 오해했음.
‒ “DeepSeek이 10배 더 효율적인 모델을 만들었으니, 더 이상 막대한 AI 인프라 투자가 필요 없을 것”이라는 시각이 나왔음.
💡 사실
‒ DeepSeek의 MoE(Mixture-of-Experts) 모델은 효율적이지만, 모든 AI 모델이 MoE 방식으로 갈 수 있는 것은 아님.
‒ 기존의 대형 밀집(Dense) 모델 대비 비용 효율성이 높긴 하지만, 이런 최적화는 어디까지나 AI 기술 발전의 일부일 뿐, AI 인프라 자체가 필요 없어진다는 것은 사실이 아님.
‒ META, 중국 정부 등이 AI 투자를 오히려 확대하고 있음.
• META: 자본 지출(CapEx) 증가 발표
• 중국: 1조 위안(약 1400억 달러) 규모 AI 투자 계획 발표
Forwarded from 하나 중국/신흥국 전략 김경환
•2025년 춘완 쇼의 주인공은 Unitree 로봇의 댄스 타임. 사측은 모든 동작이 AI 훈련 기반이라고
>【春晚机器人流畅的舞蹈动作全靠AI训练执行】据宇树科技官方透露,本次春晚舞台的扭秧歌舞蹈,是基于视频的舞蹈动作的生成与映射,靠AI训练来执行。
>【春晚机器人流畅的舞蹈动作全靠AI训练执行】据宇树科技官方透露,本次春晚舞台的扭秧歌舞蹈,是基于视频的舞蹈动作的生成与映射,靠AI训练来执行。