기억보단 기록을 – Telegram
기억보단 기록을
793 subscribers
1.47K photos
10 videos
52 files
1.22K links
하루하루 쌓아간다는 마인드로 주식/가상화폐/매크로에 대한 개인적인 생각을 공유합니다

[Blog]
https://blog.naver.com/aaaehgus

<Disclaimer>
- 매수/매도 추천아님
- 보유자 편향이 있을 수 있음
- 텔레그램 및 블로그에 게재되는 내용은 단순 기록용이며, 어떠한 경우에도 투자 결과에 대한 법적 책임소재의 증빙자료로 사용될 수 없음
- 투자에 대한 손실은 거래 당사자의 책임입니다
Download Telegram
딴건 모르겠고 팔란티어 매수 기회나 줬으면 좋겠네요😇
Forwarded from (구) 이웅찬_iM증권시황/전략 (이웅찬 iM증권)
주말에는 DeepSeek 중국 AI때문에 난리였습니다.

제가 생각할때 증시에 영향을 미칠 요인은 세 가지입니다.

1. 일단 AI Capex는 무적이라는 논리에 스크래치가 한번 났습니다. 여튼 오픈 소스입니다. 중국이 뻥치는거다 아니다 반박도 많은데 주가에서 중요한건 그런게 아닙니다. capex 말고 효율화라는 방안이 있지 않을까? 하는 의심이 생겼습니다.

2. 대 중국 반도체 수출 규제는 더 강화될 것입니다. 중국이 여튼 은근히 H100을 빼돌리기도 했을 것입니다. 얼마나 확보했는지는 어차피 알기 어렵습니다. 가운데 낀 엔비디아는 곤란해졌습니다. AMD 같은 대안이 부각받을 수 있을까요? 그건 좀 애매해 보이긴 합니다.

3. 앞으로 이걸 계기로 미국이 투자를 더 늘릴 수 밖에 없다, 군비경쟁이나 마찬가지다, 라는 주장도 나타날 수 있겠습니다. 주가 빠지면 이런 주장이 또 나오겠지요..


저는 어차피 인류사의 모든 기술이라는게, 불의 발명에서 시작해서 청동기.. 철기.. 문자.. 바퀴.. 등등... 산업혁명에서 원자폭탄 인터넷에 이르기까지

인간들은 웬만하면 다 남의 것 금방금방 베끼고 따라갔습니다.

AI만 후발주자가 따라갈 수 없는 유일한 기술이다 Capex의 규모 때문에 불가능하다.. 특이점이 오면 게임 끝난다는 논리가.. 맞을 수도 있겠지만.. 지금껏 인간 세상에 그런건 없었던 것 같습니다.


미국 정부가 나서서 소비에트와의 군비경쟁처럼 AI 투자를 더 늘릴거라는 주장도 있는데..

미국이 정부가 뭘 잘 주도하고 쓰고 하는 나라는 아닙니다. 특히 공화당 정부는 더 그렇습니다. 스타게이트만 봐도 미국 정부가 돈 쓰는건 없고 손정의 돈으로 생색내는 격입니다. 좀 더 봐야겠지만 그런 기대는 좀 이르지 않나 싶기도..


대 중국 AI 규제는 확대될까요? 이건 더 촘촘하게 죄어야 맞을 것 같죠. 엔비디아 황사장님은 왜 북경에 가 있었던 걸까요? 중국 고객이 더 중요해보였던 것일까..

여튼 스크래치는 한 번 난거 같고, 별 일 없이 지나갈 이슈는 아닐 것 같습니다.

https://www.cnbc.com/2025/01/24/how-chinas-new-ai-model-deepseek-is-threatening-us-dominance.html
1
반도체 주식의 DeepSeek에 대한 야간 시장 반응

1. Arm, $ARM : -5.5%
2. 엔비디아, $NVDA : -5.3%
3. 브로드컴, $AVGO : -4.9%
4. 슈퍼마이크로, $SMCI : -4.6%
5. 대만 반도, $TSM : -4.5%
6. 마이크론, $MU : -4.3%
7. 퀄컴, $QCOM : -2.8%
8. AMD, $AMD : -2.5%
9. 인텔, $INTC : -2.0%

미국 시장은 월요일 거래에서 시가총액이 1조 달러 이상 감소할 것으로 예상
저는 국가설정이 미국으로 되어있는데, 현재 기준 무료앱 부문에서 Deepseek가 chatgpt 따잇 했네요
#PLTR

1. 중국 딥시크 사례가 시사하는 바는 AI가 P(가격)는 감소하고 Q(수요 및 활용도)는 증가하는 방향으로 가는 분기점이 될 가능성이 있다는 점

2. P의 감소는 기업과 정부의 AI 채택을 촉진한다는 의미로 해석할 수 있음

3. 이러한 흐름 속에서 가장 부각되는 것은, AI 활용을 극대화하는 플랫폼과 솔루션을 제공하는 팔란티어일 가능성이 높지 않을까
🔥2
Forwarded from AI MASTERS
[ 사실 그런데 .. GPU는 그렇게 많이 필요 없었습니다 ]

1.
Deepseek로 인해 'NVIDIA의 GPU는 버블 아닌가?' 라는 말도 나오는데, 전 아니라고 생각이 듭니다. 연구자들이 그렇게 나왔는걸요.

작년 2월 28일, 마이크로소프트는 기존의 2진법 연구 (0, 1) 가 아닌 단 0, 1, 그리고 -1 로 만들어진 1비트LLM 이라는 이론을 내놓습니다. (2진법은 101, 10110, 10101010 이런식으로 작성이 가능하지만 1bitllm은 딱 -1, 0, 1로 구동)

기존의 트레이닝이 된 LLM을 0, 1, -1 로 다시 트레이닝을 한다면 GPU를 적게 사용을 해도 구동하는데 문제는 없다고 주장했던 페이퍼였습니다. 당시 해당 페이퍼로 연구자들은 큰 충격을 주었으며, 2024년도 최고의 페이퍼로 선정 받곤 했는데

하지만 단점은 트레이닝을 하면 기존의 LLM과 같은 데이터들이 유실이 되곤 했습니다. 사실 예측되던 결과물이긴 했습니다. 모든걸 흑백논리로 구동해야할 1bit에선 어떤 부분은 로스가 나올수 밖에 없죠
Forwarded from AI MASTERS
2.
그 이후 메타가 참전 합니다.

메타도 2024년 3월 6일, 마이크로소프트에서 실패한 결과물을 보고 경량화에 대한 페이퍼 'Galore' 를 발표합니다.

LLM에는 많은 데이터가 필요합니다. 메타는 그 부분에서 집중해서 공부를 해봅니다. 굳이 그 많은 데이터에서 중복되는 데이터는 없을까? 필요 없는 데이터는 없을까? 라는 생각으로 LLM에 무려 40% 되는 데이터를 삭제를 해봤는데, 구독하는데 큰 문제가 없는걸 발견을 합니다.

결과로 기존엔 VRAM이 58기가 ~ 정도 필요하던 상황에서 단 21GB, 4090으로도 구동이 되는걸 발견을 하여 굳이 GPU에 대한 집착을 버리곤 했습니다.
Forwarded from AI MASTERS
3.
모든 시작이 되었던 Attention Is All You Need 저자들이 모였던 2024년 Nvidia 상반기 컨퍼런스에 한번 모여서 페이퍼에 대한 후기와 개인 소견을 이야기 했습니다.

Aidan Gomez, Cohere AI의 현 CEO는 정확하게 '세상은 Transformer보다 더 좋은 모델이 필요합니다 (the world needs something better than transformers)' 라고 이야기를 했습니다.

구조적으로 transformer 는 메모리를 너무 비효율적으로 사용을 했으며, 해당 모델이 실제로 GPT3.5 이후로 크게 AI 모델들이 Transformer보다 좋은걸 공개못하기도 했습니다 (Mamba 등의 새로운 시도는 있었지만.. 다 실패 했습니다)

굳이 2+2 라는 쉬운 테스크에 많은 GPU를 사용할 필요가 없는데 현 LLM은 다 필요했습니다. 그러다 보디 3.11 와 3.9에 대한 비교도, Strawberry에 r이 몇갠지를 푸는데 큰 고난을 겪곤 했죠.

개인적 의견을 첨가하자면, Deepseek는 어쩔수 없이 새로운 시대를 열게 만들어준 모델이라고 생각합니다.

1957년 소련이 갑자기 인공위성 스푸티니크 를 발사하면서 미국 사회에선 나사가 만들어졌으며, 교육과정이 변했으며, 인터넷이 등장한거 처럼, 미국도 이젠 변화를 할껍니다. (과장이 아니라 AI 시장에서 뒤지기 싫으면 변화를 해야할껍니다..)
간밤에 나스닥
1. 조정받은 섹터 - AI 하드웨어, 전력기기, 유틸리티, LNG
2. 상대적으로 강한 섹터 - AI 소프트웨어, 보안

- 이번주 Meta, MS, 테슬라 컨콜에서 CAPEX 변화 여부 확인 필요
- 딥시크가 only H800으로만 학습시켰는지 진위 여부 확인 필요
[DeepSeek, 또 한번 주목 받아]

- 주말동안 CNBC 때문에 딥시크(DeepSeek)가 또 화제 되었네요

- 지난 20일에 발표된 추론모델 R1(V3모델 미세조정 버전)을 공개했습니다. 언론에서는 딥시크 모델이 오픈AI 추론모델 성능을 초월하고 개발비용이 1/100에 불과하다고 했는데, 이는 빠르면 작년 8월, 또는 작년 연말에 이미 회자된 내용입니다.

- 개인적으로 이 시점에 언론에서 강하게 주목하는 이유가, 단순 신모델 출시 때문인지, 아니면 미국이 중국 AI를 때리기 위한 분위기 조성인지가 헷갈리네요.

- 딥시크 창시자는 85년생의 퀀트 헷지펀드 출신입니다. 작년 연말 V3 모델 출시로 크게 회자된 이후 올해 중국 고위지도자 간담회에 참석한 사진이 회자되었습니다. 그만큼 중국정부도 AI투자에 진심이라는 것을 엿볼 수 있죠

- 딥시크의 성과는 중국이 제한된 자원에서 효율화로 당분간 돌파구를 찾았을 뿐 갈 길이 멉니다. 단, 중국의 빠른 속도의 따라잡기로 양국의 경쟁은 더 확대될 수 밖에 없고, 이는 양국 산업 발전을 촉진하는 계기로 작용합니다.

- 연초 딥시크 시사점을 적은 보고서 다시 올려드립니다. 참고하시기 바랍니다.
https://tinyurl.com/my5ydcs6
1
#AI

앤트로픽 CEO, 다리오 아모데이 인터뷰


- AI 산업은 현재 전환 단계(사전훈련 → 강화학습)에 있으며, 일부 강화학습 훈련을 통해 기존 상황을 따라잡을 수 있는 기회가 존재함. 패러다임의 전환은 단기적인 혼란이 필연적으로 수반됨. 시간이 지나면 다시 정립되기 마련

- 딥시크는 오래 전부터 알고 있었고, 알리바바 같은 다른 회사보다 성공 확률이 높다고 생각해왔음. 딥시크 같은 저렴한 대체 모델이 등장하면서, AI 모델의 퀄리티에 따라 가격 경쟁이 심화될 가능성이 열려 있음

- AI 분야에서 2026-27년은 AGI의 도래가 가능한 매우 중요한 시점으로, 이 시기에 앞서가는 국가가 영구적인 우위를 점할 가능성이 있음. 미국이 선두를 유지하기 위해서는 1) 에너지 공급2) 민주주의 국가 간의 컴퓨팅 능력 협력을 강화해야하며, 3) 지속적으로 AI칩 수출을 통제해야함.

- 딥시크가 가성비로 마케팅하는 중이지만, H100칩을 5만개 보유하고 있는 것도 사실임. (일론머스크의 Colossus 클러스터의 약 절반 정도)

- 현재 미국과 중국은 비슷한 규모의 수만개의 AI칩을 가지고 있기 때문에 균형점에 있지만, 미국 기업들과 AI를 계속 경쟁하기는 어려울 것. 중국이 수만개의 H100 칩을 밀수하는 것은 가능하지만, 1)미국의 수출 통제와 2) 중국 화웨이 칩의 퀄리티는 매우 떨어지기 때문에 수십만 - 수백만 개의 칩을 획득하는 것은 불가능하다고 생각

- 미국에서 25년 말까지 수십 만개, 26년에는 수백만개의 AI 칩이 생산될 것으로 전망

참고로 앤트로픽은 GPT 대항마 중 하나인 Claude를 출시했고, 다리오 아모데이는 샘알트먼과 Open AI의 윤리성이 상실되어가는 것에 대한 회의감을 느끼고 퇴사하여 앤트로픽을 설립했습니다.

https://www.youtube.com/watch?v=uvMolVW_2v0&t=2s
2
테크쪽에서 오늘도 주가 오르는 기업: 애플, 마소, 메타, 팔란티어
미국 10개 이상의 주에서 암호화폐 관련 법안을 도입

#BTC
일론: 이건 최고의 분석

DeepSeek와 미국 AI의 미래 트렌드에 관한 분석 요약

1. DeepSeek의 비용과 진입 장벽
•DeepSeek의 6백만 달러 훈련 비용에는 아키텍처 설계, 알고리즘 실험, 데이터 준비 과정이 포함되어 있지 않습니다.
•이는 수억 달러의 초기 투자와 DeepSeek이 보유한 수만 대의 A100 GPU 클러스터 같은 강력한 하드웨어가 없으면, 다른 팀이 동일한 성과를 단순히 재현하기 어렵다는 것을 의미합니다.

2. 중국과 모델 접근성
•DeepSeek의 개발은 GPT-4o 및 o1을 기반으로 한 모델 증류(distillation) 기술에 의존한 것으로 보입니다.
•이는 고급 GPU 수출을 제한하는 미국의 제재가 중국이 선도적인 AI 모델에 접근하는 것을 막지 못했다는 사실을 보여줍니다.
•**“만약 무료로 우유(GPU 기반 모델)를 얻을 수 있다면 굳이 젖소(GPU)를 살 필요가 없다.”**라는 말로 이 상황을 비유할 수 있습니다.

3. 미래 트렌드
(1) 추론의 탈중앙화
•AI 추론이 클라우드에서 로컬(엣지 디바이스)로 이동함에 따라, 컴퓨팅 구조가 탈중앙화될 것입니다.
•이는 PC와 스마트폰의 대규모 업그레이드를 촉발할 가능성이 있습니다.

(2) AI 인프라의 리스크
•현재의 AI 인프라 승자들(기술 기업, 산업, 에너지 분야)은 탈중앙화된 추론으로 인해 타격을 받을 가능성이 있습니다.

(3) ASI(초지능) 잠재력
•미래의 AI 모델이 암 치료 방법을 발견하거나 **“워프 엔진”**을 발명할 수 있다면, 초지능이 가져오는 경제적 이익은 엄청날 것입니다.
•이는 훈련 자본 지출과 에너지 소비를 지속적으로 증가시킬 것입니다.

(4) 데이터와 플랫폼의 가치 증가
•유튜브, 페이스북, 인스타그램, X와 같은 독자적인 데이터 분배 능력을 가진 플랫폼은 AI 기술로 인해 더욱 높은 가치를 가지게 될 것입니다.

(5) 미국 연구소의 대응 전략
•미래에는 미국의 연구소들이 최첨단 모델을 발표하는 것을 중단할 가능성이 큽니다.
•이는 기술이 증류를 통해 복제될 위험을 방지하기 위함입니다.
•하지만 DeepSeek-R1 같은 기술은 이미 **“고양이가 주머니에서 완전히 뛰쳐나온 상황”**일 수 있습니다.

4. Grok-3에 대한 평가
(1) Grok-3의 의미와 발전 가능성
•Grok-3는 GPT-4 이후 **“사전 학습 확장 법칙(Pre-training Scaling Laws)”**을 검증하는 첫 번째 대규모 테스트가 될 것입니다.
•몇 주 안에 **강화 학습(RL)**을 통해 추론 능력을 더욱 향상시킬 가능성이 있습니다.

(2) Grok-3의 성능과 전망
•Grok-3는 이미 o1을 능가하는 성능을 보여주고 있으며,
•앞으로 얼마나 더 뛰어난 성과를 낼 수 있을지가 핵심 관건이 될 것입니다.

https://x.com/doki_jerry/status/1884371292121637122
👍1
#인플레

1) EU 가스 인벤토리 5년 평균 하회 지속
2) EU 가스 유출 속도는 매우 빨라지는 중0