상상인 AI/퀀트/디지털자산 김경태 – Telegram
상상인 AI/퀀트/디지털자산 김경태
707 subscribers
166 photos
4 videos
5 files
173 links
Download Telegram
[GPT-OSS 오픈소스 모델, 전문가 혹평]

Kyle Corbitt(OpenPipe 설립자, Google 경력)
"GPT-OSS는 합성 데이터(Synthetic Data)로 훈련시킨 모델이다. Microsoft Phi 모델과 비슷한 방식이다. 그래서 성능 기복이 매우 심하고 훈련 데이터 이외 작업 성능은 매우 떨어진다.
아마도 저작권 침해를 피하기 위해 이런 결정을 한 것 같다"


Jason Lee (UC Berkeley 교수, Google Deepmind 경력)
"GPT-OSS는 벤치마크에 과적합시킨 고물(Junk) 모델이며, 이건 그냥 환각 기계다 (Hallucination Machine). 내가 GPT-OSS에 참여하지 않은 것이 자랑스럽다"
😱1🦄1
[주간 실업수당 청구건수 지표 발표]

연속, 신규 모두 예측치 소폭 상회
🤔2
[MSCI 지수 신규 편입]

편입: 두산, 효성중공업, LIG넥스원
편출: LG이노텍, CJ제일제당, SKC
[GPT-5 & Agent 모드 & 개발자 모드 출시 코멘트]

출시 내용 요약


사용자 대상 개선사항:
스마트 라우팅을 갖춘 통합 시스템: GPT-5가 쿼리 복잡도에 따라 빠른 응답과 심층 추론 중 자동으로 선택
환각 현상 대폭 감소: GPT-4o 대비 45% 적은 사실 오류 (사고 모드 사용 시 80% 감소)
덜 "AI스러운" 성격: 아첨성 감소(14.5%에서 6% 미만으로), 불필요한 이모지 감소, 더 자연스러운 대화 스타일
창의적 작업 능력 향상: 특히 "미적 감각"을 갖춘 프론트엔드 디자인에 강함 - 한 번의 프롬프트로 아름다운 웹사이트/앱 생성 가능
새로운 커스터마이징 옵션: 다양한 소통 스타일을 위한 4가지 프리셋 성격(냉소가, 로봇, 경청자, 너드)
한계에 대한 더 솔직한 태도: 작업을 완료할 수 없을 때 이를 인식하고 소통하는 능력 향상

2. 벤치마크를 넘어선 실질적 개선사항

Cursor는 "우리가 사용한 가장 똑똑한 코딩 모델"이라며 독특한 성격을 언급
Vercel은 프론트엔드 작업에서 "독보적인 카테고리"라고 평가
실용 애플리케이션에서 주요 오류 22% 감소
사용자가 체감하는 구체적 개선사항: 깊숙이 숨겨진 버그 포착 능력 향상, 자연스러운 리듬의 뛰어난 문학적 글쓰기, 더 능동적인 작업 완료

3. 가격 (API)
API 가격 구조:

GPT-5: 입력 100만 토큰당 $1.25, 출력 100만 토큰당 $10
GPT-5 mini: 입력 100만 토큰당 $0.25, 출력 100만 토큰당 $2
GPT-5 nano: 입력 100만 토큰당 $0.05, 출력 100만 토큰당 $0.40

4. 에이전트 모드 기능

🔸복잡한 작업 조율: 수십 개의 도구 호출을 순차적 및 병렬로 연결 가능
🔸진행 상황 소통: 도구 호출 사이에 계획, 업데이트, 요약 출력
🔸자율 실행: 승인을 위해 멈추지 않고 야심찬 작업을 더 능동적으로 완료
🔸오류 복원력: 도구 오류 처리 및 실패 복구 능력 향상
🔸긴 컨텍스트 신뢰성: 확장된 다단계 작업에서 컨텍스트 유지 능력 우수

5. 코딩 벤치마크

SWE-bench Verified: 74.9%
Aider polyglot: 88% (o3 대비 오류 1/3 감소)
효율성 우위: o3보다 22% 적은 출력 토큰과 45% 적은 도구 호출로 더 나은 점수 달성


변경점 결론

-Hallucination(환각률)이 기존 3~5%대에서 1% 미만으로 크게 줄은 점에 주목
**(필자 체감상 실수/교묘한 환각이 크게 감소)
-사고력 대폭 증가: 데이터가 적은 문제, 새로운 문제에 대한 논리력/해결력이 대폭 향상
-Agent 모드의 경우 성능은 탁월하나 너무 느린 작업속도가 단점
-단순히 벤치마크만 높은 과적합 모델이 아닌 실성능이 대폭 향상된 모델


한 줄 요약: 왕의 귀환. 5번을 달 자격이 있다


https://openai.com/index/introducing-gpt-5/
[MSCI 스몰캡 지수 변경]

편입: CJ제일제당, 비에이치아이, 달바글로벌, 디앤디파마텍, 두산로보틱스, 지아이이노베이션, 하림지주, 현대지에프홀딩스, LS마린솔루션, 엠앤씨솔루션, NHN, 로보티즈, 에스앤에스텍, 원텍, SNT다이내믹스, 태광산업, 동양생명

편출: HLB테라퓨틱스, 카카오페이, 미원상사
[테슬라, 사내 Dojo 슈퍼컴퓨터 팀 해체]

-테슬라가 Dojo 슈퍼컴퓨터 팀을 해체하고, 팀 리더인 피터 배넌(Peter Bannon)이 회사를 떠날 예정. 약 20명의 직원이 신생 기업 DensityAI로 이직했으며 남은 Dojo 팀원들은 테슬라 내 다른 데이터센터 및 컴퓨팅 프로젝트로 재배치

-엔비디아, AMD, 삼성전자 등 외부 파트너와 협력을 통해 이를 해결할 계획

https://www.reuters.com/business/autos-transportation/tesla-disbands-dojo-supercomputer-team-bloomberg-news-reports-2025-08-07/
상상인 AI/퀀트/디지털자산 김경태 pinned «[GPT-5 & Agent 모드 & 개발자 모드 출시 코멘트] 출시 내용 요약 사용자 대상 개선사항: 스마트 라우팅을 갖춘 통합 시스템: GPT-5가 쿼리 복잡도에 따라 빠른 응답과 심층 추론 중 자동으로 선택 환각 현상 대폭 감소: GPT-4o 대비 45% 적은 사실 오류 (사고 모드 사용 시 80% 감소) 덜 "AI스러운" 성격: 아첨성 감소(14.5%에서 6% 미만으로), 불필요한 이모지 감소, 더 자연스러운 대화 스타일 창의적 작업 능력…»
GPT-5가 기대치에 못 미치고 벤치마크 점수가 예상보다 낮다는 반응이 많습니다.

특히 샘 알트만의 핵폭탄 제작 드립으로 저평가 분위기에 더욱 불을 붙이는 느낌인데,

Claude와 Gemini를 주력으로 사용하며 이들의 전망을 더 좋게 보는 저의 입장에서도, GPT-5는 시간이 지나면 분명 재평가될 모델이라고 생각합니다. 그 근거는 다음과 같습니다:

1. 현재 AI 모델은 학습 데이터가 방대해지고 모델 크기가 커진 데다 추론 및 검색 기능까지 통합되었음

2. 따라서 데이터가 충분히 존재하는 작업이나 자주 수행하는 작업은 이미 뛰어난 성능을 보임

3. 그러나 가장 큰 문제점은 학습 데이터가 부족한 업무와 해답이 불명확한 업무에서 큰 발전이 없었다는 점

4. AI의 근본적인 논리 전개력과 사고력 향상이 가장 큰 과제였는데, 이 부분에서 GPT-5는 놀라운 향상을 보여줌

5. 글 요약이나 검색 등에서 자잘한 오류가 있을 수 있으나, 똑똑한 사람도 실수를 저지를 수 있듯이 이는 GPT-5가 부족해서가 아니라 LLM 구조상 불가피하게 발생하는 오류임

결론적으로, 어려운 문제 및 실생활에서 해답이 불분명한 과제를 해결하는 데 있어 GPT-5는 굉장히 훌륭한 성능을 보일 것이며, 이는 출시 첫날에 즉시 드러날 부분이 아닙니다.

OpenAI의 미래는 알 수 없지만 약속한 만큼의 성능 향상은 보여준 것으로 보입니다

감사합니다!
6
레딧, AI 모델에서 가장 많이 쓰이는 출처로 부상

2~4위는 Wikipedia, Youtube, Google 등
Forwarded from Decoded Narratives
Bank of America: AI로 인해 美 노동시장에 미칠 충격이 임박한 상황 - 대졸자 실업률이 2023년 12월 4.0%에서 2025년 7월 8.1%로 급등

#INDEX
Decoded Narratives
Bank of America: AI로 인해 美 노동시장에 미칠 충격이 임박한 상황 - 대졸자 실업률이 2023년 12월 4.0%에서 2025년 7월 8.1%로 급등 #INDEX
2021년 빅테크 호황기에 M7 기업들은 채용을 대폭 확대
-> AI 투자 확대 및 인력 대체 증가 & 고급 인력 연봉 증가
-> 3년 전 뽑은 신입들 중 상당수 인력 감축 대상에 포함되어 실직
-> 실직한 고스펙 신입들은 경력직으로 일자리 시장에 다시 진출
-> 대졸 쌩신입들과 경쟁에서 우위
-> 신입 대졸들은 AI로 인한 신입 고용 감소 & 경력자들과의 경쟁 이중고
😱2
https://www.reuters.com/world/china/chinas-july-factory-gate-prices-miss-forecast-deflation-concerns-persist-2025-08-09/

- 중국 7월 PPI –3.6%로 예상(–3.3%) 하회, 2년 가까이 하락 지속

- CPI는 0.0%로 전월(0.1%)보다 둔화됐지만 예상(–0.1%)은 상회.
월간 PPI는 –0.2%로 낙폭 축소, CPI는 0.4% 반등

- 전문가들은 일부 완화 신호에도 과잉공급·부동산 부진·미중 무역 불확실성 등 구조적 리스크로 디플레이션 우려 지속 전망
이제 하버드도 비트코인에 베팅…1600억 쏟아부은 이유

11일 코인텔레크래프는 하버드 매니지먼트 컴퍼니(Harvard Management Company)가 미국증권거래위원회(SEC)에 제출한 보고서를 통해 블랙록 비트코인 ETF 보유 규모가 1억1600만달러(약 1600억원)에 달한다고 보도했다.

하버드 매니지먼트 컴퍼니는 하버드의 기금 운용을 담당하는 곳이다. 지난해 기준 532억달러(약 74조원)가 쌓여 있다. 이 기금은 교직원 인건비, 연구 활동 지원비, 장학금 지급, 주식·부동산 투자 등에 쓰인다. 수익률은 연평균 10% 안팎으로 알려져 있다.

**항상 "비트코인 100달러까지 떨어진다"하던 보수적인 기관에서 결국 비트코인에 자산배분을..

https://n.news.naver.com/mnews/article/009/0005539165
[휴메딕스, 에보브테라퓨틱스 ‘리들부스터’ 독점 판매 계약 체결]

휴온스그룹 휴메딕스는 최근 에보브테라퓨틱스와 '리들부스터 PN/EX(REEDLE BOOSTER PN/EX)'의 국내 독점 판매 계약을 체결했다고 11일 밝혔다.

브이티와 에보브테라퓨틱스가 공동 개발한 리들부스터는 브이티코스메틱의 '리들샷'을 병의원에서 사용할 수 있도록 만든 제품이다. 주사형 스킨부스터 시술 대비 낮은 통증과 회복기간으로 시술 후 빠른 일상회복이 가능하고 즉각적인 피부 활력 개선을 유도할 수 있는 것이 특징이다.


***아시는 분은 많이들 아시겠지만
현대차->NH투자증권 제약/바이오 베스트 애널리스트 출신이십니다 ㄷㄷ

https://www.thebionews.net/news/articleView.html?idxno=17091
[읽을거리: AI 시대의 컨설팅 업체: 맥킨지가 존폐 위기를 해쳐나가는 법]
-WallStreetJournal 칼럼

-AI가 데이터 분석, 인사이트 도출, 프레젠테이션 슬라이드 제작을 분 단위로 처리하면서 전통적 전략자문의 희소성과 가격 프리미엄이 급속히 약화

고객 니즈 변화: “조언”보다 “성과” 요구. 맥킨지는 자문에서 실행 파트너로 전환

현재 컨설팅 업체의 핵심 리스크/위기:
1. 프레젠테이션·지식 전달 중심 서비스의 가격 하락과 차별화 약화
2. AI를 보유한 고객이 리서치를 자체 수행하면서 외부 의존도 감소

3. 세일즈포스 AI 에이전트 등 컨설팅의 핵심 서비스(진단→권고→슬라이드)가 타 업체의 상품화 압력에 직면

조직·운영 변화
-사내 AI 에이전트를 도입해 프레젠테이션 작성, 인터뷰·리서치 요약, 노트 테이킹을 자동화/슬림화.
-경영진은 “AI로 인력 축소를 목표로 하진 않는다”고 하지만 프로젝트당 투입 인원은 줄어 구조적 효율화가 진행 중.

-향후 결과 책임형 계약, 현장 실행력, 독자 데이터·툴·딥리서치, 변화관리·거버넌스·리스크 역량으로의 전환 없이는 대규모 축소 / 수익성 악화가 불가피.

https://www.wsj.com/tech/ai/as-ai-comes-for-consulting-mckinsey-faces-an-existential-shift-4bc0ae67?mod=tech_feat1_ai_pos2