1. 엔비디아 루빈 SOCAMM 용량 축소
• 핵심원문
“NVDA는 Rubin NVL72의 랙당 SOCAMM DRAM 용량을 약 55TB에서 약 28TB로 축소하고 있으며, 대부분의 Rubin 시스템이 192GB 모듈 대신 96GB SOCAMM을 사용할 것으로 예상된다. 이 변경으로 추정 랙 비용은 760만 달러에서 680만 달러로 낮아지고, 총소유비용(TCO)은 GPU당 시간당 4.16달러에서 3.90달러로 감소한다.”
“엔비디아는 최근 SOCAMM2 모듈 물량 비율을 변경하며, 전체 주문량을 오히려 증가시킴 — 192GB 모듈이 반절로 주는 대신, 96GB 모듈은 오히려 6배에 가깝게 증가하며 주력 제품으로 변경함 (64GB 모듈은 50% 증가). 이로 인해 총 SOCAMM2 LPDDR 수요량은 기존 전망 대비 10~20% 증가하게 됨”
“2026년 SoCAMM2로 공급 가능한 물량은 DRAM 3사 전체 약 300억 Gb으로 이미 정해져 있음. 1c nm Capa 확장 한계로 추가 물량 증가 사실상 불가능”
“Vera Rubin향 SO-CAMM 탑재량은 기존 1,536억 GB (192GB x 8)에서 768억 GB (96GB x 8)로 하향된 것으로 추정됩니다. 한국 메모리반도체의 LPDDR5x 단품 및 SO-CAMM 합산 공급량은 2026년 180억 Gb에서 2027년 290억 Gb로 성장할 것으로 전망합니다.”
“SemiAnalysis에 따르면 2026년 1분기 기준 SOCAMM 계약 가격은 GB당 약 8달러 수준까지 상승”
• 기대효과
이번 이슈는 SemiAnalysis가 6월 3일자 기관용 유료 레터에서 다룬 내용으로 왜곡 확산되었다. “SOCAMM 용량 반토막”을 구실로 삼성전자·SK하이닉스·마이크론 등 메모리 관련주가 급락했으나, 이는 반대로 해석할 수 있다.
사양 변경의 배경은 수요 약화가 아닌 LPDDR 공급 부족이다. 엔비디아는 Rubin NVL72(루빈 GPU 72개 + 베라 CPU 36개로 구성)에서 CPU 측 메모리인 SOCAMM의 모듈당 용량을 192GB에서 96GB로 낮췄다. 핵심은 AI 성능을 직접 결정하는 HBM4(GPU당 288GB, 8-Stack 구조)에는 아무런 변화가 없다는 점이다. SOCAMM은 Vera CPU의 데이터 버퍼링과 시스템 메모리를 담당하는 보조 메모리(LPDDR5X 기반)로, 기능적 위계가 HBM4와 다르다.
용량 축소의 실질적 목적은 TCO 인하를 통한 루빈 랙 보급 속도 확대다. 랙 비용이 760만 달러에서 680만 달러로 낮아지고, TCO가 GPU 시간당 4.16달러에서 3.90달러로 줄어들면서 수천 랙 규모의 데이터센터를 운영하는 하이퍼스케일러 입장에서는 수억 달러 규모의 비용 절감이 가능해진다. 이는 수요 둔화가 아니라 제한된 공급 내에서 시스템 보급을 극대화하려는 엔비디아의 전략적 설계 변경이다.
총 비트(Bit) 수요 측면에서도 실질적 훼손은 없다. 2026년 SOCAMM2 공급 가능 물량은 DRAM 3사 합산 약 300억 Gb으로 이미 확정돼 있으며 1c nm Capa 확장 한계로 추가 증량이 사실상 불가능한 상황이다. 즉 엔비디아는 이 고정된 풀 안에서 NVL72와 Vera CPU Rack 양쪽에 물량을 배분해야 하기 때문에, 모듈당 용량을 낮춰 더 많은 셋(Set) 출하를 가능하게 한 것이다. 이 결과 96GB 모듈 주문이 6배 가까이 급증했고, 총 SOCAMM2 LPDDR 수요량은 기존 전망 대비 오히려 10~20% 증가했다. (한국투자증권, 메리츠증권)
SOCAMM 계약 가격이 2026년 1분기 기준 GB당 약 8달러까지 상승했다는 사실은 LPDDR5X 시장의 극단적 공급 부족을 단적으로 보여준다. 한국 메모리 업체들의 LPDDR5x 단품·SO-CAMM 합산 공급량이 2026년 180억 Gb에서 2027년 290억 Gb로 성장할 것으로 전망하며, 대당 탑재량이 줄었음에도 TAM이 변하지 않았다는 것은 시장 예상보다 더 많은 GPU 출하가 이뤄질 가능성을 시사한다고 분석했다. 또한 2026~2027년 메모리 업사이드는 Q(물량)가 아닌 P(가격)의 상승이며, SOCAMM2 채용 확대로 LPDDR5 ASP 상승이 하반기에도 지속될 것으로 전망한다. SOCAMM2는 서버향 응용처이므로 모바일향 LPDDR5X보다 높은 가격이 형성되기 때문이다. (대신증권, 한국투자증권)
참고로, NVDA도 SOCAMM의 TAM이 3,000억 달러라고 밝힌 바 있어, 이번 이슈는 생태계 훼손이 아닌 시장 개화 초입의 수급 조정으로 해석하는 것이 합리적이다.
2. JP Morgan, 수년간의 비관론 접고 테슬라 투자의견 상향
• 핵심원문
“테슬라가 피지컬 AI 사업을 준비하며 시장을 확대하고 있다. 테슬라는 피지컬 AI 하드웨어와 소프트웨어 양쪽을 모두 보유하고 있는 기업으로 수직적 통합이 이루어져 있기 때문에, 피지컬 AI 사업을 대규모로 확대하기 유리하다”
“이러한 피지컬 AI 규모 확대에 유리하다는 강점은 시장에서 저평가되고 있다. 특히 전기차 및 배터리 생산라인은 추후 휴머노이드 로봇인 Optimus에도 적용될 수 있다”
“당사는 Optimus의 2040년 총유효시장(TAM)이 미국에 500만 대, 글로벌 3,000만 대에 달할 것으로 보고 있다”
“휴머노이드 로봇과 AI 기반 자동화 사업이 향후 10년간 테슬라의 새로운 성장 동력이 될 수 있다고 판단, 기존 자동차 제조업체가 아닌 기술 플랫폼 기업 관점에서 테슬라를 평가하기 시작했다”
• 기대효과
JP Morgan은 이번 보고서를 통해 테슬라에 대한 투자의견을 기존 ‘비중축소’에서 ‘중립’으로 상향 조정하고 목표주가도 145달러에서 475달러로 대폭 상향했다. 담당 애널리스트 Rajat Gupta는 지난달 테슬라 커버리지를 새로 맡은 인물로, 이번 상향은 JP Morgan이 수년간 유지해온 테슬라 비관론을 공식 철회하고 가치평가 프레임 자체를 전환했다는 점에서 상징적이다.
변화의 핵심은 테슬라를 전통 자동차 기업이 아닌 피지컬 AI 플랫폼 기업으로 재정의한 것이다. JP Morgan은 테슬라의 하드웨어·소프트웨어 수직 통합이 경쟁사 대비 독보적인 출발점 우위를 제공하며, 이 점이 시장에서 여전히 저평가되고 있다고 지적했다. 특히 기존 전기차·배터리 생산라인이 휴머노이드 로봇 Optimus의 제조 비용 절감과 기업 고객 검증에 직접 활용될 수 있다는 점, 그리고 방대한 주행 데이터가 로보택시와 Optimus 개발 모두에 공유되는 플라이휠 효과를 핵심 경쟁 해자로 꼽았다.
수익 전망 면에서 JP Morgan은 테슬라 EPS가 2028년 이후 변곡점을 맞아 2026년 약 1.95달러에서 2030년 약 7.50달러로 약 3배 성장할 것으로 예상했다. 매출 역시 2025년 약 950억 달러에서 2030년 약 2,030억 달러로 두 배 이상 확대되며, 그 성장의 절반 가까이가 자율주행·로보틱스 관련 서비스와 신규 사업에서 나올 것으로 전망했다.
시장 규모 관점에서 JP Morgan은 테슬라를 ① 자동차, ② 에너지 저장, ③ 로보택시, ④ 휴머노이드 로봇, ⑤ 인프라 라이선싱의 5개 상호 연결 시장에 걸쳐 평가하며, 2035년 합산 잠재 TAM을 약 3.9조 달러로 제시했다. Optimus만 놓고 보면 2040년 기준 미국 500만 대, 글로벌 3,000만 대 시장이 형성될 것으로 봤다. 다만 규제 승인, 안전 검증, 신기술 양산 확장 등 실행 리스크가 여전히 높다는 점도 함께 경고했다.
JP Morgan과 같은 월가 대형 IB가 비관론을 공식 철회하고 피지컬 AI 프레임으로 테슬라를 재평가했다는 사실은, 테슬라를 둘러싼 시장의 내러티브가 전기차 판매 실적 중심에서 AI·로보틱스 플랫폼 가치 중심으로 본격 전환되고 있음을 보여준다.
3. 앤스로픽, “AI가 AI를 만드는 시대 예상보다 빠르다”
• 핵심원문
“앤스로픽 코드베이스에 병합되는 코드의 80% 이상을 Claude가 작성. 많은 연구자들은 이미 수개월째 직접 코드를 작성하지 않고 Claude를 활용해 업무 수행”
“엔지니어 1인당 코드 생산성은 ’24년 대비 약 8배 증가. ’21~25년 평균 대비 분기당 코드 배포량 8배 확대”
“가장 개방적이고 어려운 엔지니어링 과제 성공률은 6개월 만에 약 26%에서 76%까지 상승. 연구 방향 선택에서도 인간보다 더 나은 판단을 내리는 비율이 64%까지 증가”
“연구 최적화 실험에서 Mythos Preview는 약 52배 성능 향상 기록. AI 안정성 연구에서는 인간 연구자(23%) 대비 97% 수준 성과 달성”
“AI가 독립적으로 수행 가능한 작업 길이는 과거 7개월마다 2배에서 현재 약 4개월마다 2배로 가속”
• 기대효과
앤스로픽 산하 연구기관 Anthropic Institute는 2026년 6월 4일 “AI가 자기 자신을 만들 때(When AI builds itself)”라는 제목의 보고서를 공개했다. 보고서의 핵심 메시지는 AI가 AI 개발을 스스로 가속하는 ‘재귀적 자기개선(Recursive Self-Improvement, RSI)’ 사이클이 대부분의 기관이 예상한 것보다 빠르게 현실화되고 있다는 경고다.
수치가 이를 뒷받침한다. 2025년 2월 Claude Code 도입 이전 앤스로픽 코드베이스에서 Claude 작성 코드 비중은 한 자릿수 초반이었으나, 2026년 5월 기준 80% 이상으로 급등했다. 코드 품질도 2025년 말 인간보다 다소 낮은 수준에서 현재 동등 수준에 도달했으며, 1년 내 인간을 추월할 것으로 앤스로픽은 전망한다. 코드 작성을 넘어 연구 판단력 영역에서도 진전이 빠르다. Mythos Preview는 연구자가 잘못된 방향으로 접어들기 직전 시점에서 더 나은 다음 단계를 선택하는 비율이 64%로, 2025년 11월 Opus 4.5의 51%에서 크게 상승했다.
이번 보고서의 의미는 단순한 성능 발표를 넘어, AI 산업의 경쟁 단위 자체가 바뀌고 있다는 선언에 있다. 앤스로픽은 AI 업계의 다음 경쟁이 ‘더 좋은 모델’이 아니라 ‘AI가 AI 개발을 얼마나 빠르게 가속할 수 있는가’로 이동하고 있다고 명시했다. 이미 코드 작성보다 인간의 코드 리뷰와 연구 방향 결정이 새로운 병목이 된 상황이며, AI가 AI 개발을 가속하는 피드백 루프가 시작됐음을 사실상 공식화한 것이다.
앤스로픽은 향후 시나리오를 세 가지로 제시했다. 가장 가능성이 낮은 ① 발전 둔화(S-Curve), 가장 가능성이 높은 ② 인간이 방향을 설정하고 AI가 대부분의 연구개발을 실행하는 구도, 그리고 ③ AI가 자신의 후속 모델을 설계·개선·개발하는 재귀적 자기개선(RSI)이다. 앤스로픽은 RSI 시나리오에서 발전 속도가 인간 연구 인력이 아닌 컴퓨트와 알고리즘 개선 속도에 의해 결정된다고 명시했으며, 이 경우 정렬(alignment) 문제가 가장 큰 불확실성이라고 경고했다.
투자 관점에서 시사점은 명확하다. RSI 사이클이 가속될수록 AI 모델 개발 속도가 컴퓨트 투입량에 직결되며, 이는 GPU·HBM 등 AI 인프라 수요의 구조적 확대를 의미한다. 앤스로픽은 충분한 글로벌 검증 체계가 마련될 경우 프론티어 AI 개발 감속 또는 일시 중단도 선택지로 검토해야 한다고 주장했으나, 현실적으로 단일 기업의 감속은 선두 교체만 초래할 뿐이라고 스스로 인정하고 있어, 업계 전반의 AI 인프라 투자 경쟁은 오히려 더 강화될 가능성이 높다.
4. AI 에이전트 토큰 비용, “huge issue”로 부상
• 핵심원문
“OpenAI CEO Sam Altman은 2026년 초만 해도 AI 비용 문제가 주요 논의 대상이 아니었지만, 최근 갑자기 ‘huge issue’가 됐다고 말함.”
“우버: 5,000명의 엔지니어에게 클로드 코드를 도입한 지 단 4개월 만에 1년 치 AI 예산 전체를 전액 탕진 (인당 월 $500~$2,000 지출).”
“컨텍스트 재전송 낭비: 청구 비용의 62%는 실제 작업이 아니라, 에이전트가 호출될 때마다 기존 코드 맥락(Context)을 반복해서 전송하는 데 낭비됨.”
“깃허브 코파일럿 (6월 1일): 정액제 기반에서 조직 전체 크레딧 풀을 둔 ‘토큰당 사용량 요금제(UBB)’로 변경. 헤비 유저의 비용 추적 가시화.”
“새로운 시장의 탄생: AI 에이전트의 비용을 측정, 예측, 최적화(감소)해주는 ‘비용 통제(Cost Discipline / FinOps) 솔루션’ 계층이 가장 시급하고 가치 있는 AI 인프라 비즈니스로 급부상함.”
• 기대효과
2026년 상반기를 기점으로 AI 에이전트 비용 구조가 근본적으로 바뀌고 있다. Sam Altman이 AI 토큰 비용을 “huge issue”로 공식 인정한 것은 AI 업계가 ‘보급 확산’ 국면에서 ‘비용 통제’ 국면으로 전환되고 있음을 보여주는 상징적 신호다. AI 에이전트 비용이 ‘무제한·정액제(보조금 지급형)’에서 ‘실제 사용량(토큰 단위) 기반’으로 급격히 전환되고 있으며, 그 충격은 이미 구체적인 수치로 나타나고 있다.
기업 현장의 비용 충격 사례가 잇따르고 있다. 마이크로소프트는 사내에서 인기를 끌던 클로드 코드 라이선스를 2026 회계연도 말(6월 30일)에 맞춰 전격 취소하고 자사 제품인 깃허브 코파일럿으로 강제 전환했으며, 우버는 5,000명의 엔지니어에게 클로드 코드를 도입한 지 단 4개월 만에 1년치 AI 예산 전체를 탕진(인당 월 $500~$2,000)했다. 익명의 헬스케어 기업은 6개월간 무의식적으로 1조 개의 토큰을 소비하며 600만 달러의 예정에 없던 지출이 발생했다.
비용 폭탄의 구조적 원인도 분석됐다. 리놉스텍 감사 결과에 따르면 같은 도구를 써도 사용 습관에 따라 인당 토큰 소비량이 최대 20배 차이가 나며, 특히 청구 비용의 62%는 실제 작업이 아닌 에이전트 호출 시마다 기존 코드 맥락을 반복 전송하는 데 낭비되는 구조적 비효율에서 발생한다.
업계의 요금제 전환도 빠르게 진행되고 있다. 깃허브 코파일럿은 6월 1일부터 정액제를 토큰당 사용량 요금제(UBB)로 전환했고, 앤스로픽은 6월 15일부터 구독 요금제 내 프로그래밍 방식 사용 시 크레딧 제한을 도입한다. 요금제 전환은 AI 도구의 실사용 비용이 가시화된다는 의미로, 기업들은 더 이상 AI 도입 비용을 막연한 IT 예산으로 처리할 수 없게 됐다. 딜로이트가 CFO를 위한 ‘토큰 경제학 가이드’를 발간할 만큼 AI 비용 관리는 테크 부서를 넘어 재무·경영진의 핵심 과제로 부상하고 있다.
이 국면이 만들어내는 새로운 시장이 주목된다. AI 에이전트의 비용을 측정·예측·최적화하는 ‘FinOps 솔루션’ 계층이 AI 인프라 내에서 가장 시급하고 가치 있는 신규 비즈니스로 부상하고 있으며, Reuters는 이용자 수보다 토큰 사용량이 AI 업계의 실제 사용 규모와 매출을 보여주는 핵심 지표로 자리잡고 있다고 분석했다.
5. 삼성·SK하이닉스·마이크론 3사, 엔비디아 HBM4 퀄 전원 통과
• 핵심원문
“세 개 공급업체 모두 인증을 완료했고 모두 양산에 들어갔다”
“베라 루빈 플랫폼 공급을 지원하기 위해 경쟁하고 있다”
“고속 메모리를 매우 많이 사용하게 될 것이며, 현재 메모리 공급은 제약이 있는 상황이어서 공급을 최대한 확보하는 동시에 이를 효율적으로 활용할 수 있도록 한국 파트너들과 협력하고 있다”
“올해 하반기는 상반기보다 훨씬 더 큰 규모가 될 것이고 내년은 더욱 커질 것”
• 기대효과
젠슨 황 엔비디아 CEO가 6월 5일 방한 당일 입국 직후 취재진과의 만남에서 삼성전자·SK하이닉스·마이크론 메모리 3사 전원이 HBM4 퀄테스트 인증을 완료하고 양산에 들어갔음을 공식 확인했다. 이는 HBM3E 세대에서 SK하이닉스가 사실상 독점에 가까운 공급 구조를 유지하던 것과 달리, HBM4 세대부터는 3사 모두가 베라 루빈 공급망에 진입해 본격적인 경쟁 구도가 형성됐음을 의미한다.
HBM4는 엔비디아가 올해 하반기 출시하는 차세대 AI 가속기 베라 루빈에 탑재되는 6세대 고대역폭메모리다. 검색 결과에 따르면 삼성전자는 세계 최초로 2월부터 HBM4 양산 출하를 시작했고 6월부터 베라 루빈용 공급에 들어가며, SK하이닉스는 루빈 초기 물량의 약 70%를 차지하고 있는 것으로 UBS가 추산했다. 마이크론은 2분기부터 합류한다.
3사 동시 진입의 핵심 시사점은 HBM 공급 경쟁 구도의 재편이다. HBM3E 세대에서 SK하이닉스(64%)·마이크론(21%)·삼성전자(15%)로 형성된 점유율 구도가, HBM4 세대에서는 삼성전자의 본격 반등과 함께 재편될 가능성이 높아졌다. 젠슨 황이 공급 경쟁을 명시적으로 인정한 것 자체가 엔비디아가 특정 공급사 의존을 줄이고 공급망 다변화를 추진하고 있음을 시사한다.
수급 측면에서는 여전히 공급 제약이 핵심 변수다. 젠슨 황은 “현재 메모리 공급은 제약이 있는 상황”이라고 직접 언급했으며, SK하이닉스는 투자자들과의 미팅에서 HBM의 높은 가격 수준이 내년까지 유지될 것으로 예상하고 HBM 시장의 공급 부족이 2027년까지 이어질 가능성이 있다고 전망했다. 3사가 모두 양산에 돌입했음에도 공급 부족이 지속된다는 것은 AI 가속기 수요 자체가 그만큼 폭발적으로 증가하고 있다는 방증이며, 이는 HBM ASP 상승 기조가 유지될 수 있는 구조적 근거가 된다.
6. 딥시크, 미국 기업 지출 지수 6월 1위 — 오픈AI·앤스로픽 제치고 급부상
• 핵심원문
“중국 인공지능 스타트업 딥시크가 6월 주요 미국 기업 지출 지수에서 1위를 차지했습니다. 기업들이 OpenAI와 Anthropic의 대안을 찾고 있기 때문입니다.”
“미국 기업들은 딥시크에 직접 결제하고 있었으며, 이는 이들이 딥시크의 오픈소스 모델을 자체 내부 서버에 호스팅하는 대신 딥시크를 통해 직접 데이터를 주고받고 있었음을 시사합니다.”
“딥시크의 도입은 오픈소스 모델로의 더 광범위한 이동 흐름의 일부입니다. Fireworks AI와 Fal AI 같은 플랫폼도 6월의 주목받는 벤더 목록에 포함됐으며, 오픈소스 모델의 성능이 프리미엄 독점 모델에 비해 훨씬 낮은 비용으로 경쟁력을 갖추고 있기 때문입니다.”
“가격 75% 인하 후 가성비 최고 평가…텐센트·CATL 등 74억 달러 투자”
• 기대효과
뉴욕 기반 기업 지출 플랫폼 Ramp가 5만 개 이상의 미국 기업 결제 데이터를 추적해 산출하는 ‘트렌딩 소프트웨어 벤더’ 지수에서 딥시크가 6월 1위를 차지했다. 이 지수는 기업이 특정 소프트웨어 벤더에 처음으로 결제를 시작하는 시점을 추적한다. 딥시크의 1위 등극은 기업들이 고가의 오픈AI·앤스로픽 모델의 대안을 적극적으로 탐색하고 있다는 가장 강력한 시장 신호로 해석된다.
이번 부상의 직접적 배경은 가격 경쟁력이다. 딥시크는 V4 Pro 모델 API 가격을 75% 인하하고 이를 영구 정책으로 확정했다. 새로운 가격은 출력 토큰 기준 100만 토큰당 0.87달러로, 이는 Claude Opus 4.7의 100만 토큰당 25달러, GPT-5.5의 30달러와 비교해 최대 34배 저렴한 수준이다. 벤치마크 기관 Artificial Analysis는 가격 인하 이후 딥시크 V4 Pro를 달러당 지능(intelligence-per-dollar) 기준 세계 최고 수준으로 평가했으며, 법률 AI 벤치마크에서 GPT-5.5 바로 아래 성능을 기록해 전문 업무 적용 가능성이 검증됐다.
특히 주목할 점은 미국 기업들이 딥시크의 오픈소스 모델을 자체 서버에 호스팅하는 대신 딥시크 서버에 직접 기업 데이터를 전송하고 있다는 사실이다. Ramp 이코노믹스랩 수석 이코노미스트 Ara Kharazian은 이를 “기업들이 중국 모델을 사용하면서 미국 데이터를 중국 서버로 주고받을 의사가 있다는 가장 강력한 신호”라고 평가했다. 이는 단순한 비용 절감을 넘어 데이터 주권과 지정학적 리스크를 감수하면서까지 비용 압박을 해소하려는 기업들의 절박함을 드러낸다.
경쟁 구도 측면에서 이번 사태가 구조적으로 중요한 이유는 타이밍이다. 앤스로픽은 6월 1일 약 9,650억 달러 기업가치로 IPO를 비공개 신청했고, 오픈AI는 3월 8,520억 달러 기업가치로 1,220억 달러 투자를 유치했다. 이 밸류에이션 수준에서는 두 회사 모두 딥시크와 가격 경쟁을 벌이는 것이 구조적으로 불가능하다. IPO를 준비 중인 AI 유니콘들이 고밸류에이션의 압력으로 프리미엄 가격 정책을 유지해야 하는 바로 그 시점에, 딥시크가 가격을 영구 인하하며 시장 기준점 자체를 바꿔버린 것이다.
딥시크는 이와 동시에 텐센트·CATL 등으로부터 약 50억 위안(약 74억 달러) 규모의 첫 외부 투자 유치를 진행 중이며, 중국 국가 AI 산업 투자 펀드도 참여해 사실상 국가적 지원을 받는 구조가 형성되고 있다. 딥시크의 부상은 단순한 저가 경쟁사의 등장이 아니라, 오픈소스 모델 + 국가 자본 + 구조적 가격 우위라는 삼중 조합이 글로벌 AI 모델 시장의 경쟁 해자를 위협하기 시작했음을 보여준다.
잘 읽었습니다. 감사합니다.