DEEP RESEARCH · NVIDIA/GROQ
엔비디아의 그록 전략적 기술 인수와 AI 추론 시장 재편
200억 달러 규모 계약, LPU의 결정론적 구조, 그리고 2026~2028년 AI 반도체 투자 지형을 정리했다.
0. 결론 먼저
제가 보는 이번 사건의 본질은 엔비디아가 학습 GPU의 독점력을 추론 효율 영역까지 확장하려는 움직임입니다. 그록의 LPU는 초저지연·결정론적 실행이라는 장점을 갖고 있었고, 엔비디아는 이를 흡수해 GPU 생태계의 약점이던 추론 비용과 지연 문제를 보완하려는 것으로 해석됩니다.
- 원문은 2025년 12월 24일 엔비디아와 그록 간 200억 달러, 약 28조 원 규모 전략 계약을 핵심 이벤트로 제시합니다.
- 그록은 구글 TPU 설계자 조나단 로스가 2016년 창업했으며, LPU(Language Processing Unit)를 통해 실시간 추론에 특화된 구조를 제시했습니다.
- 향후 3년 탑픽 관점에서는 엔비디아, 브로드컴, 리벨리온을 각각 통합 플랫폼, 커스텀 ASIC, 독립 추론 칩 대안으로 봅니다.
1. 추론의 시대가 열린 이유
생성형 AI 초기에는 거대 모델 학습을 위한 H100과 Blackwell 같은 GPU 확보가 핵심이었습니다. 하지만 모델이 실제 서비스로 배포되면서 병목은 학습보다 추론 비용, 지연, 전력 효율로 이동했습니다.
해석: 대화형 AI, 에이전틱 AI, 실시간 검색·코딩·고객지원 서비스는 배치 크기가 작고 지연에 민감합니다. 이 구간에서 범용 GPU는 강하지만 항상 가장 효율적인 답은 아닐 수 있습니다.
2. 그록 LPU: 결정론적 실행과 SRAM 중심 설계

그록 LPU는 하드웨어 스케줄러, 캐시 컨트롤러, 분기 예측기 같은 제어 로직을 줄이고, 컴파일러가 칩 내부 데이터 이동과 연산 타이밍을 클럭 사이클 단위로 미리 계획한다는 점이 핵심입니다.
공식 사실: 원문은 그록이 약 230MB SRAM을 칩 내부에 탑재했고, 내부 대역폭이 80TB/s 이상이라고 설명합니다.
해석: SRAM은 빠르지만 용량이 작습니다. 그래서 그록은 단일 칩보다 수백 개 칩을 RealScale 인터커넥트로 연결해 하나의 큰 칩처럼 다루는 랙 스케일 아키텍처로 문제를 풀려 했습니다.
3. GPU vs TPU vs LPU

| 구분 | GPU | TPU | LPU |
|---|---|---|---|
| 철학 | 대규모 병렬 처리, 범용성 | 시스톨릭 어레이, 행렬 연산 특화 | 결정론적 실행, 추론 지연 최소화 |
| 메모리 | HBM, H100 기준 80GB 언급 | HBM + ICI | 칩 내부 SRAM 약 230MB |
| 강점 | CUDA 생태계와 학습 | 구글 내부 학습 가성비와 스케일업 | 초저지연 추론과 예측 가능성 |
| 약점 | Batch Size=1 활용률 30~40% 언급 | 폐쇄적 접근성 | 대용량 모델을 위한 랙 스케일 설계 필요 |
4. 계약의 전략적 의미와 거시 환경
원문은 이 계약을 인수 또는 기술 라이선싱 성격의 전략적 결합으로 설명하며, 엔비디아가 구글 TPU와 독립 추론 칩의 압박에 대응하는 움직임으로 해석합니다. 그록은 2025년 2월 아람코와 파트너십을 맺고 중동에 19,000개 이상의 LPU를 배치하는 약 15억 달러 프로젝트를 수주했다고 정리되어 있습니다.
Genesis Mission
DOE와 OSTP가 주도하는 AI 과학 인프라 프로젝트로, 원문은 그록이 24개 핵심 파트너 중 하나라고 설명합니다.
Project Prometheus
제프 베이조스가 62억 달러를 투자한 물리 AI 프로젝트로, 저지연 칩 수요처가 될 수 있다고 원문은 봅니다.
중동 데이터센터
아람코 파트너십과 19,000개 이상 LPU 배치는 매출 성장의 동력으로 제시됩니다.
5. 2026~2028 탑픽과 리스크
엔비디아
- 그록의 SRAM·컴파일러 역량을 확보하면 학습과 추론을 모두 아우르는 플랫폼이 될 수 있습니다.
- 리스크는 독점 규제와 빅테크 자체 칩 개발입니다.
브로드컴
- 엔비디아 의존을 줄이려는 구글, 메타, 오픈AI 등의 커스텀 칩 수요를 흡수할 수 있는 파트너로 제시됩니다.
리벨리온
- 그록이 엔비디아 진영으로 흡수될 경우 독립 추론 칩 벤더 공백이 생기고, 한국 리벨리온이 그 대안으로 부각될 수 있다는 관점입니다.
- 원문은 삼성 파운드리 4nm/2nm, HBM 결합, 2026년 Rebel-Quad 양산 계획, 사우디 아람코 투자 유치를 언급합니다.
제 결론은 간단합니다. AI 반도체 전쟁의 질문이 “얼마나 큰 칩을 만들 것인가”에서 “얼마나 효율적으로 제어할 것인가”로 바뀌고 있습니다. 그래서 앞으로는 CUDA 생태계뿐 아니라 컴파일러, 메모리 계층, 랙 스케일 연결 구조를 함께 봐야 합니다.
출처
- 자료 1: https://m.blog.naver.com/PostView.naver?blogId=star_of_self&logNo=224123717510
- 자료 2: https://techstrong.ai/articles/nvidia-strikes-20-billion-licensing-deal-for-groq-ai-technology/
- 자료 3: https://www.varindia.com/news/nvidia-20b-groq-deal-signals-new-phase-of-ai-chip-consolidation
- 자료 4: https://www.webpronews.com/the-deterministic-bet-how-groqs-lpu-is-rewriting-the-rules-of-ai-inference-speed/
- 자료 5: https://medium.com/the-low-end-disruptor/groqs-deterministic-architecture-is-rewriting-the-physics-of-ai-inference-bb132675dce4
- 자료 6: https://www.youtube.com/watch?v=xBMRL_7msjY
- 자료 7: https://www.weforum.org/people/jonathan-ross/
- 자료 8: https://www.reddit.com/r/NVDA_Stock/comments/1apeo2w/deeper_dive_into_interview_with_jonathan_ross_ceo/
- 자료 9: https://medium.com/@salihturkoglu/processing-units-is-all-you-need-e0dcd58e78cf
- 자료 10: https://drive.google.com/open?id=13Uw85NwEXsVowA7EM3_1xhVbTTAGzWY9
- 자료 11: https://www.reddit.com/r/deeplearning/comments/1dhy93q/why_are_gpus_more_preferable_than_tpus_for_dl/
- 자료 12: https://blog.startupstash.com/groq-vs-nvidia-the-real-world-strategy-behind-beating-a-2-trillion-giant-58099cafb602
- 자료 13: https://www.investing.com/news/stock-market-news/nvidia-to-acquire-groq-for-20-billion-in-its-largest-deal-ever-cnbc-reports-4422745
- 자료 14: https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-buys-ai-chip-startup-groqs-assets-for-usd20-billion-in-the-companys-biggest-deal-ever-transaction-includes-acquihires-of-key-groq-employees-including-ceo
- 자료 15: https://groq.com/newsroom/groq-and-nvidia-enter-non-exclusive-inference-technology-licensing-agreement-to-accelerate-ai-inference-at-global-scale
- 자료 16: https://www.streetinsider.com/Investing/Breaking+down+Nvidia%E2%80%99s+unusual+%2420+billion+deal+with+Groq/25779684.html
- 자료 17: https://the-decoder.com/nvidias-20-billion-groq-deal-is-really-about-blocking-googles-tpu-momentum/
- 자료 18: https://www.thestreet.com/investing/nvidia-makes-its-biggest-purchase-ever
- 자료 19: https://www.reddit.com/r/LocalLLaMA/comments/1puyq9r/exclusive_nvidia_buying_ai_chip_startup_groqs/
- 자료 20: https://sacra.com/c/groq/
- 자료 21: https://www.pminsights.com/companies/groq
- 자료 22: https://medium.com/tdk-ventures/an-insider-investor-view-on-groq-d9bbd6c1a291
- 자료 23: https://www.reddit.com/r/mlscaling/comments/1el4knb/groq_2023_sales_as_low_as_34_million_and_a_net/
- 자료 24: https://tracxn.com/d/companies/groq/__pMJjkNzO3GELYaHvYyAD0pQB4BYTFTHh4Klu4dAJvoU/funding-and-investors
- 자료 25: https://www.energy.gov/genesis-mission
- 자료 26: https://www.hpcwire.com/2025/12/01/genesis-mission-americas-strategic-shift-in-ai-for-science/
- 자료 27: https://www.energy.gov/articles/energy-department-announces-collaboration-agreements-24-organizations-advance-genesis
- 자료 28: https://groq.com/newsroom/groq-partners-with-us-department-of-energy-to-advance-ai-inference-and-next-generation-computing-infrastructure
- 자료 29: https://timesofindia.indiatimes.com/technology/tech-news/jeff-bezos-to-lead-6-2-billion-ai-startup-project-prometheus-understanding-the-project-and-could-this-outpace-chatgpt/articleshow/125409255.cms
- 자료 30: https://www.vktr.com/ai-market/inside-project-prometheus/
- 자료 31: https://www.nasdaq.com/articles/prediction-these-3-artificial-intelligence-ai-stocks-will-be-big-winners-again-2026
- 자료 32: https://www.investopedia.com/ai-stocks-could-stay-the-place-to-be-next-year-here-are-two-banks-top-chip-picks-11873732
- 자료 33: https://www.investing.com/analysis/amd-vs-nvidia-vs-broadcom-3-very-different-ai-plays-200671935
- 자료 34: https://koreatechdesk.com/rebellions-arm-first-asia-investment-korea-ai-chips-global
- 자료 35: https://www.siliconrepublic.com/start-ups/rebellions-raises-250m-arm-samsung-ai-chip-inference
- 자료 36: https://www.fwdstart.me/p/rebellions-raises-250m-at-1-4b-valuation-expands-ai-chip-push-into-saudi-arabia