Anthropic이 확보한 것: Colossus 2가 아닌 Colossus 1
2026년 5월 6~7일 발표된 Anthropic–xAI 컴퓨트 파트너십은 Anthropic에 테네시주 멤피스의 Colossus 1 슈퍼컴퓨터 클러스터에 대한 독점 접근권을 부여한다 — 초기 보도 대부분이 xAI의 더 넓은 인프라 전체와 혼동한 특정 자산이다. xAI는 자체 Grok 모델 학습 및 추론을 위해 신형 Colossus 2 시설을 보유하며, Anthropic은 Colossus 1 전체를 임대했다 — 대략 NVIDIA H100 15만 개, H200 5만 개, GB200 Blackwell 가속기 3만 개로, 300MW 이상의 전력 용량을 갖춘 총 22만 개 이상의 GPU다. Colossus 1/Colossus 2 구분은 대부분의 보도에서 빠져 있지만, Anthropic이 실제로 통제하는 규모와 xAI 운영 스택 안에 남아 있는 것을 정확히 파악하는 데 중요하다.
핵심 요약: Anthropic은 xAI의 Colossus 1 클러스터 전체를 임대했다 — 멤피스에 위치한 22만 개 이상의 NVIDIA GPU(H100, H200, GB200 Blackwell)와 300MW 이상의 전력 용량을 2029년 5월까지 월 12.5억 달러에 사용한다. xAI는 Colossus 2를 보유한다. 양측 모두 90일 사전 통보로 계약을 해지할 수 있으며, 머스크는 공개적으로 단독 회수 조건을 명시했다.
xAI의 Colossus 2 구축 사양은 공개적으로 밝혀지지 않았으며, xAI는 제3자에 임대할 계획이 있다는 어떠한 신호도 주지 않고 있다. Anthropic이 통제하는 것은 동일한 멤피스 데이터센터 내에 3세대 GPU가 함께 위치한 단일 시설 클러스터다. GPU 구성은 워크로드 할당에서 중요하다: H100과 H200이 기존 Claude 추론 워크로드의 대부분을 담당하고, GB200 Blackwell 3만 개는 와트당 처리량과 더 큰 모델 컨텍스트 윈도우에 최적화된 최첨단 컴퓨트 계층을 나타낸다.
Colossus 1은 원래 xAI가 멤피스에서 122일 이내에 구축·가동했다 — 2024년 업계 주목을 받은 착공-가동 일정으로, 전통적인 하이퍼스케일 일정 밖에서 대규모 GPU 인프라를 얼마나 빠르게 세울 수 있는지의 기준점이 됐다. 이 속도 우선 접근 방식은 아래 멤피스 섹션에서 다루는 환경 규정 준수 이력을 형성했다 — 122일 완공을 이끈 긴박감이 규제 절차보다 속도를 우선하는 허가 태도를 낳은 것이다.
| 가속기 모델 | 대략적 수량 | 아키텍처 | 메모리 구성 |
|---|---|---|---|
| NVIDIA H100 SXM5 | ~150,000 | Hopper | HBM2e / HBM3 (80 GB) |
| NVIDIA H200 SXM5 | ~50,000 | Hopper (HBM3e variant) | HBM3e (141 GB) |
| NVIDIA GB200 | ~30,000 | Blackwell | HBM3e (next-gen, higher BW) |
| 합계 | >220,000 | — | — |
출처: Tom's Hardware, Latent Space
계약 조건: 월 12.5억 달러, 초기 할인 구간, 그리고 90일 해지 옵션

Anthropic–xAI 협정의 재무 조건은 AI 기업 간 컴퓨트 임대 계약치고는 이례적으로 구체적이다. 2026년 5월 20일 TechCrunch 보도에 따르면, Anthropic은 Colossus 1 독점 사용에 대해 월 12.5억 달러를 xAI에 지급하며, xAI가 인프라 램프업을 완료하는 처음 두 달 동안은 할인된 요율이 적용된다. 할인 구간은 계약 체결 당시 Colossus 1이 Anthropic의 추론 워크로드에 완전히 최적화되어 있지 않았음을 반영한다; 랙 구성, 네트워킹, 소프트웨어 스택이 정상 요금 청구에 적합한 수준이 되기까지 몇 주간의 튜닝이 필요했다. 계약은 2029년 5월까지 유효하다.
정상 요율 기준으로 협정의 연간 가치는 약 50억 달러이며, 전체 기간의 누적 계약 금액은 400억 달러 이상으로 — AI 역사상 가장 큰 공개 컴퓨트 계약 중 하나다.
"[The] Anthropic/xAI compute deal is ~$5B/year annualized, and up to ~$40B+ over the full term through May 2029 with discounted rates in months 1–2." — Latent Space AI News, 2026년 5월
90일 해지 조항은 Claude를 프로덕션 의존성으로 취급하는 모든 이에게 운영상 가장 중요한 조건이다. 양측 모두 90일 사전 통보로 계약을 해지할 수 있다 — 즉 Anthropic은 대략 한 분기 남짓한 여유를 두고 대안적 용량을 급하게 확보해야 할 수 있고, xAI는 마찬가지로 짧은 기간 내에 월 12.5억 달러 이상의 수익을 회수할 수 있다. 이는 몇 달간의 단계적 축소와 마이그레이션 기간이 내포된 전형적인 클라우드 제공업체 SLA가 아니다. 이는 계약 기간 내내 양측을 지속적인 협상 태세에 놓이게 하는 쌍방 탈출구이며, 다년간 하이퍼스케일 계약이 통상적으로 제공하는 운영 확실성을 어느 쪽에도 부여하지 않는다.
Claude 추론은 5월 6~7일 발표 며칠 내에 Colossus 1 하드웨어에 배포됐으며, 이는 Anthropic이 배포를 사전에 준비하고 공개 직후 거의 즉시 프로덕션 트래픽을 라우팅할 준비가 되어 있었음을 나타낸다. 프로덕션 배포의 속도는 이것이 미래를 위한 용량 옵션이 아니었음을 시사한다 — 이미 실제 수요 압력을 받고 있던 방출 밸브였던 것이다.
Anthropic이 외부 컴퓨팅을 필요로 한 이유
2026년 초 Anthropic의 컴퓨팅 부족은 어떤 현실적인 내부 조달 일정도 따라잡을 수 없을 만큼 빠른 수요 성장의 직접적인 결과였습니다. 회사의 ARR은 전년 대비 약 80배 — 연율로 환산하면 약 8,000% 성장 — 에 달하는 속도로 증가했고, 이런 속도 앞에서는 자금력이 충분한 GPU 조달 파이프라인조차 12~18개월씩 뒤처질 수밖에 없습니다. 규모가 아무리 크더라도 단일 장기 인프라 계약 하나로는, 몇 달이 아닌 몇 주 만에 형성되는 수요 급등을 해결할 수 없습니다.
직접적인 원인은 Claude Code였습니다. 특히 지속적으로 무거운 추론 부하를 유발하는 에이전틱·장문 컨텍스트 코딩 작업에서 개발자들 사이의 빠른 채택이 급속히 확산되면서, Anthropic의 기존 계약 용량으로는 감당하기 어려운 GPU 부족이 발생했습니다. 에이전틱 사용 사례는 설비 계획 측면에서 일반 대화형 채팅과 본질적으로 다릅니다. 단일 사용자 세션이 분당 여러 번 모델 호출을 하며 몇 시간씩 추론을 지속할 수 있어, 일반 사용자의 하루치 수요를 활발한 개발 작업 한 오후로 압축시킵니다. 이런 세션이 동시에 대거 실행되면, 필요한 GPU 여유 용량은 Anthropic의 기존 설비 계획이 최적화해온 인터랙티브 사용 모델에 비해 비선형적으로 증가합니다.
Anthropic에는 상당한 규모의 장기 컴퓨팅 계약이 이미 존재합니다. Amazon과의 최대 5 GW 파트너십이 진행 중이며, 2026년 말까지 약 1 GW가 가동될 예정입니다. Google 및 Broadcom과의 별도 5 GW 계약은 2027년부터 가동에 들어갈 예정입니다. Microsoft·NVIDIA와의 300억 달러 Azure 용량 파트너십, 그리고 Fluidstack과의 500억 달러 구축 계획은 더 먼 미래를 겨냥하고 있습니다. 이 계약들은 4개 인프라 파트너에 걸쳐 수 기가와트 규모의 약정을 나타내지만, 공통점이 하나 있습니다. 2026년 1~2분기에 열린 용량 공백을 해소해줄 계약은 단 하나도 없다는 것입니다.
장기 계약 중 가장 진척이 빠른 것은 Amazon 계약입니다. 2026년 말까지 1 GW 미만이 가동된다는 것은 올해 하반기부터 2027년에 걸쳐 규모가 확대된다는 의미입니다. Google·Broadcom 계약은 2027년 이전에는 의미 있는 기여가 어렵습니다. Azure와 Fluidstack은 계약으로서가 아닌 운영 용량 기준으로는 더 먼 이야기입니다. 지금부터 해당 계약들이 생산 규모에 도달하는 시점까지 — 대략 향후 12~18개월 — Colossus 1은 Anthropic이 새 인프라를 구축하지 않고도 즉시 활성화할 수 있는 유일한 대규모 GPU 풀입니다.
이는 AI 인프라의 구조적 현실이지 계획 실패가 아닙니다. 최첨단 GPU 클러스터는 계약 체결부터 생산 준비까지 12~24개월이 걸리는 반면, LLM 도입 곡선은 몇 주 만에 가팔라질 수 있습니다. Colossus 1 임대는 Amazon·Google 용량이 Anthropic의 수요 성장을 독자적으로 흡수할 만한 규모에 도달할 때까지의 공백을 메우는 가교 역할을 합니다.
개발자 관점의 변화: 사용량 제한과 API 할당량
개발자 입장에서 Colossus 1 계약이 가져온 가장 구체적인 단기 신호는 파트너십 발표와 동시에 공지된 사용량 제한 변경이었습니다. Claude Code의 5시간 사용량 제한은 발표 시점에 Pro·Max·Team·Enterprise 전 티어에 걸쳐 두 배로 늘어났습니다. Pro·Max 계정의 피크 시간대 쓰로틀링은 폐지되었습니다. Claude Opus 모델의 API 속도 제한도 계약 발효와 함께 대폭 상향 조정되었습니다. Colossus 1 용량이 Claude 추론 트래픽에 투입되면서, 이 변경 사항들은 5월 6~7일 발표 후 며칠 안에 적용되었습니다.
Claude Code로 활발히 개발 중인 개발자에게 두 배로 늘어난 5시간 한도는 기존 한도에 자주 근접하던 긴 에이전틱 세션의 마찰을 줄여줍니다. 대규모 리팩터링, 장기 테스트 생성, 다중 파일 컨텍스트 분석 같은 작업을 이제 체크포인트-재시작 주기 없이 더 오랫동안 연속으로 실행할 수 있습니다. 피크 시간대 쓰로틀링 폐지는 레이턴시·가용성 계획에서 시간대 변수를 제거합니다. 자연적인 비피크 시간이 스케줄에 내장되지 않는 자동화 파이프라인을 운영하는 팀에게 특히 의미 있는 단순화입니다.
Opus 속도 제한 상향은 Opus가 선호 성능 티어인 API 연동에 특히 중요합니다. 이전 한도 안에 머물기 위해 적극적인 캐싱이나 요청 큐잉을 구현해온 팀은 이제 속도 제한이 걸리기 전까지 더 많은 여유 용량을 확보하게 됩니다. 단, Anthropic이 구체적인 새 수치를 공개하지 않았다는 점에 유의하십시오. 제3자 추정치는 실제 값과 차이가 날 수 있으므로, 본인 티어의 실제 할당량은 대시보드와 최신 API 문서를 직접 확인하십시오.
Colossus 1 용량의 일부는 데이터 레지던시 요건을 가진 아시아·유럽 기업 고객을 위해 특별히 배정되어 있습니다. 데이터 주권 요건이 있는 규제 산업이나 지역을 위해 개발 중이라면, Memphis 물리 인프라 및 관련 데이터 처리 계약이 해당 관할권의 특정 기준을 충족하는지 Anthropic 기업 영업팀에 직접 확인하십시오. 미국 시설과의 물리적 근접성과 데이터 레지던시 요건에 대한 계약상 준수는 별개의 사안으로, 각각 별도로 확인해야 합니다.
재반환 조항: 머스크의 조건과 xAI의 병행 행보

Anthropic–xAI 계약에는 일반적인 컴퓨트 임대와 구별되는 공개 조건이 담겨 있습니다. Elon Musk는 Anthropic의 AI가 "인류에 해를 끼치는 행위"를 할 경우 컴퓨트를 회수할 권리를 유보했습니다. 이 조항에 대한 구체적인 피해 기준, 판단 절차, 통보 기간, 또는 SLA에 준하는 내용은 공개되지 않았습니다. 이는 발동 기준이 정의되지 않은 일방적 조건으로, 실제로 행사될 가능성과 무관하게 계약상 이례적입니다.
"누구도 내 악 감지기를 작동시키지 않았다"고 머스크는 Anthropic 경영진에 대해 말하면서, "그들의 AI가 인류에 해를 끼치는 행위를 할 경우 컴퓨트를 회수할 권리를 유보한다"고도 밝혔습니다. — Elon Musk, Tom's Hardware 보도
머스크는 이번 거래를 정렬(alignment) 기반으로 규정하며, 서명 전 Anthropic 경영진과 Claude의 미션에 대해 직접 논의했고 자신의 평가를 순수한 상업적 검토가 아닌 가치 검증으로 위치시켰다고 밝혔습니다. 이러한 프레이밍이 실제 계약 조항을 반영하는지, 혹은 재반환 조항이 서명된 계약서에 공개 발언과 동일한 형태로 존재하는지 아니면 공개 발언에만 국한되는지는 알 수 없습니다. 양측 모두 계약서를 공개하지 않았습니다. 상업적 조건은 TechCrunch 보도를 통해 확인되었지만, 거버넌스 조항은 계약서 본문으로부터 독립적으로 검증되지 않았습니다.
Claude를 운영 의존성으로 취급하는 개발자와 기업 팀에게 재반환 조항은 표준 SLA 프레임워크가 다루지 않는 거버넌스 모호성을 도입합니다. 일반적인 클라우드 제공업체 SLA는 가동 시간 보장, 인시던트 대응 일정, 다운타임 보상 메커니즘을 명시합니다. Colossus 1 계약이 추가하는 것은 — 적어도 공개 발언에 따르면 — 표준 90일 양방 해지 외에 항소 절차, 통보 기간, 또는 중요성 기준이 공개되지 않은 주관적 피해 평가로 정의된 일방적 발동 조건입니다. Claude의 공급망을 평가하는 기업 법무 팀은 하이퍼스케일 계약에 없는 위험 범주를 평가해야 합니다: 운영 의존성으로서의 가치 정렬 위험.
xAI의 병행 용량 조치 타이밍은 주목할 만합니다. 2026년 5월 6일 — Anthropic 발표 당일 — xAI는 여러 Grok 4.1 Fast 모델에 대한 지원 종료 공지를 발행하며 사용자들에게 5월 15일 종료까지 불과 2주의 여유만 주었습니다. 이것이 Colossus 1 용량 이전과의 운영적 연계를 나타내는 것인지 — 구형 모델 폐기로 서빙 용량을 확보하는 것 — 아니면 독립적인 제품 로드맵 결정인지는 확인되지 않았습니다. 인과 관계와 무관하게 타이밍의 일치는 주목할 만하며, xAI 자체의 용량 포지션이 발표일 전후로 실질적으로 변화했음을 시사합니다.
Anthropic 입장에서의 구조적 우려는 재반환 조항이 실제로 행사되지 않더라도 핵심 운영 의존성에 비표준 거버넌스 변수를 삽입한다는 점입니다. 표준 SLA 위험은 정량화 가능합니다: 가동 시간 SLA, 보상 일정, 인시던트 대응 일정. 재반환 조항은 정의상 정량화 불가능한 위험을 도입합니다 — 이는 Anthropic의 AI가 정의되지 않은 피해 기준을 넘었는지에 대한 머스크의 평가로 발동되며, 공개된 판단 메커니즘이 없습니다. 이는 기존 벤더 위험 관리 프레임워크의 범위 밖에 있는 위험 범주입니다.
멤피스 시설의 환경 법적 책임
Colossus 1은 문서화된 환경 컴플라이언스 이력이 있으며, 이는 Anthropic의 의존성에 무시할 수 없는 위험 요인입니다. 멤피스 시설에 전력을 공급하는 가스 터빈은 처음에 대기청정법 허가나 필수 오염 제어 장치 없이 운영되었으며, 표준 규제 심사를 피하기 위해 '임시 발전기'로 분류되었는데 — 이 명칭은 환경 분석가와 지역사회 옹호자들이 이의를 제기한 것입니다. '임시 발전기' 분류는 알려진 규제 차익 거래입니다: 고배출 장비가 표준 신규 오염원 심사(New Source Review) 절차 밖에서 운영될 수 있게 하며, 그렇지 않으면 오염 제어 시설 설치와 수개월에 걸친 허가 일정이 필요합니다.
독립적 분석에 따르면 해당 시설의 운영은 지역 대기질의 측정 가능한 저하와 멤피스 인근 지역의 병원 입원율 증가와 연관되었습니다. 2026년 5월 현재, 공식적인 EPA 집행 조치는 공개적으로 발표되지 않았습니다. 그러나 기본적인 컴플라이언스 자세 — 속도 우선 건설, 소급 허가, 표준 심사를 우회하는 분류 선택 — 는 상당한 미디어 보도를 받는 고프로필·고수익 상업 계약과 결부될 때 면밀한 검토를 받는 유형의 규제 노출입니다.
Claude를 운영 의존성으로 평가하는 개발자들과 ESG 공시 요건 또는 기업 환경 약속의 적용을 받는 기업 구매자들에게, 이는 즉각적인 기술적 위험이라기보다는 평판 및 규제 위험 요인입니다. 리스크는 세 가지 시나리오에서 복합됩니다: EPA 집행으로 시설 운영이 중단되는 경우; Anthropic의 인프라 선택에 대한 지속적인 대중 감시로 고객의 브랜드 노출이 발생하는 경우; 또는 기업 구매자 자체의 환경 약속이 미허가 가스 터빈 운영과 연계된 서비스 사용에 마찰을 일으키는 경우.
이 사안에서 Anthropic의 입장은 구조적으로 제한됩니다 — Colossus 1을 건설하지 않았고 초기 허가 자세에 대한 책임도 없습니다. 그러나 주요 유료 고객이 되고 공개적인 월 12억 5천만 달러 계약을 체결함으로써, Anthropic은 계약 기간 동안 해당 법적 책임에 대한 평판상 근접성을 수용한 것입니다. 기업 조달 팀은 벤더 위험 평가 완료 시 이를 문서화해야 합니다. 특히 조직이 Scope 3 배출 보고 대상이거나 공급망 인프라에까지 적용되는 공개 환경 약속이 있는 경우 더욱 그렇습니다.
궤도 컴퓨트: 발표된 내용과 여전히 공백으로 남은 것
Anthropic–xAI 발표에는 미래 지향적 성명이 포함되어 있었습니다. Anthropic은 SpaceX와 협력하여 "수 기가와트 규모의 궤도 AI 컴퓨트 용량"을 구축하는 데 관심을 표명했습니다. 그러나 이 발표와 함께 일정, 기술 사양, 궤도 고도 체계, 열 관리 방식, 발사체 요구사항, 또는 연결 아키텍처는 전혀 공개되지 않았습니다. 이는 로드맵 약속이 아닌 방향성 신호로 받아들여야 하며, 5~10년 미만의 지평을 가진 아키텍처 결정에 반영해서는 안 됩니다.
궤도 컴퓨트의 기술적 난제는 지상 코로케이션과 본질적으로 다르며, Anthropic이나 SpaceX는 이를 공개적으로 다룬 바 없습니다. 저궤도(LEO)에서의 전력 생성은 태양전지판 면적과 지구 그림자 대비 궤도 위치에 의해 제약됩니다. 기가와트 규모의 컴퓨트를 제공하는 위성 클러스터는 대형 태양광 어레이나 핵 에너지원 중 하나를 필요로 하는데, 상용 AI 추론을 위한 단기 배치 경로는 어느 쪽도 명확하지 않습니다. 진공 환경에서의 열 관리는 훨씬 복잡합니다. 공기 냉각은 불가능하고, 액체 냉각 시스템은 유지보수가 불가능한 환경에서 치명적인 장애 지점이 됩니다. 더불어 한번 발사된 하드웨어는 업그레이드할 수 없어, 궤도에 진입하는 GPU 세대는 자산의 운영 수명 동안 고정됩니다.
SpaceX의 스타링크 LEO 위성군은 궤도 컴퓨트 레이어를 위한 가장 유력한 연결 백본입니다. 현재 스타링크 v2 성능은 유리한 조건에서 지상국까지 20ms 미만의 지연을 지원합니다. 그러나 스타링크는 통신 네트워크이지 전력이나 컴퓨트 네트워크가 아닙니다. 이를 궤도 추론의 업링크/다운링크 레이어로 활용하려면 궤도 세그먼트와 지상 세그먼트 양쪽에 걸쳐 별도의 인프라 투자가 필요하며, 이는 아직 공개적으로 범위가 정해지지 않았습니다.
다년간의 인프라 의존성을 Anthropic API 기반으로 계획하는 개발자들에게 실질적인 인프라는 Colossus 1(최소 2026년 중반까지), Amazon 계약(2026년 말~2027년까지 확장), Google/Broadcom 딜(2027년부터)입니다. 궤도 컴퓨트 발표는 Anthropic의 장기 인프라 야심과 SpaceX와의 관계를 이해하는 데 맥락적으로 의미가 있을 뿐, 현재 또는 단기 개발 작업의 계획 입력값으로는 활용할 수 없습니다.
Anthropic 전체 컴퓨트 스택: Colossus 1의 위치

Colossus 1 임대는 Anthropic의 컴퓨트 전략에서 구체적이고 시한이 있는 위치를 차지합니다. 클라우드 공급업체 파트너십을 통해 장기적이고 목적 맞춤형 용량이 가동될 때까지 2026년의 수요 급증을 메우는 가교 역할입니다. 전체 스택에서 Colossus 1이 차지하는 위치를 이해하면, 전략적 가치와 전체 계약 포트폴리오 대비 위험 프로필 모두를 명확히 파악할 수 있습니다.
| 파트너 | 발표된 규모 / 가치 | 예상 가동 시점 | 스택 내 역할 | 주요 위험 요소 |
|---|---|---|---|---|
| xAI (Colossus 1) | 월 $12.5억; GPU 약 22만 개; 300MW+ | 2026년 5월 가동 중 | 가교: 2026년 단기 공백 해소 | 90일 해지 조항; 회수 조항; 단일 시설; 비표준 거버넌스 |
| Amazon AWS | 최대 5GW; 2026년 말 약 1GW | ~1GW 2026년 12월; 전체 미정 | 2026~2027년+ 주요 확장 레이어 | 가동 일정; 용량 확보 경쟁 |
| Google / Broadcom | 5GW | 2027년부터 | 2027년+ 확장 레이어 | 2027년까지 지연; Google이 Claude와 직접 경쟁 |
| Microsoft / NVIDIA (Azure) | $300억 규모 약정 | 다년 지평 | 장기 이중화 | 긴 리드타임; Azure 공급업체 의존성 |
| Fluidstack | $500억 규모 구축 | 다년 지평 | 장기 용량 다변화 | 최대 발표 금액; 대규모 실행 위험 |
| SpaceX (궤도 — 관심 표명) | 수 GW (투기적) | 일정 미공개 | 미래 방향성 신호에 그침 | 기술적 실현 가능성; 최소 5~10년 지평 |
Sources: Anthropic, Latent Space
이 표는 의존성 집중 위험을 명확히 보여줍니다. Colossus 1은 단일 시설, 단일 운영사 자산으로 비표준 해지 조건을 갖추고 있어, 클라우드 공급업체 SLA에서 통상 기대하는 위험 프로필과는 거리가 있습니다. 제2 데이터센터도, Colossus 계약 내 지리적 이중화도, 하이퍼스케일 클라우드 공급업체 수준의 가동 보장·장애 대응 일정·보상 체계를 갖춘 SLA도 없습니다. Amazon 용량이 확대되고 Google/Broadcom 용량이 가동되기까지 향후 12~18개월 동안, Anthropic의 최대 용량 자원은 동시에 가장 관례적이지 않은 방식으로 위험이 분산된 자원이기도 합니다.
클라우드 공급업체, 코로케이션 운영사, 직접 경쟁사로부터의 컴퓨트 임대까지 아우르는 5개의 공개 인프라 파트너를 망라한 전체 스택의 폭은, Anthropic이 어느 단일 계약도 영속적인 장기 해법으로 보지 않는다는 신호입니다. 이 다변화는 다년 맥락에서 Claude를 기반으로 개발하는 개발자들에게 긍정적입니다. 단일 파트너 장애가 치명적인 용량 위기로 이어질 위험을 크게 줄여 주기 때문입니다. 그러나 2026년까지의 단기적으로는 Colossus 1이 실질적인 제약 요소입니다. Claude가 크리티컬 패스에 있다면, 정확한 의존성 모델링을 위해 Colossus 1의 계약 조건, 거버넌스 조건, 일정을 먼저 파악해야 합니다.
자주 묻는 질문
Anthropic이 xAI의 Colossus 2 클러스터에 접근할 수 있나요?
아닙니다. xAI는 자사의 Grok 모델 학습 및 추론을 위해 Colossus 2를 계속 보유합니다. Anthropic의 임대 계약은 Colossus 1에만 해당되며, NVIDIA H100 약 150,000개, H200 50,000개, GB200 Blackwell 가속기 30,000개로 총 220,000개 이상의 GPU와 300MW를 초과하는 전력 용량을 포함합니다. Colossus 2의 사양은 아직 공개적으로 완전히 공개되지 않았으며, xAI는 그 용량을 제3자에게 임대할 의향을 밝힌 바 없습니다. 이 구분은 초기 보도 대부분에서 다루어지지 않았지만, Anthropic이 통제하는 것과 Grok 개발을 위해 xAI의 운영 스택 안에 남아 있는 것을 정확히 파악하는 데 중요합니다.
2026년 5월 Claude Code 요청 한도 증가의 원인은 무엇인가요?
Colossus 1 계약으로 즉각적인 추가 GPU 용량이 확보되었으며, Anthropic은 2026년 5월 6~7일 발표 후 며칠 만에 Colossus 하드웨어에 Claude 추론을 배포했습니다. 이를 통해 Pro, Max, Team, Enterprise 등 모든 티어에서 Claude Code의 5시간 사용 한도가 두 배로 늘어났고, Pro 및 Max 계정의 피크 시간대 속도 제한이 해제되었으며, Claude Opus 모델의 API 요청 한도도 크게 높아졌습니다. 근본적인 원인은 Claude Code의 빠른 도입으로 발생한 에이전트 추론 수요가 Anthropic이 기존에 확보한 용량을 초과했기 때문입니다.
Elon Musk는 계약 종료 전에 컴퓨팅 자원을 회수할 수 있나요?
Musk가 공개적으로 밝힌 조건에 따르면, 그렇습니다. 그는 Anthropic의 AI가 "인류에 해를 끼치는 행동에 가담할" 경우 Colossus 1 컴퓨팅 자원을 회수할 권리를 유보해 두었습니다. 또한 어느 쪽이든 이유에 상관없이 90일 전 통보로 계약을 종료할 수 있습니다. 회수 조건과 관련된 공식적인 심의 절차, 피해 기준 정의, 또는 별도의 통보 기간은 공개된 바 없습니다. 이 조건이 공개적으로 설명된 형태로 서명된 계약서에 존재하는지, 아니면 실제 계약서에서 더 제한적인 표현으로 나타나는지는 알 수 없으며, 어느 쪽도 계약서 전문을 공개하지 않았습니다.
Memphis 시설의 환경 문제는 무엇인가요?
Colossus 1 Memphis 시설의 가스 터빈은 처음에 청정공기법 허가나 필요한 오염 제어 장치 없이 운영되었습니다. 이 시설은 표준 규제 심사를 피하기 위해 해당 터빈을 "임시 발전기"로 분류했으며, 이 분류는 환경 분석가들로부터 이의가 제기되었습니다. 독립적인 분석에 따르면 시설 운영이 Memphis 인근 지역의 대기질 저하 및 입원 환자 증가와 연관이 있는 것으로 나타났습니다. 2026년 5월 현재, 공식적인 EPA 집행 조치는 공개적으로 발표되지 않았습니다. 비용을 지불하는 고객인 Anthropic 입장에서 이는 미해결 규제 및 평판 리스크입니다. ESG 보고 또는 Scope 3 배출 요건을 적용받는 기업 구매자는 공급업체 리스크 평가에 이를 문서화해야 합니다.
Colossus 계약은 Anthropic의 Amazon, Google, Microsoft 계약과 어떤 관계가 있나요?
Colossus 1 계약은 다른 협약들이 같은 일정 안에 채울 수 없는 단기 공백을 해결합니다. Amazon의 용량(~1GW)은 2026년 하반기부터 순차적으로 가동될 예정이며, Google/Broadcom의 5GW 계약은 2027년에 도래합니다. $300억 규모의 Azure 및 $500억 규모의 Fluidstack 약정은 운영 용량 기준으로 더 먼 미래의 이야기입니다. Colossus 1은 현재 가동 중이며, Claude Code 도입으로 촉발된 2026년의 급격한 수요를 메우는 가교 역할을 합니다. 클라우드 제공업체 스택은 기존 SLA 프레임워크를 갖춘 장기적·지리적으로 분산된 목적형 인프라를 대표합니다. Colossus 1은 다각화 전략의 한 수단일 뿐, 그것을 대체하는 것이 아닙니다.
앞으로 주목할 점
Anthropic–xAI 컴퓨팅 계약은 LLM 인프라 시장이 어디로 가고 있는지가 아니라, 지금 어느 위치에 있는지를 보여주는 신호로 가장 정확하게 해석됩니다. Anthropic 규모의 회사가 Amazon, Google, Microsoft, Fluidstack에 수십억 달러를 약정해 두고도 단기 수요 급증을 메우기 위해 직접 경쟁사에서 컴퓨팅을 임대해야 했다는 사실은, 실제 GPU 가용성이 대형 AI 인프라 계약의 발표 주기보다 얼마나 뒤처지는지를 잘 보여줍니다. 서명된 계약과 실제 운영 용량은 다른 범주이며, 그 간극은 현재 프론티어 규모에서 분기에서 수년 단위로 측정됩니다.
개발자와 기술 팀에게 실질적인 단기 시사점은 분명합니다. Claude API 가용성과 요청 한도는 2026년 1분기보다 구조적으로 개선되었으며, 용량은 이미 가동 중이고 한도 증가도 효력이 발생했습니다. 90일 계약 해지 조항과 회수 조건은 실제 리스크 요인으로, 엄격한 가동률 요건을 가진 프로덕션 시스템—특히 대체 모델이 미리 통합되어 있지 않은 경우—의 공급업체 평가에서 추적·문서화할 가치가 있습니다. 2026~2027년에 걸쳐 순차 가동될 Amazon 및 Google/Broadcom 용량은 Colossus 협약에 대한 Anthropic의 의존도를 점진적으로 낮출 것이며, 해당 용량이 운영에 들어갈 때 추가 한도 증가나 신규 지역 가용성 발표에 주목하세요.
궤도 컴퓨팅 관련 언급은 5년 미만의 어떤 계획 전제에도 포함시키기보다는 주변 시야 정도로 두는 것이 적절합니다. Memphis 환경 규정 준수 이력은 시설 운영에 영향을 미칠 수 있는 집행 동향을 모니터링할 가치가 있습니다. 그리고 경쟁사에 월 $12.5억 이상을 지불하면서 Amazon, Google, Microsoft와 독자 용량을 구축하는 경쟁 구도는, 계약이 2029년 5월 만기에 이르거나 어느 한쪽이 90일 해지권을 행사하기 전까지 어느 쪽도 공개적으로 해소할 뚜렷한 유인이 없는 구조적 긴장으로 남아 있습니다.
최종 업데이트: 2026-05-29. 2026년 5월 29일까지 입수 가능한 보도 및 분석을 바탕으로 작성되었습니다. 계약 조건은 어느 쪽도 독립적으로 공개하지 않았으며, 재무 수치는 TechCrunch 및 Latent Space 보도에서 발췌했습니다. 용량 계획 결정을 내리기 전에 Anthropic 대시보드에서 현재 API 요청 한도를 확인하세요.