DeepSeek V3: 중국 오픈소스 AI가 흔들어놓은 것들

2025년 초, DeepSeek V3 공개는 꽤 충격적이었어요. 성능은 GPT-4o 수준인데 학습 비용은 극적으로 낮았고, 무엇보다 오픈소스로 풀렸거든요.

## DeepSeek V3가 뭐가 달랐나

DeepSeek V3는 **671B 파라미터 MoE(Mixture of Experts)** 모델이에요. MoE 구조 덕분에 추론 시 전체 파라미터를 다 쓰지 않아도 돼서 효율이 올라가요. 학습에는 약 2,788만 달러(약 370억 원)가 들었다고 알려졌는데, 같은 성능의 다른 모델들에 비해 상당히 낮은 편이에요.

코딩 벤치마크에서 성능이 특히 눈에 띄었고, 수학 추론 능력도 경쟁력이 있었어요. GPT-4o, Claude 3.5 Sonnet과 비교해서 뒤지지 않는다는 평가가 많이 나왔죠.

## 왜 오픈소스로 풀었을까

솔직히 처음엔 저도 의아했어요. 상업 모델들은 API 수익화가 기본인데, 왜 오픈소스로? 몇 가지 해석이 있어요.

하나는 **생태계 선점 전략**이에요. 개발자들이 많이 쓰면 파생 활용이 늘어나고, 기업 클라이언트 유입으로 이어지는 구조죠. 다른 하나는 미국 빅텍의 모델 독점 구도에 대한 도전 의식. 중국 AI 기업 입장에서 오픈소스는 "우리도 된다"는 메시지이기도 하거든요.

## AI 판도에 끼친 영향

DeepSeek V3 공개 직후, 엔비디아 주가가 하루 17% 가까이 빠진 일이 있었어요. "그렇게 비싼 GPU 클러스터가 없어도 세계 최고 수준 모델이 나올 수 있다"는 인식이 확산됐거든요. 이건 꽤 상징적인 사건이었어요.

실제로 오픈소스 LLM 생태계에서 DeepSeek 기반 파인튜닝 모델이 빠르게 늘어났고, 기업들이 API 의존 없이 자체 모델을 돌리는 시나리오가 현실적이 됐어요.

## 실사용 입장에서 보면

개발자들 사이에서 DeepSeek V3는 "성능 대비 가장 가성비 좋은 API"라는 평이 많아요. 무엇보다 로컬 배포가 가능하다는 점이 데이터 민감도가 높은 기업들한테 매력적이고요.

한국 시장에서도 DeepSeek 기반 서비스들이 조용히 늘어나고 있어요. IT 업계 입장에서는 "어떤 모델을 쓸지"보다 "어떻게 파인튜닝하고 통합할지"가 더 중요한 고민이 된 시대예요.

DeepSeek V3: 중국 오픈소스 AI가 흔들어놓은 것들

// COMMENTS

ON THIS PAGE