DeepSeek V4 출시 — GPT-5.4에 근접했지만 스스로 뒤처진다고 했어요

2025년 1월, DeepSeek R1이 공개되던 날 Nvidia 주가가 하루 만에 약 17% 떨어졌어요. 중국의 작은 AI 스타트업이 미국 최고 수준의 AI와 비슷한 성능을 훨씬 저렴하게 만들었다는 소식 하나가 시장 전체를 흔든 거예요.

그로부터 1년, 4월 24일 TechCrunch가 보도한 DeepSeek V4가 나왔어요. 근데 이번 발표에서 가장 눈에 띈 건 모델 자체가 아니었어요. 발표 방식이었어요.

saradasish-pradhan--SDEwTeaZ4A-unsplash — 사진: Unsplash의 Saradasish Pradhan

보통 AI 기업들은 이렇게 하지 않아요

AI 모델이 새로 나올 때마다 발표 자료는 비슷해요. 이전 모델보다 얼마나 빠른지, 경쟁사 모델보다 어떤 벤치마크에서 앞서는지를 강조해요. 한계나 뒤처지는 부분은 잘 나오지 않아요.

DeepSeek V4 발표는 달랐어요. 지식 테스트에서 GPT-5.4와 Gemini 3.1 Pro보다 약간 뒤처진다고 직접 밝혔어요. 전체 개발 궤적이 최첨단 모델보다 “약 3~6개월 뒤처져 있다” 고도 표현했어요. 자기 모델 발표 자리에서 이렇게 구체적으로 한계를 수치화해서 인정하는 경우는 드물어요.

물론 이게 전략일 수도 있어요. 먼저 말해버리면 외부 평가에서 지적당하는 것보다 낫거든요. 근데 어떤 의도였든, 숫자로 명시했다는 건 사실이에요.

실제로 어느 수준인가

그럼 V4가 실제로 어느 수준인지 봐야 해요.

V4는 Flash와 Pro 두 버전으로 나왔어요. V4 Pro는 현존 오픈소스 모델 중 가장 큰 모델이에요. 덩치는 크지만 실제 연산할 때는 필요한 부분만 작동하는 구조라, 크기에 비해 속도와 비용이 훨씬 효율적이에요. Flash는 Pro보다 가볍고 빠른 버전이에요. 두 모델 모두 컨텍스트 윈도우는 100만 토큰이에요. 긴 문서나 대규모 자료를 한 번에 넣고 처리할 수 있는 크기예요.

DeepSeek 자체 벤치마크 기준으로 코딩 부문에서 GPT-5.4에 “비슷한” 수준이에요. 추론 벤치마크에서는 최첨단 모델과의 격차를 거의 좁혔다고 밝혔어요. 다만 이 수치들은 모두 DeepSeek 자체 평가 기준이에요. 독립적인 검증이 나오기 전까지는 참고 수준으로 보는 게 맞아요.

한 가지 명확한 한계가 있어요. V4는 텍스트 전용이에요. GPT-5.5나 Gemini 3.1 Pro처럼 이미지·오디오·영상을 처리하는 기능이 없어요. 멀티모달이 필요하다면 다른 선택지를 봐야 해요.

그래서 써볼 만한가

AI 도구를 실제로 쓰는 입장에서 가장 직접적으로 와닿는 건 가격이에요.

V4 Flash는 입력 100만 토큰당 $0.14, 출력 $0.28이에요. V4 Pro는 입력 $0.145, 출력 $3.48이에요. GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro보다 낮은 가격이에요.

다만 알아둘 배경이 있어요. Anthropic과 OpenAI는 DeepSeek가 자신들의 모델을 무단으로 학습에 활용했다는 혐의를 제기하고 있어요. 이 논란은 아직 해소되지 않은 상태예요.

자동화 파이프라인을 만들거나 반복 작업에 AI를 연결할 때 비용 차이가 실질적으로 느껴지거든요. 텍스트 처리가 중심이고 가격이 중요한 상황이라면 써볼 만한 선택지가 생긴 거예요.

AI 기업이 자기 모델의 한계를 먼저 말할 때, 여러분은 신뢰가 생기나요?

격차를 좁혔다, 한계도 직접 밝혔다 — DeepSeek V4

보통 AI 기업들은 이렇게 하지 않아요

실제로 어느 수준인가

그래서 써볼 만한가

댓글 달기 댓글 취소