DeepSeek은 어떤 회사이며 어떤 AI 기술을 개발하나요?


DeepSeek은 2023년에 설립된 중국 항저우 기반의 인공지능 스타트업이다. 이름만 보면 그냥 AI 회사 같지만, 이 회사가 최근 몇 달 사이에 업계에서 굉장히 빠르게 주목을 받았다. 규모는 아직 크지 않은데, 효율적으로 잘 만든 LLM 모델 덕분에 OpenAI나 구글 같은 빅테크 회사들 사이에서도 긴장하게 만들었다는 얘기들이 많다

DeepSeek을 만든 건 량원펑이라는 사람이다. 이 사람은 원래 수학 전공자고, 금융 쪽에서도 일했던 경험이 있는데, AI에 꽤 깊이 관여하면서 회사를 차렸다. 자금은 중국계 헤지펀드 High-Flyer에서 지원받고 있다. 그래서인지 모델 개발 속도도 빠르고, 투자 여력도 생각보다 탄탄하다

이 회사가 공개한 대표 모델이 DeepSeek-R1이다. 이 모델이 관심을 끌었던 건, 단순히 성능이 좋아서가 아니라, 학습 비용을 굉장히 낮췄기 때문이다. GPT-4 같은 모델은 학습 비용이 수천억 원 단위로 드는 반면, DeepSeek-R1은 600만 달러 정도로 훈련을 마쳤다고 알려져 있다. 성능도 상위권이고, 오픈소스 라이선스로 공개돼서 누구나 활용할 수 있게 돼 있다

이후 V3, V3.1 같은 시리즈도 나왔고, 프로그래밍 특화 모델인 DeepSeek-Coder-V2, 논리와 증명을 중심으로 하는 Prover-V2 같은 모델도 잇달아 공개했다. 특히 V3 시리즈는 mixture-of-experts 구조를 채택해, 실제로 작동하는 모델 수를 줄이면서도 효율적으로 높은 성능을 낼 수 있도록 설계됐다

DeepSeek의 모델은 모두 오픈 가중치 형태로 공개되고 있어서, 연구자나 개발자들이 자유롭게 활용할 수 있다. 그래서 일부에서는 이 회사를 두고, AI 기술의 민주화를 이끄는 새로운 흐름이라고 보기도 한다. 물론 정치적인 민감성과 보안 문제를 우려하는 시각도 있지만, 기술적으로는 인정받는 분위기다

중국에서도 이렇게 빠르게 독자적인 LLM을 만드는 회사가 나타났다는 건 의미가 크다. 단순히 서구권 기술을 따라가는 걸 넘어서, 구조적으로 새로운 방식을 도입하고, 오픈소스 생태계에서 주도권을 가져가려는 시도가 본격화되고 있다는 얘기다. DeepSeek은 그런 흐름의 대표적인 사례다


댓글 남기기