딥시크(DeepSeek), AI 시장의 게임 체인저 될까…ChatGPT와 비교 분석

기사출처 : 톱스타뉴스

코인텔레그래프 보도에 따르면, AI 챗봇 ‘딥시크(DeepSeek)’가 글로벌 AI 시장에서 주목받고 있다. 오픈소스 대형 언어 모델(LLM) 중 가장 큰 규모를 자랑하는 딥시크는 6700억 개의 매개변수를 갖춘 R1 모델을 기반으로 하며, 경제성과 성능에서 기존 AI 모델과 차별점을 보이고 있다. 특히 ChatGPT, 구글의 제미니(Gemini), XAI의 그록(Grok)과 경쟁 구도를 형성하며 AI 기술의 진화를 이끌고 있다.

딥시크는 R1 모델과 V3 모델을 개발했으며, R1 모델은 단계적으로 응답을 생성하는 방식으로 인간의 사고 과정을 모방한다. 이를 통해 메모리 사용량을 줄여 비용 효율성을 극대화했다. 개발 비용도 600만 달러 수준으로, GPT-4의 1억 달러 이상과 비교해 상당히 저렴한 수준이다. 코인텔레그래프 보도에 따르면, 딥시크의 창립자인 량원펑은 2022년 9월부터 미국의 수출 규제를 받기 전, 엔비디아 A100 칩 5만 개 이상을 확보했으며, 여기에 저렴한 H800 칩을 조합해 고성능 AI 모델을 개발하는 데 성공했다.

딥시크가 기존 AI 모델들과 차별화되는 핵심 요소는 혼합 전문가(MoE, Mixture-of-Experts) 아키텍처와 다중 헤드 잠재 어텐션(MLA, Multi-head Latent Attention) 기술이다. MoE는 전체 매개변수 중 일부만 활성화하는 방식으로 연산 자원을 절약하고, MLA는 기존 어텐션 메커니즘보다 낮은 메모리 사용량을 요구해 처리 속도를 높인다. 이러한 기술적 차별점 덕분에 딥시크는 ChatGPT 등과 비교해 비용 효율성이 높으면서도 성능이 뛰어난 AI 모델로 평가받고 있다.

코인텔레그래프 보도에 따르면, 딥시크 R1은 오픈소스로 공개됐으나, 학습 데이터는 비공개로 유지하고 있다. 이러한 접근 방식은 AI 모델의 검증 가능성을 높이면서도 기업의 경쟁력을 유지하는 전략으로 해석된다. 또한, 고성능 AI 연구의 접근성을 높여 대규모 언어 모델(LLM)의 발전을 가속화할 가능성이 있다. 마크 안드레센은 딥시크의 등장을 미국 AI 시장의 ‘스푸트니크 모멘트’라고 평가하며, 미국의 AI 주도권에 대한 도전이 될 것이라고 지적했다.

딥시크의 창립자인 량원펑은 2023년 12월 딥시크를 설립한 후, 불과 1년 만에 AI 업계에서 주목받는 인물로 떠올랐다. 저장대학에서 전자정보공학과 컴퓨터과학을 전공한 그는 AI 전문가이면서도 금융 분야에서도 영향력을 가진 인물이다. 그는 중국 최초로 1,000억 위안(약 13억 달러) 이상의 자금을 조달한 퀀트 헤지펀드 ‘하이플라이어(High-Flyer)’의 CEO이기도 하다. 량원펑은 퀀트 트레이딩을 통해 축적한 AI 데이터 분석 역량을 기반으로 딥시크를 개발했으며, 중국 AI 기술이 단순 모방을 넘어 혁신해야 한다는 입장을 강조해왔다.

코인텔레그래프 보도에 따르면, AI 개발에는 막대한 자금이 필요하지만, 딥시크는 기존 방식과 달리 비교적 적은 비용으로 유사한 성능을 구현하는 전략을 취했다. 메타는 AI 기술 개발에 650억 달러를 투자했으며, 오픈AI의 CEO 샘 알트먼은 AI 산업이 향후 수조 달러 규모의 반도체 투자가 필요하다고 언급한 바 있다. 그러나 딥시크는 저렴한 비용과 기존보다 덜 정교한 하드웨어로 경쟁력을 확보했다. 이와 같은 접근 방식은 AI 기술의 보편화를 앞당기고, 다양한 산업에서 AI 활용도를 높일 수 있는 계기가 될 것으로 보인다.

ChatGPT와의 비교에서도 딥시크는 독특한 강점을 보인다. ChatGPT는 다목적 AI 모델로 자연어 처리와 콘텐츠 생성에 강점을 가진 반면, 딥시크는 기술적 문제 해결과 효율적인 정보 처리를 목표로 설계됐다. 딥시크 R1은 6710억 개의 매개변수 중 37억 개만 활성화하는 방식으로 연산 자원을 절약하며, 이는 ChatGPT의 1조8000억 개 매개변수 전체를 사용하는 방식과 차이가 있다. 또한, 딥시크는 강화 학습(RL) 기반의 ‘사고 연쇄(chain-of-thought)’ 방식으로 문제 해결 능력을 향상시켰다.

딥시크의 개발 비용은 550만 달러 수준으로, ChatGPT가 1억 달러 이상의 비용을 투입한 것과 비교해 10분의 1 수준이다. 또한, ChatGPT는 운영 비용이 하루 10만 달러, 월 300만 달러에 이르는 반면, 딥시크는 훨씬 적은 비용으로 운영 가능하다. API 비용 또한 ChatGPT보다 저렴하게 책정돼, 비용 부담을 줄이려는 기업과 연구소에서 선호할 가능성이 높다.

코인텔레그래프 보도에 따르면, 딥시크는 중국 시장에서 정치적으로 민감한 주제에 대한 응답을 제한하는 등 검열이 적용되고 있다. 예를 들어, 톈안먼 사태에 대한 질문에는 답변을 회피하는 방식을 취하며, ‘도움이 되고 해가 없는’ 답변만 제공하도록 설계됐다. 이는 바이두의 어니(Ernie)와 바이트댄스의 도우바오(Doubao) 등 중국산 AI 모델에서 공통적으로 나타나는 현상이다. 이러한 검열 정책으로 인해 글로벌 시장에서의 경쟁력이 제한될 가능성이 제기되고 있다.

또한, 딥시크의 데이터 보안과 개인정보 보호 문제도 논란이 되고 있다. 오픈AI는 데이터 수집과 사용에 대해 투명성을 유지하는 반면, 딥시크는 데이터의 상업적 활용 가능성이 크고, 광고 파트너와의 데이터 공유 가능성도 있는 것으로 알려졌다. 특히, 중국 내 데이터 저장과 보안 규정이 글로벌 기준과 차이가 있어, 해외 기업들이 딥시크를 도입하는 데 부담을 느낄 수 있다.

결과적으로 딥시크는 비용 효율성을 극대화한 AI 모델로서 ChatGPT와 경쟁할 수 있는 강력한 대안이 될 가능성을 보이고 있다. 그러나 검열, 데이터 보안 및 글로벌 확장성 등의 문제가 해결되지 않는다면, 기술력만으로는 한계를 가질 수도 있다. AI 시장에서 딥시크의 성장이 계속될지, 글로벌 시장에서 ChatGPT를 위협하는 존재로 자리 잡을지는 향후 규제 환경과 기술 발전 속도에 따라 달라질 전망이다.

기사링크 : https://www.topstarnews.net/news/articleView.html?idxno=15597832


코멘트

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다