검색창 열기 인더뉴스 부·울·경

ICT 정보통신

카카오, ‘카나나’ 언어모델 구축 완료…경량모델 오픈소스 공개

URL복사

Thursday, February 27, 2025, 15:02:32

초거대 언어모델 개발 완료로 전 라인업 구축…연구 성과 공개
"라마, 젬마 등 글로벌 AI 모델과 견주는 언어모델…학습비용 50%절감"

 

인더뉴스 이종현 기자ㅣ카카오[035720]는 올해 출시 예정인 AI 서비스 ‘카나나(Kanana)’ 언어모델의 연구 성과를 담은 테크니컬 리포트를 ‘아카이브(ArXiv)’에 공개했다고 27일 밝혔습니다. 

 

이와 함께 경량 언어모델인 ‘카나나 나노 2.1B’ 모델을 오픈소스로 깃허브(GitHub)에 배포했습니다.

 

테크니컬 리포트는 매개변수와 학습 방법, 학습 데이터 등 세부 사항을 담아낸 AI 논문입니다.

 

카카오는 이번 리포트에 카나나 언어모델 전체의 사전, 사후 트레이닝 전 과정을 자세히 담았습니다. 카나나 모델의 구조, 학습 전략, 글로벌 벤치마크에서의 성과도 확인할 수 있습니다.

 

카카오는 초거대 언어모델 ‘카나나 플래그’가 지난해 말 학습을 완료, 카나나 언어모델의 전체 라인 업(플래그, 에센스, 나노)을 모두 구축하게 됐습니다.

 

카나나 플래그는 글로벌 최고 수준의 한국어·영어 성능을 달성한 모델로 한국어 성능을 평가하는 ‘LogicKor’, ‘KMMLU’ 벤치마크에서 타 모델을 압도하는 처리 능력을 입증했다고 회사 측은 설명했습니다. 

 

또한, 학습 자원 최적화를 통해 유사 사이즈의 모델 대비 50% 이상 비용을 절감하며 SOTA(State-of-the-Art) 수준의 효율성과 성능을 동시에 구현했습니다.

 

 

카카오는 대규모 언어모델의 학습 효율을 높이기 위해 ▲Staged pre-training ▲Pruning(모델 구성 요소를 가지치기해 중요 요소만 남기는 기법) ▲Distillation(큰 모델의 지식을 더 작은 모델로 전달하는 증류 기법) ▲DUS(Depth Upscaling, 깊이 업스케일링) 등 학습 기법을 적용했습니다. 

 

이를 통해 다양한 사이즈의 고성능 모델을 효율적으로 개발, 글로벌 유사 크기 모델 대비 절반 이하의 학습 비용을 실현했습니다.

 

카카오는 향후 카나나 모델에 강화 학습과 연속 학습 기반의 최신 기술을 접목해 추론, 수학,코딩 능력을 강화하고 정렬 기술을 고도화해 사용자 요청의 수행 정확도를 높일 계획입니다. 

 

이를 통해 음성, 이미지, 영상 등 다양한 형태로 소통 가능하도록 모델 고도화를 지속할 예정입니다.

 

한편, 이날 오픈소스로 공개한 ‘카나나 나노 2.1B’은 온디바이스 환경에서도 활용 가능한 고성능의 경량 모델로, 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 보인다고 회사 측은 설명했습니다.

 

'카나나 Nano 2.1B'의 베이스 모델과 인스트럭트 모델, 임베딩 모델이 오픈소스 커뮤니티인 깃허브를 통해 제공됩니다.

 

'카나나 Nano 2.1B'는 연구자와 개발자가 활용하기 적절한 크기의 모델이자 온디바이스 환경에서도 활용 가능한 고성능의 경량 모델입니다. 

 

지난달 카카오 공식 테크블로그를 통해 공개한 바와 같이 한국어와 영어 처리 능력에서 우수한 결과를 보여줍니다.

 

카카오는 이번 오픈소스 공개를 통해 AI 기술의 접근성을 높이고, 연구자와 개발자들이 다양하게 응용할 수 있도록 업데이트를 지속할 계획입니다.

 

김병학 카카오 카나나 성과리더는 “모델 최적화와 경량화 기술을 바탕으로 라마, 젬마 등 글로벌 AI 모델과 견줄 수 있는 고성능의 자체 언어모델 라인업을 효율적으로 확보하게 됐고, 이번 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것으로 기대한다”며 “효율과 성능 중심의 실용적이고 안전한 AI 모델을 개발해 AI 경쟁력을 강화할 것이다”고 말했습니다. 

English(中文·日本語) news is the result of applying Google Translate. <iN THE NEWS> is not responsible for the content of English(中文·日本語) news.

배너

이종현 기자 flopig2001@inthenews.co.kr

배너

‘거래 먹통은 막아야 하는데’…증권사, 서버 증설 왜 고민하나

‘거래 먹통은 막아야 하는데’…증권사, 서버 증설 왜 고민하나

2025.04.10 08:23:20

인더뉴스 최이레 기자ㅣ최근 주식시장에서 전산장애로 인해 시세제공, 매매거래 등이 차질을 빚는 사례가 발생하면서 매매불확실성에 대한 우려가 나오고 있습니다. 증권사들도 고민하는 가운데. 매매체결시스템 서버 증설 문제가 부각되고 있습니다. 갑작스러운 주문량 급증 등에 대비해 여유있게 서버 용량을 확보해 놓을 필요가 있지만 본사와 가까운 수도권에 마땅한 데이터센터를 찾기 힘들다는 지적입니다. 수도권 전력사용 규제도 어려움으로 꼽히고 있습니다. 금융투자업계에 따르면 지난달 18일 한국거래소 매매체결시스템에서 전산장애가 발생한데 이어 이달 3일과 4일에는 키움증권 거래플랫폼 매수·매도 주문지연이 발생했습니다. 뒤이어 지난 5일에는 미국 중개증권사 거래시스템 문제이긴 하지만, 삼성증권과 대신증권, NH투자증권 등에서 미국 주식거래를 위한 시세제공이나 매매체결 확인 및 정정·취소 주문이 지연됐습니다. 이에 대해 증권사 데이터관리 또는 거래플랫폼 담당자들 사이에서는 서버 증설이 필요하다는 목소리가 커지고 있습니다. 일반적으로 모바일트레이딩시스템(MTS)과 홈트레이딩시스템(HTS) 주문 송수신 과정은 ▲투자자가 사용하는 매체인 MTS나 HTS에서 주문이 전송되면 ▲증권사 정보분배 서버를 거쳐 주문 원장 서버로 전달, 매매 정보가 취합된 후 ▲거래소 매매체결시스템으로 넘어가 최종 체결되는 구조입니다. 이 과정에서 MTS나 HTS에서 주문이 폭증하면 증권사 정보분배 서버가 일시적으로 작동을 멈추는 전산장애가 일어납니다. 이 경우 이후 과정들이 진행되지 않기 때문에 시스템이 복구되기 전까지 주문체결이 지연될 수 밖에 없습니다. 이같은 병목현상에 따른 체결지연과 같은 사고를 줄이기 위해서는 서버용량을 늘릴 필요가 있다는게 업계 관계자들의 설명입니다. 한 증권사 데이터관리 담당자는 "서버를 늘린다고 해서 전산장애가 근절된다는 보장은 없지만 아무래도 주문을 처리할 수 있는 용량이 늘기 때문에 (사고를) 줄일 수는 있을 것 같다"고 말했습니다. 일부 대형 증권사를 취재한 결과 증권사에서 평균적으로 주문을 처리할 수 있는 용량은 10만TPS(Transactions Per Second)로 추산됩니다. TPS는 초당 주문 처리 건수를 의미합니다. 예컨대 10만TPS면 1초에 최대 10만건의 주문을 처리할 수 있다는 뜻입니다. 이 주문에는 매매 거래를 포함해 체결확인, 시세조회 등이 포함됩니다. 통상 증권사 MTS와 HTS에 동시접속자가 가장 많이 몰리는 시간은 정규장 개장 10분 전인 오전 8시50분부터 9시30분입니다. 이때 일부 증권사 거래 매체에는 최대 50만명이 몰리기도 하는데 만약 개장과 동시에 접속자가 급증한다면 병목현상에 따른 접속제한이나 거래체결 지연과 같은 전산장애가 일어날 확률이 높아집니다. 50만명의 접속자가 주문을 1개씩만 내도 50만TPS가 필요하기 때문입니다. 따라서 TPS를 늘릴 수 있는 서버증설이 필요한데, 문제는 서버를 갖출 마땅한 공간이 부족한 실정입니다. 삼성증권이 올해초 발간한 보고서에 따르면 국내 상업용 데이터센터는 지난해말 기준 44개로 수요 대비 부족한 것으로 추정됩니다. 2022년에는 전년대비 1개만 늘면서 2023년까지 과부족 현상이 극심했습니다. 추진 프로젝트 절반 이상이 착공 지연된 결과라고 삼성증권은 분석했습니다. 더불어 지난해 6월 지방 개발 유도를 위한 정책인 '분산에너지 활성화 특별법' 시행으로 수도권에서 전력 확보가 어려워진 점도 증권사 서버 증설을 가로막고 있습니다. 한 증권사 인프라 담당자에 따르면 증권사에서 하루 거래를 처리하는데 필요한 전력 소비량은 평균 15~17MW(메가와트)입니다. 이런 상황에서 '5MW 이상의 전력수요가 발생해 전력계통에 부담을 줄 경우 한국전력이 공급을 중단할 수 있다'는 특별법 조항도 부담스럽다는 설명입니다. 이 증권사 관계자는 "시설 확충을 한다면 관리와 접근이 용이한 수도권이 후보지가 될 가능성이 크지 않겠냐"며 "계약조건이나 보안 안정성, 입지 등을 충족하는 물건을 찾는게 관건이 될 것"이라고 말했습니다.


배너


배너