검색창 열기 인더뉴스 부·울·경

ICT 정보통신

카카오, ‘카나나’ 언어모델 구축 완료…경량모델 오픈소스 공개

URL복사

Thursday, February 27, 2025, 15:02:32

초거대 언어모델 개발 완료로 전 라인업 구축…연구 성과 공개
"라마, 젬마 등 글로벌 AI 모델과 견주는 언어모델…학습비용 50%절감"

 

인더뉴스 이종현 기자ㅣ카카오[035720]는 올해 출시 예정인 AI 서비스 ‘카나나(Kanana)’ 언어모델의 연구 성과를 담은 테크니컬 리포트를 ‘아카이브(ArXiv)’에 공개했다고 27일 밝혔습니다. 

 

이와 함께 경량 언어모델인 ‘카나나 나노 2.1B’ 모델을 오픈소스로 깃허브(GitHub)에 배포했습니다.

 

테크니컬 리포트는 매개변수와 학습 방법, 학습 데이터 등 세부 사항을 담아낸 AI 논문입니다.

 

카카오는 이번 리포트에 카나나 언어모델 전체의 사전, 사후 트레이닝 전 과정을 자세히 담았습니다. 카나나 모델의 구조, 학습 전략, 글로벌 벤치마크에서의 성과도 확인할 수 있습니다.

 

카카오는 초거대 언어모델 ‘카나나 플래그’가 지난해 말 학습을 완료, 카나나 언어모델의 전체 라인 업(플래그, 에센스, 나노)을 모두 구축하게 됐습니다.

 

카나나 플래그는 글로벌 최고 수준의 한국어·영어 성능을 달성한 모델로 한국어 성능을 평가하는 ‘LogicKor’, ‘KMMLU’ 벤치마크에서 타 모델을 압도하는 처리 능력을 입증했다고 회사 측은 설명했습니다. 

 

또한, 학습 자원 최적화를 통해 유사 사이즈의 모델 대비 50% 이상 비용을 절감하며 SOTA(State-of-the-Art) 수준의 효율성과 성능을 동시에 구현했습니다.

 

 

카카오는 대규모 언어모델의 학습 효율을 높이기 위해 ▲Staged pre-training ▲Pruning(모델 구성 요소를 가지치기해 중요 요소만 남기는 기법) ▲Distillation(큰 모델의 지식을 더 작은 모델로 전달하는 증류 기법) ▲DUS(Depth Upscaling, 깊이 업스케일링) 등 학습 기법을 적용했습니다. 

 

이를 통해 다양한 사이즈의 고성능 모델을 효율적으로 개발, 글로벌 유사 크기 모델 대비 절반 이하의 학습 비용을 실현했습니다.

 

카카오는 향후 카나나 모델에 강화 학습과 연속 학습 기반의 최신 기술을 접목해 추론, 수학,코딩 능력을 강화하고 정렬 기술을 고도화해 사용자 요청의 수행 정확도를 높일 계획입니다. 

 

이를 통해 음성, 이미지, 영상 등 다양한 형태로 소통 가능하도록 모델 고도화를 지속할 예정입니다.

 

한편, 이날 오픈소스로 공개한 ‘카나나 나노 2.1B’은 온디바이스 환경에서도 활용 가능한 고성능의 경량 모델로, 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 보인다고 회사 측은 설명했습니다.

 

'카나나 Nano 2.1B'의 베이스 모델과 인스트럭트 모델, 임베딩 모델이 오픈소스 커뮤니티인 깃허브를 통해 제공됩니다.

 

'카나나 Nano 2.1B'는 연구자와 개발자가 활용하기 적절한 크기의 모델이자 온디바이스 환경에서도 활용 가능한 고성능의 경량 모델입니다. 

 

지난달 카카오 공식 테크블로그를 통해 공개한 바와 같이 한국어와 영어 처리 능력에서 우수한 결과를 보여줍니다.

 

카카오는 이번 오픈소스 공개를 통해 AI 기술의 접근성을 높이고, 연구자와 개발자들이 다양하게 응용할 수 있도록 업데이트를 지속할 계획입니다.

 

김병학 카카오 카나나 성과리더는 “모델 최적화와 경량화 기술을 바탕으로 라마, 젬마 등 글로벌 AI 모델과 견줄 수 있는 고성능의 자체 언어모델 라인업을 효율적으로 확보하게 됐고, 이번 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것으로 기대한다”며 “효율과 성능 중심의 실용적이고 안전한 AI 모델을 개발해 AI 경쟁력을 강화할 것이다”고 말했습니다. 

English(中文·日本語) news is the result of applying Google Translate. <iN THE NEWS> is not responsible for the content of English(中文·日本語) news.

배너

이종현 기자 flopig2001@inthenews.co.kr

배너

증시에 스며든 대선공약 기대감…허니문 랠리 수혜주는?

증시에 스며든 대선공약 기대감…허니문 랠리 수혜주는?

2025.05.30 11:32:02

인더뉴스 최이레 기자ㅣ제21대 대통령선거가 지난 29일 사전투표 시작과 함께 본격적인 막을 올렸습니다. 대선은 증시에서도 시장 방향성을 좌우할 수 있는 중요한 이벤트로 꼽히는데 이번에도 각 후보 간 공약에 따라 관련주들이 들썩이는 모습을 보이고 있습니다. 증권가에서도 후보별 공통 공약에서 투자 기회를 엿볼 수 있을 것으로 진단하고 있습니다. 특히 인공지능(AI) 육성, 내수 진작, 재건축 규제 완화 등과 같은 이슈에서 의견이 모이고 있어 선거 후에도 단기 상승 모멘텀을 제공할 여지가 크다는 분석입니다. 30일 한국거래소에 따르면 증권주들은 전날 일제히 52주 신고가를 새로 썼습니다. 시가총액 9조원을 자랑하는 미래에셋증권 주가는 23% 이상 급등했고 NH투자증권, 한국금융지주, 삼성증권, 키움증권 등 대형 증권사들이 이 대열에 합류했습니다. 소형주로 분류되는 상상인증권은 상한가를 기록한 가운데 이날도 급등세를 이어가고 있습니다. 이재명 더불어민주당 대선후보의 발언이 증권주들을 끌어올렸습니다. 지난 28일 'K-이니셔TV 1400만 개미와 한 배 탔어요' 유튜브 생방송에 출연한 이 후보는 "보수 정권에서는 산업·경제 정책도 전무하고 시장 불공정·불투명, 기업·경영 지배권 남용이 일상이라 주가가 오를 수 없었다"며 "이런 것만 개선돼도 (코스피지수가) 최소 200~300포인트는 가뿐히 오른다"고 말했습니다. 이는 대선 국면에 접어들면서 각 후보의 공약과 연관된 섹터를 중심으로 정책 수혜 기대감이 일부 종목에 선반영되고 있는 상황으로 볼 수 있습니다. 특히 대선 결과를 예단할 수 없는만큼 주요 후보들의 공약 일치성 여부가 투자 판단 기준으로 작용할 수 있다는 의견이 제기되고 있습니다. 세부적으로는 건설, 소매유통, 반도체 등이 주요 정책 수혜 대안으로 주목받고 있습니다. 특히 건설업종의 경우 더불어민주당과 국민의힘 모두 주택 공급 확대를 위해 재개발·재건축 규제 완화를 공약으로 내세우고 있어 관련 기대감이 반영되고 있습니다. 이 같은 정책 기대에 힘입어 삼성물산, 현대건설, GS건설, 대우건설, DL이앤씨 등 주요 건설주의 주가가 최근 일제히 상승하며 우상향세를 나타내고 있습니다. 이와 함께 양당 후보 모두 내수 진작을 위한 추경카드를 꺼내든 만큼 그 온기가 소매유통 섹터로 전달될 가능성이 크다는 전망도 나오고 있습니다. 이재명 더불어민주당 대선 후보는 이미 지난 2월 35조원 규모 추가경정예산(추경)을 제안한 바 있고 김문수 국민의힘 후보도 30조원 규모의 민생 추경안 편성 등을 공약한 바 있습니다. 현대백화점을 포함해 이마트, 롯데쇼핑 등에 내수 활성화 기대감이 주가 반등 모멘텀으로 작용하고 있는 가운데 BGF리테일, GS리테일 뿐아니라 기업·소비자간거래(B2C)를 주요 수익 모델로 두고 있는 소매유통업 상장사들이 선택지가 될 수 있다는 의견입니다. 강현기 DB증권 연구원은 "현재 건설과 소매유통업종 밸류에이션은 역사적 최저 주가순자산비율(PBR) 부근에 머물고 있다"며 "이와 같은 상황에서 부양책이 실행돼 부동산 가격을 자극할 경우 건설 업종 주가는 긍정적인 흐름을 나타낼 수 있고 부동산 가격 상승으로 나타나는 파생적 소비 역시 관련주들의 주가 상승을 부추길 수 있다"고 평가했습니다. 여기에 양당 모두 AI산업 육성 및 발전을 주요 공약으로 발표한 만큼 반도체 섹터 역시 대선 이후에도 눈여겨 볼 필요가 있다는 시각이 형성되고 있습니다. 김병연 NH투자증권 연구원은 "대선 결과에 따른 영향보다 정치공백 해소 및 산업 지원책 시행이 긍정적으로 작용할 것"이라며 "산업지원책 중 근로조건 완화에 대한 입장이 상이하나 이외 양당이 공유하는 지원책은 시설투자와 국산화 확대로 연계될 가능성이 크다"고 전망했습니다.


배너


배너