검색창 열기 인더뉴스 부·울·경

Communication 통신

SKT, A.X 기반 멀티모달·범용 문서 해석 기술 공개

URL복사

Tuesday, July 29, 2025, 15:07:04

'A.X 인코더'와 'A.X 4.0 비전 랭귀지 라이트' 2종 공개

 

인더뉴스 이종현 기자ㅣSK텔레콤[017670]은 LLM(거대언어모델)인 A.X(에이닷 엑스)를 기반으로 한 시각-언어모델(VLM)과 LLM 학습을 위한 범용 문서 해석 기술을 선보였다고 29일 밝혔습니다.
 

SKT가 이날 오픈소스 커뮤니티 허깅페이스에 공개한 모델은 'A.X Encoder(인코더)'와 'A.X 4.0 VL Light(비전 랭귀지 라이트)' 2종입니다. 해당 모델들은 학술 연구나 상업 이용 등에 자유롭게 활용 가능합니다.
 

SKT는 7월 한 달 동안 대규모 학습(CPT)에 기반한 A.X 4.0 모델 2종(표준, 경량)에 이어 프롬 스크래치 방식의 A.X 3.1 모델 2종(표준, 경량)을 순차적으로 선보였습니다. 이번에 LLM을 산업 영역에 보다 폭넓게 활용하기 위한 기술 2종을 추가하면서 총 6개의 모델을 발표했습니다.


SKT는 프롬 스크래치 방식의 LLM 개발을 꾸준히 이어가는 한편, 향후 발표할 A.X 4.0 추론형 모델 등 지속적으로 개발중인 LLM의 활용도와 성능을 높여갈 계획입니다.
 

자연어처리 기술에서 인코더란 입력된 문장을 문맥으로 변환하고 이를 바탕으로 다양한 자연어 처리 작업을 수행하도록 돕는 핵심 구성요소입니다. 문장의 모든 단어들의 상호 관계를 파악, 전체 의미와 맥락을 이해하는 역할을 합니다.
 

SKT는 A.X 모델에 필요한 데이터의 전 과정 처리 프로세스에 적용하기 위해 'A.X 인코더'를 개발했습니다. 'A.X인코더'는 긴 문서도 빠르고 효율적으로 처리 가능해 대규모 LLM 학습에 적합합니다.


'A.X 인코더'는 1억 4900만개(149M)의 매개변수를 바탕으로 작동하며 자연어 이해 성능지표 평균 85.47점을 달성해 글로벌 최고수준(SOTA)급 성능을 확인했습니다. 기존 글로벌 오픈소스 모델을 기반으로 KLUE 팀에서 공개한 'RoBerTa-base'의 성능지표(80.19점)를 상회하는 수준입니다. 'A.X 인코더'는 1만6384개의 토큰까지 처리가 가능해 기존 모델들보다 최대 3배의 추론속도와 2배의 학습속도를 구현할 수 있습니다.

 
'A.X 4.0 VL Light'는 대규모 멀티모달 한국어 데이터셋이 학습된 시각-언어모델(VLM)입니다. 한국어와 관련된 시각정보 및 언어 이해뿐만 아니라 표·그래프 이해, 제조 도면 이해와 같은 기업용 애플리케이션에서 높은 성능을 보입니다. 70억개(7B) 매개변수의 A.X 4.0 Light 모델을 기반으로 개발되어 사용자 시스템에 쉽게 적용 가능하면서도 중형 모델 수준의 성능이 특징입니다.
 

'A.X 4.0 VL Light'는 한국어 시각 벤치마크에서 평균 79.4점을 기록하며 Qwen2.5-VL32B(73.4점)보다 작은 모델 크기에도 불구하고 우수한 성능을 보였습니다. 또한, 한국어 텍스트 벤치마크에서는 평균 60.2점을 기록, 경량모델임에도 국내 모델 중에서 최상위권에 포진했습니다. 한국어 문화 및 맥락적 이해를 평가하기 위해 설계된 멀티모달 벤치마크인 K-Viscuit에서 80.2점을 기록했고 복잡한 문서 구조와 차트·표를 이해하는데 중점을 둔 KoBizDoc 벤치마크에서는 89.8점을 달성했습니다. 각각 Qwen2.5-VL32B 모델보다 뛰어나거나(72.3점) 비슷한(88.8점) 수준입니다.


이러한 성능에도 높은 효율을 자랑하는 'A.X 4.0 VL Light'는 동일한 한국어 데이터입력 시 Qwen2.5-VL32B 대비 약 41% 적은 텍스트 토큰을 사용하여 사용하는 기업들의 비용을 낮추는데 기여할 수 있습니다.


김태윤 SK텔레콤 파운데이션 모델 담당은 “독자적인 기술력 확보가 소버린 AI의 핵심인 만큼, 자체 역량을 높이고 컨소시엄 기업들과의 협업에도 박차를 가해 글로벌 최고 수준의 AI 경쟁력을 확보할 것”이라고 말했습니다.

English(中文·日本語) news is the result of applying Google Translate. <iN THE NEWS> is not responsible for the content of English(中文·日本語) news.

배너

이종현 기자 flopig2001@inthenews.co.kr

배너

삼성전자, ‘AI 포럼 2025’ 개최…글로벌 석학과 미래 AI 전략 논의

삼성전자, ‘AI 포럼 2025’ 개최…글로벌 석학과 미래 AI 전략 논의

2025.09.15 13:55:11

인더뉴스 이종현 기자ㅣ삼성전자[005930]가 15일부터 16일까지 양일간 '삼성 AI 포럼 2025'를 개최한다고 15일 밝혔습니다. 올해로 9회째를 맞는 '삼성 AI 포럼'은 매년 학계와 업계 전문가들이 한자리에 모여 AI 분야의 최신 연구 성과를 공유하고, 향후 연구 방향을 모색하는 기술 교류의 장입니다. 이번 포럼에는 ▲딥러닝 분야의 세계적 석학인 요슈아 벤지오 캐나다 몬트리올대 교수 ▲언어모델과 AI 에이전트 연구의 권위자인 조셉 곤잘레스 UC 버클리 교수 등 글로벌 AI 전문가들이 기조 강연에 나섭니다. 전영현 삼성전자 대표이사 부회장은 개회사를 통해 "삼성전자는 다양한 업무영역에 AI 기술을 적용해 언제 어디서나 쉽고 빠르게 AI를 활용할 수 있는 기반 기술을 개발하고 있다"라며 "올해 삼성 AI 포럼은 산업계와 학계를 대표하는 전문가들을 모시고 AI가 사회와 산업을 어떻게 변화시키는지 논의하고 함께 지혜를 나누는 의미 있는 시간이 될 것"이라고 말했습니다. 삼성전자 DS부문이 주관하는 1일차 포럼은 경기도 용인에 위치한 삼성전자 The UniverSE에서 진행됐습니다. 이날 포럼에는 사전 초청자 200여명이 참석해 '반도체 산업의 버티컬 AI 전략과 비전'을 주제로 논의했습니다. 기조 강연에 나선 벤지오 캐나다 몬트리올대 교수는 기존 AI 모델에서 발생할 수 있는 '인간 통제 회피', '악의적 사용' 등 잠재적 위험 요소를 설명하고 안전장치 역할을 할 새로운 모델 '과학자 AI'를 소개했습니다. 그는 "과학자 AI 모델은 인간을 모방하거나 기쁘게 하려는 의도 없이 검증된 사실과 데이터를 근거로 정직한 답변을 제공한다"라며 "안전성과 과학적 발견의 가속화 측면에서 과학자 AI 기술이 중요하다"라고 강조했습니다. 반도체 설계 자동화 회사인 지멘스 EDA의 아밋 굽타 부사장은 'AI 기반 전자 설계의 미래'를 주제로 강연을 진행했습니다. 그는 "반도체 전자 설계 자동화 도구에 AI를 통합하는 것이 무엇보다 중요하다"라며 "특히 AI의 잠재력을 완전하게 활용하기 위해서는 전체 워크플로우에서 작동하는 엔드투엔드(End-to-End) 시스템이 필요하다"라고 설명했습니다. 송용호 삼성전자 DS부문 AI센터장 부사장과 강석형 포항공대(POSTECH) 교수, 문일철 한국과학기술원(KAIST) 교수가 진행한 기술 세션에서는 반도체 설계 및 제조 분야의 최신 AI 응용 연구 성과와 미래 전망이 논의됐습니다. 송 부사장은 "AI는 칩 설계나 소프트웨어 개발에 필수적인 도구가 됐으며 제조 분야에서도 제조 복잡성의 기술적 한계를 극복하는 데 AI가 크게 기여할 것"이라고 강조했습니다. 한편 이날 진행된 '삼성 AI 연구자상' 시상에는 ▲니콜라스 파프르노 캐나다 토론토대 교수 ▲로즈 유 UC 샌디에이고 교수 ▲르렐 핀토 뉴욕대 교수 등 3명이 선정됐으며 수상자들의 현장 강연도 진행됐습니다. 16일에 진행하는 2일차 포럼은 삼성전자 DX부문이 주관하며 '생성형 AI를 넘어, 에이전틱 AI로'를 주제로 온라인 운영됩니다. 전경훈 삼성전자 DX부문 최고기술책임자(CTO) 겸 삼성리서치장 사장은 "생성형 AI는 이미 일상과 산업 전반에서 필수 도구로 자리 잡았다"라며 "삼성전자는 본격화되는 에이전틱 AI 시대에 맞춰 사용자에게 실질적으로 도움이 되는 AI 기술을 준비할 것"이라고 말했습니다. 둘째 날 기조 강연에는 ▲언어모델과 AI 에이전트 연구의 권위자인 조셉 곤잘레스 UC 버클리 교수 ▲AI의 자율적 계획 수립과 의사결정 분야 전문가 수바라오 캄밤파티 애리조나 주립대 교수 ▲확산 방식 언어모델(DLM) 기술을 공개한 스타트업 인셉션의 공동창립자 겸 스탠퍼드대 교수 스테파노 에르몬 등이 나섭니다. UC 버클리 곤잘레스 교수는 거대언어모델(LLM) 기반의 에이전트 능력 고도화 연구 사례를 발표합니다. 또 사용자와 에이전트 간 상호작용 사이에 발생하는 공백 시간을 활용해 에이전트가 추론·학습·계획을 수행하는 '슬립타임 컴퓨트' 패러다임도 소개합니다. 캄밤파티 애리조나 주립대 교수는 기존 거대언어모델의 한계를 보완하기 위한 '대규모 추론 모델(LRM)' 연구 결과를 공유합니다. 그는 언어 모델에서 해결돼야 할 주요 과제로 ▲정확성 보장 ▲상황 적응형 계산 ▲중간 추론 해석 제공 등을 제시할 예정입니다. 에르몬 스탠퍼드대 교수는 이미지·영상·오디오 생성에 활용되던 확산 모델을 언어에 적용한 '확산 언어 모델(DLM)'을 발표합니다. 이 기술은 순차적 텍스트 생성 방식의 한계를 극복하고 보다 효율적인 언어 모델의 패러다임을 제시할 전망입니다. 기술 세션에서는 삼성리서치 연구원들이 ▲카메라 색온도 자동 조절 AI 기술 ▲지식 증류를 활용한 효율적인 거대언어모델 학습 기법과 적용 사례 ▲스마트폰, TV 등 전자제품에 거대언어모델을 탑재하기 위한 온디바이스 기술 ▲실제 목소리로 더빙 음성을 자동 생성하는 AI 기술 등 최신 연구개발 성과를 공유합니다. 또 ▲멀티 에이전트 시스템으로 다양한 보고서를 분석하고 자동 생성하는 '딥 다이브' 기술 ▲다양한 형식의 문서를 거대언어모델이 이해할 수 있는 구조로 자동 변환시켜 주는 '문서 AI' 기술 ▲제품에 탑재되는 생성형 AI 모델들의 개발 주기를 단축하는 '온디바이스 AI 스튜디오' 등 사내 생산성 향상을 위한 기술과 적용 사례도 공개됩니다. 2일차 '삼성 AI 포럼 2025'는 삼성전자 개발자 유튜브 채널에서 시청 가능합니다.




배너