인더뉴스 노혜정 인턴기자ㅣKT(대표이사 구현모)가 AI(인공지능)원팀 참여기관인 한국전자통신연구원(원장 김명준·ETRI)·KAIST(총장 이광형)·한양대학교(총장 김우승)와 함께 ‘초거대 AI 모델’ 개발 공동 연구 협약을 체결했다고 18일 밝혔습니다.
이번 프로젝트는 각 기관에서 자연어 처리 분야를 대표하는 국내 최고의 연구진으로 구성됐습니다. KT의 오랜 사업 경험과 풍부한 데이터를 활용해 초거대 AI 모델을 개발하게 됩니다.
AI원팀에서는 초거대 AI 모델 확보를 대한민국 AI 경쟁력을 위한 핵심 의제로 설정하고 약 6개월 이상 실무 논의와 협력을 지속해 왔습니다. 이번 협약 체결로 기관별 역할을 정의하고 본격적 프로젝트 수행에 나설 계획입니다.
이에 따라 KT는 다른 참여기관들과 함께 ▲대규모 GPU 인프라 구축 ▲데이터 수집·분석 ▲모델 학습 ▲응용태스크 적용 등 R&D·상용화 관련 업무를 총괄적으로 수행합니다.
KAIST의 경우 머신러닝 알고리즘 최적화와 애플리케이션 파트를 맡게 되며, 한양대는 데이터 정제·필터링 알고리즘 개발, 분산·병렬 알고리즘과 모델 최적화 분야에서 힘을 보탤 예정입니다. 한국전자통신연구원(ETRI)은 대형 모델학습·모델개발 분야에 참여하게 됩니다.
AI 원팀은 2021년 말까지 1차로 초거대 AI의 학습을 완료하고, 2022년 상반기 내 초거대 AI모델을 상용화할 계획입니다. 또한, 대규모 AI 연산 인프라를 구축하고 향후 2000억 파라미터(매개변수) 이상의 모델까지 가능하도록 인프라 규모를 점진적으로 확대할 예정입니다.
또한 AI 원팀 연구진은 학습데이터 필터링 강화, 데이터 간 균형 조정 등을 통해 AI의 편향성을 우선 제거하는데요. 유해 콘텐츠(Toxic Content) 필터링 기술 등 다양한 딥러닝 기반 탐지 기술을 적극 활용해 AI 윤리 이슈도 사전에 차단한다는 계획입니다.
특히 이번에 개발하는 초거대 언어모델은 즉시 상용화가 가능한 ‘과제 지향적(Task-Oriented)’ 형태로 설계됩니다. 이에 초거대 언어모델을 통해 향상된 ▲STT(음성인식) ▲TTS(음성합성) ▲TA(텍스트 분석) ▲대화 등 요소기술은 먼저 KT 기가지니와 AICC 서비스 고도화를 위해 활용됩니다. 나아가 제조·금융·물류·유통 등 AI 원팀 참여기업들의 다양한 사업 분야에 적용할 예정입니다.
향후 AI 원팀은 초거대 AI 모델로 영역을 확장합니다. 이번 연구로 개발되는 모델은 ‘AI 1등 대한민국’이라는 AI 원팀의 취지에 따라 국내외 많은 기업들과 학교, 연구기관들이 AI 원팀의 초거대 모델을 활용해 한국어 언어지능에 대한 손쉽게 접근하고, 다양한 산업분야에 활용하도록 지원할 계획입니다.
이윤근 ETRI 인공지능연구소장은 “ETRI가 보유한 한국어 AI기술인 엑소브레인 원천기술을 보다 발전시켜 초거대 언어모델 프로젝트에 적용해 한국어처리 분야의 AI기술주권 확보에 기여하겠다”고 밝혔습니다.
홍경표 KT 융합기술원장은 “AI 원팀 소속기관이 보유한 기술과 경험을 모두 결집한 초거대 AI모델 개발은 차세대 AI 핵심 원천기술 확보라는 측면에서 의미를 가진다”며 “이번 프로젝트를 통해 대한민국의 국가 AI 산업 경쟁력 강화에 기여하고, 산업전반의 디지털 트랜스포메이션(Digital Transformation, 디지털 전환)과 고객 라이프스타일 변화를 선도하겠다”고 말했습니다.