
인더뉴스 권용희 기자ㅣ알리바바 클라우드는 자체 개발한 거대언어모델(LLM) '통이치엔원'의 새로운 버전인 '큐원-72B'와 '큐원 1.8B'를 오픈소스로 공개했다고 5일 밝혔습니다.
알리바바 클라우드는 자사AI 모델 커뮤니티 '모델스코프'와 협업 AI 플랫폼 '허깅페이스'에서 해당 모델을 공개했습니다.
'큐원-72B'은 3조개 이상 토큰으로 사전 학습됐습니다. 특정 역할이나 페르소나를 선택해 맥락에 맞는 응답을 생성하는 능력을 드러내는 언어 스타일 이전 기능을 선보입니다. 해당 기능은 개인화된 챗봇과 같은 AI 애플리케이션에서 유용하게 사용될 수 있습니다.
엣지에서 실행할 수 있는 18억 개의 파라미터로 구성된 LLM '큐원-1.8B'도 오픈소스로 공개했습니다. 경량 버전인 ‘큐원-1.8B’는 컴퓨터 리소스가 제한된 휴대폰과 같은 엔드 장치에서 추론을 돕습니다. 해당 모델은 컴퓨팅 리소스 요구사항이 적어 비용을 효율화시킬 수 있다는 특징을 갖췄습니다.
큐원-72B 모델을 연구 목적으로 활용 시 코드, 모델 가중치 및 도큐멘테이션(설명서)를 무료로 활용할 수 있습니다. 상업적 용도의 경우, 월간 활성 사용자 수가 1억 명 미만인 기업에 한해서 무료로 사용할 수 있습니다. 큐원-1.8B는 현재 연구 목적으로만 활용 가능합니다.
사전 학습된 오디오 이해 모델 '큐원 오디오'와 대화형으로 미세 조정된 버전인 '큐원-오디오-챗'도 추가로 공개했습니다. '큐원-오디오'는 사람의 음성, 자연음, 음악 등 다양한 형식의 텍스트와 오디오 투입 자료를 해석해 텍스트로 출력할 수 있습니다.
징런 저우 알리바바 클라우드 CTO는 "알리바바 클라우드는 가장 개방적인 클라우드로서 모든 사람이 생성형 AI 역량을 활용할 수 있도록 하는 것을 목표로 한다"라면서 "기술을 공유하고 파트너들과 함께 오픈소스 커뮤니티의 발전을 촉진해 나갈 것이다"라고 말했습니다.