검색창 열기 인더뉴스 부·울·경

Tech 테크

엔비디아, 구글과 AI ‘젬마’ 성능 업그레이드

URL복사

Friday, February 23, 2024, 09:02:34

엔비디아 AI 플랫폼 전반에서 텐서RT-LLM으로 성능 가속화
미세조정, 프로덕션 애플리케이션 배포 가능
맞춤형 챗봇 제공하는 '챗 위드 RTX'에서도 젬마 지원 예정

 

인더뉴스 이종현 기자ㅣ엔비디아가 구글과 협력해 모든 엔비디아 AI 플랫폼에서 AI 모델 '젬마(Gemma)'를 위한 최적화를 실시했다고 23일 밝혔습니다.

 

젬마는 구글의 새로운 경량 오픈 언어 모델입니다. 멀티모달 모델인 제미나이(Gemini) 개발에 사용된 동일한 연구와 기술을 기반으로 구축됐으며 엔비디아는 구글과 협력해 엔비디아 텐서RT-LLM(TensorRT-LLM)으로 젬마의 성능을 가속화했습니다. 텐서RT-LLM은 데이터센터, 클라우드 혹은 엔비디아 RTX GPU가 탑재된 PC에서 대규모 언어 모델(LLM) 추론을 최적화하는 오픈 소스 라이브러리입니다.

 

개발자들은 클라우드 상의 엔비디아 GPU에서도 젬마를 실행할 수 있습니다. 여기에는 H100 텐서 코어(H100 Tensor Core) GPU를 기반으로 하는 구글 클라우드 A3인스턴스(A3 instances)가 포함되며 초당 4.8테라바이트의 141GB HBM3e 메모리를 갖춘 엔비디아 H200 텐서 코어 GPU도 합류할 예정입니다. 구글은 올해 안에 이를 배포할 예정입니다. 

 

또한 엔비디아 기술 데모인 챗 위드 RTX에 곧 젬마가 추가로 지원될 예정입니다. 챗 위드 RTX는 검색 증강 생성(Retrieval-augmented generation, RAG)과 텐서RT-LLM 소프트웨어를 사용해 로컬 RTX 기반 윈도우 PC에서 사용자에게 생성형 AI 기능을 제공하는 기술입니다.

 

챗 위드 RTX는 로컬에서 모델이 실행되므로 결과가 빠르게 제공되며 사용자 데이터가 디바이스에 유지됩니다. 클라우드 기반 LLM 서비스에 대신 챗 위드 RTX를 사용하면 민감한 데이터를 제3자와 공유하거나 인터넷에 연결할 필요 없이 로컬 PC에서 처리할 수 있습니다.

 

엔비디아는 지난 21일 미국 뉴욕증시 마감 후 실적발표를 통해 2023 회계연도 4분기(지난해 10월~올 1월)기준 매출 221억300만달러(약 28조원), 주당순이익(EPS) 5.16달러를 기록했다고 밝혔습니다.

English(中文·日本語) news is the result of applying Google Translate. <iN THE NEWS> is not responsible for the content of English(中文·日本語) news.

배너

이종현 기자 flopig2001@inthenews.co.kr

배너

통신3사, 추석 연휴 기간 통신 품질 ‘집중 관리’ 돌입

통신3사, 추석 연휴 기간 통신 품질 ‘집중 관리’ 돌입

2025.10.02 14:28:32

인더뉴스 이종현 기자ㅣ추석 연휴가 다가오는 가운데 이동통신 3사가 추석 연휴 특별 소통 대책을 마련하고 이동통신 품질 집중 관리에 들어갑니다. 최근 연이은 해킹 사고로 보안에 대한 국민적 관심이 높은 상황인 만큼 3사는 신뢰 회복을 위해 트래픽과 보안 관리에 더욱 힘쓸 예정입니다. SK텔레콤[017670]은 추석 연휴 전날인 2일부터 마지막 날인 9일까지 특별 소통 상황실을 운영하고 SK브로드밴드, SK오앤에스, 홈앤서비스 등 자회사와 SK AX 등 관계사와 협력해 대응 체계를 강화할 예정이라고 밝혔습니다. 대응 인력도 강화해 연휴 기간동안 총 1만2000여명을 투입해 전국 통신망을 24시간 모니터링합니다. SKT는 추석 당일인 6일에는 데이터 트래픽이 평시 대비 약 19% 증가해 연휴 기간 중 최대치를 기록할 것으로 예상하고 있습니다. 해외여행객들이 이용하는 국제 로밍 트래픽도 추석 연휴 기간 평시 대비 최대 30% 증가할 것으로 예상됩니다. 이에 SKT는 전국 주요 기차역, 버스 터미널, 휴게소, 공항, 주요 관광지, 숙박시설, 번화가, 성묘지 등을 중심으로 5G 및 LTE 기지국 용량 증설을 완료했습니다. 또 국지적 데이터 트래픽 증가가 예상되는 고속도로 상습 정체구간의 이동통신 품질 점검은 물론 고객들이 귀성·귀경길에 자주 이용하는 에이닷 등의 서비스 관리에도 집중할 예정입니다. 보안 측면에서도 통합보안관제센터를 중심으로 디도스 공격·해킹 시도 등을 실시간 모니터링하고, 상황 발생 시 즉각 대응할 수 있도록 네트워크를 24시간 집중 분석할 방침입니다. KT[030200]는 추석연휴 기간 네트워크 집중 관제 체계를 가동하고 4000여명의 네트워크 전문가를 전국에 배치한다고 밝혔습니다. 과천 네트워크 관제센터를 중심으로 종합상황실을 운영해 유무선 통신 서비스 이상 유무를 24시간 상시 모니터링할 예정입니다. 또 교통 정체가 예상되는 주요 고속도로, 휴게소 및 인파 밀집 지역인 터미널, KTX/SRT 역사, 공항, 쇼핑몰 등 전국 총 665곳을 네트워크 집중관리 지역으로 선정하고, 이동통신 기지국 증설 및 서비스 품질 점검을 완료했습니다. KT는 'AI 클린메시징 시스템'을 통해 스팸을 실시간으로 대응하고 차단할 방침입니다. 또한, 악성파일 분석 특화 AI모델 'AI 디도스 스캐너'로 통신망 디도스(DDoS) 공격에 대비하겠다고도 밝혔습니다. LG유플러스[032640]는 서울 마곡사옥에 종합상황실을 열고 24시간 집중 모니터링에 돌입합니다. 또 전국 고속도로, 휴게소, KTX/SRT 역사, 버스터미널, 공항 등에 있는 5G 및 LTE 기지국의 사전 점검 등을 통해 품질을 측정하고 이를 기반으로 최적화 작업도 진행한다고 밝혔습니다. 아울러 명절 통화량 및 데이터 사용량 추이를 분석해 주요 고속도로 요금소 및 휴게소 상습 정체구간등 중요 거점지역에 현장요원을 배치하고 상시 출동 준비태세를 갖추는 등 돌발 상황에 대비할 예정입니다.




배너