
인더뉴스 이종현 기자ㅣ엔비디아가 텍스트를 3D 그래픽으로 변환하는 생성형 AI 모델 라떼3D(Large-scale Amortized Text-To-Enhanced3D Synthesis, LATTE3D)를 25일 공개했습니다.
라떼3D는 가상 3D 프린터처럼 텍스트 프롬프트를 1초 안에 사물과 동물의 3D 그래픽으로 변환할 수 있으며 표준 렌더링 애플리케이션에 널리 사용되는 포맷으로 제작됐습니다.
모델은 각 텍스트 프롬프트에 따라 몇 가지 다른 3D 모양 옵션을 생성해 크리에이터에게 선택권을 제공하며 선택된 개체는 몇 분 내에 더 높은 품질로 최적화됩니다. 사용자는 해당 그래픽을 그래픽 소프트웨어 애플리케이션이나 엔비디아 옴니버스와 같은 플랫폼으로 전송할 수 있다. 이를 통해 오픈USD(Universal Scene Description, OpenUSD) 기반 3D 워크플로우와 애플리케이션을 사용할 수 있습니다.
라떼3D 훈련에는 엔비디아 A100 텐서 코어(Tensor Core) GPU가 사용됐습니다. 3D 그래픽 외에도 챗GPT(ChatGPT)를 통해 생성된 텍스트 프롬프트를 훈련했다. 이를 통해 사용자가 특정 3D 개체를 설명할 때 제시할 수 있는 다양한 문구를 처리하는 능력을 향상시켰습니다.
라떼3D를 개발한 산자 피들러(Sanja Fidler) 엔비디아 AI 리서치 담당 부사장은 "1년 전만 해도 AI 모델이 이 정도 품질의 3D 비주얼을 생성하는 데 1시간이 걸렸지만 이제는 10~12초 정도면 충분하다."며 "훨씬 더 빠른 속도로 결과를 생성할 수 있게 되면서 업계 전반의 크리에이터들이 거의 실시간으로 텍스트를 3D로 생성할 수 있게 됐다"고 말했습니다.