AI 합성 데이터란 VIDEO: Are You Still Using Real Data to Train Your AI?
아직도 실제 데이터를 사용하여 AI를 교육하고 계십니까?
Nvidia의 Rev Lebaredian은 합성 데이터가 AI 시스템을 더 낫게 하고 어쩌면 더 윤리적으로 만들 수 있다고 말합니다.
직관에 어긋날 수도 있다. 그러나 일부는 자율주행차나 창고 로봇과 같은 지저분한 실제 환경에서 작동해야 하는 AI 시스템을 훈련시키는 열쇠가 사실 실제 데이터가 아니라고 주장한다. 대신, 어떤 사람들은 인공지능의 진정한 잠재력을 열어줄 것이 바로 합성 데이터라고 말한다.
수집된 데이터 대신 합성 데이터가 생성되는데, 컨설팅 업체인 가트너는 AI 시스템 교육에 사용되는 데이터의 60%가 합성 데이터가 될 것으로 추정했다. 그러나 합성 데이터가 실제 데이터를 정확하게 미러링하고 실제 상황에 맞게 AI 시스템을 준비할 수 있는지에 대한 의문이 남아있기 때문에 이것의 사용은 논란의 여지가 있다.
Nvidia는 합성 데이터 트렌드를 수용하고 있으며, 젊은 산업에서 선두 주자가 되기 위해 노력하고 있다. 지난 11월 엔비디아 창업자 겸 CEO인 옌센황은 엔비디아가 "AI 네트워크 훈련을 위한 근거 자료로 합성 데이터를 생성하는 엔진"이라고 표현한 옴니버스 복제기 출시를 발표했다. IEEE Spectrum은 Nvidia의 시뮬레이션 기술 및 Omniverse 엔지니어링 부사장인 Rev Lebaredian과 통화하여 이것이 무엇을 의미하는지 알아냈다.
Omniverse Replicator는 "신경망을 훈련시키기 위해 물리적으로 시뮬레이션된 합성 데이터를 생성하는 강력한 합성 데이터 생성 엔진"으로 설명된다. 그게 무슨 뜻인지, 특히 "신체 시뮬레이션"이 무슨 뜻인지 설명해주실 수 있나요?
* Omniverse Replicator
NVIDIA CEO 젠슨 황은 다양한 소식과 데모, 광범위한 이니셔티브를 비롯해 메타버스 혁신기술인 NVIDIA Omniverse Avatar와 Omniverse Replicator를 선보였다. 또한 3D 워크플로우를 위한 NVIDIA의 가상 세계 시뮬레이션과 협업 플랫폼인 Omniverse가 NVIDIA의 기술을 어떻게 통합하는지 설명하고, 화상 회의용 플랫폼 Project Maxine을 Omniverse Avatar와 혼용하는 방법을 소개, 고객 지원용 Project Tokkio를 시연했다.
황기철 콘페이퍼 에디터 인플루언서
Ki Chul Hwang Conpaper editor influencer
(Source:
https://spectrum.ieee.org/synthetic-data-ai)
NVIDIA Omniverse Replicator For DRIVE Sim – Synthetic Data Generation