Nvidia의 새로운 Text-To-3D가 엔지니어링 및 제품 디자인에 의미하는 것

tl; dr: 제너레이티브 AI는 놀라운 속도로 진화하고 있습니다. Nvidia의 최신 알고리즘은 불과 3개월 전에 게시된 프로젝트보다 두 배 빠른 속도로 텍스트를 2D 메시로 변환합니다. 이것은 기술적 능력이 이제 이미 우리가 그들과 함께 일하는 능력을 능가하고 있음을 의미합니다.

지난 주 종이 Nvidia 과학자들은 생성 AI 공간이 진화하는 기하급수적인 속도를 보여주었습니다. 특히 지난 9개월 동안 눈에 띄는 이 폭발적인 활동은 제품 디자인, 엔지니어링 및 생산뿐만 아니라 삶의 모든 부분에 영향을 미칠 것입니다. 변화는 아이디어가 전달되는 방식의 구조적 제약에서 업계를 풀고 더 빠른 혁신 주기를 지원하며 궁극적으로 지속 가능성 약속을 이행할 수 있게 합니다.

Nvidia Research의 Magic 3D 알고리즘에서 메시를 생성하는 데 사용된 프롬프트와 함께 예제 메시.

Nvidia Deep Imagination 연구

AI가 우리가 일하는 방식을 근본적으로 혁신할 것이라는 말을 수년 동안 들었지만 창조적인 부문이 첫 번째 희생자가 될 것이라고 예상한 사람은 거의 없었습니다. 3년 GPT-2020의 인간과 유사한 텍스트 생성기의 등장으로 가능성이 더욱 선명해졌습니다. 그 이후로 DALL-E(텍스트에서 이미지로), Whisper(음성 인식), 가장 최근의 Stable Diffusion(텍스트에서 이미지로)은 음성 및 시각적 AI 도구의 기능을 향상시켰을 뿐만 아니라 이를 사용하는 데 필요한 리소스를 줄였습니다(GPT-175의 3억 매개변수에서 안정적인 확산의 경우 900억으로).

Stable Diffusion의 크기는 5GB 미만의 디스크 공간을 의미하며 모든 노트북에서 실행할 수 있습니다. 뿐만 아니라; OpenAI(주로 Microsoft에서 자금을 지원하고 GPT-3, DALL-E 및 Whisper를 게시함)와 달리 Stable Diffusion은 오픈 소스이므로 다른 사람들이 훨씬 더 쉽게 학습을 기반으로 구축할 수 있습니다. 즉, 우리는 혁신 주기의 시작일 뿐임을 의미합니다. 현재 Nvidia의 논문에서 볼 수 있듯이 앞으로 더 많은 일이 있을 것입니다.

Stable Diffusion의 후원자(stability.ai)는 새로운 방향으로 탐색하는 다른 팀에 기술 및 재정적 보조금을 제공함으로써 이러한 추세를 더욱 강화하고 있습니다. 또한 수많은 프로젝트를 통해 더욱 광범위한 사용자가 도구를 사용할 수 있습니다. 그중에는 오픈 소스 디자인 도구인 Blender용 플러그인과 Adobe의 독점 Photoshop에 해당하는 플러그인이 있습니다. 도구에 대한 전체 API 액세스는 대규모 벤처 캐피탈 달러로 자금을 조달하고 있습니다. 즉, 수십만 명의 데이터 엔지니어뿐만 아니라 수억 명의 소프트웨어 개발자가 이제 이러한 알고리즘에 대한 자체 도구를 만들게 됩니다.

음성, 이미지 및 텍스트는 이러한 기술에 의해 중단되는 첫 번째 수직 분야에 속합니다. 그러나 3D는 그리 멀지 않습니다. 틈새 생성 예술 외에도 만화는 분명한 첫 번째 적용 지점입니다. Stable Diffusion을 기반으로 하는 포켓몬 생성기가 이미 있습니다. 다음은 시각 효과와 영화입니다. 그러나 많은 다른 부문이 중단될 가능성이 높습니다. 그 중 Interiorai.com이 책임을 주도하는 인테리어 디자인이 있습니다.

이 모든 흥분 속에서 설계 및 엔지니어링에 혁신을 적용하는 것은 뒷전 생각처럼 느껴집니다. 그러나 궁극적으로 가장 큰 영향을 받는 영역이 될 가능성이 높습니다. 물론 초기 문제가 있습니다. 하나는 Stable Diffusion과 동포가 아직 정확하지 않다는 것입니다. 이는 만화에서는 문제가 되지 않지만 텍스트를 산업 환경에서 사용되는 완전한 3D 형상으로 변환하려는 모든 시도에 있어 주요 과제입니다. 그것은 초기 관심을 가진 영역입니다(Bits101이라는 프로젝트가 2015년 이스라엘에서 시작되었습니다). 이것은 업계의 성배일 수 있지만 해결하기 훨씬 쉬운 중간 과제가 많이 있습니다. 여기에는 개선된 개체 인식(Yolo 알고리즘이 이미 큰 효과를 발휘하고 있음)이 포함되며, 이를 통해 인용 및 주석이 개선되어 품질이 향상되고 실수가 줄어듭니다. 플러그인은 또한 Generative AI를 사용하여 기본 디자인(Primitives)을 개발하는 것을 더 쉽게 만들 수 있어야 하며, 그런 다음 요구 사항에 따라 허용 오차를 개선하기 위해 디자인 도구에서 추가로 편집할 수 있습니다. 이는 유한 요소 분석을 사용하여 동일한 작업을 수행한 Altair의 Inspire에서 이미 사용된 접근 방식입니다. 이러한 프리미티브는 주석이 달린 모델의 합성 데이터베이스 역할도 할 수 있으며 3D CAD 업계에서는 이러한 모델이 부족합니다. Physna의 CEO 겸 창립자 기사에서 이것을 지적합니다. 이러한 새로운 방법을 사용하여 상세한 3D 설계를 생성하려는 자체 시도를 자세히 설명합니다. 또한 이러한 알고리즘을 구동하기 위해 합성 데이터를 사용하는 데 따른 많은 함정을 강조합니다. 3D 도면에서 2D 설계를 생성하는 것은 지능형 CAM과 마찬가지로 또 다른 잠재적 응용 분야입니다. 최상의 가공 전략을 결정하기 위한 공구 마모 라이브러리.

이러한 과제는 자체적으로 해결하는 것이 중요하고 수익성이 있습니다. 그러나 그들의 주된 영향은 궁극적으로 의도를 전달하기 위한 3D 디자인에 대한 의존도를 줄여 아이디어에서 디자인까지의 경로를 발전시키는 데 도움이 될 것입니다. 2D든 3D든 디자인은 고객의 요구 사항을 최종 제품으로 변환하는 주요 수단으로 사용되었습니다. 이러한 설계는 가치 있는 고객 통찰력, 제조 제한 사항 및 회사 목표가 모두 저장되고 얽힐 수 없지만 단독으로 식별되는 블랙 박스 역할을 하기 때문에 업계를 제약합니다. 이것은 무언가가 변경될 때 단순히 디자인을 조정하는 것이 불가능하다는 것을 의미합니다. 이것이 3D 프린팅과 같은 제조 혁신이 채택하는 데 오랜 시간이 걸리고 단기 투자자들을 지속적으로 실망시키는 이유입니다. 항공기를 구성하는 구성 요소는 20년 이상의 생산 수명에도 불구하고 설계되는 순간부터 "설정"됩니다. 혁신의 범위는 거의 없습니다. 이들은 차세대 출시를 기다려야 합니다.

단일 제약 조건을 변경하고 Stable Diffusion과 같은 알고리즘이 설계 및 생산 매개변수를 재구성하도록 허용하면 새로운 혁신의 채택 속도가 크게 빨라지고 더 가볍고 성능이 우수한 제품을 더 빠르게 만들 수 있습니다. Formula 1 또는 시스템 설계에서와 마찬가지로 미래의 엔지니어는 제품의 목적과 한계가 무엇인지 데이터 소스를 참조하여 단어로 표현할 수 있는 제약 관리자 역할을 할 것입니다.

이러한 방식으로 신규 및 기존 제품에 대한 엔지니어링 프로세스의 속도를 높이지 않고는 우리가 스스로 설정해야 하는 야심찬 지속 가능성 목표를 달성할 수단이 거의 없습니다. 이를 위해서는 먼저 디자인을 넘어 의사소통에 사용할 수 있는 언어에 동의해야 합니다. 이 새로운 시맨틱 모델은 위에서 설명한 혁신의 분명한 차이입니다. 많은 회사들이 이미 이를 실험하기 시작했습니다. 예를 들면 다음과 같습니다. 필드 개념을 가진 nTopology. 그러나 시맨틱 모델이 공급할 알고리즘과 달리 변화의 속도는 느립니다. Nvidia의 새로운 알고리즘은 알려진 바에 따르면 두 배 이상 빠릅니다. 드림퓨전, 게시된 지 2개월 미만입니다. 제품 및 엔지니어링 회사는 생성적 AI의 폭발적인 증가가 지닌 가능성을 최대한 활용하기 위해 새롭고 미래 지향적인 방식으로 아이디어를 포착하기 위해 노력해야 합니다. 알고리즘의 변화 속도는 모스 법칙이 도구가 디지털화되는 모든 곳에 적용된다는 것을 다시 한 번 보여주었습니다. 과제의 시급성에도 불구하고 이러한 변화를 수용하고 잠재력을 발휘할 수 있는 새로운 커뮤니케이션 방법을 배포하지 못하는 인간의 무능력이 문제입니다.

출처: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/