새로운 Al Generative Art 살펴보기

알 제너레이티브 아트 인간과 자율 시스템 간의 협력을 기반으로 하는 대부분의 경우 시각적인 예술 유형입니다. "자율 시스템"은 다음과 같이 정의됩니다. 인공 지능 프로그래머의 개입 없이 복잡한 작업을 수행할 수 있는 소프트웨어, 알고리즘 또는 모델.

에 의해 만들어진 기괴한 이미지의 병치에서 달-E 미니 ~로 NFT 시장에서 AI 알고리즘으로 생성된 이미지는 점점 더 주류 상상 속으로 진입하고 있습니다. 실제로 분석할 가치가 있는 주제에 대한 두 가지 중요한 프로젝트는 다음과 같습니다. 중도 과 달-이 2.

물론 이 소식은 트위터에도 퍼졌습니다. 무엇보다도 그것에 대해 논평한 사람은 Charles Hoskinson입니다. 그는 다음과 같이 썼습니다.

AI 생성 예술. 이 그림을 단 몇 분 만에 만들 수 있었습니다. 이 기술이 3년 후에 얼마나 놀라운 기술이 될지 상상할 수 없습니다 pic.twitter.com/jOTOCZj7ki
- Charles Hoskinson (@ IOHK_Charles) ２０２４년 ２월 ２７일

Al Generative Art: 초기 실험 및 기능

Generative Art가 무엇인지 이해했다면 다음과 같은 기본 원칙 중 하나를 강조하는 것이 중요합니다. 무작위성. Generative Art의 기본 속성입니다.

실제로 소프트웨어 유형에 따라 자율 시스템은 생성 명령이 실행될 때마다 항상 다르고 고유한 결과를 처리하거나 사용자 입력에 응답하여 다양한 수의 결과를 반환할 수 있습니다.

Generative Art의 첫 번째 실험은 1960년대로 거슬러 올라갑니다. 해롤드 코헨 그의 아론 프로그램. Cohen은 처음에 독립 실행형 소프트웨어를 사용하여 팝 아트 실크스크린에서 영감을 받은 추상 작품을 생성했습니다. Cohen의 작품은 현재 런던의 Tate Gallery에 전시되어 있습니다.

Generative Art의 또 다른 속성이지만 점점 더 특권이 없는 속성은 프로그래머가 제공하고 소프트웨어 코드 내에서 구현되는 패턴 또는 추상 요소의 반복입니다.

또한 텍스트-이미지 연관에서 작동하는 점점 더 복잡해지는 신경망의 개발로 점점 더 사실적이고 정확한 이미지를 생성할 수 있는 생성 모델의 개발이 가능해졌습니다. 이 Generative Art 범주의 가장 잘 알려진 예는 다음과 같습니다. 달-이.

Dall-E는 다중 모드 신경망을 기반으로 합니다. GPT-3 딥 러닝 모델 OpenAI, 최근에 개발한 동일한 회사 ChatGPT, 챗봇은 2022년 XNUMX월에 출시되었으며 "감독" 및 강화 학습 기술.

Dall-E로 돌아가서 이 시스템이 텍스트 설명에서 이미지를 생성할 수 있음을 알 수 있습니다. "즉각적인," 텍스트-이미지 쌍의 데이터 세트를 기반으로 합니다.

2021년 3월 대중에게 공개되고 해당 분야의 소수 전문가의 특권으로 남아 있던 Dall-E의 첫 번째 버전은 이러한 유형의 생성 모델 측면에서 GPT의 혁신을 능가하는 진정한 혁명을 나타냈습니다. XNUMX 그 자체.

또한 중요한 점은 Dall-E가 처리한 결과의 정확성이 다른 OpenAI 솔루션의 완벽한 범위로 입증되었다는 사실입니다. 쥐다 (대조 언어-이미지 사전 훈련).

인터넷에서 찾을 수 있는 캡션과 같은 텍스트-이미지 연결을 기반으로 훈련된 이미지 분류 및 순위 지정 신경망입니다. 프롬프트당 사용자에게 제안되는 결과 수를 32개로 줄이는 CLIP의 개입 덕분에 Dall-E는 대부분의 경우 만족스러운 이미지를 반환하는 것으로 나타났습니다.

중간 여정: 디자인, 인적 인프라 및 인공 지능

예상대로, 중도 떠오르는 Al Generative Art 개념의 일부인 중요한 프로젝트입니다. 구체적으로 Midjourney는 새로운 사고 방식을 탐구하고 인류의 상상력을 확장하는 독립 연구소입니다.

사용법은 간단합니다. 먼저 계정을 생성해야 합니다. 디스코드, Midjourney가 그 중 하나인 다양한 커뮤니티를 호스팅하는 플랫폼입니다. 애플리케이션 내에는 토론에 적극적으로 참여하거나 참여하지 않을 수 있는 다양한 채팅방이 있습니다.

인공 지능을 처음 사용하려면 다음 단계로 이동해야 합니다. "초보자" 채널, 여기서 25개의 무료 렌더링 사용할 수 있습니다.

하나의 렌더링은 동일한 텍스트 입력에서 생성된 XNUMX개의 다른 변형 생성에 해당합니다.

따라서 25개의 렌더링은 Midjourney 봇이 수행한 25개의 처리 작업을 나타냅니다. 결과적으로 이미지를 생성하려면 "프롬프트"라는 텍스트 메시지를 통해 Midjourney 봇과 상호 작용해야 합니다. 여기에는 사용자가 염두에 두고 있는 이미지를 설명하는 키워드가 있습니다.

원하는 만큼 세부 정보를 추가할 수 있으며 중요한 것은 키워드를 쉼표로 구분하는 것입니다. 렌더링이 완료되면 컴퓨터는 선택할 설명에 따라 XNUMX개의 다른 이미지를 반환합니다.

또한 프로그램이 렌더링을 마치면 이미지를 기반으로 기본 설정을 전달할 수 있으며 원하는 경우 XNUMX개 버전을 다시 생성할 수 있습니다.

DALL-E 2: 예술 작품을 위한 새로운 AI 시스템

Midjourney 외에도 DALL-E 2는 자연어 설명에서 사실적인 이미지와 예술 작품을 만들 수 있는 새로운 AI 시스템입니다. 뿐만 아니라 DALL-E 2는 개념, 속성 및 스타일도 결합할 수 있습니다.

새로운 AI 시스템의 강점은 원본 캔버스에 있는 것 이상으로 이미지를 확장하여 새로운 확장 구성. 또한 자연어 캡션에서 기존 이미지를 사실적으로 변경할 수 있으며 그림자, 반사 및 질감을 고려한 요소를 추가 및 제거할 수 있습니다.

DALL-E 2의 기능에는 이미지를 찍고 원본에서 영감을 받은 여러 변형을 만드는 것도 포함됩니다. DALL-E 2는 이미지와 이미지를 설명하는 데 사용되는 텍스트 간의 관계를 학습했습니다.

라는 프로세스를 사용합니다. "확산," 임의의 점 패턴으로 시작하여 해당 이미지의 특정 측면을 인식할 때 해당 패턴을 이미지로 점차 변경합니다.

그래서 OpenAI가 2021년 2월에 DALL-E를 도입한 후, 이제 최신 시스템인 DALL-E XNUMX는 해상도가 XNUMX배 더 현실적이고 정확한 이미지를 생성합니다.

DALL-E 2는 연구 프로젝트로 시작하여 현재 베타 버전. 시스템이 개발하고 지속적으로 개선하고 있는 보안 완화에는 폭력, 증오 또는 성인 이미지를 생성하는 시스템의 기능 제한 및 학습 기반 단계적 배포가 포함됩니다.

출처: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/