GPT-4에 대해 알아야 할 사항 Generative AI Chat의 후속 제품 GPT 및 AI 윤리 및 AI 법률 고려 사항

주요 헤드라인을 장식한 블록버스터 영화의 속편 개봉에 대한 평소 반응은 어떻습니까?

어떤 사람들은 속편을 보고 원작보다 못하더라도 좋다는 평가를 내립니다. 다른 사람들은 매우 높은 기대치를 가지고 있을 수 있으며 최신 영화를 본 후 황홀하게 울부짖을 것은 없지만 합리적으로 좋다고 선언합니다. 최신 영화가 무엇을 포함하든 간에 의심할 여지 없이 크게 실망하고 첫 번째 영화가 부끄럽지 않게 속편보다 앞서 있었다고 간단히 선언할 일부가 있습니다.

같은 범위의 반응과 감정이 4년 3.14월 14일 또는 2023인 Pi Day에 AI 제조업체 OpenAI가 어제 발표한 GPT-4에서 전면에 나타났습니다. 먹는 날, GPT-XNUMX 공개는 많은 언론의 관심과 소셜 미디어에서 많은 수다를 얻었습니다.

여기서는 GPT-4의 주요 기능과 기능을 이전 버전인 ChatGPT(제 비유에서 초기 "블록버스터")와 비교하면서 설명하겠습니다. 또한 GPT-4 및 ChatGPT의 경우를 포함하여 아마도 특히 GPT-XNUMX 및 ChatGPT의 경우 의심할 여지없이 광범위한 사용과 열광적인 미디어 및 현재와 ​​미래의 AI.

간단히 말해서 영화의 속편과 마찬가지로 GPT-4는 어떤 면에서 ChatGPT보다 낫습니다. 여기에서 간단히). 다소 의아하다는 반응. 속편은 많은 사람들이 예상했던 슬램덩크가 아닙니다. 그보다 더 미묘한 차이가 있음이 밝혀졌습니다. 우리 모두가 살고 있는 현실 세계인 것 같습니다.

아마도 OpenAI의 CEO인 Sam Altman은 GPT-14 출시에 대해 2023년 4월 XNUMX일 트윗에서 가장 잘 말했습니다.

  • “지금까지 가장 유능하고 정렬된 모델인 GPT-4가 있습니다. 오늘 API(대기자 명단 포함)와 ChatGPT+에서 사용할 수 있습니다.”
  • "여전히 결함이 있고 여전히 제한적이며 더 많은 시간을 보낸 후보다 처음 사용할 때 여전히 더 인상적인 것 같습니다."

GPT-4 릴리스의 결과로 현재 상황이나 환경에 따라 고려할 수 있는 작업에 대한 제 제안은 다음과 같은 잠재적 조치로 구성됩니다.

  • 기존 ChatGPT 사용자. 이미 ChatGPT를 사용하고 있다면 GPT-4를 자세히 살펴보고 대신 사용할 것인지 확인해야 합니다(또는 ChatGPT를 사용하는 것 외에 GPT-4를 사용할 수도 있으므로 ChatGPT 또는 GPT 중 하나를 사용하십시오) -4, 필요에 따라 달라짐). ChatGPT를 사용하기 위한 월 $4 가입 모드인 ChatGPT Plus를 구독하는 경우 GPT-20로 플레이할 수 있습니다. 그렇지 않으면 현재 특별히 GPT-4에 액세스할 수 있는 쉬운 방법이 없습니다(주의 사항 검색 엔진인 Microsoft Bing은 여기 링크에서 논의한 GPT-4의 변형을 사용합니다.
  • 생성 AI를 사용한 적이 없습니다. ChatGPT를 사용하지 않고 제너레이티브 AI를 사용한 적이 없는 경우 무료로 액세스할 수 있는 ChatGPT로 먼저 시작하는 것이 좋습니다(또는 물론 무수히 많은 다른 제너레이티브 AI 앱을 사용하여 여정을 시작하는 것이 좋습니다). 이 AI 영역으로). 기존 ChatGPT 사용자와 관련하여 위의 사항에서 언급한 바와 같이 현재 GPT-4는 무료가 아닙니다. ChatGPT에 익숙해지면 ChatGPT Plus에 가입하여 GPT-4에 액세스하는 등의 추가 혜택을 받을 가치가 있는지 결정할 수 있습니다.
  • 다른 생성 AI를 사용합니다. ChatGPT 이외의 생성 AI 앱을 사용하는 경우 ChatGPT가 제공하는 것 이상의 개선 사항이 있으므로 GPT-4에 큰 관심을 가질 수 있습니다. 일부 정통한 AI 사용자가 ChatGPT가 다른 옵션만큼 좋지 않다고 결정했기 때문에 이것을 언급합니다. 기존 선택이 여전히 최선인지 판단하기 위해 GPT-4에 대한 최신 정보를 얻는 것이 좋습니다. 그것은 수 있습니다. 따라서 나는 확실히 당신이 GPT-4로 전환해야 한다고 주장하는 것이 아니라 사용 가능한 다른 자동차의 타이어를 차는 것이 항상 신중하다고 말하는 것뿐입니다.
  • API를 통해 ChatGPT에 액세스하는 기타 소프트웨어. 여기 링크에서 논의한 API(애플리케이션 프로그래밍 인터페이스)를 통해 ChatGPT에 연결하는 소프트웨어를 만드는 사람들은 API를 통해 GPT-4를 사용하는 것을 자세히 살펴보는 것이 현명할 것입니다. 한 가지 중요한 질문은 GPT-4 API를 사용하는 비용이 ChatGPT를 사용하는 것보다 훨씬 높다는 것입니다. GPT-4의 추가 이점과 ChatGPT를 고수하는 저렴한 대안에 대한 트레이드 오프 분석을 수행하고 싶을 것입니다. 이것은 다소 복잡한 결정입니다. 생각 없이 하지 말고 마음챙김으로 그렇게 하십시오.

많은 사람들에게 충격적으로 보이는 한 가지는 뉴스 가치가 이전에 예상했던 수준으로 그다지 올라가지 않았다는 것입니다.

이유를 설명하겠습니다.

오리지널 블록버스터와 속편

작년 XNUMX월 말에 ChatGPT로 알려진 생성 AI 앱이 출시되었다는 사실을 알고 계실 것입니다.

이것은 놀라운 대히트였습니다.

그때까지 제너레이티브 AI 애플리케이션을 일반 대중에게 공개하려는 이전의 노력은 일반적으로 경멸과 분노에 부딪혔습니다. 우려의 근거는 제너레이티브 AI가 비속어, 불미스러운 편견, 거짓, 오류, 심지어 꾸며낸 사실 또는 소위 AI 환각 (AI를 의인화하는 경향이 있기 때문에 "환각"이라는 용어가 마음에 들지 않습니다. 여기 링크에서 내 토론을 참조하십시오).

제너레이티브 AI는 사용자가 입력한 텍스트 프롬프트에서 출력을 생성하는 AI 유형으로, 텍스트 기반 에세이를 생성 또는 생성하거나 이미지 또는 삽화를 생성하거나 오디오를 생성하거나 비디오를 생성할 수 있습니다. 이들은 일반적으로 텍스트를 텍스트로, 텍스트를 에세이로, 텍스트를 아트로, 텍스트를 이미지로, 텍스트를 오디오로, 텍스트를 비디오로 등으로 지칭합니다. 제너레이티브 AI의 놀라운 점은 생성된 작업이 겉보기에 인간이 생성한 출력과 동등하다는 것입니다. 인간의 마음과 인간의 손으로만 생성된 유사한 구성과 생성 AI 출력을 구별하는 데 어려움을 겪을 것입니다.

제너레이티브 AI에 대한 자세한 내용은 ChatGPT 및 제너레이티브 AI의 기초와 학생들의 ChatGPT 적용 범위, 에세이에서 잠재적인 부정 행위 문제(여기 링크 사용), 정신 건강 조언을 위한 ChatGPT(여기 링크 참조), 잠재적인 표절 및 생성 AI의 저작권 침해에 대한 우려(여기 링크), 여기 링크의 더 많은 중요한 주제.

ChatGPT가 일반적인 채찍질을 얻지 못한 이유 중 하나는 ChatGPT를 출시하기 전에 AI 제조업체인 OpenAI의 일부 비하인드 스토리 작업 때문이었습니다. 그들은 특히 혐오스럽고 추악한 에세이를 출력하는 것을 막기 위해 다양한 기술과 기술을 사용하려고 노력했습니다. ChatGPT는 전적으로 텍스트 대 텍스트 또는 텍스트 대 에세이 스타일의 생성 AI입니다. 따라서 기이하고 분노한 출력을 방지하려는 시도는 단어 처리로 구성됩니다. 결과물이 예술이나 이미지인 경우에도 유사한 문제가 발생하지만, 이런저런 종류의 공격적인 이미지 생성을 방지하기 위해 포착하기가 동일하거나 더 어려울 수 있습니다.

AI 제조업체가 점점 더 많이 채택하고 있는 주목할만한 기술은 다음을 사용하는 것으로 구성됩니다. RLHF (인간 피드백을 통한 강화 학습). 일반적으로 작동하는 방법은 다음과 같습니다. 생성 AI 앱이 인터넷을 통해 텍스트를 스캔하는 것과 같이 초기에 데이터 교육을 받으면 인간 검토자가 AI에게 말할 가치가 있는 것과 말할 수 없는 것을 안내하거나 보여주기 위해 활용됩니다. 이 일련의 승인 및 비승인을 기반으로 생성 AI는 방출해도 되는 것과 허용되지 않는 것으로 보이는 것을 패턴 일치시킬 수 있습니다.

또 다른 매우 중요한 점을 언급하고 싶습니다.

AI는 지각이 없습니다.

엉뚱한 헤드라인이 무엇을 선언하든 오늘날의 AI는 지각력이 없습니다. 생성 AI의 경우 앱은 광범위한 계산 패턴 일치 소프트웨어 및 데이터 모델링 장치입니다. 인터넷에서 수백만 개의 단어를 조사한 후 단어와 그 통계적 관계에 대한 패턴을 도출합니다. 그 결과 인간 언어를 모방한 놀라운 형태가 탄생했습니다(일부 AI 내부자는 이것을 확률적 앵무새, 어떤 종류의 요점을 만들지 만 유감스럽게도 토론에 다른 지각 요소를 가져옵니다).

제너레이티브 AI는 워드 프로세싱 패키지를 사용할 때 자동 완성 기능으로 생각할 수 있지만 훨씬 더 포괄적이고 고급 기능입니다. 나는 당신이 문장을 쓰기 시작했고 문장의 나머지 부분에 단어를 추천하는 자동 완성 기능이 있다고 확신합니다. ChatGPT와 같은 생성 AI를 사용하면 프롬프트를 입력하면 AI 앱이 단순히 단어를 완성하는 것이 아니라 질문에 답하고 전체 응답을 작성하려고 시도합니다.

또한 ChatGPT 또는 기타 유사한 생성 AI 앱을 사용할 때 많은 사람들이 저지르는 초보적인 실수는 자랑스러운 대화형 대화 기능을 사용하지 못하는 것입니다. 어떤 사람들은 프롬프트를 입력한 다음 답변을 기다립니다. 그들은 그것이 전부라고 생각하는 것 같습니다. 하나 완료. 그러나 이것은 생성 AI의 핵심을 놓치고 있습니다. 보다 유용한 접근 방식은 생성 AI와의 대화 참여와 관련된 일련의 프롬프트를 수행하는 것입니다. 여기에서 제너레이티브 AI가 정말 빛을 발합니다. 여기 링크에서 제 예시를 확인하세요.

ChatGPT는 AI의 놀라운 돌파구로 미디어와 일반 대중에게 알려졌습니다.

현실은 종종 연구실이나 싱크 탱크에서 유사한 다른 많은 AI 앱이 고안되었으며 어떤 경우에는 조심스럽게 대중에게 제공되었습니다. 위에서 말했듯이 결과는 일반적으로 예쁘지 않았습니다. 사람들은 제너레이티브 AI를 찌르고 찌르고 잔인한 성격의 에세이를 얻을 수 있었습니다. 여기 링크에서 제 보도를 참조하세요. 이러한 경우 AI 제조업체는 일반적으로 공개 시장에서 AI를 철회하고 연구실 사용 또는 신중하게 선택한 AI 베타 테스터 및 개발자에 다시 집중해야 했습니다.

나머지 AI 업계의 많은 사람들은 ChatGPT가 여전히 잘못된 출력을 생성하는 줄타기를 할 수 있었지만 대중 정서가 OpenAI가 전체 액세스에서 AI 앱을 제거하도록 강요하지 않은 정도에 이르렀다는 사실에 충격을 받았습니다.

이것은 ChatGPT의 진정한 충격이었습니다.

대부분의 사람들은 충격이 대화 능력이라고 생각했습니다. AI에 종사하는 사람들을 위한 것이 아닙니다. 거의 모든 AI 내부자를 놀라게 한 것은 혐오스러운 말을 내뱉을 수 있는 생성 AI를 출시할 수 있고 반발이 빠르게 후퇴할 만큼 치열하지 않다는 점이었습니다. 누가 알았 겠어? 실제로 ChatGPT가 출시되기 전에 루머 밀은 기껏해야 며칠 또는 몇 주 안에 OpenAI가 AI 앱을 모든 사용자가 쉽게 사용할 수 있게 만든 것을 후회할 것이라고 예측했습니다. 그들은 접근을 제한하거나 집까지 걸어가서 숨을 쉬어야 할 것입니다.

ChatGPT 롤아웃의 놀라운 성공은 거리를 만날 수 있는 다른 생성 AI 앱의 문을 조심스럽게 열었습니다. 예를 들어 Google에서 Bard를 발표한 것과 생성 AI를 기존 웹 검색에 연결하려는 욕구로 인해 인터넷 검색 엔진 전쟁이 어떻게 가열되고 있는지에 대해 논의했습니다. 여기 링크를 참조하세요.

ChatGPT는 합리적으로 블록버스터로 특징지을 수 있습니다. 그것은 또한 말하자면 갑자기 나온 것입니다. 때때로 블록버스터 영화는 출시와 동시에 블록버스터가 될 가능성이 있는 것으로 미리 알려져 있습니다. 다른 경우에 영화는 대중을 놀라게 하고 영화 제작자까지 놀라게 하는 잠꾸러기입니다. ChatGPT와 OpenAI에서 일어난 일입니다.

자, 블록버스터 ChatGPT가 있습니다.

ChatGPT는 기본적으로 GPT-3.5로 알려진 GPT 버전을 기반으로 합니다. 이전에는 GPT-3, GPT-2 등이 있었습니다. AI 세계와 AI에 접한 사람들은 모두 OpenAI가 다음 버전인 GPT-4에서 작업하고 있다는 것을 알고 있었습니다.

GPT-4는 ChatGPT의 후속 또는 속편으로 간주됩니다.

이것은 우리를 영화에 대한 나의 비유로 되돌려줍니다. 깜짝 블록버스터인 ChatGPT는 엄청난 인기를 끌었습니다. GPT-4가 무엇이고 대중이 어떻게 반응할지에 대한 기대는 엉뚱한 추측으로 가득 차 있었습니다. GPT-4는 물 위를 걸을 것입니다! GPT-4는 과속 총알보다 빠를 것입니다! GPT-4는 지각 AI 또는 인공 일반 지능(AGI)의 달성이 될 것입니다!

계속해서 이것은 사라졌습니다.

OpenAI의 CEO인 Sam Altman이 YouTube에 게시된 인터뷰(17년 2023월 4일자)에서 다음과 같이 말한 것을 막연히 알고 계실 것입니다. 나는 그것이 모두 어디에서 오는지 모릅니다. 사람들은 실망하기를 간청하고 있으며 그렇게 될 것입니다. 과대 광고는 마치… 우리에게는 실제 AGI가 없으며 그것이 우리에게 기대되는 것입니다.”

글쎄, GPT-4가 여기 있습니다.

영화가 나왔습니다.

우리 눈으로 직접 볼 수 있습니다. 길들여지지 않은 추측은 더 이상 없습니다. 현실이 자리를 잡았습니다.

반짝이는 새 장난감의 포장을 풀자.

GPT-4의 필수 요소

의심 할 여지없이 GPT-4가 제공하는 것을 알고 싶어합니다.

내 토론에서 OpenAI가 GPT-4에 대해 제공한 다양한 문서와 비디오를 언급하고 GPT-4 사용에 기반한 발언을 할 것입니다. 토론의 편의를 위해 열렬히 인용할 편리한 문서가 두 개 있다는 점을 알아두시기 바랍니다. 하나는 OpenAI 공식 GPT-4 기술 보고서 다른 하나는 OpenAI 관계자입니다. GPT-4 시스템 카드 문서(둘 다 OpenAI 웹 사이트에서 사용 가능). 의 약어로 인용하겠습니다. TR 위한 GPT-4 기술 보고서SC 위한 GPT-4 시스템 카드.

TR에 대한 초록의 첫 번째 문장을 인용하여 시작하겠습니다.

  • "우리는 이미지 및 텍스트 입력을 수용하고 텍스트 출력을 생성할 수 있는 대규모 다중 모드 모델인 GPT-4의 개발을 보고합니다."

믿거 나 말거나, 그 한 문장에 많은 것이 꽉 차 있습니다.

자리에 앉아 손에 편안하게 음료를 드십시오.

제너레이티브 AI에 대해 일반적으로 받아들여지는 경험 법칙 중 하나는 시스템이 클수록 유창함과 전반적인 기능이 향상될 가능성이 높다는 것입니다. 이것은 역사적으로 생성 AI 시스템의 크기가 커지고 대화식 대화를 수행하는 측면에서 점점 더 유창해짐에 따라 상대적으로 잘 확립된 것으로 보입니다. 모든 사람이 이것이 사실이어야 한다고 믿는 것은 아니며, 잠재적으로 더 큰 형제만큼 많은 것을 달성하기 위해 다양한 최적화를 사용하는 더 작은 크기의 설정을 적극적으로 찾는 연구원들이 있습니다.

위에서 인용한 TR의 GPT-4에 대한 문장에서 이것이 "대규모" 생성 AI라는 문구를 보았을 것입니다. 오늘날의 생성 AI 시스템의 상대적 크기에 따라 모든 사람이 대리 동의하는 경향이 있습니다.

AI 내부자의 마음에 대한 분명한 질문은 얼마나 큰가입니다. 대규모 GPT-4는 언제?

일반적으로 AI 제조업체는 생성 AI의 다양한 크기 메트릭을 자랑스럽게 선언합니다. 크기와 규모가 얼마나 중요한지 나머지 AI 세계에 알리기 위해 그렇게 할 수 있습니다. 자랑하기 위해 그렇게 할 수도 있습니다. 단순히 자동차와 같기 때문에 그렇게 할 수 있습니다. 여기서 자연스러운 호기심은 엔진이 얼마나 크고 얼마나 빨리 갈 것인가입니다.

TR에 따르면 다음과 같이 표시됩니다.

  • "경쟁 환경과 GPT-4와 같은 대규모 모델의 안전 영향을 모두 감안할 때 이 보고서에는 아키텍처(모델 크기 포함), 하드웨어, 교육 컴퓨팅, 데이터 세트 구성, 교육 방법 등에 대한 추가 세부 정보가 포함되어 있지 않습니다."

AI 내부자들은 이것이 매력적이라고 ​​생각하는 경향이 있습니다. 한편으로는 이러한 중요한 특성을 말하지 않는 것이 외교와의 불안한 단절인 것 같습니다. 즉, 그렇게 하면 독점 비밀이 공개되거나 사이버 보안 바지의 문을 열 수 있다는 논리도 이치에 맞는 것 같습니다.

AI 제조업체는 생성 AI에 대한 특정 특성을 부주의하게 중요한 단서를 제공하지 않는 정도와 방식으로 공개해야 합니까?

이 고려 사항을 숙고하기 위해 AI 윤리 모자를 쓰도록하겠습니다.

어떤 사람들은 우리가 명시적인 공개를 요구하는 새로운 AI 법을 제정하게 될 수도 있다고 생각합니다.

대중은 AI에 무슨 일이 일어나고 있는지, 특히 AI가 더 커지고 아마도 결국 실존적 위험의 끔찍한 영역으로 방향을 바꿀 가능성이 있을 때 알아야 한다는 생각입니다. 여기 링크에서 제 분석을 참조하세요.

계속해서 GPT-4를 교육하는 데 어떤 데이터가 사용되었는지도 알 수 없습니다.

데이터는 제너레이티브 AI의 출현을 좌우합니다. 일부 사람들은 이러한 생성 AI 기능을 고안하기 위해 인터넷 전체를 스캔했다고 잘못 가정합니다. 아니요. 사실 여기 링크에서 논의하는 것처럼 인터넷의 아주 작은 부분만 스캔되고 있습니다.

관련된 측면은 생성 AI가 실시간으로 인터넷을 검색하고 계산 패턴 일치를 즉석에서 조정하는지 여부입니다. ChatGPT는 2021년 이전에 발생한 스캔으로 제한되었습니다. 즉, ChatGPT를 사용할 때 2022년과 2023년에 일어난 일에 대한 데이터가 거의 없습니다.

GPT-4에는 즉각적인 조정을 위해 인터넷에 대한 최신 실시간 연결이 포함될 것이라는 소문이 있었습니다.

TR이 말하는 내용은 다음과 같습니다.

  • “GPT-4는 일반적으로 2021년 XNUMX월 사전 훈련 데이터의 대부분이 중단된 후 발생한 이벤트에 대한 지식이 부족하고 경험에서 배우지 않습니다. 때로는 너무 많은 영역에 걸친 능력에 부합하지 않는 것처럼 보이는 간단한 추론 오류를 만들거나 사용자의 명백한 거짓 진술을 받아들이는 데 지나치게 속기 쉽습니다.”

그러면 일부 사람들이 GPT-4에 약간 실망한 이유를 알 수 있을 것입니다. 소문에 따르면 실시간으로 작동하는 동시에 인터넷에 즉석에서 조정할 수 있습니다. ChatGPT에 비해 크게 개선되었습니다. 현실은 GPT-4가 여전히 오래된 데이터를 다루고 있다는 것입니다. 그리고 인터넷에서 새로 고침을 기반으로 계산 패턴 일치 자체에 실시간 조정이 일어나지 않습니다.

더 많은 소식이 있습니다.

앞서 GPT-4가 대규모라고 인용한 문장도 GPT-4가 멀티 모달.

개념에 대한 배경 지식을 제공하겠습니다. 멀티 모달 생성 AI.

이 토론을 시작할 때 텍스트 대 텍스트 또는 텍스트 대 에세이, 텍스트 대 예술 또는 텍스트 대 이미지, 텍스트 대 오디오, 텍스트 대 텍스트와 같은 다양한 유형의 생성 AI가 있다고 언급했습니다. -to-video 등. 이들은 모두 콘텐츠를 처리하는 단일 모드로 간주됩니다. 예를 들어 텍스트를 입력하고 생성된 에세이를 얻을 수 있습니다. 또 다른 예는 텍스트를 입력하고 생성된 아트웍을 얻는 것입니다.

작년 말에 나는 2023년 AI 발전에서 우리가 볼 수 있는 것에 대한 연간 예측을 했습니다(여기 링크 참조). 나는 다중 모달 생성 AI가 뜨거울 것이라고 말했습니다. 아이디어는 예를 들어 텍스트와 이미지(입력 시 두 가지 모드)를 입력하고 이를 생성 AI에 프롬프트로 사용하여 생성된 비디오 및 오디오 트랙과 함께 출력으로 에세이를 얻을 수 있다는 것입니다(입력 시 세 가지 모드). 산출).

따라서 다수의 모드가 공존할 수 있습니다. 프롬프트 또는 입력에 다양한 모드가 있을 수 있습니다. 생성된 응답 또는 출력에 다양한 모드가 있을 수도 있습니다. 입력과 출력 모두에서 믹스 앤 매치를 가질 수 있습니다. 그것이 일이 향하는 곳입니다. 다중 모달 기능으로 인해 제너레이티브 AI로 할 수 있는 일의 가능성과 흥미진진함이 엄청나게 열립니다.

ChatGPT에는 단일 모드만 있습니다. 텍스트를 입력하면 생성된 텍스트가 출력으로 표시됩니다.

GPT-4가 음속 장벽을 허물고 모든 것에 완전한 멀티모달 기능을 제공한다는 소문이 돌았습니다. 모두가 텍스트가 포함될 것이라는 것을 알고 있었습니다. 이미지나 아트워크가 오디오와 함께 추가되고 비디오도 추가될 것이라는 기대가 있었습니다. 모두에게 무료가 될 것입니다. 원하는 만큼의 모드를 포함하여 입력에 대한 모든 모드. 또한 원하는 대로 혼합된 많은 모드를 포함하여 출력의 모든 모드.

진정한 모드의 스모가스보드.

GPT-4는 무엇을 제공합니까?

TR에서 해당 문장으로 돌아가십시오.

  • "우리는 이미지 및 텍스트 입력을 수용하고 텍스트 출력을 생성할 수 있는 대규모 다중 모드 모델인 GPT-4의 개발을 보고합니다."

텍스트를 입력하면 텍스트가 출력되고 입력에 이미지를 입력할 수도 있습니다.

입력된 이미지의 이미지 또는 비전 처리를 보여주는 데모는 예를 들어 그림의 항목이 생성 AI에 의해 식별된 다음 그림을 설명하는 서면 내러티브로 구성될 수 있음을 나타냅니다. 생성 AI에게 그림이 무엇을 묘사하는지 설명하도록 요청할 수 있습니다. 대체로 비전 처리가 주목할만한 추가 사항이 될 것입니다.

비전 처리 또는 이미지 분석 기능은 아직 공개적으로 사용할 수 없습니다(OpenAI 웹 사이트 블로그에 따라).

  • "더 넓은 가용성을 위해 이미지 입력 ​​기능을 준비하기 위해 단일 파트너와 긴밀히 협력하여 시작하고 있습니다."

이 모든 것의 요점은 GPT-4가 분명히 이미지 입력 ​​및 분석을 수행할 수 있는 기능을 가지고 있다는 것을 깨닫는 것이 마음이 따뜻해진다는 것입니다. 많은 사람들이 이 기능의 공개 릴리스를 간절히 기다리고 있습니다. 다중 모달 분야에 진출한 OpenAI에 찬사를 보냅니다.

따라서 텍스트를 입력으로, 이미지를 입력으로(공개적으로 사용할 수 있는 경우), 텍스트를 출력으로 사용합니다.

일부는 AI 커뮤니티에서 이것이 거의 멀티 모달. 예, 이미지를 입력으로 사용하는 모드가 하나 더 있습니다. 그러나 출력으로 이미지가 아닙니다. 입력으로 오디오가 없고 출력으로 오디오가 없는 것 같습니다. 입력으로 비디오가 없고 출력으로 비디오가 없는 것 같습니다. smarmy 구부러진 사람들은 이것이 가장 미니멀 한 방식으로 "다중 모달"임을 알게됩니다.

반론은 걷기 전에 기어야 하고 뛰기 전에 걸어야 한다는 것입니다.

이것이 TR의 첫 번째 문장을 다루고 추가 주제로 이동할 수 있다고 생각합니다.

GPT-4의 더 많은 필수 요소

이 문제에 대한 전반적인 배경 지식이 추가되었으므로 이제 속도를 높일 것입니다.

다음은 GPT-4에 대한 OpenAI 블로그 게시물에 언급된 중요한 내용입니다.

  • "지난 XNUMX년 동안 우리는 전체 딥 러닝 스택을 재구축했으며 Azure와 함께 작업 부하를 위해 처음부터 슈퍼컴퓨터를 공동 설계했습니다."

이것에 대한 두 가지 빠른 포인트.

첫째, 그들이 전체 딥 러닝 스택을 재구축했다는 표시는 확실히 주목할만한 발언이자 성과입니다(이는 그들이 계산 패턴 일치 모델을 재정비하고 사물이 작동하는 방식을 재구성하기로 선택했음을 의미합니다). 그들에게 좋습니다. 일부 사람들이 구걸하는 질문은 그들이 이 재건에서 정확히 무엇을 했는지 아는 것이 좋을 것이라는 것입니다. TR과 SC는 무슨 일이 일어났는지 어느 정도 언급하지만 심도 있는 정도는 아닙니다.

물론 비법을 밝히면 안 된다고 설득력 있게 주장할 수도 있다. 그들은 그렇게 할 필요가 없습니다. 경쟁자에게 불필요하게 지원을 제공하는 이유는 무엇입니까? 동전의 다른 면은 AI와 사회의 개선을 위해 아마도 인류에게 좋을 것 같은 생성 AI를 발전시키는 데 도움이 될 것이라고 주장합니다(하나의 희망).

우리는 그 지저분한 AI 윤리와 AI 법 구분선으로 돌아왔습니다.

둘째, 인용된 설명은 그들이 처음부터 슈퍼컴퓨터를 설계했음을 나타냅니다. 이 슈퍼컴퓨터가 하는 일과 그것이 정확히 어떻게 작동하는지에 대한 관심 외에도, 이것은 완전히 다른 문제를 제기합니다.

일부에서는 생성 AI가 큰 돈을 벌 수 있는 게임이 되고 있다고 우려합니다. 가장 큰 돈과 가장 큰 자원을 가진 기술 회사만이 생성 AI를 고안하고 현장에 배치할 수 있습니다. 이것이 의문시되는 이유는 아마도 우리가 소수의 기술 회사에 의해서만 엄격하게 통제되는 생성 AI를 가지게 될 것이기 때문입니다. 우리는 그러한 회사와 그들의 제품에 크게 의존하게 될 수 있습니다.

생성 AI가 소수의 좁은 명령에 집중되는 것을 방지하기 위해 잠재적으로 기존 법률을 사용하거나 새로운 AI 법률을 고안해야 합니까?

반추 할 것.

ChatGPT와 GPT-4 사이의 엄청나게 큰 차이 측면에서 신발이 떨어지기를 기다리고 있다면 GPT-4에 대한 OpenAI 블로그 게시물에서 이에 대해 살펴보십시오.

  • “평범한 대화에서 GPT-3.5와 GPT-4의 차이는 미묘할 수 있습니다. 작업의 복잡성이 충분한 임계값에 도달하면 차이가 나타납니다. GPT-4는 GPT-3.5보다 더 안정적이고 창의적이며 훨씬 더 미묘한 지침을 처리할 수 있습니다.”

저는 이러한 뚜렷한 차이가 없다는 사실을 발견했습니다. 즉, ChatGPT로 일상적인 유휴 종류의 잡담을 하고 GPT-4와 마찬가지로 하는 경우 GPT-4가 전반적으로 더 강력한 것으로 간주된다는 사실을 특별히 깨닫지 못할 수도 있습니다. .

눈에 띄는 한 가지 측면은 두 개의 생성 AI 앱과의 대화에 대한 컨텍스트를 설정하는 것입니다.

여기에 의미하는 바가 있습니다.

생성 AI 앱을 사용하면 AI와 함께 시작하고 계속하는 대화에 뛰어들 때가 있습니다. 다른 경우에는 AI에게 대화의 맥락을 알려주는 것으로 시작합니다. 예를 들어 생성 AI에게 내가 AI와 자동차 엔진에 대해 논의하고 싶고 AI가 자동차 정비사인 척하기를 원한다고 말하는 것으로 시작할 수 있습니다. 그런 다음 AI가 그에 따라 응답하도록 단계 또는 설정을 설정합니다.

ChatGPT를 사용하는 많은 사람들은 AI 앱과 처음 대화에 참여할 때 컨텍스트 설정의 중요성을 깨닫지 못합니다. 어떤 응답을 받게 될 것인지에 따라 엄청난 차이가 날 수 있습니다. 나는 종종 ChatGPT가 특정 상황에 대해 자체적으로 잘 연마되지 않는다는 것을 발견했습니다. 시도하지만 자주 부족합니다. 지금까지 GPT-4는 문맥 설정을 사용하여 정말 빛을 발하는 것 같습니다.

생성 AI를 사용하고 그렇게 할 때 컨텍스트를 설정하려는 경우 ChatGPT보다 GPT-4에 전반적인 우위를 확실히 부여할 것입니다.

관련 요소에는 다음과 같은 측면도 있습니다. 조종성 작동합니다.

ChatGPT의 일부 사용자는 때때로 AI 앱이 지나치게 유머러스하거나 지나치게 간결해 보이는 응답을 제공하는 것에 놀랐습니다. 이는 생성적 AI가 입력 프롬프트에서 그러한 종류의 응답을 트리거하는 것으로 보이는 무언가를 감지하는 경우 발생할 수 있습니다. 당신은 농담으로 무언가에 대해 물어보고 이것이 ChatGPT를 농담과 가벼운 어조로 이끌 것이라는 것을 깨닫지 못할 수도 있습니다.

GPT-4 및 조종성에 대한 OpenAI 블로그 게시물에 따르면:

  • “고정된 장황함, 어조 및 스타일을 가진 고전적인 ChatGPT 성격 대신 개발자(및 곧 ChatGPT 사용자)는 이제 '시스템' 메시지에서 이러한 방향을 설명하여 AI의 스타일과 작업을 규정할 수 있습니다. 시스템 메시지를 통해 API 사용자는 범위 내에서 사용자 경험을 크게 사용자 정의할 수 있습니다.”

다시 말하지만 이것은 생성 AI 앱의 사용자 경험을 향상시킬 것입니다. 다른 제너레이티브 AI 제조업체도 마찬가지로 하고 있으며 필연적으로 어떤 형태의 조종성과 상황에 맞는 설정 기능을 갖춘 거의 모든 AI 앱을 갖게 될 것입니다.

아직 험난한 길

일반적으로 생성 AI를 뒷받침하는 지속적이고 골치 아픈 문제는 모든 종류의 불쾌하고 노골적인 혼란스러운 출력이 생성될 수 있다는 것입니다.

칼럼 포스팅에서 저는 다음과 같은 다양하고 진지한 우려 사항을 다루었습니다.

  • 생성 AI 생성 오류
  • 생성 AI가 만들어낸 거짓
  • 생성 AI 내장 편향
  • AI 환각
  • 프라이버시 침해
  • 데이터 기밀성 약점
  • 허위정보 유포자
  • 잘못된 정보 전파자
  • 무기에 대한 이중 사용
  • 인간에 의한 과잉 의존
  • 인간에 대한 경제적 영향
  • 사이버 범죄 강화
  • 등등

일부 소문은 GPT-4가 마술처럼 기적적으로 모든 생성 AI 질병을 정리하고 해결할 것이라는 것입니다.

머리가 좋은 사람이라면 그런 소문이 설득력을 가질 수 있다고 생각한 사람은 아무도 없을 것입니다. 이들은 매우 어려운 AI 문제입니다. 쉽게 해결되지 않습니다. 이 지속적이고 격분시키는 어려움과 싸우기 위해 아직 해야 할 일이 많이 있습니다. 생성 AI 환경에 얽힌 AI 윤리 문제를 정복하려면 마을이 필요할 것입니다.

OpenAI는 마땅한 공로를 인정하기 위해 이러한 다양한 문제를 어떻게 해결하고 있는지 설명하고자 했습니다. AI 윤리에 관심이 있는 분들은 TR과 SC를 자세히 읽어 보시기 바랍니다.

다음은 예를 들어 TR에서 OpenAI가 언급한 GPT-4에 대한 평이한 의견입니다.

  • “GPT-4는 공격 계획이나 증오 발언에 대한 조언과 같은 잠재적으로 유해한 콘텐츠를 생성할 수 있습니다. 사용자 의도나 널리 공유되는 가치를 나타내지 않을 수 있는 다양한 사회적 편견과 세계관을 나타낼 수 있습니다. 또한 손상되었거나 취약한 코드를 생성할 수도 있습니다. GPT-4의 추가 기능은 또한 새로운 위험 표면으로 이어집니다.”

또한 그들은 TR에서 이렇게 말합니다.

  • “이 분석을 통해 우리는 GPT-4가 외부 데이터로 증강될 때 개인을 식별하는 데 사용될 가능성이 있음을 발견했습니다. 또한 GPT-4의 사이버 보안 기능이 이전 세대의 LLM보다 크게 뛰어나지는 않지만 사회 공학 또는 기존 보안 도구 강화와 같은 성공적인 사이버 공격의 특정 단계 비용을 잠재적으로 낮추는 추세를 계속하고 있음을 발견했습니다. . 안전 완화 조치 없이 GPT-4는 유해하거나 불법적인 활동을 수행하는 방법에 대한 자세한 지침도 제공할 수 있습니다.”

이러한 어려움과 관련된 수많은 항목을 모두 다룰 수 있는 열 공간이 여기에 없습니다. AI 윤리 및 AI 법률 관점에서 생성 AI에 대한 저의 지속적인 분석에서 추가 칼럼 범위를 찾아보십시오.

잠시 시간을 내어 OpenAI가 이러한 어려운 과제에 접근하는 방법에 대한 식별 정보를 제공했음을 인정하는 것이 가치 있는 것 같습니다. 그들이 그렇게 해야 할 이유가 없었다고 말할 수 있습니다. 마치 아무 것도 없는 것처럼 행동할 수 있습니다. 또는 모호한 손짓을 하고 이러한 문제를 해결하기 위해 많은 영리한 작업을 수행하고 있다고 주장할 수 있습니다.

다행스럽게도 그들은 일반적으로 생성 AI 릴리스와 함께 발생하는 반발과 윙윙 거리는 소리보다 앞서 나가기 위해 합리적인 접근 방식을 선택했습니다. 그들은 아마도 이러한 문제를 뿌리 뽑고 완화하거나 해결하려는 진지함과 의지를 확고히 보여 주려는 것일 것입니다.

이러한 문제를 솔직하고 다가오는 방식으로 추구하기 위한 지속적이고 격렬한 노력이 없다면 모든 AI 분야가 가혹한 구타를 당할 것이라는 추가 생각을 제안하고 싶습니다. 숨겨진 블랙박스 접근 방식을 취하는 것은 일반 대중의 분노를 불러일으킬 수밖에 없습니다. 또한 AI 회사가 이러한 문제를 해결하려고 시도하지 않으면 입법자와 규제 기관이 이러한 문제에 휘말릴 가능성이 있으며 새로운 AI 법률의 쓰나미가 모든 AI 제조업체와 해당 분야에 영향을 미칠 것이라고 예상할 수 있습니다. 일체 포함.

어떤 사람들은 우리가 이미 그 시점에 와 있다고 믿습니다.

그들은 많은 AI 제작자들이 그들이 하고 있는 일을 공유하고 있는 것처럼 보이지만 이것은 다소 교활한 형태의 그럴듯한 부인이라고 주장합니다. 요컨대, 일이 더 잘 고안될 때까지 기다리기보다는 소름 끼치고 명백히 잘못된 AI를 진압하고 일을 바로잡기 위해 가능한 모든 일을 하고 있다고 선언하여 AI 윤리 및 AI 법에 있는 사람들을 막으십시오. 저는 제 칼럼에서 이 "준비될 때까지 기다림"이라는 진행 중인 논쟁에 대해 자주 논의했습니다.

TR에 따라:

  • “OpenAI는 보다 안전한 출시를 준비하기 위해 4월 초부터 GPT-XNUMX와 배포 계획을 반복하고 있습니다. 우리는 이로 인해 위험 표면이 줄어들었지만 완전히 제거되지는 않았다고 생각합니다. 오늘의 배포는 배포로 인한 위험 최소화, 긍정적인 사용 사례 지원, 배포를 통한 학습 사이의 균형을 나타냅니다.”

당면한 문제로 돌아가서, 생성 AI와 관련하여 AI 환각이 일반적인 문제라고 앞서 언급했습니다.

다시 말하지만, 캐치 프레이즈가 마음에 들지 않지만 인기를 얻은 것 같습니다. AI 환각 문제의 핵심은 매우 미친 내용을 포함하는 출력을 생성할 수 있다는 것입니다. 출력이 옳은지 그른지를 분별하는 것은 사용자의 몫이라고 생각할 수 있습니다. 여기서 우려되는 점은 출력에 사용자가 구성 여부를 쉽게 판단할 수 없는 구성 항목이 포함될 수 있다는 것입니다. 그들은 출력이 말하는 모든 것을 믿을 수 있습니다.

또한 제너레이티브 AI의 결과물을 믿게 되는 미묘한 경향이 있습니다. 일반적으로 출력은 확실한 자신감을 암시하는 어조와 방식으로 작성됩니다. 제너레이티브 AI를 정기적으로 사용한다고 가정하면 대부분의 시간 동안 진실된 자료를 보는 데 만족하기 쉽습니다. 그런 다음 완전히 합리적이고 사실로 채워진 생성 된 에세이처럼 보이는 것의 중간에 구성 된 것이 뽑히면 쉽게 속을 수 있습니다.

GPT-4에 대한 TR의 설명은 다음과 같습니다.

  • “GPT-4는 '환각'하는 경향이 있습니다. 이러한 경향은 모델이 점점 더 설득력 있고 믿을 수 있게 되어 사용자가 모델에 지나치게 의존하게 되면서 특히 해로울 수 있습니다. 반직관적으로, 모델이 어느 정도 친숙한 영역에서 진실한 정보를 제공할 때 사용자가 모델에 대한 신뢰를 구축함에 따라 모델이 더 진실해질수록 환각은 더 위험해질 수 있습니다.”

좋은 소식은 GPT-4에서 AI 환각의 가능성을 줄이기 위한 노력이 있었고 현재 진행 중인 것으로 보인다는 것입니다. 또한 GPT-4가 AI 환각을 피하는 측면에서 GPT-3.5를 능가한다고 주장하지만, AI 환각이 여전히 발생할 것이라는 점은 분명합니다.

이에 대한 TR은 다음과 같습니다.

  • "내부 평가에서 GPT-4 실행은 최신 GPT-19 모델보다 개방 영역 환각을 피하는 데 3.5% 포인트 더 높고 폐쇄 영역 환각을 피하는 데 29% 포인트 더 높습니다."

지금은 논의의 이 부분을 마무리하기 위해 모든 AI 제조업체의 생성 AI가 이러한 문제에 직면하고 있습니다. 아무도 이것을 어떻게든 치료하지 못했습니다. 어려운 AI 문제를 찾고 있다면 이 물에 뛰어들어 도움을 받을 것을 촉구합니다. 해야 할 일이 많습니다.

결론

블록버스터 영화가 한동안 상영되고 극장에서 홈 스트리밍으로 옮겨갔을 때, 꽤 많은 사람들이 그 영화를 보았거나 그것을 본 다른 사람들로부터 그것에 대해 뭔가를 알고 있을 것입니다. 이후 속편이 발표되고 촬영에 돌입하면 그 기대감은 천문학적 수준에 이를 수 있다.

현재 스타워즈 시리즈의 일부이자 스타트랙의 리부트를 제작한 전설적인 영화 제작자인 JJ 에이브람스는 속편에 대해 이렇게 말했습니다.

Pixar의 공동 설립자인 Edwin Catmull은 속편에 대해 다음과 같이 강조했습니다.

블록버스터 ChatGPT를 보고 싶다면 쉽게 가입할 수 있습니다. 속편 GPT-4는 액세스하기가 약간 더 까다롭습니다. 또한 사용할 수 있는 다른 영화가 많이 있고 다른 생성 AI 앱을 사용할 수 있으므로 영화 감상(일명 생성 AI) 경험이 다양하고 만족스러운지 확인하고 싶을 수 있습니다.

마지막 냉정한 메모. 접할 수 있는 콘텐츠는 PG13, R 또는 NC-17일 수 있습니다. 명심하십시오.

출처: https://www.forbes.com/sites/lanceeliot/2023/03/15/what-you-need-to-know-about-gpt-4-the-just-released-successor-to-generative- ai-chatgpt-plus-ai-ethics-and-ai-law-considerations/