ChatGPT V4는 막대, SAT를 능가하고 ETH 계약에서 익스플로잇을 식별할 수 있습니다.

인공지능(AI) 챗봇의 최신 버전인 챗GPT(ChatGPT)인 GPT-4는 고교 시험과 로스쿨 시험을 상위 90%의 점수로 통과할 수 있으며 이전 버전에서는 불가능했던 새로운 처리 기능을 갖추고 있다.

GPT-4의 테스트 점수 수치는 14월 XNUMX일 제작자 OpenAI에 의해 공유되었으며 "훨씬 더 미묘한 지침"을 보다 창의적이고 안정적으로 처리하는 것 외에도 이미지, 오디오 및 비디오 입력을 텍스트로 변환할 수 있음을 보여줍니다.

OpenAI는 “시험 응시자의 상위 10% 정도의 점수로 모의 변호사 시험을 통과했습니다.”라고 덧붙였습니다. “반면 GPT-3.5의 점수는 하위 10% 정도였습니다.”

수치는 GPT-4가 LSAT 시험에서 163번째 백분위수에서 88점을 획득했음을 보여줍니다.

*최근 다양한 미국 시험에서 GPT-4 및 GPT-3.5의 시험 결과. 원천:* *OpenAI*

GPT4의 점수는 상위 20개 로스쿨에 입학할 수 있는 좋은 위치에 놓일 것이며 Harvard, Stanford, Princeton 또는 Yale과 같은 명문 학교에 입학하는 데 필요한 보고된 점수보다 몇 점 부족합니다.

ChatGPT의 이전 버전은 LSAT에서 149점을 받아 하위 40%에 들었습니다.

GPT-4는 최근에 졸업한 법대생이 미국 관할 지역에서 변호사로 활동할 수 있도록 허용하는 시험인 Uniform Bar Exam에서 298점 만점에 400점을 받았습니다.

*UBE 점수는 각 미국 관할 구역에서 법률 업무를 수행하기 위해 인정되어야 합니다. 원천:* *전국 변호사 협의회*

이전 버전의 ChatGPT는 이 테스트에서 고전하여 10점 만점에 213점으로 하위 400%에 들었습니다.

미국 고등학생들이 대학 진학 준비도를 측정하기 위해 치르는 SAT Evidence-Based Reading & Writing과 SAT Math 시험에서 GPT-4는 각각 93번째 백분위수와 89번째 백분위수를 기록했습니다.

GPT-4는 AP 생물학(85-100%), 화학(71-88%) 및 물리학 2(66-84%)에서 평균 백분위수 점수보다 훨씬 높은 "하드" 과학에서도 뛰어났습니다.

*최근 다양한 미국 시험에서 GPT-4 및 GPT-3.5의 시험 결과.* *출처: OpenAI.*

그러나 AP 미적분학 점수는 상당히 평균적이어서 43~59번째 백분위수에 속했습니다.

GPT-4가 부족한 또 다른 영역은 영문학 시험으로 두 개의 개별 테스트에서 8~44번째 백분위수에 점수를 기록했습니다.

OpenAI는 GPT-4 및 GPT-3.5가 2022-2023 연습 시험에서 이러한 테스트를 수행했으며 언어 처리 도구에서 "특정 교육"을 받지 않았다고 말했습니다.

“우리는 이 시험을 위해 특별한 훈련을 하지 않았습니다. 시험의 문제 중 일부는 교육 중에 모델에 표시되었지만 그 결과가 대표적이라고 생각합니다.”

결과는 트위터 커뮤니티에도 두려움을 불러일으켰습니다.

관련 : ChatGPT는 Web3 공간에 어떤 영향을 미칩니까? 업계 답변

FactoryDAO의 창립자 Nick Almond 이야기 14,300월 14일 그의 트위터 팔로워 4명은 GPTXNUMX가 "사람들을 겁주고" 글로벌 교육 시스템을 "붕괴"시킬 것이라고 말했습니다.

평가 이론은 몇 년 동안 내 인생의 큰 덩어리였습니다. 나는 수년 전에 오는 이 날에 대해 두드리고 있었다. 당시 나는 말 그대로 레지던트 크랭크처럼 들렸다.
하지만... 정말 이것은 이 시점에서 감독된 평가 이외의 모든 것이 끝났다는 것을 의미합니다.
— drnick ️²(@DrNickA) 2023 년 3 월 14 일

전 Coinbase 이사인 Conor Grogan은 라이브 이더리움 스마트 계약을 GPT-4에 삽입했고 즉시 몇 가지 "보안 취약점"을 지적했으며 코드가 악용될 수 있는 방법을 설명했습니다.

라이브 Ethereum 계약을 GPT-4에 버렸습니다.
즉시 여러 보안 취약점을 강조하고 계약이 악용될 수 있는 노출 영역을 지적했습니다. 그런 다음 계약을 악용할 수 있는 구체적인 방법을 확인했습니다. pic.twitter.com/its5puakUW
— 코너 (@jconorgrogan) 2023 년 3 월 14 일

ChatGPT에 대한 초기 스마트 계약 감사에서는 첫 번째 버전도 코드 버그를 합리적인 수준으로 찾아낼 수 있음을 발견했습니다.

AI 뉴스레터 'The Rundown'의 창립자인 Rowan Cheung은 종이에 손으로 그린 가짜 웹사이트를 GPT가 코드로 옮기는 동영상을 공유했습니다.

방금 GPT-4가 손으로 그린 스케치를 기능적인 웹 사이트로 바꾸는 것을 보았습니다.
이건 미쳤어. pic.twitter.com/P5nSjrk7Wn
— 로완 청(@rowancheung) 2023 년 3 월 14 일