GPT-4
GPT-4는 대규모 멀티모달 모델(이미지와 텍스트 입력을 받아들이고 텍스트 출력을 내보내는)로, 많은 실제 시나리오에서 인간보다 능력이 떨어지지만 다양한 전문 및 학술 벤치마크에서 인간 수준의 성능을 보여줍니다. 예를 들어, 모의 변호사 시험에서 응시자 중 상위 10% 정도의 점수로 합격한 반면, GPT-3.5의 점수는 하위 10% 정도에 그쳤습니다. 저희는 6개월 동안 적대적 테스트 프로그램과 ChatGPT에서 얻은 교훈을 바탕으로 GPT-4를 반복적으로 조정하여 사실성, 조종성, 가드레일을 벗어나는 것을 거부하는 능력에서 완벽하지는 않지만 역대 최고의 결과를 얻었습니다. >> GPT-4 모의 변호사 시험: 상위 10% 점수로 합격 >> GPT-3.5: 하위 10% 지난 2년 동안 전체 딥 러닝 스택을..
2023.03.16