'Generative AI' 카테고리의 글 목록 (3 Page)

언어 모델은 단기간에 배우는 학생입니다.

2020년 OpenAI는 이전 언어 모델보다 10배 많은 1,750억 개의 파라미터를 갖춘 생성 언어 모델인 GPT-3를 발표하고 NLP 벤치마크에서 그 성능을 공개했습니다. 하지만 단순히 규모만 업그레이드한 것이 아닙니다. GPT-3는 텍스트 상호 작용만으로 작업을 처리할 수 있는 향상된 기능을 보여주었습니다. 이러한 작업에는 제로 샷, 원샷, 소수 샷 학습이 포함되며, 모델에 작업 정의 및/또는 몇 가지 예제가 주어지고 추가 교육 없이 작업을 수행해야 합니다. 즉, 파인 튜닝이 사용되지 않습니다. 마치 사람이 간단한 명령어의 몇 가지 예제만 보고 새로운 언어 작업을 수행하는 것과 같습니다. 하지만 어떤 경우에는 GPT-3의 성능이 SOTA(최첨단) 원튜닝 시스템의 성능과 거의 일치하기도 합니다. 최근..

2023.03.22

[In Context Learning] 인-컨텍스트 러닝의 신비로움

'인-컨텍스트 러닝'이란 무엇인가? 연구자들은 대규모 언어 모델이 해당 작업에 대해 학습되지 않았음에도 불구하고 몇 가지 예시만 보고도 작업을 수행하는 방법을 배우는 인컨텍스트 학습이라는 흥미로운 현상을 연구하고 있습니다. 예를 들어, 누군가 모델에 몇 가지 예문과 그에 대한 감정(긍정 또는 부정)을 제공한 다음 새로운 문장을 입력하면 모델이 올바른 감정을 제공할 수 있습니다. GPT-3와 같은 대형 언어 모델은 인터넷 규모의 텍스트 데이터를 학습하여 앞의 텍스트가 주어졌을 때 다음 토큰을 예측하는 것으로 학습됩니다. 이 간단한 목적과 대규모 데이터셋 및 모델이 결합되어 매우 유연한 언어 모델이 생성되어, 모델은 모든 텍스트 입력을 "읽어" 들이고 이를 조건으로 하여 해당 입력 다음에 나올 수 있는 텍스..

2023.03.21

BioGPT: 생물의학 텍스트 생성 및 마이닝을 위한 사전 학습된 생성 트랜스포머

사전 학습된 언어 모델은 일반 자연어 영역에서의 큰 성공에 힘입어 생물의학 영역에서도 점점 더 많은 관심을 받고 있습니다. 일반 언어 영역에서 사전 학습된 언어 모델의 두 가지 주요 분파, 즉 BERT(및 그 변형)와 GPT(및 그 변형) 중 첫 번째 분파는 BioBERT 및 PubMedBERT와 같이 생물 의학 영역에서 광범위하게 연구되어 왔습니다. 이들은 다양한 차별적 다운스트림 생물의학 작업에서 큰 성공을 거두었지만 생성 능력이 부족하여 적용 범위가 제한적입니다. 이 논문에서는 대규모 생물의학 문헌에 대해 사전 학습된 도메인별 생성 트랜스포머 언어 모델인 BioGPT를 제안합니다. 6개의 생의학 NLP 과제에 대해 BioGPT를 평가하고 대부분의 과제에서 기존 모델보다 우수한 성능을 보임을 입증합니..

2023.03.21

GPT-4

GPT-4는 대규모 멀티모달 모델(이미지와 텍스트 입력을 받아들이고 텍스트 출력을 내보내는)로, 많은 실제 시나리오에서 인간보다 능력이 떨어지지만 다양한 전문 및 학술 벤치마크에서 인간 수준의 성능을 보여줍니다. 예를 들어, 모의 변호사 시험에서 응시자 중 상위 10% 정도의 점수로 합격한 반면, GPT-3.5의 점수는 하위 10% 정도에 그쳤습니다. 저희는 6개월 동안 적대적 테스트 프로그램과 ChatGPT에서 얻은 교훈을 바탕으로 GPT-4를 반복적으로 조정하여 사실성, 조종성, 가드레일을 벗어나는 것을 거부하는 능력에서 완벽하지는 않지만 역대 최고의 결과를 얻었습니다. >> GPT-4 모의 변호사 시험: 상위 10% 점수로 합격 >> GPT-3.5: 하위 10% 지난 2년 동안 전체 딥 러닝 스택을..

2023.03.16

알파카: 강력한 오픈소스 명령-따름 모델

Alpaca: A Strong Open-Source Instruction-Following Model 저자: 로한 타오리*와 이샨 굴라자니*, 티안이 장*, 얀 두부아*, 쉬첸 리*, 카를로스 게스트린, 퍼시 량, 타츠노리 B. 하시모토 52K 명령따르기 데모에서 LLaMA 7B 모델을 파인 튜닝 모델인 Alpaca 7B를 소개합니다. 알파카는 OpenAI의 텍스트 다빈치-003과 유사하게 작동하지만 놀라울 정도로 작고 재현하기 쉽고 저렴합니다(600달러 미만). * 알파카 7B > LLaMA 7B 모델 파인튜닝 모델 > OpenAI 다빈치-003과 유사하지만, 사이즈가 작고 저렴합니다. (600달러 미만? 오픈AI 다빈치-003 호출 비용, 데이터 생성 비용) 참고: Instrction-Followin..

2023.03.15

[OpenAI] ChatGPT 및 Whisper API 소개

이제 개발자는 API를 통해 ChatGPT 및 Whisper 모델을 앱과 제품에 통합할 수 있습니다. 이 글은 오픈AI 블로그 기사를 번역하고 요약한것입니다. https://openai.com/blog/introducing-chatgpt-and-whisper-apis Introducing ChatGPT and Whisper APIs Developers can now integrate ChatGPT and Whisper models into their apps and products through our API. openai.com OpenAI는 최첨단 언어(ChatGPT) 및 음성-텍스트 변환(Whisper) 기능의 API 제공 이제 API에서 ChatGPT 및 Whisper 모델을 사용할 수 있게 되어..

2023.03.09

해피해커

해피해커

태그

최근글

댓글

공지사항

아카이브

Generative AI(21)

티스토리툴바