Generative AI

HuggingGPT (허깅GPT): ChatGPT와 허깅페이스의 친구들로 AI 과제 해결하기

해피해커 2023. 4. 2. 00:00

HuggingGPT에게 사진을 주고, 사진이 묘사하는 것과, 사진에 몇개의 객체가 있는지를 설명하라고 요청한다. LLM은 태스크 처리를 위해, 어떤 모델을 사용해야 할 지 계획하고 실행한다. 그리고 그 결과를 이용해서 응답을 생성한다.

 

다양한 영역과 방식으로 복잡한 AI 작업을 해결하는 것은 인공 지능(AGI)을 향한 핵심 단계입니다. 다양한 도메인과 양식에 사용할 수 있는 풍부한 AI 모델이 있지만, 복잡한 AI 작업을 처리할 수는 없습니다. 대규모 언어 모델(LLM)이 언어 이해, 생성, 상호 작용 및 추론에서 탁월한 능력을 보여 왔다는 점을 고려할 때, 우리는 LLM이 복잡한 AI 작업을 해결하기 위해 기존 AI 모델을 관리하는 컨트롤러 역할을 할 수 있으며, 언어는 이를 지원하는 일반적인 인터페이스가 될 수 있다고 주장합니다. 이러한 철학을 바탕으로 저희는 LLM(예: ChatGPT)을 활용하여 머신러닝 커뮤니티의 다양한 AI 모델(예: 허깅페이스)을 연결하여 AI 과제를 해결하는 시스템인 HuggingGPT를 소개합니다. 구체적으로는 사용자 요청을 받았을 때 작업 계획을 수립하고, HuggingFace에서 제공되는 기능 설명에 따라 모델을 선택하고, 선택한 AI 모델로 각 하위 작업을 실행한 후 실행 결과에 따라 응답을 요약하는 데 ChatGPT를 활용합니다. ChatGPT의 강력한 언어 능력과 허깅페이스의 풍부한 AI 모델을 활용하여 다양한 양식과 영역에서 수많은 정교한 AI 작업을 처리하고 언어, 시각, 음성 및 기타 까다로운 작업에서 인상적인 결과를 얻을 수 있는 허깅GPT는 AGI를 향한 새로운 길을 개척하고 있습니다.

Language is a generic interface for LLMs to connect AI models

언어는 LLM이 AI 모델을 연결하기 위한 일반적인 인터페이스입니다.

 

 

 

 

이 글은 다음 링크의 논문을 요약했습니다.

https://arxiv.org/pdf/2303.17580.pdf