OpenAI API 모델 7가지는 알고 갑시다

2023. 3. 4. 08:12IT/AI

728x90
반응형

 

 

모델

개요

OpenAI API는 기능과 가격대가 다른 다양한 모델 세트로 구동됩니다. 또한 미세 조정을 통해 특정 사용 사례에 대한 원래 기본 모델에 대해 제한된 사용자 정의를 수행할 수 있습니다 .

모델설명
GPT-3.5 GPT-3에서 개선되고 자연어 또는 코드를 이해하고 생성할 수 있는 일련의 모델
DALL·E 자연어 프롬프트가 주어지면 이미지를 생성하고 편집할 수 있는 모델
Whisper 오디오를 텍스트로 변환할 수 있는 모델
Embeddings 텍스트를 숫자 형식으로 변환할 수 있는 일련의 모델
Codex
제한된 베타
자연어를 코드로 번역하는 것을 포함하여 코드를 이해하고 생성할 수 있는 일련의 모델
Moderation 텍스트가 민감하거나 안전하지 않은지 감지할 수 있는 미세 조정 모델
GPT-3 자연어를 이해하고 생성할 수 있는 일련의 모델

또한 Point-E , Whisper , Jukebox  CLIP을 포함한 오픈 소스 모델을 게시했습니다 .

연구원을 위한 모델 색인을 방문하여 연구 논문에 어떤 모델이 포함되었는지, InstructGPT 및 GPT-3.5와 같은 모델 시리즈 간의 차이점에 대해 자세히 알아보십시오.


GPT-3.5

GPT-3.5 모델은 자연어 또는 코드를 이해하고 생성할 수 있습니다. 우리의 가장 유능하고 비용 효율적인 모델은 gpt-3.5-turbo채팅에 최적화되어 있지만 기존 완료 작업에도 잘 작동합니다.

최신 모델설명최대 요청교육 데이터
gpt-3.5-turbo 가장 유능한 GPT-3.5 모델이며 1/10 비용으로 채팅에 최적화되었습니다 text-davinci-003. 최신 모델 반복으로 업데이트됩니다. 4,096 토큰 2021년 9월까지
gpt-3.5-turbo-0301 2023년 3월 1일 스냅샷 gpt-3.5-turbo. 달리 gpt-3.5-turbo이 모델은 업데이트를 받지 않으며 2023년 6월 1일에 끝나는 3개월 동안만 지원됩니다. 4,096 토큰 2021년 9월까지
text-davinci-003 curie, babbage 또는 ada 모델보다 더 나은 품질, 더 긴 출력 및 일관된 지침 준수로 모든 언어 작업을 수행할 수 있습니다. 또한 텍스트 내에 완성 삽입 을 지원합니다 . 4,000 토큰 2021년 6월까지
text-davinci-002 유사한 기능이지만 text-davinci-003강화 학습 대신 감독된 미세 조정으로 훈련됨 4,000 토큰 2021년 6월까지
code-davinci-002 코드 완성 작업에 최적화됨 4,000 토큰 2021년 6월까지

gpt-3.5-turbo최상의 결과를 얻을 수 있으므로 실험하면서 사용하는 것이 좋습니다 . 작업이 완료되면 다른 모델을 시도하여 더 낮은 대기 시간이나 비용으로 동일한 결과를 얻을 수 있는지 확인하는 것이 좋습니다.

 
OpenAI 모델은 비결정적입니다. 즉, 동일한 입력이 다른 출력을 생성할 수 있습니다. 온도를 0으로 설정하면 출력이 대부분 결정적이지만 약간의 변동성이 남아 있을 수 있습니다.

기능별 모델

 gpt-3.5-turbo모델은 채팅에 최적화되어 있지만 기존 완료 작업에 매우 적합합니다. 원본 GPT-3.5 모델은 텍스트 완성 에 최적화되어 있습니다 .

임베딩 생성  텍스트 편집을 위한 엔드포인트는 고유한 특수 모델 세트를 사용합니다.


터보(Turbo)

Turbo는 ChatGPT를 지원하는 동일한 모델 제품군입니다. 대화식 채팅 입력 및 출력에 최적화되어 있지만 Davinci 모델 제품군과 비교할 때 완료 시에도 동일하게 잘 수행됩니다. ChatGPT에서 잘 수행할 수 있는 모든 사용 사례는 API의 Turbo 모델 제품군에서 잘 수행되어야 합니다.

Turbo 모델 제품군은 ChatGPT와 같은 정기적인 모델 업데이트를 받는 최초의 모델이기도 합니다.

잘하는 것: 대화와 텍스트 생성

Davinci (다 빈치 )

Davinci는 가장 유능한 모델 제품군이며 다른 모델(Ada, Curie 및 Babbage)이 수행할 수 있는 모든 작업을 수행할 수 있으며 종종 적은 지침으로도 수행할 수 있습니다. 특정 청중을 위한 요약 및 창의적인 콘텐츠 생성과 같이 콘텐츠에 대한 많은 이해가 필요한 응용 프로그램의 경우 Davinci가 최상의 결과를 생성합니다. 이러한 향상된 기능에는 더 많은 컴퓨팅 리소스가 필요하므로 Davinci는 API 호출당 비용이 더 많이 들고 다른 모델만큼 빠르지 않습니다.

Davinci가 빛나는 또 다른 영역은 텍스트의 의도를 이해하는 것입니다. 다빈치는 많은 종류의 논리 문제를 해결하고 등장인물의 동기를 설명하는 데 꽤 능숙합니다. Davinci는 원인과 결과와 관련된 가장 어려운 AI 문제 중 일부를 해결할 수 있었습니다.

잘하는 것: 복잡한 의도, 원인과 결과, 청중을 위한 요약

Curie

Curie는 매우 강력하면서도 매우 빠릅니다. Davinci는 복잡한 텍스트를 분석하는 데 더 강하지만 Curie는 감정 분류 및 요약과 같은 많은 미묘한 작업을 수행할 수 있습니다. Curie는 또한 질문에 답하고 Q&A를 수행하는 것과 일반 서비스 챗봇으로서 매우 능숙합니다.

잘하는 것: 언어 번역, 복잡한 분류, 텍스트 감성, 요약

Babbage

Babbage는 간단한 분류와 같은 간단한 작업을 수행할 수 있습니다. 또한 문서가 검색 쿼리와 얼마나 잘 일치하는지 순위를 매기는 시맨틱 검색과 관련하여 상당히 유능합니다.

잘하는 것: 보통분류, 의미 검색 분류

Ada ( 에이다 )

Ada는 일반적으로 가장 빠른 모델이며 텍스트 구문 분석, 주소 수정 및 너무 많은 뉘앙스가 필요하지 않은 특정 종류의 분류 작업과 같은 작업을 수행할 수 있습니다. Ada의 성능은 종종 더 많은 컨텍스트를 제공함으로써 향상될 수 있습니다.

잘하는 것: 텍스트 파싱, 단순 분류, 주소 수정, 키워드

참고: Ada와 같은 더 빠른 모델이 수행하는 작업은 Curie 또는 Davinci와 같은 더 강력한 모델이 수행할 수 있습니다.

올바른 모델 찾기

실험은 gpt-3.5-turboAPI가 무엇을 할 수 있는지 알아보는 좋은 방법입니다. 달성하고자 하는 것에 대한 아이디어를 얻은 후에는 gpt-3.5-turbo또는 다른 모델을 유지하고 해당 기능을 최적화하려고 시도할 수 있습니다.

서로 다른 모델을 나란히 실행하여 출력, 설정 및 응답 시간을 비교한 다음 데이터를 Excel 스프레드시트로 다운로드할 수 있는 GPT 비교 도구를 사용할 수 있습니다 .

DALL·E

DALL·E는 자연어로 된 설명에서 사실적인 이미지와 예술을 만들 수 있는 AI 시스템입니다. 현재 특정 크기의 새 이미지를 생성하거나, 기존 이미지를 편집하거나, 사용자 제공 이미지의 변형을 생성하는 메시지가 주어지면 기능을 지원합니다.

API를 통해 사용할 수 있는 현재 DALL·E 모델은 원래 모델보다 더 사실적이고 정확하며 4배 더 높은 해상도 이미지를 가진 DALL·E의 두 번째 반복입니다. Labs 인터페이스 또는 API를 통해 사용해 볼 수 있습니다 .

Whisper

Whisper는 범용 음성 인식 모델입니다. 다양한 오디오의 대규모 데이터 세트에 대해 학습되며 다국어 음성 인식은 물론 음성 번역 및 언어 식별을 수행할 수 있는 멀티태스킹 모델이기도 합니다. Whisper v2-large 모델은 현재 whisper-1모델 이름으로 API를 통해 사용할 수 있습니다.

현재 Whisper의 오픈 소스 버전 과 API를 통해 제공되는 버전 간에는 차이가 없습니다 . 그러나 API를 통해 다른 수단을 통해 수행하는 것보다 API를 통해 Whisper를 훨씬 빠르게 실행할 수 있는 최적화된 추론 프로세스를 제공합니다. Whisper에 대한 자세한 기술 정보는 백서에서 확인할 수 있습니다 .

Embeddings (임베딩 )

임베딩은 두 텍스트 간의 관련성을 측정하는 데 사용할 수 있는 텍스트의 숫자 표현입니다. 2세대 임베딩 모델은 text-embedding-ada-002적은 비용으로 이전 16개의 1세대 임베딩 모델을 대체하도록 설계되었습니다. 임베딩은 검색, 클러스터링, 권장 사항, 변칙 검색 및 분류 작업에 유용합니다. 발표 블로그 게시물 에서 최신 임베딩 모델에 대해 자세히 알아볼 수 있습니다 .

Codex  제한된 베타

Codex 모델은 코드를 이해하고 생성할 수 있는 GPT-3 모델의 후손입니다. 그들의 학습 데이터에는 자연어와 GitHub의 수십억 줄의 공개 코드가 모두 포함되어 있습니다. 자세히 알아 보기

그들은 Python에서 가장 유능하며 JavaScript, Go, Perl, PHP, Ruby, Swift, TypeScript, SQL, 심지어 Shell을 포함한 12개 이상의 언어에 능숙합니다.

현재 두 가지 Codex 모델을 제공합니다.

최신 모델설명최대 요청교육 데이터
code-davinci-002 가장 유능한 코덱스 모델. 특히 자연어를 코드로 번역하는 데 능숙합니다. 코드를 완성하는 것 외에도 코드 내에 완성을 삽입하는 것도 지원합니다. 8,000 토큰 2021년 6월까지
code-cushman-001 Davinci Codex와 거의 비슷하지만 약간 더 빠릅니다. 이러한 속도 이점은 실시간 응용 프로그램에 바람직할 수 있습니다. 최대 2,048개의 토큰  

자세한 내용은 Codex 작업 가이드를 참조하십시오 .

Codex 모델은 제한된 베타 기간 동안 무료로 사용할 수 있으며 감소된 속도 제한이 적용됩니다 . 사용에 대해 알아가면서 광범위한 응용 프로그램 세트를 사용할 수 있도록 가격 책정을 제안할 것입니다.

이 기간 동안 애플리케이션이 Google의 사용 정책을 준수하는 한 애플리케이션을 사용할 수 있습니다 . 초기 사용 중에 이러한 모델에 대한 피드백을 환영하며 커뮤니티와 소통하기를 기대합니다.

기능별 모델

기본 Codex 모델은 텍스트 완성 끝점과 함께 사용하기 위한 것입니다. 또한 임베딩 생성  코드 편집을 위해 엔드포인트와 함께 사용하도록 특별히 설계된 모델도 제공합니다 .


Moderation

중재 모델은 콘텐츠가 OpenAI의 사용 정책을 준수하는지 확인하도록 설계되었습니다 . 이 모델은 증오, 증오/위협, 자해, 성적, 성적/미성년자, 폭력 및 폭력/그래픽 범주에서 콘텐츠를 찾는 분류 기능을 제공합니다. 검토 가이드 에서 자세한 내용을 확인할 수 있습니다 .

모델설명

텍스트 검토-최신 가장 유능한 조정 모델. 정확도는 안정적인 모델보다 약간 더 높을 것입니다.
텍스트 조정 안정 최신 모델과 거의 비슷하지만 약간 더 오래되었습니다.

GPT-3

GPT-3 모델은 자연어를 이해하고 생성할 수 있습니다. 이 모델은 보다 강력한 GPT-3.5 세대 모델로 대체되었습니다. 그러나 원래 GPT-3 기본 모델( davinci, curie, ada및 babbage)은 현재 미세 조정이 가능한 유일한 모델입니다.

최신 모델설명최대 요청교육 데이터
text-curie-001 Davinci보다 매우 유능하고 빠르며 비용이 저렴합니다. 2,048 토큰 2019년 10월까지
text-babbage-001 간단한 작업이 가능하고 매우 빠르고 비용이 저렴합니다. 2,048 토큰 2019년 10월까지
text-ada-001 매우 간단한 작업이 가능하며 일반적으로 GPT-3 시리즈에서 가장 빠른 모델이며 가장 저렴합니다. 2,048 토큰 2019년 10월까지
davinci 가장 유능한 GPT-3 모델. 다른 모델이 할 수 있는 모든 작업을 종종 더 높은 품질로 수행할 수 있습니다. 2,048 토큰 2019년 10월까지
curie 매우 유능하지만 Davinci보다 빠르고 저렴합니다. 2,048 토큰 2019년 10월까지
babbage 간단한 작업이 가능하고 매우 빠르고 비용이 저렴합니다. 2,048 토큰 2019년 10월까지
ada 매우 간단한 작업이 가능하며 일반적으로 GPT-3 시리즈에서 가장 빠른 모델이며 가장 저렴합니다. 2,048 토큰 2019년 10월까지

나날이 발전이 있으시기를 기원합니다. 

728x90
반응형