
벤 에드워즈 / 아르스 테크니카
수요일에 OpenAI가 발표했습니다. 채팅GPT, 대규모 언어 모델의 GPT-3 제품군을 위한 대화 기반 AI 채팅 인터페이스. 현재 자유롭게 사용 테스트 단계에서 OpenAI 계정으로. 달리 GPT-3 OpenAI의 Playground 및 API에 있는 모델인 ChatGPT는 사용자 친화적인 대화형 인터페이스를 제공하며 잠재적으로 유해한 출력을 강력하게 제한하도록 설계되었습니다.
“대화 형식을 통해 ChatGPT는 후속 질문에 답하고, 실수를 인정하고, 잘못된 전제에 이의를 제기하고, 부적절한 요청을 거부할 수 있습니다.” 쓴다 발표 블로그 페이지의 OpenAI.
지금까지 사람들은 ChatGPT의 취약점을 탐색하는 동시에 다양한 잠재적 용도를 발견하면서 ChatGPT를 테스트해 왔습니다. 할 수 있습니다 시를 쓰다옳은 코딩 실수 자세한 예시와 함께, 생성하다 AI 아트 프롬프트, 쓰다 새로운 코드, 설명하다 핫도그를 샌드위치로 보는 철학적 분류에 대해 그리고 버블 정렬 알고리즘의 최악의 경우 시간 복잡도를 설명하세요… “1940년대 갱스터 영화에 나오는 말이 빠른 현자” 스타일로요.
OpenAI의 새로운 ChatGPT는 1940년대 갱스터 영화에 나오는 재빠르게 말하는 현명한 사람의 스타일로 Python 코드 예제를 사용하여 버블 정렬 알고리즘의 최악의 경우 시간 복잡도를 설명합니다. pic.twitter.com/MjkQ5OAIlZ
— 라일리 굿사이드(@goodside) 2022년 12월 1일
ChatGPT는 또한 잠재적으로 유해할 수 있는 많은 질문(증오심 표현, 폭력적인 콘텐츠 또는 폭탄 제조 방법과 같은 주제와 관련된)에 대한 답변을 거부합니다. 반대하다 그것의 “프로그래밍과 목적.” OpenAI는 다음 두 가지를 통해 이를 달성했습니다. 특별 프롬프트 모든 입력에 추가되고 인간 피드백에서 강화 학습(Reinforcement Learning from Human Feedback)이라는 기술을 사용하여RLHF), 인간이 생성된 응답을 어떻게 평가하는지에 따라 AI 모델을 미세 조정할 수 있습니다.
레이닝 공격적인 성향 대규모 언어 모델 중 하나는 주요 문제 잠재적인 시장 유용성을 제한했으며 OpenAI는 ChatGPT를 중요한 것으로 보고 있습니다. 반복 단계 모두에게 안전한 AI 모델을 제공하는 방향으로
그러나 놀랍지 않게도 사람들은 이미 방법을 알아냈습니다. 우회하다 일부 ChatGPT의 내장 콘텐츠 필터는 인공지능에게 가상 시나리오(또는 시). ChatGPT도 취약한 프롬프트 인젝션 공격, 아르스가 깨뜨린 이야기 9월에.
GPT-3와 마찬가지로 대화 기반 사촌도 다음과 같이 권위 있게 들리는 방식으로 내용을 완전히 구성하는 데 매우 능숙합니다. 존재하지 않는 책, 내용에 대한 세부 정보 포함. 이것은 오늘날 존재하는 대규모 언어 모델의 또 다른 주요 문제를 나타냅니다. 숨이 막힐 정도로 설득력 있는 정보 전체 천을 구성할 수 있다면 그 출력을 어떻게 신뢰할 수 있습니까?
OpenAI의 새로운 챗봇은 놀랍습니다. 그것은 매우 흥미로운 것들을 환각시킵니다. 예를 들어, 그것은 (v 흥미로운 소리!) 책에 대해 말했고 나는 그것에 대해 물었습니다.
불행하게도 아마존도, G Scholar도, G Books도 그 책이 진짜라고 생각하지 않습니다. 아마도 그래야 할 것입니다! pic.twitter.com/QT0kGk4dGs
— 마이클 닐슨(@michael_nielsen) 2022년 12월 1일
그래도 사람들이 그러하듯이 주목ChatGPT의 출력 품질은 주목할만한 개선 새로운 것을 포함하여 이전 GPT-3 모델보다 텍스트-다빈치-003 우리가 화요일에 쓴 모델. OpenAI 자체는 ChatGPT가 “2021년 4분기 이전의 텍스트와 코드의 혼합”에 대해 훈련된 모델의 “GPT 3.5” 시리즈의 일부라고 말합니다.
한편, GPT-4의 소문 계속 소용돌이. 오늘의 ChatGPT 모델이 2021년 OpenAI의 GPT-3 교육 작업의 정점을 나타낸다면 지난 12개월 동안 회사가 어떤 GPT 관련 혁신을 수행했는지 보는 것이 흥미로울 것입니다.