OpenAI는 재미있는 결과로 새로운 AI 기반 챗봇을 테스트하도록 모든 사람을 초대합니다.

-


AI가 생성한 챗봇 이미지.
크게 하다 / AI가 생성한 챗봇 이미지가 프롬프트에서 예언한 대로 구불구불한 방사형 선에서 폭발합니다.

벤 에드워즈 / 아르스 테크니카

수요일에 OpenAI가 발표했습니다. 채팅GPT, 대규모 언어 모델의 GPT-3 제품군을 위한 대화 기반 AI 채팅 인터페이스. 현재 자유롭게 사용 테스트 단계에서 OpenAI 계정으로. 달리 GPT-3 OpenAI의 Playground 및 API에 있는 모델인 ChatGPT는 사용자 친화적인 대화형 인터페이스를 제공하며 잠재적으로 유해한 출력을 강력하게 제한하도록 설계되었습니다.

“대화 형식을 통해 ChatGPT는 후속 질문에 답하고, 실수를 인정하고, 잘못된 전제에 이의를 제기하고, 부적절한 요청을 거부할 수 있습니다.” 쓴다 발표 블로그 페이지의 OpenAI.

지금까지 사람들은 ChatGPT의 취약점을 탐색하는 동시에 다양한 잠재적 용도를 발견하면서 ChatGPT를 테스트해 왔습니다. 할 수 있습니다 시를 쓰다옳은 코딩 실수 자세한 예시와 함께, 생성하다 AI 아트 프롬프트, 쓰다 새로운 코드, 설명하다 핫도그를 샌드위치로 보는 철학적 분류에 대해 그리고 버블 정렬 알고리즘의 최악의 경우 시간 복잡도를 설명하세요… “1940년대 갱스터 영화에 나오는 말이 빠른 현자” 스타일로요.

ChatGPT는 또한 잠재적으로 유해할 수 있는 많은 질문(증오심 표현, 폭력적인 콘텐츠 또는 폭탄 제조 방법과 같은 주제와 관련된)에 대한 답변을 거부합니다. 반대하다 그것의 “프로그래밍과 목적.” OpenAI는 다음 두 가지를 통해 이를 달성했습니다. 특별 프롬프트 모든 입력에 추가되고 인간 피드백에서 강화 학습(Reinforcement Learning from Human Feedback)이라는 기술을 사용하여RLHF), 인간이 생성된 응답을 어떻게 평가하는지에 따라 AI 모델을 미세 조정할 수 있습니다.

레이닝 공격적인 성향 대규모 언어 모델 중 하나는 주요 문제 잠재적인 시장 유용성을 제한했으며 OpenAI는 ChatGPT를 중요한 것으로 보고 있습니다. 반복 단계 모두에게 안전한 AI 모델을 제공하는 방향으로

그러나 놀랍지 않게도 사람들은 이미 방법을 알아냈습니다. 우회하다 일부 ChatGPT의 내장 콘텐츠 필터는 인공지능에게 가상 시나리오(또는 ). ChatGPT도 취약한 프롬프트 인젝션 공격, 아르스가 깨뜨린 이야기 9월에.

GPT-3와 마찬가지로 대화 기반 사촌도 다음과 같이 권위 있게 들리는 방식으로 내용을 완전히 구성하는 데 매우 능숙합니다. 존재하지 않는 책, 내용에 대한 세부 정보 포함. 이것은 오늘날 존재하는 대규모 언어 모델의 또 다른 주요 문제를 나타냅니다. 숨이 막힐 정도로 설득력 있는 정보 전체 천을 구성할 수 있다면 그 출력을 어떻게 신뢰할 수 있습니까?

그래도 사람들이 그러하듯이 주목ChatGPT의 출력 품질은 주목할만한 개선 새로운 것을 포함하여 이전 GPT-3 모델보다 텍스트-다빈치-003 우리가 화요일에 쓴 모델. OpenAI 자체는 ChatGPT가 “2021년 4분기 이전의 텍스트와 코드의 혼합”에 대해 훈련된 모델의 “GPT 3.5” 시리즈의 일부라고 말합니다.

한편, GPT-4의 소문 계속 소용돌이. 오늘의 ChatGPT 모델이 2021년 OpenAI의 GPT-3 교육 작업의 정점을 나타낸다면 지난 12개월 동안 회사가 어떤 GPT 관련 혁신을 수행했는지 보는 것이 흥미로울 것입니다.



관련 기사