GPT-5: 우리가 보고 싶은 4가지 새로운 기능-일체 포함-php.cn

적어도 우리는 그러기를 바라고 있습니다. GPT-5의 구체적인 출시 날짜는 없으며 우리가 알고 있다고 생각하는 대부분의 정보는 다른 정보를 종합하고 점을 연결하려는 시도에서 비롯됩니다.

그래도 마감일에 관계없이 GPT-5가 출시되면 확인하고 싶은 몇 가지 주요 기능이 있습니다.

OpenAI의 GPT-5란 무엇인가요?

GPT-5는 OpenAI의 GPT-4 AI 모델의 큰 기대를 받고 있는 후속 제품으로, 시장에서 가장 강력한 생성 모델이 될 것으로 널리 예상됩니다. 현재 GPT-5의 공식 출시 날짜는 없지만 빠르면 2024년 여름에 출시될 수 있다는 징후가 있습니다. 현재 모델에 대한 세부 사항은 거의 알려져 있지 않지만 어느 정도의 정보를 통해 몇 가지를 말할 수 있습니다. 확실성:

OpenAI는 미국 특허청에 해당 이름에 대한 상표를 등록했습니다. 여러 OpenAI 경영진이 모델의 가능한 기능에 대해 논의하거나 암시했습니다. OpenAI CEO인 Sam Altman은 2024년 3월 Lex Fridman과의 YouTube 인터뷰에서 이 모델을 반복해서 언급했습니다.

이 모든 것은 하나의 흥미로운 현실을 가리킵니다: GPT-5가 다가오고 있습니다! 즉, 현재로서는 추측이 많은 부분이 있습니다. 그러나 우리가 모델에서 보기를 희망하고 상당히 확신하는 몇 가지 사항이 있습니다.

1. 더 많은 다중 모드

GPT AI 모델 제품군의 가장 흥미로운 개선 사항 중 하나는 다중 모드입니다. 명확하게 말하면, 다중 양식은 텍스트뿐만 아니라 이미지, 오디오, 비디오와 같은 다른 유형의 입력도 처리하는 AI 모델의 기능입니다. 다중 양식은 앞으로 GPT 모델 제품군에 대한 중요한 발전 벤치마크가 될 것입니다.

GPT-4는 이미 이미지 입력 및 출력 처리에 능숙하므로 오디오 및 비디오 처리에 대한 개선은 OpenAI의 다음 이정표이며 GPT-5는 시작하기에 좋은 곳입니다. Google은 이미 Gemini AI 모델을 통해 이러한 종류의 다중 모드로 상당한 진전을 이루고 있습니다. 응답하지 않는 것은 OpenAI의 특징이 아닙니다. 그러나 물론 우리의 말을 그대로 받아들이지는 마십시오. Unconfuse Me 팟캐스트[PDF 사본]에서 Bill Gates는 OpenAI CEO인 Sam Altman에게 향후 2년 동안 GPT 시리즈에 대해 어떤 이정표를 예상하는지 물었습니다. 그의 첫 번째 대답은? 비디오 처리.

따라서 GPT-5에서는 비디오를 프롬프트로 업로드하고, 이동 중에 비디오를 만들고, 텍스트 프롬프트로 비디오를 편집하고, 비디오에서 세그먼트를 추출하고, 대용량 비디오 파일에서 특정 장면을 찾는 등 비디오를 가지고 놀 수 있을 것으로 기대합니다. . 우리는 오디오 파일에 대해서도 유사한 작업을 수행할 수 있을 것으로 기대합니다. 네, 큰 질문입니다. 그러나 AI 개발 속도를 고려하면 이는 매우 합리적인 기대입니다.

2. 더 크고 효율적인 컨텍스트 창

시장에서 가장 정교한 AI 모델 중 하나임에도 불구하고 AI 모델의 GPT 제품군은 가장 작은 컨텍스트 창 중 하나를 가지고 있습니다. 예를 들어, Anthropic의 Claude 3는 200,000개 토큰의 컨텍스트 창을 자랑하는 반면, Google의 Gemini는 무려 1백만 개의 토큰(표준 사용의 경우 128,000개)을 처리할 수 있습니다. 대조적으로, GPT-4는 128,000개의 토큰이라는 비교적 작은 컨텍스트 창을 가지며, ChatGPT와 같은 인터페이스에서 실제로 사용할 수 있는 토큰은 약 32,000개 이하입니다.

고급 다중 양식이 등장하면서 향상된 컨텍스트 창은 거의 불가피합니다. 어쩌면 2~4배 정도 증가하면 충분할 수도 있지만, 우리는 10배 정도 증가할 것으로 기대합니다. 이를 통해 GPT-5는 훨씬 더 효율적인 방식으로 훨씬 더 많은 정보를 처리할 수 있습니다. 이제 더 큰 컨텍스트 창이 항상 더 나은 것을 의미하는 것은 아닙니다. 따라서 단순히 컨텍스트 창을 늘리는 것보다 컨텍스트 처리의 효율성이 높아지기를 바랍니다.

모델에는 백만 개의 토큰 컨텍스트 창(약 700,000 단어 용량)이 있을 수 있지만 500,000 단어 책을 요약하라는 요청을 받았을 때 전체 컨텍스트를 적절하게 처리할 수 없기 때문에 포괄적인 요약을 생성하지 못할 수 있습니다. 이론적으로는 그렇게 할 수 있는 능력이 있다. 50만 단어로 된 책을 읽을 수 있다고 해서 그 안에 있는 모든 내용을 기억하거나 현명하게 처리할 수 있다는 의미는 아닙니다.

3. GPT 에이전트

아마도 GPT-5 릴리스의 가장 흥미로운 가능성 중 하나는 GPT 에이전트의 데뷔일 것입니다. AI에서는 "게임 체인저"라는 용어가 과도하게 사용되었지만 GPT 에이전트는 모든 실질적인 의미에서 진정으로 게임 체인저가 될 것입니다. 하지만 이것이 얼마나 판도를 바꾸게 될까요?

현재 GPT-4와 같은 AI 모델은 작업을 완료하는 데 도움이 될 수 있습니다. 그들은 이메일을 쓰고, 농담을 하고, 수학 문제를 풀고, 블로그 게시물 초안을 작성할 수 있습니다. 그러나 해당 특정 작업만 수행할 수 있으며 작업을 완료하는 데 필요한 일련의 관련 작업을 완료할 수는 없습니다.

당신이 웹 개발자라고 가정해 봅시다. 업무의 일환으로 디자인, 코드 작성, 문제 해결 등 많은 일을 수행해야 합니다. 현재는 한 번에 이러한 작업 중 일부만 AI 모델에 위임할 수 있습니다. GPT-4 모델에 홈 페이지용 코드를 작성하도록 요청한 다음 연락처 페이지, 정보 페이지 등에 대해 코드를 작성하도록 요청할 수 있습니다. 이러한 작업을 반복적으로 완료해야 합니다. 그리고 모델이 단순히 완료할 수 없는 작업이 있습니다.

AI 모델에 특정 하위 작업을 요청하는 이러한 반복 프로세스는 시간이 많이 걸리고 비효율적입니다. 이 시나리오에서는 웹 개발자인 귀하가 관련 작업 전체를 완료할 때까지 AI 모델에 한 번에 하나의 작업을 조정하고 지시하는 역할을 담당하는 인간 에이전트입니다.

GPT 에이전트는 복잡한 작업의 모든 하위 집합을 자율적으로 스스로 지시하고 처리할 수 있는 GPT-5가 조정하는 전문 전문 봇을 약속합니다. '자율적'과 '자율적'을 강조합니다.

따라서 GPT-5가 GPT 에이전트와 함께 제공되는 경우 단순히 "홈페이지용 코드를 작성해 주세요"가 아니라 "Maxwell Timothy를 위한 포트폴리오 웹사이트를 구축"하도록 요청할 수 있습니다. 그런 다음 GPT-5는 이론적으로 전문 AI 에이전트를 호출하여 웹 사이트 구축에 필요한 다양한 하위 작업을 처리함으로써 자체 프롬프트를 표시할 수 있습니다. 하나의 GPT를 호출하여 Maxwell Timothy에 대한 정보를 얻기 위해 웹을 스크랩하고, 다른 에이전트는 다양한 페이지에 대한 코드를 작성하고, 다른 에이전트는 이미지를 생성 및 최적화하고, 다른 AI 에이전트는 사이트를 배포할 수 있으며, 이 모든 작업은 사람의 반복적인 작업이 필요하지 않습니다. 격려.

4. 환각 감소

OpenAI가 AI 모델에서 환각을 처리하는 데 큰 진전을 이루었지만 GPT-5에 대한 진정한 리트머스 테스트는 광범위한 환각 문제를 해결하는 능력이 될 것입니다. 의료, 항공, 사이버 보안과 같이 위험도가 높고 안전이 중요한 영역에 AI를 채택합니다. 이는 모두 AI의 과도한 개입으로 큰 이익을 얻을 수 있지만 현재는 큰 채택을 피하고 있는 영역입니다.

명확하게 말하면, 이 맥락에서 환각은 AI 모델이 그럴듯하게 들리지만 완전히 조작된 정보를 높은 수준의 확신을 가지고 생성하고 제시하는 상황을 의미합니다.

환자 증상과 의료 보고서를 분석하기 위해 GPT-4가 진단 시스템에 통합되는 시나리오를 상상해 보세요. 환각으로 인해 AI는 자신 있게 잘못된 진단을 내리거나 상상한 사실과 거짓 논리를 바탕으로 잠재적으로 위험한 치료 과정을 추천할 수 있습니다. 의료 분야에서 이러한 오류의 결과는 치명적일 수 있습니다.

항공, 원자력, 해양 작전, 사이버 보안 등 결과가 큰 다른 분야에도 유사한 유보가 적용됩니다. 우리는 GPT-5가 환각 문제를 완전히 해결할 것이라고 기대하지는 않지만, 그러한 사건의 가능성을 크게 줄일 수 있을 것으로 기대합니다.

우리는 매우 기대되는 이 AI 모델의 공식 출시를 간절히 기다리고 있지만 한 가지는 확실합니다. GPT-5는 인공 지능으로 가능한 것의 경계를 재정의하고 인간-기계 협업의 새로운 시대를 열 수 있는 잠재력을 가지고 있다는 것입니다. 혁신.

위 내용은 GPT-5: 우리가 보고 싶은 4가지 새로운 기능의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!