올해 대형 모델 폭발 이후 현재의 인공지능 기술은 아직 2세대 시스템 단계로, 아직 인공일반지능(AGI) 수준에는 도달하지 못했습니다. 그러나 일부 분야에서는 AI Agent를 이미 처리에 사용할 수 있습니다. 일반적인 B-end 애플리케이션으로서 비즈니스 요구 사항을 충족하는 AI 에이전트를 설계하는 방법은 무엇입니까?
인공지능의 급속한 발전과 함께 다양한 첨단 대형 모델, 제품, 도구가 속속 등장하고 있습니다. B측 제품 관리자로서 우리는 이 혁신적인 인공지능 기술을 적극적으로 수용하고 이를 자체 비즈니스에 적용하여 기업의 효율성이 산업 발전에 뒤처지지 않도록 해야 합니다
일반적으로 기업이 대규모 모델을 독립적으로 개발하지 않는 경우 타사의 대규모 모델 역량에 의존하여 기업 자체에 적합한 AI 제품이나 도구를 구축하는 AI 역량을 개발해야 합니다.
아래 그림과 같이 일반적인 대규모 모델 방향에는 자연어 처리(NLP), 멀티모달(multimodal) 및 음성 인식이 포함됩니다. 대형 모델 제조사는 특정 방향의 역량을 기반으로 AI 훈련을 실시해 AI가 특정 분야의 '반복 가능'하고 '표준화 가능한' 작업에서 인간을 대체할 수 있도록 해준다.
사진은 오픈프라이버시컴퓨팅의 "수백모델 대결!"에서 인용한 사진입니다. 어떤 대형 AI 모델을 선호하시나요? 》
우리 사업에 필요한 AI 역량을 판단하기 위해서는 해당 AI 모델에 대한 연구를 진행하고 대형 모델의 출력 역량을 평가해야 합니다. 재현율, 정확성, 보안, 해석 가능성, 안정성, 비용, 개발 가능성 등 다양한 차원에서 대형 모델을 평가하여 궁극적으로 우리의 요구에 맞는 대형 모델을 선택할 수 있습니다. 이 주제에 대해서는 이전 기사에서 귀하에게 적합한 대형 모델을 선택하는 방법을 자세히 설명했습니다.
그러나 현재 AI 기술은 아직 2세대 시스템 단계로 아직 AGI 수준에는 도달하지 못했습니다. 현재 접근 가능한 대규모 모델에는 주로 다음과 같은 측면을 포함하여 몇 가지 문제가 여전히 있습니다.
1. AI 환상:
AI 환상이란 지식 기억, 이해 능력, 훈련 방법 및 모델 기술에 있어서 인공 지능의 한계를 말하며, 이로 인해 출력 결과가 부정확하거나 신뢰할 수 없는 성능으로 이어집니다. 일반적인 문제로는 데이터 편향과 해석력 저하 등이 있습니다
AI 환상의 존재로 인해 AI가 안정적으로 신뢰할 수 있는 솔루션을 출력할 수 있다고 기대하더라도 여전히 일정 비율의 오답이 있을 것입니다. 예를 들어 AI가 특정 분야에서 50% 정확하다면 50개 중 25개의 오답이 나올 것이다. 높은 정확도를 요구하는 비즈니스에는 AI를 직접 적용할 수 없습니다.
2. 규정 준수 질문에 대한 답변
AI의 본질은 통계를 바탕으로 결과를 예측하는 것이며 옳고 그름을 명확하게 판단하는 능력이 부족합니다. 따라서 윤리적, 법적 및 기타 문제에 있어서 AI는 정확한 판단이나 구별을 할 수 없으며, 이는 회사에 부정적인 영향을 미칠 수 있습니다
3. 네이티브가 부족함:
현재 인공지능의 상호작용 방식은 주로 입출력을 통한 방식입니다. 사용자가 콘텐츠를 입력하면 인공지능이 결과를 출력한다. 하지만 이 프로세스는 모든 비즈니스 담당자의 사용 습관에 적합하지 않습니다
번역 시나리오를 예로 들면, 번역가의 비즈니스 프로세스는 일반적으로 다음 단계로 구성됩니다.
그러나 인건비를 절약하기 위해 번역에 AI를 사용하려는 경우 대화 입력 상호 작용에 대규모 언어 모델을 직접 사용하면 다음과 같은 문제가 발생합니다.
1) 기존 작업 흐름을 중단하고 사용 습관을 개발하기 어렵게 만듭니다.
큰 언어 모델 대화 창을 사용하면 원본 번역 작업의 비즈니스 프로세스가 중단됩니다. 원래는 번역 도구나 문서에 대한 작업만 완료하면 되었습니다. 대규모 모델 대화에 참여한 후에는 번역된 각 텍스트를 입력 상자에 입력해야 합니다.
2) 운영비 인상 상한 :
대규모 언어 모델은 대화 길이에 제한이 있습니다. 번역 내용이 많으면 일괄적으로 상호 작용을 수행해야 하므로 인건비가 증가합니다.
3) 특별한 번역 요구 사항을 충족하기 위해 운영 비용 증가:
용어 번역이나 번역 스타일 지정 등 특정 번역 요구 사항이 있는 경우 매번 상호 작용이 필요하므로 인력이 더 많이 필요합니다.
위의 문제로 인해 AI가 비즈니스 번역 효율성을 효과적으로 향상시키지 못합니다. 번거로운 작업으로 인해 사용자는 사용 습관을 형성하기 어렵고, AI를 사용하는 것보다 스스로 직접 번역하는 것이 더 낫다고 무의식적으로 생각하는 경우가 많아 교체 비용이 높습니다.
또한 AI 번역에는 환상 문제가 있어 기대 이상의 사용자 경험을 제공할 수 없습니다.
따라서 [(새 경험-기존 경험)-대체 비용]은 0보다 크지 않습니다. AI의 기본 상호 작용 방법을 직접 사용하는 것은 비즈니스 비율을 효과적으로 향상시킬 수 없으므로 좀 더 기본 방법이 필요합니다.
1. AI 에이전트란
현재 인공지능이 직면한 과제를 고려하여 B 측에서 자체 애플리케이션을 구축하는 방법에 대해 생각해 볼 필요가 있습니다. 한 가지 가능한 방법은 비즈니스에 맞게 맞춤화된 AI 에이전트를 구축하는 것입니다
일명 AI 에이전트는 인공지능 에이전트라고도 하며, 작업을 이해하고 학습하고 수행할 수 있는 자동화된 프로그램을 말합니다. 이는 "AI를 인턴으로 대우해 사소한 업무를 맡기고, 우리는 이 인턴의 결과물이 기대되는 결과를 충족하도록 지도하는 역할을 맡는다"고 비유할 수 있다.
대형 모델과 달리 AI 에이전트의 상호작용 방식은 사람들에게 메시지를 보내는 데만 국한되지 않습니다. 구체적인 업무 목표를 기반으로 요구사항에 맞는 결과를 출력하는 시스템입니다. AI Agent의 핵심은 인식 모듈, 계획 모듈 및 동작 모듈의 확장도 포함하는 대형 모델입니다
그렇다면 비즈니스 요구 사항을 충족하는 AI 에이전트를 어떻게 설계해야 할까요?
1. 적합한 비즈니스 시나리오 찾기
먼저 AI Agent에 적합한 시나리오를 결정하고, 데이터 입력을 시뮬레이션하고 출력 결과를 수집하여 선택한 시나리오의 적합성을 평가해야 합니다. 출력결과를 판단할 때에는 기대에 부합하는지 검토할 필요가 있다. 결과가 예상과 다르면 오류의 심각도를 평가하고 정밀도와 재현율에 개선의 여지가 있는지 평가해야 합니다. 개선의 여지가 있다면 프롬프트 단어를 최적화하거나 인식, 행동 및 계획 모듈 구성을 도입하여 장면 요구 사항을 충족하도록 AI를 만들 수 있습니다.
2. 입력 및 출력 기대값 정렬
AI 에이전트가 입력하는 내용과 에이전트가 출력해야 하는 내용을 결정하려면 '목표'와 '요구사항'을 명확히 해야 합니다.
이러한 '목표'와 '요구 사항'을 바탕으로 비즈니스 요구 사항을 충족하고 비즈니스 역량을 강화하는 데 적합한 입력 및 출력 방법을 선택하는 방법을 고민해야 합니다. 이는 후속 출력 프로세스를 설계하고 설계 검증 단계에서 이를 평가하여 요구 사항을 충족하는지 확인하는 데 도움이 됩니다.
3. 출력 프로세스 정렬
복잡한 출력 요구 사항에 직면할 때 다양한 AI가 서로 협력하여 궁극적으로 요구 사항을 충족하는 출력 결과를 얻을 수 있도록 여러 AI 대화 프로세스를 설계해야 합니다. 예를 들어 텍스트 분류 시나리오에서는 요구 사항을 충족하기 위해 정확한 1단계 분류를 위해 먼저 버전 3.5의 대규모 모델을 사용할 수 있습니다.
버전 4.0의 비용은 버전 3.5의 수십배이고, 1차 분류에는 버전 3.5로도 충분하므로 비용 절감을 위해 버전 3.5를 선택하시면 됩니다. 그런 다음 2차 분류에 버전 4.0을 사용하여 더 나은 분류 결과를 얻고 필요한 콘텐츠를 출력할 수 있습니다.
프로세스를 설계할 때 다음 요소를 고려해야 합니다.
비용과 효율성 측면을 종합적으로 고려한 끝에 최종적으로 적합한 계획을 결정했습니다
4. 출력 검사 메커니즘
AI 출력 결과의 오해의 소지가 있는 내용이 비즈니스에 영향을 미치는 것을 방지하려면 효과적인 검증 메커니즘을 구축해야 합니다. 일반적인 확인 방법에는 어휘 일치, 정규식 일치 및 수동 검사가 포함됩니다. 동의어 사전이나 수동 수단을 사용하여 오해의 소지가 있는 콘텐츠를 차단합니다. 또한 AI 자체가 출력에 대한 품질 검사를 수행하여 문제가 있는 콘텐츠를 필터링하고 오해의 소지가 있는 콘텐츠의 탐지율을 향상시키는 품질 검사 에이전트를 구축할 수도 있습니다.
5. 환상 솔루션
환각의 발생은 완전히 근절될 수 없는 현상입니다. 비즈니스에 대한 부정적인 영향을 방지하려면 다음과 같은 안전 계획을 세워야 합니다.
1) 수동 검사 : AI 출력이 사용자에게 전달되기 전 수동 검사 링크를 도입합니다. 수동 검사를 통과한 후에만 결과가 사용자에게 출력됩니다. 이런 방식으로 AI 환상이 비즈니스에 부정적인 영향을 미치는 것을 완벽하게 방지할 수 있으며, AI의 결과물을 활용해 효율성을 높일 수도 있습니다. 그러나 이 방법은 수동 검토가 필요하므로 특정 인건비가 증가합니다.
2) 합리적인 패키징: 우리가 B-side용 AI 애플리케이션이라는 점을 고려하여 출력 애플리케이션을 "AI 어시스턴트"로 패키징하는 등의 방법을 사용하여 사용자에게 "여기의 출력 결과는 생성됩니다. AI에 의한 것이며 참고용으로만 사용됩니다." 이러한 방식으로 우리는 사용자가 합리적인 심리적 기대를 형성하고 환각 출력이 발생할 때 불리한 반응을 피할 수 있도록 할 수 있습니다.
3. 요약
위의 아이디어를 바탕으로 B면 번역 에이전트, 데이터 분류 에이전트, 지능형 고객 서비스 에이전트 및 기타 서비스를 구축할 수 있습니다. 물론 이는 모두가 개인적인 생각을 교환하고 토론하는 것을 환영합니다.
나에게 투표해주세요
2023 모두가 프로덕트 매니저 선발에 참여하게 되었어요. 제 글을 좋아하는 친구들이 와서 응원해줬으면 좋겠어요~
아래 링크를 클릭하시면 제 개인 후보 페이지로 들어가시고, 빨간 하트를 클릭하시면 저에게 투표하실 수 있습니다.
1인당 하루 최대 30표까지 투표할 수 있습니다. 투표를 하면 추첨을 통해 도서, 모두가 프로덕트 매니저 기념 주변기기, 스타팅포인트교실 회원권 등의 선물을 받을 수 있습니다!
투표는 아래 링크를 클릭해주세요: https://996.pm/7d9yE
칼럼니스트
레몬케이크는 깨끗하고 위생적입니다. 공식 계정: 레몬케이크는 모두 깨끗하고 위생적입니다. 게임 업계의 B-end 제품입니다. 게임 업계에서 CRM, 리스크 관리, BI, SDK, AI 관련 콘텐츠를 담당해 왔으며 정기적으로 개인적인 생각이나 요약 기사를 작성하고 있습니다~
이 글은 모두가 제품 관리자입니다
에 게재된 글입니다. 무단 전재를 금합니다.제목 사진은 Unsplash에서 가져온 것이며 CC0 라이선스를 기반으로 합니다
위 내용은 AI 에이전트가 엔터프라이즈 수준 설계에 대해 생각하는 방식의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!