3월 16일 오후, 바이두는 베이징 본사에서 차세대 대형 언어 모델과 생성 AI 제품을 주제로 기자회견을 열었습니다.WenxinYiyan. Baidu 창립자이자 회장 겸 CEO인 Robin Li와 Baidu의 최고 기술 책임자인 Wang Haifeng이 참석하여 문학 창작, 비즈니스 카피라이팅 창작, 수학적 계산, 중국어 이해 및 다중 언어 분야에서 Wen Xin Yi Yan의 5가지 사용 시나리오를 시연했습니다. 모달 세대.
실시간 시연으로 볼 때 Wen Xinyiyan은 인간의 의도를 어느 정도 이해하는 능력을 갖추고 있으며 그의 답변의 정확성, 논리 및 유창성은 점차 인간 수준에 가까워지고 있습니다. 그러나 Robin Li는 이러한 유형의 대형 언어 모델이 개발 및 완성 단계와는 거리가 멀고 개선의 여지가 많다는 점을 여러 번 언급했습니다. 앞으로는 확실히 빠르게 발전하고 변화할 것입니다. 낮.
Baidu는 Wen Xinyiyan의 초대 테스트 계획도 발표했습니다. 3월 16일부터 1차 사용자는 Wenxinyiyan 공식 웹사이트에서 테스트 코드를 초대하여 제품을 체험할 수 있으며, 향후 더 많은 사용자에게 공개될 예정입니다. 또한 Baidu Smart Cloud는 곧 Wenxinyiyan API 인터페이스 통화 서비스를 기업 고객에게 공개할 예정입니다. 3월 16일부터 정식으로 예약이 오픈됩니다. 공식 홈페이지에 "Baidu Smart Cloud"를 검색해 들어가시면 Wenxin Yiyan Cloud 서비스 테스트 참여를 신청하실 수 있습니다.
현재 대규모 언어 모델과 생성 AI는 새로운 기술 패러다임을 대표하며 전 세계 모든 기업이 놓칠 수 없는 기회입니다. Baidu Wenxinyiyan은 금융, 에너지, 미디어, 정부 업무 등 수천 개 산업의 지능적 변혁을 지원하는 인공지능 기반형 권한 부여 플랫폼으로 자리매김하고 있습니다. Robin Li는 "Baidu는 모든 사람과 협력하여 인공지능 기술의 발전을 촉진하여 모든 사람이 가장 진보된 생산성 도구를 사용하여 모든 사람이 혜택을 누릴 수 있기를 바랍니다."라고 말했습니다.
Robin Li는 기자회견에서 다음과 같이 말했습니다. Wen Xin의 말 문학 창작, 비즈니스 카피라이팅 창작, 수학적 계산, 중국어 이해 및 다중 모드 생성을 포함한 5가지 사용 시나리오에서의 성능입니다.
문신의연은 문학 창작 장면에서 유명한 SF 소설 '삼체 문제'의 핵심 내용을 대화 질문을 바탕으로 요약하고, '삼체 문제'를 계속 집필하기 위한 다섯 가지 제안 각도를 제시했습니다. ", 대화의 질문과 답변을 반영하고, 요약, 분석, 콘텐츠 제작 등 종합적인 능력을 보유합니다.
또한 문신의연은 '삼체문제'의 작가와 드라마 속 배우에 대한 사실적 질문에 정확하게 답변했습니다. 생성적 AI는 사실에 관한 질문에 답할 때 종종 '만들어내는' 경우가 많으며 Wen Xinyiyan은 Baidu의 지식 강화 대형 모델 개념을 이어가고 사실에 관한 질문의 정확성을 크게 향상시킵니다.
비즈니스 카피라이팅 창작 시나리오에서 Wen Xinyiyan은 회사 이름 지정, 슬로건 작성, 보도 자료 작성 등의 창의적인 작업을 성공적으로 완료했습니다.
3번의 연속 콘텐츠 제작을 통해 Wen Xinyiyan은 인간의 의도를 정확하게 이해하고 명확하게 표현할 수 있었습니다. 이것이 바로 거대한 규모의 데이터를 기반으로 발생하는 "지능 출현"입니다. Wenxin Yiyan의 대형 모델 학습 데이터에는 수조 개의 웹 페이지 데이터, 수십억 개의 검색 데이터 및 이미지 데이터, 수백억 개의 일일 음성 통화 데이터, 5,500억 개의 사실에 대한 지식 그래프가 포함됩니다.
Wen Xinyiyan은 또한 어느 정도의 사고 능력을 가지고 있으며 수학적 추론 및 논리적 추론과 같은 비교적 복잡한 작업을 배울 수 있습니다. 인간의 논리적 사고를 훈련시키는 "같은 우리 안의 닭과 토끼"와 같은 고전적인 질문에 직면한 Wen Xinyiyan은 질문의 의미를 이해하고 문제 해결을 위한 올바른 아이디어를 얻은 다음 올바른 단계를 따라 문제를 계산할 수 있습니다. 학생처럼 한걸음 한걸음씩 정답을 맞춰보세요.
문학 창작, 비즈니스 카피라이팅 창작, 수학적 계산은 대규모 언어 모델의 공통된 장점이자 능력입니다. 이를 바탕으로 Wenxinyiyan은 또한 더 나은 중국어 이해와 다중 모드 생성 능력을 보여줍니다.
현장 시연에서 문신의연은 '낙양종이 비싸다'라는 관용어의 의미와 이에 상응하는 '낙양종이 비싸다'라는 경제이론을 정확하게 설명했으며, '낙양종이는 비싸다'라는 네 단어를 활용해 삼행시를 창작하기도 했다. 비싸다".
다중 모드 생성 측면에서 Robin Li는 Wen Xin Yi Yan의 텍스트, 그림, 오디오 및 비디오 생성 능력을 보여주었습니다. 흥미롭게도 Wenxinyiyan은 쓰촨성 방언과 같은 방언으로도 음성을 생성할 수 있습니다. Wenxinyiyan의 비디오 생성 기능은 현재 높은 비용으로 인해 모든 사용자에게 공개되지 않으며 앞으로 점차적으로 액세스될 예정입니다.
"다중 모드는 생성 AI의 분명한 발전 추세입니다." Robin Li는 "앞으로 Baidu의 대규모 다중 모드 모델 통합 능력이 향상됨에 따라 Wen Xinyiyan의 다중 모드 생성 기능도 계속 향상될 것입니다. "
Wen Xinyiyan의 성능, 인간의 의도를 어느 정도 이해하는 능력을 갖추고 있으며, 답변의 정확성, 논리성, 유창함도 점차 인간 수준에 가까워지고 있습니다. 그러나 전반적으로 이러한 유형의 대규모 언어 모델은 완전히 개발되지 않았으며 실제 사용자 피드백을 통한 점진적인 반복에 의존합니다.
Wang Haifeng은 Wenxinyiyan이 ERNIE 및 PLATO 시리즈 모델을 기반으로 개발된 차세대 지식 강화 대형 언어 모델이라고 말했습니다. 핵심 기술에는 감독된 미세 조정, 인간 피드백을 통한 강화 학습, 프롬프트, 지식 향상, 검색 향상 및 대화 향상이 포함됩니다. 처음 3개는 이러한 대규모 언어 모델에 사용되는 기술로 ERNIE 및 PLATO에 적용 및 축적되었으며 Wen Xinyiyan에서 더욱 강화되고 연마되었습니다. 마지막 3개는 Baidu가 이미 기술 우위를 갖고 있는 기술입니다. 또한 Wen Xinyiyan이 미래에 더욱 강해질 수 있는 기반이기도 합니다.
Robin Li는 다음과 같이 강조했습니다. "Wen Xinyiyan은 실제 사용자 피드백, 개발자 호출 및 모델 반복 사이에 플라이휠을 구축할 것입니다. 효과가 빠르게 향상되어 '3일 동안 분리하면 감동받을 것'입니다. "놀랍습니다."
Robin Li는 Baidu가 현재 세계 주요 기업 중 벤치마크 ChatGPT 제품을 만드는 최초의 회사라고 말했습니다. Robin Li는 다음과 같이 지적했습니다. "어느 회사이든 몇 달 만에 이렇게 큰 언어 모델을 구축하는 것은 불가능합니다. 딥 러닝과 자연어 처리에는 수년간의 끈기와 축적이 필요하며 빠르게 완료할 수 없습니다."예, Wen Xinyiyan은 지난 수년간 Baidu의 노력의 연속입니다. 인간이 인공지능 시대로 접어들면서 IT기술의 기술스택은 과거 3계층에서 '칩-프레임워크-모델-응용' 4계층으로 근본적인 변화를 겪었다. 오늘날 Baidu는 고급 칩 Kunlun 코어부터 Feipiao 딥 러닝 프레임워크, Wenxin 사전 훈련된 대형 모델, 검색에 이르기까지 이 4개 계층의 풀 스택 레이아웃을 갖춘 세계에서 몇 안 되는 인공 지능 회사 중 하나입니다. , 지능형 클라우드, 자율주행, Xiaodu 등의 애플리케이션은 모든 수준에서 업계 최고의 자체 개발 기술을 보유하고 있습니다. Robin Li는 Baidu AI의 풀 스택 레이아웃의 장점은 기술 스택의 4계층 아키텍처에서 엔드투엔드 최적화를 달성하여 효율성을 크게 향상시킬 수 있다는 것이라고 믿습니다. 특히, 프레임워크 계층과 모델 계층 사이에는 강력한 시너지 효과가 있어 보다 효율적인 모델을 구축하고 비용을 크게 절감할 수 있습니다. 실제로 매우 큰 규모의 모델을 훈련하고 추론하는 것은 딥러닝 프레임워크에 큰 도전이 됩니다. 예를 들어, 수천억 개의 매개변수 모델에 대한 효율적인 분산 훈련을 지원하기 위해 Baidu Flying Paddle은 특별히 4D 하이브리드 병렬 기술을 개발했습니다. Baidu가 지난 2월 “Wen Xin Yi Yan”을 공식 발표한 이후 650개 이상의 기업이 Wen Xin Yi Yan 생태계에 대한 접근을 발표했습니다. Robin Li는 대규모 언어 모델이 세 가지 주요 산업 기회를 가져올 것이라고 예측합니다. 첫 번째 카테고리는 주류 비즈니스 모델이 IaaS에서 MaaS로 변경된 새로운 유형의 클라우드 컴퓨팅 회사입니다. Wen Xin의 말은 클라우드 컴퓨팅 산업의 게임 규칙을 근본적으로 바꿀 것입니다. 과거 기업은 컴퓨팅 성능, 스토리지 등 기본적인 클라우드 서비스에 더 중점을 두고 클라우드 공급업체를 선택했습니다. 앞으로는 프레임워크가 좋은지, 모델이 좋은지, 모델, 프레임워크, 칩, 애플리케이션의 4개 계층 간의 협업에 따라 더 많은 것이 달라질 것입니다. Wen Xinyiyan은 Baidu Intelligent Cloud를 통해 외부 세계에 서비스를 제공하여 기업이 농업, 산업, 금융, 교육, 의료, 운송 및 에너지와 같은 핵심 분야에서 자체 모델과 애플리케이션을 구축할 수 있도록 지원합니다. 산업은 새로운 산업 공간을 빠르게 형성하여 디지털 차이나(Digital China) 실현을 돕습니다. Robin Li는 Baidu Smart Cloud가 공용 클라우드 서비스와 민영화 배포를 모두 포함하는 Wen Xinyiyan의 클라우드 서비스와 애플리케이션 제품을 중심으로 한 주제로 가까운 시일 내에 기자 회견을 개최할 것이라고 발표했습니다. 두 번째 범주는 산업 모델을 미세 조정하는 회사입니다. 이는 일반 대형 모델과 기업 사이의 중간 계층으로, 산업에 대한 통찰력을 바탕으로 일반 대형 모델 역량을 활용하여 업계 고객에게 솔루션을 제공할 수 있습니다. 이와 관련하여 Baidu Wenxin Model은 전력, 금융, 미디어 및 기타 분야에서 10개 이상의 산업 모델을 출시했습니다. 세 번째 범주는 대규모 모델 기반을 기반으로 애플리케이션을 개발하는 회사, 즉 애플리케이션 서비스 제공업체입니다. Robin Li는 대부분의 기업가와 회사에 있어 진정한 기회는 ChatGPT 및 Wenxinyiyan과 같은 기본 대규모 모델을 처음부터 구축하는 것이 아니라고 주장했습니다. 이는 매우 비현실적이고 비경제적입니다. 이는 일반적인 대형 언어 모델을 기반으로 중요한 응용 서비스를 선제적으로 개발할 수 있는 진정한 기회가 될 수 있습니다. 현재 텍스트 생성, 이미지 생성, 오디오 생성, 비디오 생성, 디지털 피플, 3D 및 기타 시나리오를 기반으로 많은 기업가 스타 기업이 등장했으며 이는 미래의 새로운 거인이 될 수 있습니다. “우리는 인공 지능이 오늘날 우리가 갖고 있는 모든 산업을 완전히 변화시킬 것이라고 믿습니다. AI의 장기적인 가치와 사회 각계각층에 대한 파괴적인 변화는 이제 막 시작되었을 것입니다. 제품이 등장하면 더 많은 이정표가 생길 것입니다."라고 Robin Li는 말했습니다. (오렌지 1개)
위 내용은 Robin Li: Wen Xinyiyan의 벤치마크인 ChatGPT의 기준점은 매우 높으며, Baidu는 세계 주요 기업 중 최초로 이를 수행했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!