> 기술 주변기기 > 일체 포함 > SenseTime이 SuperCLUE 9월 평가 목록에서 1위를 차지하며 AI 지능화 방향으로 주목받고 있습니다.

SenseTime이 SuperCLUE 9월 평가 목록에서 1위를 차지하며 AI 지능화 방향으로 주목받고 있습니다.

PHPz
풀어 주다: 2023-10-13 17:49:01
앞으로
761명이 탐색했습니다.

최근 SuperCLUE에서 9월 전체 순위와 부문별 작업 목록을 공개했는데, SenseTime의 SenseChat 3.0이 중국 대형 모델 전체 순위에서 1위에 올랐습니다. 새로 추가된 AI 에이전트 하위 목록에서도 SenseChat 3.0이 1위에 올랐으며, GPT-3.5, Claude 2는 물론 국내 모든 중국 대형 모델을 제치고 GPT-4 성능에 이어 2위를 차지했습니다. 이는 대형 모델 분야에서 혁신적인 개발 및 생산성 출시에 있어 SenseTime의 장점과 AGI 탐구에 대한 축적 및 잠재력을 보여줍니다

SenseTime이 SuperCLUE 9월 평가 목록에서 1위를 차지하며 AI 지능화 방향으로 주목받고 있습니다.

참고: 해외 대표 모델(GPT4.0/Claude2/gpt-3.5)은 순위에 참여하지 않습니다.

SuperCLUE는 중국 일반 대형 모델의 종합 평가 벤치마크로, 다양한 기능 차원에서 대형 모델의 성능을 종합적으로 평가하는 것을 목표로 하며, 중국에서 가장 전문적이고 대표적인 중국 대형 모델 평가 벤치마크 중 하나입니다. 이번 평가에서는 국내외 가장 대표적인 일반언어모델 20인을 선정하였습니다

객관 점수 GPT-3.5를 초과하여 전체 토론 목록에서 1위를 차지했습니다.

최신 SuperCLUE 전체 순위와 각 카테고리 작업 순위는 주로 대형 모델의 4가지 능력 사분면, 즉 언어 이해 및 추출, 컨텍스트 페어링, 생성 및 생성, 역할극을 포함한 언어 이해 및 생성에 중점을 둡니다. 지식 및 백과사전, 계산, 코드, 논리 및 추론, 도구 사용, 작업 계획 등 시스템 보안, 명령 공격 등 총 12가지 기본 기능

SenseTime의 SenseChat 3.0은 총점 62.75점으로 전체 순위 1위에 올랐습니다. OPT 객관식 문제 부문에서는 SenseChat 3.0이 GPT-3.5까지 제치고 중국 대형 모델에서 강력한 경쟁력을 입증했습니다

.

SenseTime은 SenseChat이 2023년 4월에 공식 출시될 것이라고 논의했습니다. 이는 중국에서 수천억 개의 매개변수를 기반으로 하는 최초의 대규모 언어 모델 중 하나이며 지속적으로 반복적으로 업데이트됩니다. SenseTime의 대규모 AI 장치인 SenseCore를 사용합니다. 현재 약 30,000개의 온라인 GPU가 있으며 컴퓨팅 성능 규모가 6 ExaFLOPS로 증가하여 대규모 언어 모델의 훈련, 업그레이드 반복 및 서비스를 효과적으로 지원합니다.

인공지능 에이전트 개발을 가속화하고 강력한 인공지능을 향한 움직임을 가속화하세요

대형 모델의 개발로 인해 "채팅"은 사람들의 요구 사항을 충족하는 것과는 거리가 멀었습니다. 도구를 정확하게 사용하는 능력은 대형 모델의 생산성을 해방하는 열쇠가 되었습니다. SuperCLUE의 새로운 AI 에이전트 하위 목록은 업계 최초의 AI 에이전트 목록으로, "도구 사용"과 "작업 계획"이라는 두 가지 핵심 기능에서 AI 에이전트의 성능을 평가하는 데 중점을 둡니다. 평가에 따르면 SenseTime은 SenseChat 3.0이 인간의 필요에 따라 자동으로 작업을 완료할 수 있어 대형 모델의 생산성을 완전히 발휘할 수 있어 AI에서 GPT-4에 이어 두 번째로 역할을 할 수 있는 잠재력을 가지고 있다고 간주합니다. ​에이전트 리스트, 그리고 나머지보다 먼저 대형 모델의 평가에 참여하세요.

SenseTime이 SuperCLUE 9월 평가 목록에서 1위를 차지하며 AI 지능화 방향으로 주목받고 있습니다.

현재 세계 최고의 AI 에이전트는 거의 모두 최고의 대형 모델인 GPT-4를 통해 구동되며, 강력한 도구 사용 기능을 통해 복잡한 문제를 달성 가능한 하위 작업과 인간과 같은 자연어 상호 작용 등으로 분해할 수 있습니다. 능력. SenseChat 3.0은 코드 해석기, API 호출 및 검색이라는 세 가지 공통 도구를 사용하여 복잡한 작업을 해결하고 AI 에이전트 애플리케이션을 유연하게 구축하여 기업 생산성 혁신을 지원하는 중국의 대표적인 대규모 모델로 논의됩니다.

현재 SenseTime은 금융, 휴대폰, 의료, 자동차, 부동산, 에너지, 미디어, 산업 제조 등 다양한 수직 산업 분야에서 500개 이상의 고객과 긴밀한 협력 관계를 구축했습니다. 강력한 대규모 모델인 SenseChat은 지속적으로 빠르게 개선되어 SenseTime에 인간처럼 상호 작용할 수 있는 더욱 강력한 인공 지능 에이전트를 개발할 수 있는 기회를 제공하고 인공 일반 지능의 중요한 기반과 지원을 모색할 수 있는 기회를 제공합니다

위 내용은 SenseTime이 SuperCLUE 9월 평가 목록에서 1위를 차지하며 AI 지능화 방향으로 주목받고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:sohu.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿