기술 주변기기 일체 포함 AI 시스템을위한 현대 아키텍처를 발전시키는 6 가지 방법

AI 시스템을위한 현대 아키텍처를 발전시키는 6 가지 방법

Jun 24, 2025 am 11:15 AM

AI 시스템을위한 현대 아키텍처를 발전시키는 6 가지 방법

프로젝트는 메모리 제한에 직면하고 있습니다. 매개 변수가 수십억과 수조에 도달함에 따라 데이터 센터는 속도를 유지해야합니다. 이해 관계자는 공급 업체 서비스 임계 값을 면밀히 모니터링해야합니다. 비용은 지속적인 관심사로 남아 있습니다.

그러나이 메모리 사용 및 계산 수요를 처리 할 수있는 신흥 기술이 나타나서보다 관리하기 쉽습니다.

오늘날의 혁신가들은 이것을 어떻게 달성하고 있습니까?

탐험합시다.

입력 및 데이터 압축

우선 입력 압축이 있습니다.

손실 알고리즘을 개발하여 모델을 압축하거나 전체 버전 대신 압축 버전을 실행할 수 있습니다. 이러한 압축 기술은 특수 신경 네트워크 기능의 공간을 보존합니다.

다음은 Apple의 기계 학습 연구 사이트에 발표 된 논문의 발췌문입니다.

“최근에, 여러 연구에서 LLM의 훈련이없고 데이터가없는 압축 (가지 치기 및 양자화)에서 주목할만한 성공을 보여 주었으며, 50-60%의 희소성을 달성하고 무게 당 3 ~ 4 비트로 비트 폭을 감소시키고 비 압축 기준선에 비해 최소한의 혈관성 저하를 줄였습니다. "

이것이이 접근법이 어떻게 적용되는지의 한 예일뿐입니다.

이 Microsoft 리소스는 또한 시스템 내에서 데이터를 최소화하거나 간소화하는 또 다른 측면 인 프롬프트 압축을 탐색합니다.

희소성 접근법 : 초점과 변형

때로는 시스템 설계의 일부를 제거하여 리소스를 절약 할 수 있습니다.

모든주의 영역이 동일하게 기능하는 모델을 상상해보십시오. 그러나 입력의 특정 부분은 본질적으로 빈 공간 일 수 있지만 다른 부분은 복잡하고 중요합니다. 모델이 균일 한 적용 범위를 적용해야합니까? 높은주의 영역과 낮은주의 지역 모두에 대해 동일한 양의 계산을 사용하고 있습니다.

또는 시스템 엔지니어는 중요성에 따라 거의 관심을받지 않는 토큰을 제거 할 수 있습니다.

이 개발 단계에서 하드웨어 혁신도 분명합니다. 보다 전문화 된 GPU 및 멀티 코어 프로세서는 이러한 종류의 차별화에 대한 이점을 제공하므로 제조업체가 새로운 세대의 GPU 기술을 도입하기 위해 무엇을하고 있는지 조사 할 가치가 있습니다.

컨텍스트 문자열 수정

네트워크 크기와 관련된 또 다른 주요 과제는 시스템에서 사용하는 컨텍스트 Windows와 관련이 있습니다.

시퀀스에서 작동하는 표준 대형 언어 모델이라면 해당 시퀀스의 길이가 중요합니다. 컨텍스트는 더 큰 기능을 제공하지만 추가 리소스가 필요합니다.

컨텍스트를 조정함으로써 시스템의 '식욕'을 변경합니다. 다음은 앞에서 언급 한 프롬프트 압축 리소스의 일부입니다.

"더 긴 프롬프트는 상당한 잠재력을 유지하지만 채팅 창의 최대 한도를 초과하고 상황에 맞는 유지 기능 감소 및 API 비용 증가와 같은 다양한 문제를 재정적으로나 계산합니다."

그 직후, 저자들은 이론적으로 다른 수정에 대한 광범위한 적용 가능성을 가질 수있는 솔루션을 탐구합니다.

동적 모델과 강한 추론

현재 트랙션을 얻는 두 가지 주요 트렌드에는 시간이 지남에 따라 과거 경험에서 배우는 강력한 추론 시스템의 상승과 입력 가중치가 정적으로 남아있는 대신 진화하는 동적 시스템의 상승이 포함됩니다.

두 가지 접근법 모두 이러한 시스템을 개발하는 사람들의 설계 및 엔지니어링 요구 사항을 충족시키기위한 약속을 보여줍니다.

소음을 소개하고 분석 한 다음 새로운 생성 결과를 생성하기 위해 제거하는 확산 모델도 있습니다. 우리는 지난 주에 최적의 AI 전략에 관한 게시물에서 다루었습니다.

마지막으로, 우리는 디지털 트윈과 같은 전통적인 방법을 다시 방문 할 수 있습니다. Twinning은 정확한 시뮬레이션에서 탁월하지만 상당한 리소스를 소비합니다. 더 나은 방법이 존재하면 상당한 컴퓨팅 전력을 절약 할 수 있습니다.

이들은 우리가 듣고있는 솔루션 중 일부이며, 네트워크 가장자리의 엔드 포인트 장치에서 더 많은 처리가 발생하는 Edge Computing Concepts와 잘 맞습니다. 마이크로 컨트롤러 및 소규모 구성 요소는 데이터를 중앙 클라우드 위치로 전송하지 않고 데이터를 처리하는 효율적인 방법으로 사용될 수 있습니다.

오늘날 AI 분야에서 사람들이 성취하고있는 것을 계속 관찰 할 때 이러한 모든 발전을 고려하십시오.

위 내용은 AI 시스템을위한 현대 아키텍처를 발전시키는 6 가지 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

PHP 튜토리얼
1596
276
Elon Musk의 자율 주행 테슬라 거짓말은 마침내 그를 따라 잡고 있습니다. Elon Musk의 자율 주행 테슬라 거짓말은 마침내 그를 따라 잡고 있습니다. Aug 21, 2025 pm 04:51 PM

9 년 전 엘론 머스크 (Elon Musk)는 기자들 앞에 서서 테슬라가 미래에 대담한 도약을하고 있다고 선언했다.

Google은 Chatgpt와 경쟁하기 위해 저렴한 AI 계획을 시작할 수 있습니다 Google은 Chatgpt와 경쟁하기 위해 저렴한 AI 계획을 시작할 수 있습니다 Jul 27, 2025 am 11:10 AM

Google One AI Lite : 최근 Android Author APK Teardown 보고서에 따르면 App Researcher AssembledeBug는 Google 앱 코드에서 숨겨진 텍스트를 발견하여 가입 M의 변경 사항을 암시하는 Hidden Text를 발견했습니다.

가자 역설 : 글로벌 동정심 알고리즘을 어떻게 활성화 할 수 있습니까? 가자 역설 : 글로벌 동정심 알고리즘을 어떻게 활성화 할 수 있습니까? Jul 27, 2025 am 11:09 AM

문제가되는 불균형입니다. 우리의 집단 시선은 종종보다 정교한 기술, 컴퓨팅 힘, 정치적 부조리 및 재정적 힘의 약속에 매료됩니다. 그러나이 매혹은 근본적인 진실을 모호하게하기 시작했습니다.

브라우저는 에이전트 AI 미래의 핵심입니까? 오페라, 당혹감은 그렇게 생각합니다 브라우저는 에이전트 AI 미래의 핵심입니까? 오페라, 당혹감은 그렇게 생각합니다 Aug 17, 2025 pm 03:45 PM

당황 스러움이 웹 브라우저를 얻기로 결정한 이유는 무엇입니까? 대답은 지평선의 근본적인 변화에있을 수 있습니다. 에이전트 AI 인터넷의 상승 - 브라우저는 그 중심에있을 수 있습니다. 최근에 수석 제품 LE 인 Henrik Lexow와 이야기했습니다.

EU Nature 크레딧은 시장 중심의 친 사회적 AI로가는 길을 보여줍니다. EU Nature 크레딧은 시장 중심의 친 사회적 AI로가는 길을 보여줍니다. Aug 02, 2025 am 11:21 AM

EU Nature Credits 프레임 워크 이해 유럽 연합의 Nature Credits Initiative는 개인 및 보존에 적극적으로 참여하는 개인 및 그룹을 인식하고 보상하도록 설계된 정량화 가능한 생물 다양성 단위 시스템을 소개합니다.

7 비즈니스 레슨 AI 7 비즈니스 레슨 AI Jul 27, 2025 am 11:08 AM

이것은 많은 사람들이 올바르게하기를 간절히 바라는 접근법입니다. 여러 장애물에 직면합니다. 기술은 아직 초기 단계에 있으며, 비즈니스에 대한 명확한 로드맵이 부족하고 Cor를 자동화하기 위해 대형 언어 모델 (LLM)을 사용하는 것에 대한 광범위한 회의론이 있습니다.

TORQ 및 AI4ALL 파트너가 더 포괄적 인 AI 인재 파이프 라인을 구축합니다. TORQ 및 AI4ALL 파트너가 더 포괄적 인 AI 인재 파이프 라인을 구축합니다. Aug 01, 2025 am 11:21 AM

이번 주, 나는 Torq의 최고 인민 책임자 인 Karin Ophir Zimet과 AI4ALL의 CEO 인 Tess Posner와 협력 노력과 그 뒤에있는 변혁적인 목표에 대해 이야기했습니다. Zimet은 Torq 가이 이니셔티브를 더 깊은 책임의 일환으로보고 있다고 공유했습니다.

당신은 생성 AI라고 말하는 것처럼 완벽합니다. 당신은 생성 AI라고 말하는 것처럼 완벽합니다. Aug 03, 2025 am 11:15 AM

대체로,“당신은 당신과 마찬가지로 완벽합니다”라는 자아 부스트 라인은 현대의 AI가 최고 소금을 듣고 자하는 모든 사용자에게 효과적으로 멍청하게 준비되어 있다는 사실을 알리는 진언이되었습니다. 그것에 대해 이야기합시다. 이 분석은 a

See all articles