LLM에서 드문 단가 인 코더를 갖는 피처 회로의 제형
Feb 26, 2025 am 01:46 AM
다음은 기능 루프의 예입니다. 많은 시각적 신경망에서 "우리는"루프를 다른 각도로 감지하는 단위의 패밀리로서 루프를 찾을 수 있습니다. 곡선 탐지기는 주로 초기, 덜 복잡한 곡선 탐지기로 구성됩니다. 그리고 라인 검출기 구현.이 곡선 검출기는 다음 레이어에서 3D 지오메트리 및 복잡한 모양 감지기를 생성합니다.”[1].
다음 장에서는 LLM의 주제 예측 일관된 작업에 대한 기능 루프를 검사합니다.
오버레이 및 드문 autoencoder
-
"고양이
- 는 를 실행합니다."
"고양이 run ."
인간의 경우,이 간단한 규칙을 이해하는 것은 텍스트 생성, 번역 및 질문 및 답변과 같은 작업에 매우 중요합니다. 그러나 LLM 이이 규칙을 실제로 배웠는지 어떻게 알 수 있습니까? -
이제 LLM 양식 이이 작업에 대한 기능 루프를 찾을 수 있습니다. 빌드 기능 루프 이제 기능 루프 생성 프로세스를 구축 해 봅시다. 우리는 4 단계로 진행할 것입니다 :
"고양이가 달린다"(복수 주제)
우리는 기능 루프를 계산 다이어그램으로 구성합니다.
입력 노드는 단수 및 복수 문장을 나타냅니다.
-
숨겨진 레이어 내부에서 무슨 일이 일어나고 있는지는 명확하지 않습니다. 따라서 우리는 다음과 같은 드문 autoencoder를 도입했습니다 -
이제 기능 루프를 시각화합니다. 앞에서 언급했듯이 기능 루프는 특정 기능을 처리하는 데 사용되는 뉴런 단위입니다. 우리의 모델에는 기능이 포함됩니다 -
Sae
- 독립적 인 특징
- 는 동사 대상일 일관성 작업에 직접 기여합니다.
-
그림에서 기능 루프를 그래프로 시각화하는 것을 볼 수 있습니다.
-
우리는 또한 출력 노드를 올바른 동사로 가지고 있습니다. - gpt2-small 실제 경우 GPT2-Small에서 유사한 코드를 실행합니다. 우리는 단일 동사를 선택하기로 결정한 특징적인 루프 다이어그램을 보여줍니다.
- 결론
숨겨진 활성화 및 인코더 출력은 모두 그래프의 노드입니다. 그림의 가장자리는 활성화 강도에 의해 가중치가 가중되며, 주제 예측 합의 결정에서 어떤 경로가 가장 중요한 경로를 보여줍니다. 예를 들어, H3에서 F2 로의 경로가 중요한 역할을한다는 것을 알 수 있습니다. 기능 루프는 복잡한 LLM의 다른 부분이 최종 출력으로 이어지는 방법을 이해하는 데 도움이됩니다. 우리는 주제 예측 일관된 작업을 위해 SAE를 사용하여 기능 루프를 형성 할 가능성을 보여줍니다. 그러나, 우리는이 접근법이 여전히 인간의 개입이 필요하다는 것을 인정해야합니다. 왜냐하면 우리는 적절한 설계없이 루프를 실제로 형성 할 수 있는지 항상 알지 못하기 때문입니다. [1] 줌 : 회로 소개 이미지 자리 표시자를 보존했으며 제공된 URL에서 이미지에 액세스 할 수 있다고 가정했습니다 변하지 않은 상태로 유지하십시오.
-
위 내용은 LLM에서 드문 단가 인 코더를 갖는 피처 회로의 제형의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

인기 기사

인기 기사

뜨거운 기사 태그

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











MCP (Model Context Protocol) 란 무엇입니까?

Omniparser V2 및 Omnitool을 사용하여 지역 비전 에이전트 구축

활주로 ACT-One Guide : 나는 그것을 테스트하기 위해 스스로 촬영했다

Elon Musk & Sam Altman은 5 천억 달러 이상의 Stargate 프로젝트를 충돌시킵니다.

DeepSeek은 3FS 및 Smallpond 프레임 워크를 릴리스합니다

나는 Cursor AI와 함께 Vibe 코딩을 시도했는데 놀랍습니다!
