Heim Technologie-Peripheriegeräte KI So verwendet Andrej Karpathy LLMs

So verwendet Andrej Karpathy LLMs

Mar 21, 2025 am 10:54 AM

Das neueste Video von Andrej Karpathy, "How i benutze LLMs", bietet einen umfassenden Überblick über das sich schnell entwickelnde Ökosystem für Großsprachenmodell (LLM). Karpathy baut auf seinem vorherigen Video "Deep Diving Into LLMs" auf und zeigt, wie sich LLMs von einfachen textbasierten Chat-Schnittstellen zu ausgefeilten, multi-modalen Plattformen, die verschiedene Werkzeuge und Funktionen integrieren, übergeht. Dieser Artikel fasst seine wichtigsten Erkenntnisse und Demonstrationen zusammen.

Inhaltsverzeichnis

  • Die expandierende LLM -Landschaft
  • Jenseits des Textes: Multimodale Funktionen
  • "Denken" -Modelle: bewusste Problemlösung
  • Integration der Tool: Websuche und detaillierte Forschung
  • Erweiterte Forschung: Synthese von Informationen aus mehreren Quellen
  • Dokument- und Multimedia -Verarbeitung über Datei -Uploads
  • Python -Interpreter: Codeausführung und Datenanalyse
  • Benutzerdefinierte visuelle und Code -Tools: Claude -Artefakte und Cursor -Komponist
  • Audio -Interaktionen und Podcast -Generation mit NotebookLM
  • Visuelle Verarbeitung: Bildeingabe/OCR, Bildgenerierung und Video
  • Personalisierung: Speicher, benutzerdefinierte Anweisungen und benutzerdefinierte GPTs
  • Tipps für LLM -Anfänger
  • Abschluss

Die expandierende LLM -Landschaft

Karpathy unterstreicht das Wachstum über den wegweisenden Chatgpt hinaus und erwähnt Konkurrenten wie Gemini, Copilot, Claude, Grok, Deepseek und Lechat, die jeweils einzigartige Stärken und Preismodelle bieten. Er schlägt vor, Ressourcen wie Chatbot Arena und Scace's Rangingboard zu verwenden, um die Modellleistung zu vergleichen.

So verwendet Andrej Karpathy LLMs

Jenseits des Textes: Multimodale Funktionen

Karpathie befasst sich mit den multimodalen Fähigkeiten von LLMs und bewegt sich über die Textgenerierung hinaus.

Textgenerierung: LLMs Excel bei kreativen Schreibaufgaben (Gedichte, E -Mails usw.) mit Interaktionen, die als dynamische "Chat -Blasen" sichtbar gemacht haben. Er erklärt die zugrunde liegende Mechanik der Tokenisierung, Kontextfenster und der Rolle des POS -Taggings und der NER. Unterschiedliche Tokenisierungsalgorithmen (wie Byte-Pair-Codierung) und spezielle Token (und) werden diskutiert.

So verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMs

Der zweistufige Schulungsprozess (Vorausbildung und Nach-Training) ist detailliert und betont die Kosten und Einschränkungen der Vorausbildung und die Bedeutung der Nachtraining für die menschliche Interaktion und die Reduzierung der Halluzinationen. Er diskutiert auch Dekodierungs- und Probenahmetechniken (Kernprobenahme, Top-K-Probenahme, Strahlsuche).

So verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMs

Bild und Video: Karpathie zeigt die Bilderzeugung durch Kombination von Bildunterschriften- und Bildgenerationsmodellen. Er zeigt auch Videofunktionen, in denen das LLM über einen Kamera -Feed "sieht" und Objekte identifiziert.

Audio: Er hebt die Sprachinteraktion hervor und unterscheidet zwischen "gefälschten Audio" (Text-to-Speech) und "True Audio" (native Audio-Tokenisierung). Die Fähigkeit, Audioantworten in verschiedenen Personas zu generieren, wird gezeigt.

"Denken" -Modelle: bewusste Problemlösung

Karpathy untersucht "Denkmodelle", die durch Schritt für Schritt die Verstärkungslernen durch komplexe Probleme nutzen. Er kontrastiert diese mit Standardmodellen und veranschaulicht, wie Denkmodelle genauere Lösungen bieten können, wenn auch auf Kosten einer höheren Verarbeitungszeit. Er verwendet ein Beispiel für das Gradientenprüfungsfehler, um den Unterschied hervorzuheben.

So verwendet Andrej Karpathy LLMs

Integration der Tool: Websuche und detaillierte Forschung

Die Integration von Internet-Suchfunktionen wird diskutiert und zeigt, wie LLMs auf Echtzeitinformationen zugreifen und verarbeiten und Wissensgrenzwerte überwinden können. Er vergleicht die Suchintegration verschiedener Modelle (Claude, Gemini, Chatgpt, Verwirrung.ai).

So verwendet Andrej Karpathy LLMs

Erweiterte Forschung: Tiefe Forschung, die häufig höhere Abonnements erfordern, wird als Prozess erläutert, der umfangreiche Websuche mit Argumentation kombiniert, um umfassende Berichte mit Zitaten zu erstellen.

So verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMs

Datei -Uploads, Python -Interpreter, benutzerdefinierte Tools und Personalisierung

Der Artikel deckt dann Datei -Uploads für die Verarbeitungsdokumente und Multimedia, den integrierten Python -Interpreter für die Codehausführung und Datenanalyse, benutzerdefinierte visuelle und codelige Tools (Claude -Artefakte und Cursor -Komponist) sowie die Bedeutung von Personalisierungsfunktionen wie Speicher, benutzerdefinierten Anweisungen und benutzerdefinierten GPTs ab. Beispiele von jedem werden vorgesehen.

So verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMsSo verwendet Andrej Karpathy LLMs

Tipps für LLM -Anfänger und Schlussfolgerung

Der Artikel schließt mit Ratschlägen für Anfänger und einer Zusammenfassung der wichtigsten Imbissbuden von Karpathy und betont die Mischung aus mathematischen Prinzipien und Datenkomprimierung, die der Macht von LLMs zugrunde liegt. Die sich schnell entwickelnde Natur des Feldes wird hervorgehoben und fördert kontinuierliches Lernen und Experimentieren.

Das obige ist der detaillierte Inhalt vonSo verwendet Andrej Karpathy LLMs. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße Artikel -Tags

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Was ist das Modellkontextprotokoll (MCP)? Was ist das Modellkontextprotokoll (MCP)? Mar 03, 2025 pm 07:09 PM

Was ist das Modellkontextprotokoll (MCP)?

Aufbau eines lokalen Vision Agents mit Omniparser V2 und Omnitool Aufbau eines lokalen Vision Agents mit Omniparser V2 und Omnitool Mar 03, 2025 pm 07:08 PM

Aufbau eines lokalen Vision Agents mit Omniparser V2 und Omnitool

Replit Agent: Ein Leitfaden mit praktischen Beispielen Replit Agent: Ein Leitfaden mit praktischen Beispielen Mar 04, 2025 am 10:52 AM

Replit Agent: Ein Leitfaden mit praktischen Beispielen

Runway Act-One Guide: Ich habe mich gefilmt, um es zu testen Runway Act-One Guide: Ich habe mich gefilmt, um es zu testen Mar 03, 2025 am 09:42 AM

Runway Act-One Guide: Ich habe mich gefilmt, um es zu testen

Elon Musk & Sam Altman kämpfen über 500 Milliarden US -Dollar Stargate -Projekt Elon Musk & Sam Altman kämpfen über 500 Milliarden US -Dollar Stargate -Projekt Mar 08, 2025 am 11:15 AM

Elon Musk & Sam Altman kämpfen über 500 Milliarden US -Dollar Stargate -Projekt

Deepseek veröffentlicht 3FS & Smallpond Framework Deepseek veröffentlicht 3FS & Smallpond Framework Mar 03, 2025 pm 07:07 PM

Deepseek veröffentlicht 3FS & Smallpond Framework

Ich habe versucht, die Vibe -Codierung mit Cursor AI und es ist erstaunlich! Ich habe versucht, die Vibe -Codierung mit Cursor AI und es ist erstaunlich! Mar 20, 2025 pm 03:34 PM

Ich habe versucht, die Vibe -Codierung mit Cursor AI und es ist erstaunlich!

5 Grok 3 Eingabeaufforderungen, die Ihre Arbeit erleichtern können 5 Grok 3 Eingabeaufforderungen, die Ihre Arbeit erleichtern können Mar 04, 2025 am 10:54 AM

5 Grok 3 Eingabeaufforderungen, die Ihre Arbeit erleichtern können

See all articles