Zuckerberg sagte in den sozialen Medien, dass das von Facebook AI Research entwickelte LLaMA „derzeit das höchste“ groß angelegte Sprachmodell sei, mit dem Ziel, Forschern dabei zu helfen, ihre Arbeit auf dem Gebiet der künstlichen Intelligenz (KI) voranzutreiben.
„Large Language Models“ (LLM) können große Mengen an Textdaten verarbeiten und auf Beziehungen zwischen Wörtern im Text schließen. Mit der Weiterentwicklung der Rechenleistung und der kontinuierlichen Erweiterung der Eingabedatensätze und Parameterräume haben sich auch die Fähigkeiten von LLM entsprechend erhöht.
Derzeit hat LLM nachweislich eine Vielzahl von Aufgaben effizient ausgeführt, darunter Texterstellung, Beantwortung von Fragen, Zusammenfassung von schriftlichem Material usw. Zuckerberg sagte, dass LLM auch in komplexeren Aspekten große Entwicklungsaussichten habe, etwa beim automatischen Beweisen mathematischer Theoreme und der Vorhersage von Proteinstrukturen.
Es ist erwähnenswert, dass der kürzlich beliebte ChatGPT ein Chatbot ist, der mit LLM erstellt wurde. ChatGPT wird von GPT3.5 unterstützt, einem auf dem OpenAI 175B-Parameter trainierten Basismodell. 175B ist der Inhalt, den es aus den Trainingsdaten gelernt und gesammelt hat.
Meta gab in der offiziellen Website-Einleitung an, dass LLaMA über vier Grundmodelle verfügt: 7B, 13B, 33B und 65B, die in den meisten Benchmark-Tests besser sind als GPT3.5s Vorgänger GPT3-175B, während LLaMA-65B mit den Besten in konkurrieren kann Die Branche Chinchilla-70B und PaLM-540B konkurrieren.
Das obige ist der detaillierte Inhalt vonEinführung eines fortschrittlichen, groß angelegten Sprachmodells, offizielle Ankündigung von Meta zur Vertiefung des KI-Krieges. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!