Eine Sitzung am 23. August, dem dritten Tag der CEDEC 2024. „Fast ein vollständiges KI-Spiel. Ein Mechanismus, der es Red Ram ermöglicht, eine unbegrenzte Anzahl von Mystery-Spielen nach Wunsch des Spielers zu generieren.“
„Red Ram“ ist eine Technologiedemo, die von Morikatron, einem auf Spiele-KI spezialisierten Entwickler, entwickelt wurde und ein Versuch ist, automatisch ein Täter-Ratespiel im Krimi-Stil zu generieren, das auf vom Spieler eingegebenen Schlüsselwörtern basiert.
In dieser Sitzung erklärten Shigenori Miyamoto, der leitende Ingenieur von Morikatron, der für die Verarbeitung natürlicher Sprache für das Spiel verantwortlich war, und Rikito Takahashi, ein KI-Ingenieur, der für das Systemdesign und die Client-Implementierung verantwortlich war, wie die Generierung funktioniert.
Leitender Ingenieur Shigenori Miyamoto (rechts) und KI-Ingenieur Rikito Takahashi (links)
Spaß durch die Verwendung von Generation-KI im Spiel
Die Sitzung begann damit, dass Herr Takahashi über die Botschaft sprach, die er in diese Sitzung eingebracht hatte. Das heißt: „Ich möchte, dass mehr Spiele die KI der Generation im Spiel nutzen.“ Dies ist eine einzigartige Botschaft von Morikatron, einem Unternehmen, das sich mit KI-Technologie auskennt. Das Unternehmen ist jedoch davon überzeugt, dass durch den Einsatz generativer KI in Spielen zwei Arten von Spaß geschaffen werden können.
Zum einen gibt es so viele Variationen, dass keine Langeweile aufkommt. Ein weiterer Vorteil ist die Möglichkeit, ein Spielerlebnis zu schaffen, das auf die Vorlieben jedes Spielers zugeschnitten ist. „Red Ram“, das in dieser Sitzung besprochen wird, wurde entwickelt, um das einzigartige Spielerlebnis der generativen KI zu untersuchen.
Spielübersicht „Red Ram“ |
Wie erstellt Red Ram also Spiele?
Zuerst gibt der Spieler seine bevorzugten Einstellungen ein und dann generiert die KI eine Handlung, die den Umriss des Vorfalls darstellt. Als nächstes werden Story-Daten erstellt, die die Daten konkretisieren, und auf der Grundlage dieser Daten werden Charaktere und Schauplätze bestimmt. Abschließend werden Dialogzeilen, Charakterbilder, Hintergrundbilder usw. generiert und das Spiel durch deren Kombination vervollständigt.
Herr Miyamoto erläuterte die Einzelheiten dieser Generation. Zunächst wird die Handlung schrittweise mit LLM (groß angelegtes Sprachmodell/„Red Ram“ verwendet GPT 3.5 und 4 von OpenAI) basierend auf den vom Spieler eingegebenen Schlüsselwörtern generiert. Sind komplexe Bedingungen zur Generierung erforderlich, kommt offenbar das leistungsstarke GPT 4 zum Einsatz.
Selbst wenn der Spieler beispielsweise etwas eingibt, das nicht als Waffe geeignet ist, erstellt LLM ein entsprechendes Szenario.
Bei der Plotgenerierung werden als Eingabeaufforderungen nicht nur das Setting des Vorfalls eingegeben, sondern auch eine Anleitung zum Verfassen von Krimis und die Erstellung eines Fortschrittsablaufs. Bereiten Sie mehrere Fortschrittsabläufe vor, die von LLM manuell generiert werden, und verwenden Sie diese nach dem Zufallsprinzip. Es wird gesagt, dass die Erstellung von Plots ohne jegliche Formatbeschränkungen zu qualitativ hochwertigeren Produkten führen kann.
Aus den so erstellten Plots werden Story-Daten in einem Format generiert, das von Programmen verarbeitet werden kann. Wie in der Folie unten gezeigt, handelt es sich in der Plotphase nur um reinen Text, aus dem jedoch notwendige Daten wie Orte und Opfer extrahiert und gleichzeitig der Inhalt konkretisiert wird.
Anschließend werden aus den Story-Daten detaillierte Daten für jede Person, jeden Ort und jedes Beweisstück generiert, die im Spiel vorkommen. Neben der Bestimmung des Profils einer Person wie Alter, Persönlichkeit und Beruf wird auch der charakteristische Tonfall der Stimme ermittelt. Zu diesem Zeitpunkt wird auch eine Aufforderung zum Generieren des Bildes erstellt.
Als letztes wird ein Gesprächsszenario generiert – der Text des Verhörs (Gesprächszeile), das der Spieler, der Detektiv, mit dem Verdächtigen führt. Durch das Einfügen der bisher generierten Daten in sechs Arten von Vorlagen je nach Situation und Ort des Vorfalls werden Aufforderungen erstellt und Gespräche generiert. Darüber hinaus werden die Emotionen der Figur aus dem Text des Dialogs zu LLM abgeleitet und in sechs Arten von Emotionen klassifiziert. Dies soll dazu dienen, den Gesichtsausdruck des Tatverdächtigen bei der Bilderzeugung zu verändern.
Fahren Sie als Nächstes mit der Bildgenerierung fort. Basierend auf dem von LLM generierten Text werden Bilder mit „Stable Diffusion“ (dem Modellnamen der Bilderzeugungs-KI) vorbereitet. Für die Hintergrund- und Beweisbilder verwenden Sie die Eingabeaufforderungen, die Sie beim Generieren der entsprechenden Details erstellt haben. Zu diesem Zeitpunkt werden Anpassungen vorgenommen, um den Betrachtungswinkel des Hintergrundbilds anzupassen und schwer darstellbare Beweismittel zu ersetzen und zu zeichnen.
In ähnlicher Weise nutzen die Charakterporträts die Eingabeaufforderungen, die bei der Generierung detaillierter Daten erstellt werden. Es werden Einschränkungen angewendet, sodass das Bild an einer festen Position und in einer festen Größe gezeichnet wird. An dieser Stelle wird auch eine Verarbeitung der Hintergrundtransparenz (Ausschneiden) durchgeführt.
Beim Zuschneiden werden semantische Segmentierung (eine Segmentierungsmethode, die jedes Pixel beschriftet) und eine Technologie zur Schätzung der Bildtiefe verwendet, um ein zuverlässiges Zuschneiden zu gewährleisten, indem nur die tiefen Teile extrahiert werden.
Die Gesichtsausdrücke werden so angepasst, dass sie nicht wie eine andere Person aussehen, indem beim Generieren der Pose nur ein minimaler Teil der Eingabeaufforderungen hinzugefügt wird.
|
|
Herausforderungen und Zukunftsaussichten für generative KI-Spiele
Die nächste Folie zeigt den Vorfall, der dadurch tatsächlich erzeugt wurde.
Erstens: Da es sich bei der Tatwaffe um Tofu handelte, kann man mit Fug und Recht sagen, dass die Todesursache Ersticken war. Die Bühne sollte ein „innovatives Spieleentwicklungsunternehmen“ sein, also wurde ein Ort wie ein Büro oder ein Konferenzraum geschaffen.
Da das Tatmotiv „finanzielle Probleme“ war, entstand eine menschliche Beziehung, in deren Mittelpunkt das Verleihen und Ausleihen von Geld stand. Übrigens scheint man bei den Charakteren zwischen Live-Action-Stil und Anime-Stil wählen zu können.
Am Ende der Sitzung sprach Herr Takahashi über aktuelle Themen und Zukunftsaussichten.
Da ist zunächst die Frage der Qualität. In „Red Ram“ ergeben die Gespräche der Charaktere manchmal keinen Sinn. Beispielsweise kann ein Gespräch mit „Beweise wurden gefunden“ beginnen, aber auf mysteriöse Weise enden, indem die Beweise nicht gefunden werden. Darüber hinaus kann es sein, dass die Hauptfigur, der Detektiv, bei der Aufklärung des Falles zu Beginn sogar die Wahrheit preisgibt.
Dies macht es unmöglich, Spaß an der Lösung von Mordfällen und deren Argumentation zu haben. Mit anderen Worten: Die aktuelle Situation ist ein Spiel, bei dem man das seltsame Verhalten der generativen KI genießen kann. Das hat eine gewisse Würze und ist interessant, aber das ist nicht das Ziel von Morikatron.
Um ein konsistentes Szenario zu erreichen, ist es notwendig, das Systemdesign und die dem LLM gegebenen Eingabeaufforderungen weiterzuentwickeln. Auch andere Fragen wie Kosten und Wartezeit wurden angesprochen, es wird jedoch erwartet, dass diese durch die Weiterentwicklung des LLM-Modells schrittweise gelöst werden.
Laut Herrn Takahashi möchte er in Zukunft ein Erlebnis schaffen, bei dem die vom Spieler eingegebenen Informationen in Echtzeit in der Spielwelt widergespiegelt werden, und im Juli 2024 wird er eine Technologiedemo namens „Labyrinth of Kotodama“ veröffentlichen „. sind.
Bei dieser Demo handelt es sich um ein Textabenteuer, das darauf abzielt, einen Dungeon zu erobern. Das System ist jedoch so, dass Gegenstände auf der Grundlage der vom Spieler eingegebenen Wörter generiert werden. Als Reaktion auf die eingegebenen Wörter werden sofort das Bild, die Parameter, der Geschmackstext usw. des Artikels generiert und die Hauptfigur wird anhand des Artikels angezeigt.
Darüber hinaus sind Artikel und Generationsbeispiele zum Thema „Red Ram“ online verfügbar. Es kann über den QR-Code auf der Folie unten angezeigt werden. Wenn Sie also Interesse haben, schauen Sie doch mal vorbei.
|
Das obige ist der detaillierte Inhalt vonWas ist der Mechanismus von „Red Ram', der Mystery-Spiele generieren kann, indem man ihn der KI überlässt? [CEDEC 2024]. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!