Heim > Technologie-Peripheriegeräte > KI > Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

WBOY
Freigeben: 2023-09-08 10:05:42
nach vorne
1468 Leute haben es durchsucht

In diesem Artikel wird eine Methode zur genauen Generierung von Straßenansichtsbildern mit mehreren Ansichten mithilfe des BEV-Skizzenlayouts vorgestellt.

Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

Im Bereich des autonomen Fahrens wird die Bildsynthese häufig verwendet, um die Leistung nachgelagerter Wahrnehmungsaufgaben zu verbessern.

In diesem Bereich von Computer Vision, Verbesserung der Wahrnehmung Eine seit langem bestehende Forschungsherausforderung bei der Modellleistung wird durch synthetische Bilder erreicht. In visionszentrierten autonomen Fahrsystemen, die Multi-View-Kameras verwenden, wird dieses Problem noch deutlicher, da einige Long-Tail-Szenen nie erfasst werden können. Wie in Abbildung 1 (a) dargestellt, gibt die vorhandene Generierungsmethode die ein semantische BEV-Struktur im Segmentierungsstil in das Generierungsnetzwerk und gibt sinnvolle Mehransichtsbilder aus. Bei ausschließlicher Auswertung anhand von Metriken auf Szenenebene scheinen bestehende Methoden in der Lage zu sein, fotorealistische Street View-Bilder zu synthetisieren. Beim Vergrößern stellten wir jedoch fest, dass keine genauen Details auf Objektebene erzeugt werden konnten. In der Abbildung zeigen wir einen häufigen Fehler moderner Generierungsalgorithmen, der darin besteht, dass das generierte Fahrzeug im Vergleich zum Ziel-3D-Begrenzungsrahmen vollständig in die entgegengesetzte Richtung ausgerichtet ist. Darüber hinaus ist die Bearbeitung der BEV-Struktur des semantischen Segmentierungsstils eine schwierige Aufgabe und erfordert viel Arbeitskraft

Daher schlagen wir eine zweistufige Methode namens BEVControl vor, um eine feinere Hintergrund- und Vordergrund-Geometriesteuerung bereitzustellen, wie in Abbildung 1 dargestellt (B). BEVControl unterstützt die Eingabe von BEV-Strukturen im Skizzenstil und ermöglicht so eine schnelle und einfache Bearbeitung. Darüber hinaus zerlegt unser BEVControl die visuelle Konsistenz in zwei Unterziele: geometrische Konsistenz zwischen Straßenansichten und Vogelperspektive durch den Controller; visuelle Konsistenz zwischen Straßenansichten durch den Koordinator Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

Papierlink:

https:// m.sbmmt.com/link/1531beb762df4029513ebf9295e0d34fDetailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

Method Framework

BEVControl ist ein strukturiertes UNet-Generierungsnetzwerk, das aus einer Reihe von Modulzusammensetzungen besteht. Jedes Modul besteht aus zwei Elementen, nämlich Controller und Koordinator. Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControlEingabe: BEV-Skizze, Multi-View-Rauschenbild und Textaufforderung zur einfachen Bearbeitung;

    Ausgabe: generiertes Multi-View-Bild.
  • Methodendetails

BEV-Skizze zum kamerabedingten Kameraprojektionsprozess. Eingabe ist eine BEV-Skizze. Die Ausgabe besteht aus Vordergrundbedingungen und Hintergrundbedingungen für mehrere Ansichten.

Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

Controller: Empfängt die Vordergrund- und Hintergrundinformationen der Kameraansichtsskizze auf selbstbewusste Weise und gibt Straßenansichtsmerkmale aus, die geometrisch mit der BEV-Skizze übereinstimmen.

Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControlKoordinator: Nutzt einen neuartigen Cross-View- und Element-Aufmerksamkeitsmechanismus, um eine Cross-View-Kontextinteraktion zu erreichen und Street-View-Funktionen mit einheitlichem Erscheinungsbild auszugeben.

  • Vorgeschlagene Bewertungsmetriken

Neue Arbeiten zur Generierung von Street View-Bildern bewerten die Generierungsqualität nur anhand von Metriken auf Szenenebene (wie FID, Straßen-mIoU usw.). Wir haben festgestellt, dass es unmöglich ist, die wahre generative Fähigkeit eines generativen Netzwerks allein anhand dieser Metriken zu bewerten, wie in der folgenden Abbildung dargestellt. Die gemeldeten qualitativen und quantitativen Ergebnisse zeigen, dass beide Gruppen Street View-Bilder mit ähnlichen FID-Werten, aber sehr unterschiedlichen Fähigkeiten zur feinkörnigen Steuerung von Vorder- und Hintergrund erzeugen.

    Daher schlagen wir eine Reihe von Bewertungsmetriken vor, um die Steuerungsfähigkeiten des Erzeugungsnetzwerks genau zu messen.
Quantitative Ergebnisse

Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

Vergleich von BEVControl und modernsten Methoden zu den vorgeschlagenen Bewertungsmetriken.

Wenden Sie BEVControl zur Datenverbesserung an, um die Zielerkennungsaufgabe zu verbessern.
  • Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl
  • Qualitative Ergebnisse

    • Vergleich von BEVControl und modernsten Methoden auf dem NuScenes-Validierungsset.

    Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

    Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

    Demo -Effekt

    Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

    Detailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl

    Der Inhalt, der umgeschrieben werden muss , Zhou B. Generieren von Street View-Bildern aus der Vogelperspektive[J] arXiv preprint arXiv:2301.04634, 2023.

Das obige ist der detaillierte Inhalt vonDetailliertere Hintergrund- und Vordergrundsteuerung, schnellere Bearbeitung: der zweistufige Ansatz von BEVControl. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:jiqizhixin.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage