Heim > Technologie-Peripheriegeräte > KI > Blaupause für die Datenverwaltung im GenAI-Zeitalter

Blaupause für die Datenverwaltung im GenAI-Zeitalter

PHPz
Freigeben: 2023-11-20 17:33:35
nach vorne
1378 Leute haben es durchsucht

Blaupause für die Datenverwaltung im GenAI-Zeitalter

Je tiefer wir in die Welt von ML und GenAI vordringen, desto wichtiger wird die Betonung der Datenqualität. John Jeske, CTO der Advanced Technology Innovation Group von KMS Technology, befasst sich intensiv mit Data-Governance-Methoden wie Datenherkunftsverfolgung und föderiertem Lernen, um eine erstklassige Modellleistung sicherzustellen.

Datenqualität ist der Schlüssel zur Modellierung von Nachhaltigkeit und zum Vertrauen der Stakeholder. Während des Modellierungsprozesses erleichtert die Datenqualität die langfristige Wartung und ermöglicht es Ihnen, das Vertrauen der Benutzer und Ihrer Stakeholder-Community aufzubauen. Die Auswirkungen von „Garbage in, Garbage out“ werden in komplexen Modellen, einschließlich umfangreicher Sprachen und generativer Algorithmen, noch verstärkt. „Sagte Jeske.

Genetischer KI-Bias vs. Datenrepräsentationsprobleme

Egal welches Modell Sie für Ihren Anwendungsfall wählen, eine schlechte Datenqualität führt unweigerlich zu einer Verzerrung von GenAI-Modellen. Die Falle entsteht normalerweise durch Trainingsdaten, die das falsch angeben Umfang des Unternehmens, Kundenstamm oder Anwendungsbereich

Der wahre Reichtum liegt in den Daten selbst, nicht im kurzlebigen Modell oder in der Modellierungsstruktur. Mit dem Aufkommen einer großen Anzahl von Modellierungsrahmen in den letzten Monaten sind Daten der Wert von monetarisierbaren Vermögenswerten wird noch wichtiger

Jeff Scott, Senior Vice President of Software Services bei KMS Technology, erklärte weiter: „Wenn der von KI generierte Inhalt von der erwarteten Ausgabe abweicht, handelt es sich nicht um einen Algorithmusfehler, sondern um unzureichendes oder verzerrtes Training.“ Daten widerspiegeln

strikte Datenintegritäts-Governance

Best Practices für die Daten-Governance umfassen Aktivitäten wie Metadatenverwaltung, Datenverwaltung und automatisierte Qualitätsprüfungen. Stellen Sie beispielsweise die Zuverlässigkeit von Datenquellen sicher, verwenden Sie zertifizierte Datensätze, wenn Sie Daten für Training und Modellierung erfassen, und erwägen Sie den Einsatz automatisierter Datenqualitätstools. Obwohl dies die Komplexität erhöhen kann, sind diese Tools sehr hilfreich bei der Gewährleistung der Datenintegrität

Um die Datenqualität zu verbessern, verwenden wir Tools, die Eigenschaften wie Datengültigkeit, Integritätsprüfungen und Zeitkonsistenz bereitstellen, was zuverlässige, konsistente Daten fördert, was für wichtig ist robuste KI-Modelle.

Verantwortung und kontinuierliche Verbesserung in der KI-Entwicklung

In jedermanns Augen sind Daten ein Problem. Innerhalb eines Unternehmens ist die Zuweisung der Verantwortung für die Datenverwaltung eine wichtige Aufgabe

Das Wichtigste ist, sicherzustellen, dass die Funktionen wie geplant funktionieren und dass die Daten, auf denen trainiert wird, aus Sicht eines potenziellen Kunden sinnvoll sind. Feedback fördert das Lernen, das dann beim nächsten Training des Modells berücksichtigt wird und eine kontinuierliche Verbesserung bis zum Vertrauenspunkt bewirkt.

In unserem Workflow werden KI- und ML-Modelle strengen internen Tests unterzogen, bevor sie öffentlich eingeführt werden. Das Data-Engineering-Team erhält ständig Feedback, was iterative Verbesserungen des Modells ermöglicht, um Verzerrungen und andere Anomalien zu minimieren Daten über Teams und Systeme hinweg werden ordnungsgemäß kuratiert und durchweg rechenschaftspflichtig.

Die Risiken, die mit dem Erhalten ungenauer Ergebnisse aus der Technologie verbunden sind, müssen verstanden werden und Unternehmen müssen ihre Transparenz von Datenquellen und Umgang mit geistigem Eigentum bis hin zur Gesamtdatenqualität und -vollständigkeit bewerten.

Transparenz ist ein wesentlicher Bestandteil des Kundenvertrauens, und Data Governance ist nicht nur eine technische Aufgabe, sondern kann sich auch auf den Ruf eines Unternehmens auswirken, da Risiken durch ungenaue KI-Vorhersagen auf Endbenutzer übertragen werden.

Mit der kontinuierlichen Weiterentwicklung von GenAI wird die Beherrschung der Datenverwaltung immer wichtiger. Dies dient nicht nur der Sicherstellung der Datenqualität, sondern auch dem Verständnis der komplexen Beziehung zwischen Daten und KI-Modellen. Diese Erkenntnisse sind von entscheidender Bedeutung für den technologischen Fortschritt, die Gesundheit des Unternehmens und die Wahrung des Vertrauens der Stakeholder und der breiten Öffentlichkeit

Das obige ist der detaillierte Inhalt vonBlaupause für die Datenverwaltung im GenAI-Zeitalter. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:51cto.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage