Wissenschaftler wollen aussagekräftige Formeln finden, die experimentelle Daten genau beschreiben. Mathematische Modelle natürlicher Phänomene können manuell auf der Grundlage von Domänenwissen erstellt werden, oder sie können mithilfe von Algorithmen für maschinelles Lernen automatisch aus großen Datensätzen erstellt werden. Die akademische Gemeinschaft hat das Problem der Zusammenführung relevanter Vorkenntnisse und relevanter Funktionsmodelle untersucht und ist der Ansicht, dass die Suche nach einem Modell, das mit Vorkenntnissen über allgemeine logische Axiome konsistent ist, ein ungelöstes Problem darstellt.
Forscher des IBM-Forschungsteams und des Samsung-KI-Teams haben eine Methode „AI-Descartes“ entwickelt, die logisches Denken mit symbolischer Regression kombiniert, um eine prinzipielle Analyse natürlicher Phänomenmodelle aus axiomatischem Wissen und experimenteller Ableitung durchzuführen.
Die Studie trägt den Titel „Combining data and theory for derivable Scientific Discovery with AI-Descartes“ und wurde am 12. April 2023 in „Nature Communications“ veröffentlicht.
Künstliche neuronale Netze (NN) und statistische Regression werden häufig verwendet, um Muster und Beziehungen in Daten automatisch zu entdecken. NN gibt ein „Black-Box“-Modell zurück, bei dem die zugrunde liegenden Funktionen normalerweise nur zur Vorhersage verwendet werden. Bei der Standardregression ist die funktionale Form vorbestimmt, sodass die Modellerkennung einer Parameteranpassung gleichkommt. Bei der symbolischen Regression (SR) ist die funktionale Form nicht vorgegeben, sondern besteht aus Operatoren (z. B. +, -, × und ÷) aus einer vorgegebenen Liste und wird aus den Daten berechnet.
SR-Modelle sind im Allgemeinen „interpretierbarer“ als NN-Modelle und erfordern weniger Daten. Um Naturgesetze symbolisch aus experimentellen Daten zu entdecken, ist SR möglicherweise effektiver als NN oder die Regression in fester Form. Die Integration von NN und SR war Gegenstand neuerer Forschungen zur neurosymbolischen KI. Eine große Herausforderung bei SR besteht darin, aus den vielen Modellen, die zu den Daten passen, wissenschaftlich aussagekräftige Modelle zu identifizieren. Wissenschaftler definieren eine sinnvolle Funktion als eine Funktion, die Genauigkeit und Komplexität in Einklang bringt. Für einen bestimmten Datensatz gibt es jedoch viele solcher Ausdrücke, und nicht alle stimmen mit der bekannten Hintergrundtheorie überein.
Ein anderer Ansatz besteht darin, mit einer bekannten Hintergrundtheorie zu beginnen, aber es gibt derzeit keine praktischen Inferenzwerkzeuge, die Theoreme generieren können, die mit experimentellen Daten aus einem bekannten Satz von Axiomen konsistent sind. Automatische Theorembeweiser (ATP) sind die am häufigsten verwendeten Argumentationswerkzeuge, die Vermutungen für eine bestimmte logische Theorie beweisen können. Die Rechenkomplexität stellt für ATP eine große Herausforderung dar; für einige Arten von Logik ist der Beweis von Vermutungen unentscheidbar.
Darüber hinaus ist die Ableitung von Modellen aus logischen Theorien mithilfe formaler Argumentationswerkzeuge besonders schwierig, wenn Arithmetik- und Analysis-Operatoren beteiligt sind. Techniken des maschinellen Lernens wurden verwendet, um die Leistung von ATP zu verbessern, indem beispielsweise Reinforcement Learning zur Steuerung des Suchprozesses eingesetzt wurde.
Ableitbare Modelle sollten nicht nur empirisch genau, sondern auch prädiktiv und aufschlussreich sein.
Forscher des IBM Research Teams und des Samsung AI Teams versuchten, ein solches Modell zu erhalten, indem sie eine neuartige, auf mathematischer Optimierung basierende SR-Methode mit einem Inferenzsystem kombinierten. Daraus entstand ein End-to-End-Discovery-System „AI-Descartes“, das über SR Formeln aus Daten extrahiert und dann einen Beweis für die Ableitbarkeit der Formel aus einem Satz von Axiomen oder einen Beweis für Inkonsistenz liefert. Wenn ein Modell nachweislich nicht ableitbar ist, schlagen die Forscher neue Maße vor, die angeben, wie nah die Formel an einer ableitbaren Formel ist, und verwenden ihr Inferenzsystem, um die Werte dieser Maße zu berechnen.
Abbildung: Systemübersicht. (Quelle: Papier)
In frühen Arbeiten, die maschinelles Lernen mit Inferenz kombinierten, verwendeten Wissenschaftler logikbasierte Beschreibungen, um die Ausgabe neuronaler GAN-Architekturen einzuschränken, die Bilder generierten. Es gibt auch Teams, die maschinelle Lernwerkzeuge und Inferenzmaschinen kombinieren, um nach funktionalen Formen zu suchen, die vorab festgelegte Einschränkungen erfüllen. Dadurch soll der Ausgangsdatensatz um neue Punkte erweitert und so die Effizienz der Lernmethode und die Genauigkeit des endgültigen Modells verbessert werden. Einige Teams nutzen auch Vorkenntnisse, um zusätzliche Datenpunkte zu erstellen. Diese Studien berücksichtigten jedoch nur Einschränkungen der zu erlernenden Funktionsform und berücksichtigten keine allgemeinen theoretischen Hintergrundaxiome (logische Einschränkungen, die andere Gesetze und nicht gemessene Variablen beschreiben, die an dem Phänomen beteiligt sind).
Cristina Cornelio, die Erstautorin des Papiers und Forschungswissenschaftlerin bei Samsung AI, sagte, AI-Descartes biete einige Vorteile gegenüber anderen Systemen, aber es sei das bedeutendste Merkmal seine Fähigkeit zum logischen Denken. Wenn es mehrere Kandidatengleichungen gibt, die gut zu den Daten passen, ermittelt das System, welche Gleichung am besten zur wissenschaftlichen Hintergrundtheorie passt. Die Fähigkeit zum Denken unterscheidet das System auch von „generativen KI“-Programmen wie ChatGPT, die in großen Sprachmodellen über begrenzte Logikfähigkeiten verfügen und manchmal mit grundlegender Mathematik durcheinander geraten.
„In unserer Arbeit kombinieren wir First-Principles-Ansätze mit datengesteuerten Ansätzen, die im Zeitalter des maschinellen Lernens häufiger vorkommen und seit Jahrhunderten verwendet werden.“ Diese Kombination ermöglicht es uns, beide Methoden zu nutzen und genauere und aussagekräftigere Modelle für eine Vielzahl von Anwendungen zu erstellen“, sagte Cornelio. 🎜🎜#
AI-Descartes Der Name ist eine Hommage an das 17 Jahrhundert spielte der Mathematiker und Philosoph René Descartes, der glaubte, dass die natürliche Welt durch einige grundlegende physikalische Gesetze und logische Schlussfolgerungen beschrieben werden kann, eine Schlüsselrolle bei der wissenschaftlichen Entdeckung.
Illustration: Wissenschaftliche Methode zur Systemimplementierung erklären. (Quelle: Papier)
Forscher dieses Teams haben gezeigt, dass die Kombination logischen Denkens mit symbolischer Regression effektiver ist, um aussagekräftige Symbole physikalischer Phänomene zu erhalten sind von großem Wert, da sie mit der Hintergrundtheorie übereinstimmen und sich gut auf Bereiche verallgemeinern lassen, die deutlich größer sind als experimentelle Daten. Die Kombination aus Regression und Inferenz führt zu besseren Modellen als SR oder logische Inferenz allein.
Durch die Verbesserung oder den Austausch einzelner Systemkomponenten und die Einführung neuer Module, wie zum Beispiel abduktive Inferenz oder experimentelles Design, wird die Funktionalität des Gesamtsystems erweitert. Eine tiefere Integration von Inferenz und Regression kann zur Synthese datengesteuerter und auf Prinzipien basierender Modelle beitragen und zu einer Revolution im wissenschaftlichen Entdeckungsprozess führen. Die Entdeckung von Modellen, die mit dem Vorwissen im Einklang stehen, wird die wissenschaftliche Entdeckung beschleunigen und über bestehende Entdeckungsparadigmen hinausgehen.
Das Team verwendete Modelle, um Keplers drittes Gesetz der Planetenbewegung, Einsteins relativistisches Zeitdilatationsgesetz und Langmuirs Adsorptionstheorie abzuleiten Kandidatenformeln mit ähnlichen Fehlern in den Daten können das Modell anhand einer kleinen Anzahl von Datenpunkten bestimmende Muster erkennen. Abbildung: Visualisierung zusammengehöriger Mengen und ihrer Abstände. (Quelle: Papier)
„In dieser Arbeit brauchen wir menschliche Experten, um die Hintergrundtheorie in einer formalen, computerlesbaren Form niederzuschreiben. Was die „Axiome sind: Wenn Menschen eines davon übersehen oder falsch verstehen, funktioniert das System nicht“, sagte Tyler Josephson, Assistenzprofessor für Chemie, Biochemie und Umwelttechnik an der UMBC. „Wir hoffen, dies in Zukunft zu automatisieren.“ Teil des Jobs, damit wir weitere Bereiche der Wissenschaft und Technik erkunden können Reichtum wie echte Wissenschaftler. Ein neuer wissenschaftlicher Ansatz zur Wirksamkeit. „Einer der aufregendsten Aspekte unserer Arbeit ist das Potenzial für bedeutende Fortschritte in der wissenschaftlichen Forschung“, sagte Cornelio.
Papierlink: https://www.nature.com/articles/s41467-023-37236-y
Verwandte Berichte: https://techxplore.com/news/2023-04-ai-scientist-combines-theory-scientific.html#🎜 🎜#
Das obige ist der detaillierte Inhalt vonNeue „KI-Wissenschaftler' kombinieren Theorie und Daten, um wissenschaftliche Gleichungen zu entdecken. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!