• Zuhause
  • Artikel
  • Google führt Reinforcement Learning Frameworks ein, um KI-Modelle zu trainieren
Veröffentlicht am 18-02-2019

Google führt Reinforcement Learning Frameworks ein, um KI-Modelle zu trainieren

Blog | George Institute of Data Science

Der amerikanische multinationale Technologiekonzern Google hat ein Open Source-Framework in Verbindung mit dem auf Tensor Flow basierenden Verstärkungslernen (RL) herausgebracht.

Tensor Flow ist die Machine Learning Library von Google. Laut den Mitgliedern des Google Brain-Teams wird die Entwicklung Stabilität, Reproduzierbarkeit und Flexibilität verbessern - drei der herausragenden Merkmale des Geistes.

Verstärktes Lernen ist ein Bereich des maschinellen Lernens, der Maßnahmen zur Maximierung der mit einem bestimmten Element verbundenen Belohnungen umfasst. Das technische Lernen hat im Laufe der Jahre einen Übergang vollzogen, um sein aktuelles Stadium zu erreichen. Deep Mind - ein Startup in London, das später von Google erworben wurde - ist eines der klassischen Arbeitsbeispiele dieser Art von KI.

DQN, ein RL-Projekt von Deep Mind, hat die Eigenschaft, Spiele auf eine Weise zu spielen, die die Fähigkeiten selbst der erfahrenen Spieler unter den Menschen übertrifft.

Herausforderungen beim Aufbau von Lernsystemen zur Verstärkung

Die Wiederholung von Designs ist eines der wichtigsten Elemente für die Entwicklung von RL-Systemen. Manchmal geht es auch darum, etablierte Frameworks zu zerstören, ohne einen offensichtlichen Weg zu finden, um eine Lösung zu finden. Der einzige Haken ist, dass einige der Fallstricke in seiner Methodik den Fortschritt des Prozesses verlangsamen und die Erkundung in den nachfolgenden Stufen einschränken können.

Die meisten Experten glauben, dass die Entwicklung einen großen Durchbruch in den allgemeinen RL-Frameworks darstellt, da sie die Kombination von Flexibilität und Stabilität herbeiführt - ein Merkmal, das in keiner der derzeit vorhandenen Varianten von Frameworks verfügbar ist.

Darüber hinaus kann das Erstellen exakter Kopien von Frameworks aus den vorhandenen Einheiten ein langwieriger Prozess sein, da dies viel Zeit kostet. Eine solche Praxis kann in Zukunft zu Problemen mit der wissenschaftlichen Reproduzierbarkeit führen.

Vorteile im Zusammenhang mit der Veröffentlichung des Open Source-Frameworks

Das Paket von Google bietet einige offensichtliche Vorteile. Neben anderen Vorteilen soll die Wichtigkeit der Reproduzierbarkeit durch die Verwendung bestimmter Werkzeuge hervorgehoben werden. Nach Ansicht von Experten wird dies den Forschern dabei helfen, ihre Ideen schnell an etablierten Methoden zu messen.

Für diejenigen, die das Wasser im Hinblick auf die Realisierung der frischen Wege in RL testen, würde der Umzug ihnen das Leben erleichtern, indem sie wertvolle Zeit sparen. Und wie wir alle wissen, ist Zeit mehr wert als Geld.

Mit den Worten von Marc Bellemare und Pablo Samuel Castro, den prominenten Google-Forschern: „Inspiriert von einer der Hauptkomponenten für belohnungsmotiviertes Verhalten im Gehirn und als Ausdruck der starken historischen Verbindung zwischen Neurowissenschaften und Verstärkungslernforschung, möchte diese Plattform dies ermöglichen die Art von spekulativer Forschung, die radikale Entdeckungen antreiben kann “.

Sie sind zuversichtlich, dass die Rolle der Flexibilität und die Benutzerfreundlichkeit der Rahmenbedingungen dazu beitragen werden, Forscher zu ermutigen und zu befähigen, neue radikale und inkrementelle Ideen auszuprobieren.

Während erwartet wird, dass die neue Entwicklung den Menschen helfen wird, mehrere Ideen in kürzester Zeit durchzuarbeiten, bleibt abzuwarten, wie die Mitglieder der größeren Gemeinschaft sie in den nächsten Monaten zu ihrem Vorteil nutzen werden.

2018 George Institute of Data Science Alle Rechte vorbehalten

Ursprünglich auf www.georgedatascience.com veröffentlicht.

Siehe auch

Übersetzen und synthetisieren Sie Text mit Rust und gRPCSo veröffentlichen Sie eine React Native-Komponente in NPM - es ist einfacher als Sie denkenMein erstes Jahr als Software Engineer: Ein RückblickLernen Sie verschiedene JavaScript-Umgebungen in React Native kennenWarum ein README erstellt wurde, ist zu meinem Lieblingsteil der Entwicklung gewordenWir sind was wir tun