Veröffentlicht am 14-03-2019

Zuordnungsrauschen

Nun, da wir Audio aufzeichnen, müssen wir wissen, wo sich Audioquellen befinden und welche zu verfolgen sind. Wir müssen sicherstellen, dass die Kamera nicht plötzlich auf eine Person gedreht wird, die nur ein kurzes Wort sagt.

Wir können dies tun, indem wir zählen, wie oft eine Person nacheinander spricht, und sie zurücksetzen, wenn sie aufhören zu sprechen. Dies ist jedoch nicht ideal, da die Leute beim Sprechen Pausen einlegen. Wir möchten nicht aufhören, jemanden zu finden, nur weil sie nach einem Satz eine kurze Pause machen. Wir brauchen etwas robusteres.

Wir beschlossen, einen Mapping-Algorithmus zu verwenden, der üblicherweise für mobile Robotik verwendet wird. Der Algorithmus verwendet diese zugrunde liegende Bayes'sche Statistik, um das Mapping durchzuführen

Wir können einen ähnlichen Algorithmus verwenden, wenn es kein Rauschen gibt. POI ist in diesem Fall eine Person von Interesse.

Durch Auswahl geeigneter Wahrscheinlichkeiten können wir einen Graphen der Karte erstellen. Anders als in der mobilen Robotik, die oft eine gitterartige Wahrscheinlichkeitskarte aufweist, ist unsere wie in der folgenden Abbildung kreisförmig.

In dieser Karte befindet sich die Audioquelle in der Mitte. Wir können dies verwenden, indem wir sagen, sobald die wahrscheinlichste Audioquelle eine Wahrscheinlichkeit von> 50% hat, verfolgen Sie sie!

Der Mapping-Algorithmus funktioniert ziemlich gut und hat einige nette Funktionen. Lärm wird ziemlich gut abgeworfen. Es ist auch schneller, Personen zu finden, die bereits zuvor zugeordnet wurden. Das funktioniert ganz gut, wenn zwei Leute hin und her sprechen. Die Kameras können schnell zwischen ihnen hin- und herwechseln, sodass die Zeit zum Nachverfolgen noch besser wird.

Leider reagiert es langsam auf neue Geräusche. Wenn sich eine neue Person einem Gespräch anschließt, dauert es länger, bis sie eine höhere Wahrscheinlichkeit erhält.

Siehe auch

Technischer Online-Support für Epson® Printer - Sofortiger Support rund um die UhrMaschinelles Lernen verbessernVerwalten Ihrer Firewall unter Centos 7 mit FirewalldMessaging-Ecke für Unternehmen - Süd durch SüdwestenGoogle nimmt einen neuen Look für sein Hardware-Geschäft aufDer weltweite Markt für Flüssigfiltrationsmedien wird voraussichtlich von USD 2.135,65 wachsen