• Zuhause
  • Artikel
  • Web-Scale Citation Tracking: Können Sie die Zeichen lesen?
Veröffentlicht am 14-03-2019

Web-Scale Citation Tracking: Können Sie die Zeichen lesen?

Hören Sie diese kleine Stimme in Ihren HEAD Requests

Mit Cobaltmetrics ist Thunken auf der Suche nach einer alternativen Alternative zu Bibliometrie. Wir haben ausführlich die mangelnde Vielfalt bestehender Altmetrics-Aggregatoren diskutiert. Altmetrics sind nicht alt und Sugimoto et al. (2017) Bemerkung:

Ein kritischer Punkt ist, dass sich diese Aggregatoren auf Dokumente konzentrieren, die über eine eindeutige Objektkennung verfügen, wodurch bestimmte Dokumenttypen unweigerlich vernachlässigt werden […]. Beispielsweise konzentriert sich Altmetric.com - der wohl bekannteste Altmetrics-Aggregator - auf die Datenerhebung auf DOIs, was zu einer De-facto-Reduktion von Altmetrics-Studien auf Zeitschriftenartikel geführt hat, wobei viele Arten von Dokumenten und Zeitschriften […] sowie die meisten ausgeschlossen sind Ereignisse zweiter Ordnung, wie die Diskussion eines Artikels in einem Blogbeitrag oder Zeitungsartikel […].

Cobaltmetrics behebt das, und wir fangen gerade erst an. Anfang dieser Woche haben wir ein Update für unsere URI-Transmutations-API veröffentlicht, das Signposting nutzt, ein eleganter Ansatz, um das Internet freundlicher zu machen.

Besser jeden URI heute als einen FAIR Identifier von morgen

Eines der Leitprinzipien von Cobaltmetrics ist, dass es nicht Sache der Bibliometrics-Aggregatoren ist, zu entscheiden, was zitierbar ist. Unsere Endbenutzer wenden bei der Berechnung von Metriken möglicherweise unterschiedliche Gewichtungen auf unterschiedliche Zitiermuster an. Unsere Aufgabe besteht jedoch darin, alle Muster im Web zu beobachten. Daraus folgt, dass wir Dokumente mit permanenten Identifikatoren und Permalinks nicht nur verfolgen können. Darüber hinaus werden selbst Dokumente, denen permanente Bezeichner zugewiesen wurden, nicht unbedingt mit diesen Bezeichnern zitiert. Das Web ist nicht FAIR - und wird es höchstwahrscheinlich nie sein - und das ist gut so.

Um einen Korpus zu erstellen, der vielfältig und inklusiv ist, verfolgen wir alle URIs. Dies ist der Eckpfeiler unseres Ansatzes: Jeder Hyperlink, jedes Vorkommen eines URI ist ein Zitat. Natürlich werden bei diesem Ansatz viele Zitate in unserem Korpus im wissenschaftlichen Kontext niemals relevant sein, aber das ist kein Thema. Cobaltmetrics ist in keiner Weise auf das wissenschaftliche Netz beschränkt, und wir hoffen, dass der Korpus für andere Gemeinschaften nützlich sein wird. Vor allem ist es immer einfacher, einen Teil der Beobachtungen herauszufiltern, als die Statistiken für Ereignisse zu schätzen, die nie erfasst wurden.

Nichts ist verloren, nichts ist geschaffen, alles ist transformiert

Es gibt oft viele - mehr oder weniger wünschenswerte - URIs, die verwendet werden können, um ein bestimmtes Dokument zu zitieren: die Zielseite auf der Website des Herausgebers, das PDF auf derselben Website, die bibliografischen Datensätze in thematischen oder institutionellen Repositories, verschiedene Vordrucke auf persönlichen Websites usw. Eine unserer größten Herausforderungen besteht darin, URIs zu finden, die die gleiche Ressource direkt oder indirekt identifizieren, so dass Zitierzahlen und Aufmerksamkeitswerte genau berechnet werden können. Wir möchten, dass unsere Benutzer die Identifikatoren verwenden, mit denen sie sich am wohlsten fühlen, und uns dann für das schwere Heben zurückstellen.

In Cobaltmetrics bezeichnen wir diesen Prozess als URI-Transmutation. Wir kombinieren verschiedene Quellen, um optimale Ergebnisse zu erzielen. Anfang dieser Woche haben wir uns auf einige Beschilderungsmuster verlassen. Signposting ist eine Reihe einfacher, aber leistungsfähiger Ideen, um das Internet noch benutzerfreundlicher zu machen, was wiederum die Zitierverfolgung für graue Literatur und Dokumente an den Grenzen des wissenschaftlichen Netzes noch freundlicher macht.

Unsere URI-Transmutations-API kann jetzt Informationen aus typisierten Links aus HTTP-Link-Headern extrahieren. Ein Link-Header zeigt auf eine Ressource, die sich auf die angeforderte Ressource bezieht, und der Typ der Verknüpfung gibt die Beziehung zwischen beiden Ressourcen an. Der Beziehungstyp "Zitieren als" enthält beispielsweise einen kanonischen und hoffentlich persistenten URI, der zum Zitieren eines bestimmten Dokuments verwendet werden sollte. Die HTTP-Header für https://www.annalsofgeophysics.eu/index.php/annals/article/view/7507 weisen beispielsweise darauf hin, dass der bevorzugte URI für Zitate https://doi.org/10.4401/ag-7507 ist . In Cobaltmetrics bedeutet dies, dass entweder eine URI verwendet werden kann, um diese Veröffentlichung im Web zu zitieren, und wir können die Daten konsolidieren.

cite-as ist nicht der einzige Relationstyp, der für die URI-Transmutation relevant ist. Wir verwenden derzeit die folgenden Typen, sofern verfügbar: alternative, Lesezeichen, kanonisch, zitieren als, Duplikat, Bezeichner, neueste Version, Erinnerungsstück, Vorgängerversion, Selbst, Nachfolgerversion, Arbeitskopie von. Weitere Informationen zu Beziehungstypen finden Sie in der Registrierung.

Reproduzierbarkeit im Laufe der Zeit

Da wir Daten aus vielen verschiedenen Quellen zusammenfassen, ist die Reproduzierbarkeit eine Herausforderung. Bei der Beschilderung werden insbesondere HTTP-Anfragen verwendet. Wir können nicht garantieren, dass Server von Drittanbietern im Laufe der Zeit für einen bestimmten URI dieselben Header zurückgeben, und es besteht kein Grund zu der Annahme, dass sie dies über einen längeren Zeitraum tun werden. Darüber hinaus verwenden wir nur ungern die Verwendung von Cache-Daten und das Risiko, dass veraltete Daten zurückgegeben werden. Aus diesem Grund ist die Umwandlung auf Signposting-Basis nicht standardmäßig aktiviert und erfordert die Verwendung des X-Release: unstable-Headers in Ihren Anforderungen an die API. Weitere Informationen finden Sie in unserer Dokumentation.

Was kommt als nächstes?

Wir erweitern unseren Korpus, um noch mehr Websites zu überwachen. Nehmen Sie an unserer Ein-Fragen-Umfrage teil und teilen Sie uns mit, welche Websites von Cobaltmetrics als Priorität eingestuft werden sollen: Archivseiten, Blogs, Unternehmensseiten, Regierungsseiten, Message-Boards, News-Websites, alles!

Möchten Sie mehr über Cobaltmetrics erfahren? Probieren Sie es aus, prüfen Sie die öffentliche API, nehmen Sie an unserem Newsletter teil und wenden Sie sich an contact@thunken.com!

Siehe auch

Wie das größte technologische Wunder mein Leben veränderteDrohnen-Inspektionsdienste sind eine Milliarden-IndustrieGenerisches Geschenkpaket DZ09 Smart Watch Phone mit kostenlosem Bluetooth-Headset und Selfie-Stick -…Wer ist es überhaupt?Schmutzige WäscheNeuer Studienbericht zum Markt für Web-Filtering-Dienste im CAGR von über 13% bis 2026 Oberste Taste…