Softwareübersicht und Anwendungsfälle
Sowohl CollectOSS (ausgesprochen „Collect Us“) als auch GrimoireLab sind hervorragende Tools, um aussagekräftige Erkenntnisse über den Zustand von Open-Source-Projekten und -Ökosystemen zu gewinnen. Sie verfolgen jedoch sehr unterschiedliche Ansätze. Aufgrund dieser Unterschiede kann je nach Ihren Anforderungen eines der beiden Tools die bessere Wahl sein.
Die Besonderheiten von GrimoireLab bestehen darin, dass Sie damit Folgendes tun können:
- Erhalten Sie einen aggregierten Überblick über Ihre Softwareentwicklungsaktivitäten über eine Vielzahl von Kanälen (z. B. Repositories, Mailinglisten, Chat-Tools, Wikis) und erstellen Sie einen zentralen Ort für das Data Mining über Quellen hinweg, um diese Informationen für Ihren speziellen Kontext zu verstehen.
- Wenden Sie eine große Anzahl vorhandener, vorgefertigter Visualisierungen an, um Trends zu erkennen und den Zustand Ihrer Open-Source-Projekte und Ökosysteme kontinuierlich zu überwachen. Passen Sie diese Visualisierungen mithilfe von OpenSearch-Abfragen an, um einen Drilldown zu interessanten Daten durchzuführen.
- Sehen Sie GrimoireLab in Aktion im CHAOSS-Dashboard.
Die besonderen Merkmale von CollectOSS sind, dass man es für Folgendes verwenden kann:
- Schwerpunkt ist die Nutzung von Daten der Plattformen GitHub und GitLab (Unterstützung für weitere Plattformen wie Forgejo folgt in Kürze).
- Daten in großem Umfang erfassen mit Unterstützung für rotierende API-Schlüssel und einer Sammlung, die auf Zehntausende von Repositories skalierbar ist.
- Erstellen Sie benutzerdefinierte Abfragen, um komplexe oder unerwartete Fragestellungen mithilfe von Data-Science- oder Data-Engineering-Tools zu untersuchen, die für relationale Datenbanken und strukturierte Daten entwickelt wurden.
- Analysieren Sie Daten zu Compliance, Sicherheit, Abhängigkeiten und verwandten Softwarethemen, um die potenziellen Risiken eines Open-Source-Projekts besser zu verstehen.
- Nutzen Sie Visualisierungen, um mehr über die Gesundheit der Bevölkerung zu erfahren und die CollectOSS-Daten in der Praxis zu erkunden. 8Knoten Instrumententafel.
Jeder kann beide Tools verwenden, um aussagekräftige Erkenntnisse zu gewinnen:
- Datenwissenschaftler, Forscher und andere Datenanalysten fühlen sich möglicherweise wohler, wenn sie mithilfe der relationalen Datenbank von CollectOSS benutzerdefinierte Abfragen für eingehende Untersuchungen schreiben.
- Community-Manager, Technik-/Produktteams oder Projektleiter werden die einfache Erkennung von Trends mithilfe der Visualisierungen von GrimoireLab in verschiedenen Anwendungsfällen zu schätzen wissen.
Diese Übersicht enthält nur einige der vielen Szenarien, die jemanden dazu bringen könnten, CHAOSS-Tools zu verwenden. Dabei handelt es sich um komplexe Tools mit vielen Merkmalen und Funktionen, die sich nicht ausreichend in ein paar Punkten zusammenfassen lassen. Darüber hinaus ist jedes Open-Source-Projekt einzigartig und der Bedarf an Daten über Open-Source-Projekte und Ökosysteme kann sehr unterschiedlich sein. Obwohl wir hoffen, dass die obige Zusammenfassung Ihnen dabei hilft, das richtige Werkzeug für Ihre Bedürfnisse auszuwählen, empfehlen wir Ihnen, sich die zusätzlichen Vorteile und Funktionen unten genauer anzusehen, bevor Sie eine endgültige Auswahl treffen.
Weitere Vorteile und Funktionen
CollectOSS
- Die Daten werden inkrementell erfasst und umfassen alle Nachrichten und Commits im Zusammenhang mit Issues, Pull Requests und Pull Request Reviews, einschließlich historischer Daten.
- Unsere parallele Hochgeschwindigkeits-Datenerfassung wird produktiv mit über 40,000 Repositories eingesetzt und ermöglicht die Bewertung verschiedener Open-Source-Software-Ökosysteme.
- Die CollectOSS-Community verbessert ständig automatisierte Tests, Dokumentation und transparente Qualitätssicherungsprozesse, um CollectOSS zu einer zuverlässigen Quelle für Upstream-Gesundheitsdaten mit vollständiger Beobachtbarkeit zu machen.
- Die Erfassung und Analyse geht über das Zählen von Aktivitäten hinaus und umfasst Informationen zur Lizenzabdeckung und zum Lizenztyp, COCOMO-basierte Softwarekomplexität und Kosten für den Austausch von Daten nach Projekt und Datei, Software-Abhängigkeitsscans und Abhängigkeitsmessungen LibYearsund zeitreihenpersistente OpenSSF Scorecard-Informationen.
- Nutzer können komplexe oder unerwartete Fragen untersuchen und dabei mithilfe der relationalen Datenbank von CollectOSS oder der API benutzerdefinierte Abfragen erstellen.
- CollectOSS umfasst Datenvisualisierungen über ein erweiterbares Frontend, das mit Tools entwickelt wurde, die Datenwissenschaftlern vertraut sind (z. B. Dash und Plotly). 8Knoten ist entwickelt.
Weitere Informationen finden Sie auf der CollectOSS-Repository.
GrimoireLab
- Die Daten werden auf konsistente Weise erstellt, um eine klare Berichterstattung und zuverlässige Erkenntnisse zu ermöglichen. Die Daten werden aus über 30 Datenquellen gesammelt, einschließlich historischer Daten. Die inkrementelle Datenerfassung ermöglicht schnellere Aktualisierungen. Die Datenqualität wird durch konsequente Methoden zur Verhinderung von Datenverfall sichergestellt.
- Rohdaten werden angereichert, um tiefere Einblicke zu ermöglichen und Analysen zu ermöglichen, die über die grundlegende Zählung von Ereignissen hinausgehen. Beispielsweise identifiziert die Zwiebelanalyse im Zeitverlauf wichtige, regelmäßige und gelegentliche Mitwirkende. Die Kennzahlen zur Attraktivität und Bindung identifizieren Mitwirkende, die kürzlich einem Projekt beigetreten sind, und solche, die inaktiv geworden sind.
- Zusätzlich zu den Daten werden Dashboard-Lösungen bereitgestellt, mit denen Sie Daten untersuchen und benutzerdefinierte Visualisierungen und Dashboards erstellen können, die mit Links und Live-Daten geteilt werden können
- Für die Aktualisierung von Organisationszugehörigkeiten und die Deduplizierung von Mitwirkenden stehen Verwaltungsschnittstellen und APIs zur Verfügung
- Der Zugriff auf Daten ist auf drei Ebenen möglich: (1) Benutzeroberfläche zum Erkunden und Teilen von Daten; (2) Verwaltungsoberfläche zum Erstellen von Visualisierungen und Dashboards sowie zum Verwalten von Zugehörigkeiten; (3) Datenschnittstelle über die OpenSearch-API zu Rohdaten und angereicherten Daten zur benutzerdefinierten Analyse in verschiedenen Tools wie Jupyter Notebooks.
- Die Netzwerkanalyse ermöglicht die Aufdeckung von Beziehungen und Verbindungen zwischen Projekten, Repositories, Mitwirkenden und Organisationen.
- Der Datenschutz ist integriert, um einen DSGVO-konformen Betrieb zu unterstützen.
Weitere Informationen finden Sie auf der GrimoireLab-Website.