Verhaltens-Datensatz
Basiert auf dem GS-Segmentierungs-Report und zeigt, wo sich Wert über Steam-Spieler konzentriert.
Überblick
Ein Datensatz von 46.157 Steam-Spielerprofilen. Jeder Datensatz enthält Verhaltenssignale, Quartilseinordnungen, eine deterministische Segmentzuweisung und einen standardisierten Wert-Proxy.
Das sind nicht nur Engagement-Daten, sondern Struktur: welche Spieler ökonomisch unterschiedlich sind und warum.
Felder pro Spieler
Verhaltenssegmente
Spielerprofile
Kernsignale
Explorer + Collector = 27% of players → 62.5% of value
Struktur
Zehn Felder pro Spieler-Datensatz. Alle Felder sind typisiert, dokumentiert und für direkte Integration bereit.
| Feld | Typ | Beschreibung | Beispiel |
|---|---|---|---|
| user_id | string | Gehashter eindeutiger Identifier pro Spieler | a3f8c1... |
| library_size | int | Anzahl der auf Steam besessenen Titel-Einträge | 247 |
| total_hours | float | Gesamtstunden über alle besessenen Titel-Einträge | 4832.5 |
| top_game_hours | float | Stunden im meistgespielten Spiel | 1247.3 |
| top_game_ratio | float | Anteil der Gesamtstunden auf dem meistgespielten Titel (0,0 bis 1,0) | 0.258 |
| estimated_total_spend | float | Geschätzter Eigentumswert (library_size × 20-$-Proxy) | 4940.0 |
| engagement_quartile | int | Quartilsrang nach Gesamtstunden (1 bis 4) | 3 |
| ownership_quartile | int | Quartilsrang nach Bibliotheksgröße (1 bis 4) | 4 |
| focus_quartile | int | Quartilsrang nach Top-Title-Quote (1 bis 4) | 2 |
| segment | string | Deterministisches Verhaltenssegment-Label | Explorer |
Vorschau
Fünf repräsentative Zeilen, eine pro Segment. Alle Schlüsselfelder enthalten.
| user_id | library_size | total_hours | top_game_ratio | estimated_total_spend | segment |
|---|---|---|---|---|---|
| a3f8c1... | 162 | 3841 | 0.312 | 3240 | Core |
| b7d2e4... | 483 | 12023 | 0.128 | 9660 | Explorer |
| c1a9f3... | 42 | 3346 | 0.639 | 840 | Focused |
| d4e6b8... | 648 | 2891 | 0.127 | 12960 | Collector |
| e9c3a7... | 147 | 0 | 0 | 2940 | Dormant |
Taxonomie
Mittlere Breite, mittlere Tiefe, ausgeglichene Aufmerksamkeit. Die sichtbare Basislinie eines Steam-Publikums. Verlässlich, aber nicht der Ort, an dem sich überproportional Wert konzentriert.
Hohe Breite, hohe Tiefe, verteilte Aufmerksamkeit. Investiert breit über viele Titel. Größte Konzentration des Eigentumswerts im Datensatz.
Geringe Breite, hohe Tiefe, konzentrierte Aufmerksamkeit. Engagiert sich intensiv für wenige Titel. Hohe Engagement-Dichte, geringe ökonomische Breite.
Sehr hohe Breite, variable Tiefe. Eigentumsgetriebenes Verhalten. Höchster Wert pro Spieler. Kauft breit, unabhängig von der Spielintensität.
Mittlere bis große Bibliotheken, null aktuelle Stunden. Früher aktiv, derzeit inaktiv. Gespeicherter Eigentumswert ohne aktuelles Engagement.
Definitionen
Jedes Verhaltenssignal mit Messung, Wertebereich und Interpretationshinweis dokumentiert.
| Signal | Typ | Wertebereich | Was es misst | Auslegung |
|---|---|---|---|---|
| library_size | int | 1 to 15,000+ | Anzahl auf Steam besessener Titel-Einträge | Eigentumsbreite. Höhere Werte zeigen breitere Investition über das Ökosystem. |
| total_hours | float | 0 to 50,000+ | Kumulierte Stunden über alle Titel-Einträge | Engagement-Tiefe. Investierte Gesamtzeit, nicht Aktualität. |
| top_game_ratio | float | 0.0 to 1.0 | Anteil der Gesamtstunden auf dem meistgespielten Spiel | Aufmerksamkeitskonzentration. Niedrige Werte = verteilte Aufmerksamkeit. Hohe Werte = Fokus auf einen Titel. |
| engagement_quartile | int | 1 to 4 | Quartilsrang nach Gesamtstunden | Relative Engagement-Position innerhalb des Datensatzes |
| ownership_quartile | int | 1 to 4 | Quartilsrang nach Bibliotheksgröße | Relative Eigentumsposition innerhalb des Datensatzes |
| focus_quartile | int | 1 to 4 | Quartilsrang nach Top-Game-Quote | Relative Position der Aufmerksamkeitskonzentration |
| estimated_total_spend | float | $20 to $300,000+ | Eigentumswert-Proxy (library_size × 20 $) | Relativer Eigentumswert. Kein tatsächlicher Umsatz. |
Anwendungen
Sechs konkrete B2B-Analyse-Workflows, die der Datensatz unterstützt – jeweils an ein konkretes Signalmuster und ein messbares Forschungs-Outcome gebunden.
| Aktion | Signalmuster | Outcome |
|---|---|---|
| Hochwert-Spielersegmente für Launch-Readiness-Analyse ranken | segment = Explorer or Collector | Spieler identifizieren, die breit über das Ökosystem investieren |
| Ruhenden Eigentumswert identifizieren | segment = Dormant, library_size > 100 | Gespeicherten Wert quantifizieren, ohne Inaktivität als null Marktrelevanz zu behandeln |
| Hoch-Engagement-Spieler von Hoch-Eigentum-Spielern trennen | engagement_quartile = 4, top_game_ratio > 0.5 | Engagement-Tiefe nicht als Proxy für Eigentumswert verwenden |
| Cross-Title-Bundle-Adjazenz analysieren | library_size > 200, focus_quartile ≤ 2 | Breitengetriebene Spieler finden, die bereits Eigentum über benachbarte Titel bündeln |
| Audiences gegen die Segment-Taxonomie im eigenen Warehouse scoren | join(player_id) → user_id | Heuristische Spielerstufen durch deterministische, reproduzierbare Segmente ersetzen |
| Retention- und LTV-Modelle gegen bibliotheksübergreifende Features validieren | library_size, total_hours, top_game_ratio | Blinde Flecken in rein First-Party-Engagement-Modellen reduzieren |
Methodik
Drei Hauptsignale – Eigentumsbreite, Engagement-Tiefe und Aufmerksamkeitskonzentration – werden pro Spieler berechnet. Jedes Signal wird dann innerhalb des Datensatzes in Quartile eingeordnet.
Die Segmentzuweisung ist regelbasiert: Deterministische Kombinationen der drei Quartilsränge werden auf eines von fünf benannten Segmenten abgebildet. Kein Clustering. Kein statistisches Modell. Dieselbe Eingabe produziert immer dieselbe Ausgabe.
Der Wert-Proxy ist library_size × 20 $, eine konservative Eigentums-Baseline. Es ist keine Umsatzprognose, sondern ein vergleichbarer Anker für relativen Eigentumswert über Spieler hinweg.
FAQ
Nein. Engagement ist eine von drei Eingaben. Der Datensatz ist eine strukturelle Klassifikation, wer Spieler sind – kein Echtzeit-Activity-Feed.
Nein. estimated_total_spend ist ein 20-$-pro-Spiel-Proxy. Nutzen Sie ihn für relative Vergleiche zwischen Spielern, nicht als Umsatzprognose.
Ja. Die regelbasierte Zuordnung ist deterministisch. Derselbe Spieler mit denselben Signalen ergibt immer dasselbe Segment.
Ja. Das Schema ist offen und über user_id verknüpfbar. Die meisten Käufer kombinieren GS-Segmente mit ihren First-Party-Features.
Dieser Datensatz ist die Schicht hinter dem GS-Report.
27 % der Spieler. 62,5 % des Werts.