Gedragsdataset
Gebaseerd op de GS-segmentatie-report, laat zien waar waarde zich concentreert onder Steam-spelers.
Overzicht
Een dataset van 46.157 Steam-spelersprofielen. Elk record bevat gedragssignalen, kwartiel-rangschikkingen, een deterministische segmenttoewijzing en een gestandaardiseerde waardeproxy.
Dit zijn niet alleen engagement-data. Het is structuur: welke spelers economisch verschillend zijn en waarom.
Velden per speler
Gedragssegmenten
Spelersprofielen
Kernsignalen
Explorer + Collector = 27% of players → 62.5% of value
Structuur
Tien velden per spelersrecord. Alle velden zijn getypt, gedocumenteerd en klaar voor directe integratie.
| Veld | Type | Beschrijving | Voorbeeld |
|---|---|---|---|
| user_id | string | Gehashte unieke identifier per speler | a3f8c1... |
| library_size | int | Totaal aantal titel-records in eigendom op Steam | 247 |
| total_hours | float | Totale uren over alle titel-records in eigendom | 4832.5 |
| top_game_hours | float | Uren op de meest gespeelde game | 1247.3 |
| top_game_ratio | float | Aandeel totale uren op de meest gespeelde titel (0,0 tot 1,0) | 0.258 |
| estimated_total_spend | float | Geschatte eigendomswaarde (library_size × 20-$-proxy) | 4940.0 |
| engagement_quartile | int | Kwartiel-rangschikking op totale uren (1 tot 4) | 3 |
| ownership_quartile | int | Kwartiel-rangschikking op bibliotheekgrootte (1 tot 4) | 4 |
| focus_quartile | int | Kwartiel-rangschikking op top-titel-ratio (1 tot 4) | 2 |
| segment | string | Deterministisch gedragssegment-label | Explorer |
Voorbeeld
Vijf representatieve rijen, één per segment. Alle sleutelvelden inbegrepen.
| user_id | library_size | total_hours | top_game_ratio | estimated_total_spend | segment |
|---|---|---|---|---|---|
| a3f8c1... | 162 | 3841 | 0.312 | 3240 | Core |
| b7d2e4... | 483 | 12023 | 0.128 | 9660 | Explorer |
| c1a9f3... | 42 | 3346 | 0.639 | 840 | Focused |
| d4e6b8... | 648 | 2891 | 0.127 | 12960 | Collector |
| e9c3a7... | 147 | 0 | 0 | 2940 | Dormant |
Taxonomie
Gemiddelde breedte, gemiddelde diepte, gebalanceerde aandacht. De zichtbare baseline van een Steam-publiek. Betrouwbaar, maar niet waar buitensporige waarde zich concentreert.
Hoge breedte, hoge diepte, gespreide aandacht. Investeert breed over veel titels. Grootste concentratie van eigendomswaarde in de dataset.
Lage breedte, hoge diepte, geconcentreerde aandacht. Toegewijd aan weinig titels. Hoge engagement-dichtheid, lage economische breedte.
Zeer hoge breedte, variabele diepte. Door eigendom gestuurd gedrag. Hoogste waarde per speler. Koopt breed ongeacht speelintensiteit.
Middel- tot grote bibliotheken, nul recente uren. Eerder actief, momenteel inactief. Opgeslagen eigendomswaarde zonder recent engagement.
Definities
Elk gedragssignaal gedocumenteerd met meting, bereik en interpretatiehulp.
| Signaal | Type | Bereik | Wat het meet | Interpretatie |
|---|---|---|---|---|
| library_size | int | 1 to 15,000+ | Totaal aantal titel-records in eigendom op Steam | Eigendomsbreedte. Hogere waarden duiden op bredere investering in het ecosysteem. |
| total_hours | float | 0 to 50,000+ | Cumulatieve uren over alle titel-records | Engagement-diepte. Totaal geïnvesteerde tijd, niet recency. |
| top_game_ratio | float | 0.0 to 1.0 | Aandeel totale uren op de meest gespeelde game | Aandachtsconcentratie. Lage waarden duiden op gespreide aandacht. Hoge waarden duiden op focus op één titel. |
| engagement_quartile | int | 1 to 4 | Kwartiel-rangschikking op totale uren | Relatieve engagement-positie binnen de dataset |
| ownership_quartile | int | 1 to 4 | Kwartiel-rangschikking op bibliotheekgrootte | Relatieve eigendomspositie binnen de dataset |
| focus_quartile | int | 1 to 4 | Kwartiel-rangschikking op top-game-ratio | Relatieve positie van aandachtsconcentratie |
| estimated_total_spend | float | $20 to $300,000+ | Eigendomswaarde-proxy (library_size × 20 $) | Relatieve eigendomswaarde. Geen werkelijke omzet. |
Toepassingen
Zes concrete B2B-analyse-workflows die de dataset ondersteunt, elk verbonden aan een specifiek signaalpatroon en meetbare onderzoeksuitkomst.
| Actie | Signaalpatroon | Uitkomst |
|---|---|---|
| Hoogwaardige spelerssegmenten rangschikken voor launch-readiness-analyse | segment = Explorer or Collector | Spelers identificeren die breed in het ecosysteem investeren |
| Slapende eigendomswaarde identificeren | segment = Dormant, library_size > 100 | Opgeslagen waarde kwantificeren zonder inactiviteit als nul marktrelevantie te behandelen |
| Hoge-engagement-spelers scheiden van hoge-eigendom-spelers | engagement_quartile = 4, top_game_ratio > 0.5 | Engagement-diepte niet als proxy gebruiken voor eigendomswaarde |
| Cross-titel bundeladjacentie analyseren | library_size > 200, focus_quartile ≤ 2 | Door breedte gedreven spelers vinden die al eigendom concentreren over aangrenzende titels |
| Audiences scoren tegen de segmentaxonomie in je eigen warehouse | join(player_id) → user_id | Heuristische spelerstier vervangen door deterministische, reproduceerbare segmenten |
| Retentie- en LTV-modellen valideren op cross-bibliotheek-features | library_size, total_hours, top_game_ratio | Blinde vlekken verminderen in modellen die alleen op first-party engagement zijn gebouwd |
Methodologie
Drie hoofdsignalen — eigendomsbreedte, engagement-diepte en aandachtsconcentratie — worden per speler berekend. Elk signaal wordt vervolgens binnen de dataset gerangschikt in kwartielen.
Segmenttoewijzing is regelgebaseerd: deterministische combinaties van de drie kwartiel-rangen mappen naar één van vijf benoemde segmenten. Geen clustering. Geen statistisch model. Dezelfde input levert altijd dezelfde output.
De geschatte waardeproxy is library_size × 20 $, een conservatieve eigendoms-baseline. Het is geen omzetprognose. Het is een vergelijkende anker voor relatieve eigendomswaarde tussen spelers.
FAQ
Nee. Engagement is één van drie inputs. De dataset is een structurele classificatie van wie spelers zijn, geen real-time activiteitenfeed.
Nee. estimated_total_spend is een proxy van 20 $ per game. Gebruik het voor relatieve vergelijking tussen spelers, niet als omzetprognose.
Ja. De regelgebaseerde mapping is deterministisch. Dezelfde speler opnieuw uitvoeren met dezelfde signalen levert altijd hetzelfde segment op.
Ja. Het schema is open en op user_id te joinen. De meeste afnemers combineren GS-segmenten met hun first-party features.
Deze dataset is de laag achter de GS-report.
27% van de spelers. 62,5% van de waarde.