Gedragsdataset

De Waardeverdeling-Dataset

Gebaseerd op de GS-segmentatie-report, laat zien waar waarde zich concentreert onder Steam-spelers.

46.157 spelers|5 segmenten|Deterministisch|Schema-gereed

Overzicht

Wat je krijgt

Een dataset van 46.157 Steam-spelersprofielen. Elk record bevat gedragssignalen, kwartiel-rangschikkingen, een deterministische segmenttoewijzing en een gestandaardiseerde waardeproxy.

Dit zijn niet alleen engagement-data. Het is structuur: welke spelers economisch verschillend zijn en waarom.

10

Velden per speler

5

Gedragssegmenten

46K+

Spelersprofielen

3

Kernsignalen

Player share ≠ Value share

Explorer + Collector = 27% of players → 62.5% of value

Player share
Value share
Majority of value sits here: Explorer + Collector

Structuur

Schema

Tien velden per spelersrecord. Alle velden zijn getypt, gedocumenteerd en klaar voor directe integratie.

VeldTypeBeschrijvingVoorbeeld
user_idstringGehashte unieke identifier per spelera3f8c1...
library_sizeintTotaal aantal titel-records in eigendom op Steam247
total_hoursfloatTotale uren over alle titel-records in eigendom4832.5
top_game_hoursfloatUren op de meest gespeelde game1247.3
top_game_ratiofloatAandeel totale uren op de meest gespeelde titel (0,0 tot 1,0)0.258
estimated_total_spendfloatGeschatte eigendomswaarde (library_size × 20-$-proxy)4940.0
engagement_quartileintKwartiel-rangschikking op totale uren (1 tot 4)3
ownership_quartileintKwartiel-rangschikking op bibliotheekgrootte (1 tot 4)4
focus_quartileintKwartiel-rangschikking op top-titel-ratio (1 tot 4)2
segmentstringDeterministisch gedragssegment-labelExplorer

Voorbeeld

Sample-data (representatieve rijen)

Vijf representatieve rijen, één per segment. Alle sleutelvelden inbegrepen.

user_idlibrary_sizetotal_hourstop_game_ratioestimated_total_spendsegment
a3f8c1...16238410.3123240Core
b7d2e4...483120230.1289660Explorer
c1a9f3...4233460.639840Focused
d4e6b8...64828910.12712960Collector
e9c3a7...147002940Dormant

Taxonomie

Segmentdefinities

Core

Gemiddelde breedte, gemiddelde diepte, gebalanceerde aandacht. De zichtbare baseline van een Steam-publiek. Betrouwbaar, maar niet waar buitensporige waarde zich concentreert.

Explorer

Hoge breedte, hoge diepte, gespreide aandacht. Investeert breed over veel titels. Grootste concentratie van eigendomswaarde in de dataset.

Focused

Lage breedte, hoge diepte, geconcentreerde aandacht. Toegewijd aan weinig titels. Hoge engagement-dichtheid, lage economische breedte.

Collector

Zeer hoge breedte, variabele diepte. Door eigendom gestuurd gedrag. Hoogste waarde per speler. Koopt breed ongeacht speelintensiteit.

Dormant

Middel- tot grote bibliotheken, nul recente uren. Eerder actief, momenteel inactief. Opgeslagen eigendomswaarde zonder recent engagement.

Definities

Signaaldefinities

Elk gedragssignaal gedocumenteerd met meting, bereik en interpretatiehulp.

SignaalTypeBereikWat het meetInterpretatie
library_sizeint1 to 15,000+Totaal aantal titel-records in eigendom op SteamEigendomsbreedte. Hogere waarden duiden op bredere investering in het ecosysteem.
total_hoursfloat0 to 50,000+Cumulatieve uren over alle titel-recordsEngagement-diepte. Totaal geïnvesteerde tijd, niet recency.
top_game_ratiofloat0.0 to 1.0Aandeel totale uren op de meest gespeelde gameAandachtsconcentratie. Lage waarden duiden op gespreide aandacht. Hoge waarden duiden op focus op één titel.
engagement_quartileint1 to 4Kwartiel-rangschikking op totale urenRelatieve engagement-positie binnen de dataset
ownership_quartileint1 to 4Kwartiel-rangschikking op bibliotheekgrootteRelatieve eigendomspositie binnen de dataset
focus_quartileint1 to 4Kwartiel-rangschikking op top-game-ratioRelatieve positie van aandachtsconcentratie
estimated_total_spendfloat$20 to $300,000+Eigendomswaarde-proxy (library_size × 20 $)Relatieve eigendomswaarde. Geen werkelijke omzet.

Toepassingen

Toepassingen voor afnemers

Zes concrete B2B-analyse-workflows die de dataset ondersteunt, elk verbonden aan een specifiek signaalpatroon en meetbare onderzoeksuitkomst.

ActieSignaalpatroonUitkomst
Hoogwaardige spelerssegmenten rangschikken voor launch-readiness-analysesegment = Explorer or CollectorSpelers identificeren die breed in het ecosysteem investeren
Slapende eigendomswaarde identificerensegment = Dormant, library_size > 100Opgeslagen waarde kwantificeren zonder inactiviteit als nul marktrelevantie te behandelen
Hoge-engagement-spelers scheiden van hoge-eigendom-spelersengagement_quartile = 4, top_game_ratio > 0.5Engagement-diepte niet als proxy gebruiken voor eigendomswaarde
Cross-titel bundeladjacentie analyserenlibrary_size > 200, focus_quartile ≤ 2Door breedte gedreven spelers vinden die al eigendom concentreren over aangrenzende titels
Audiences scoren tegen de segmentaxonomie in je eigen warehousejoin(player_id) → user_idHeuristische spelerstier vervangen door deterministische, reproduceerbare segmenten
Retentie- en LTV-modellen valideren op cross-bibliotheek-featureslibrary_size, total_hours, top_game_ratioBlinde vlekken verminderen in modellen die alleen op first-party engagement zijn gebouwd

Methodologie

Hoe de segmenten worden gebouwd

Drie hoofdsignalen — eigendomsbreedte, engagement-diepte en aandachtsconcentratie — worden per speler berekend. Elk signaal wordt vervolgens binnen de dataset gerangschikt in kwartielen.

Segmenttoewijzing is regelgebaseerd: deterministische combinaties van de drie kwartiel-rangen mappen naar één van vijf benoemde segmenten. Geen clustering. Geen statistisch model. Dezelfde input levert altijd dezelfde output.

De geschatte waardeproxy is library_size × 20 $, een conservatieve eigendoms-baseline. Het is geen omzetprognose. Het is een vergelijkende anker voor relatieve eigendomswaarde tussen spelers.

FAQ

Veelgestelde vragen

Is dit engagement-data?

Nee. Engagement is één van drie inputs. De dataset is een structurele classificatie van wie spelers zijn, geen real-time activiteitenfeed.

Is het waardeveld werkelijke omzet?

Nee. estimated_total_spend is een proxy van 20 $ per game. Gebruik het voor relatieve vergelijking tussen spelers, niet als omzetprognose.

Zijn segmenten stabiel in de tijd?

Ja. De regelgebaseerde mapping is deterministisch. Dezelfde speler opnieuw uitvoeren met dezelfde signalen levert altijd hetzelfde segment op.

Kunnen we uitbreiden met onze eigen signalen?

Ja. Het schema is open en op user_id te joinen. De meeste afnemers combineren GS-segmenten met hun first-party features.

Deze dataset is de laag achter de GS-report.

27% van de spelers. 62,5% van de waarde.

Toegang wordt verleend onder een schriftelijke datagebruiksovereenkomst. Samples kunnen een representatieve doorsnede over alle vier lagen bevatten, afhankelijk van de use case van de afnemer, dekkingseisen en goedkeuringsstatus.

We verkopen of delen deze formuliergegevens nooit. Zie de pagina Privacy voor details.