Dataset comportemental

Le Dataset Distribution de Valeur

Basé sur le report de segmentation GS, montre où la valeur se concentre chez les joueurs Steam.

46 157 joueurs|5 segments|Déterministe|Prêt pour schéma

Aperçu

Ce que vous obtenez

Un dataset de 46 157 profils de joueurs Steam. Chaque enregistrement comprend des signaux comportementaux, des classements par quartile, une affectation de segment déterministe et un proxy de valeur standardisé.

Ce ne sont pas que des données d'engagement. C'est une structure : quels joueurs sont économiquement différents et pourquoi.

10

Champs par joueur

5

Segments comportementaux

46K+

Profils joueur

3

Signaux principaux

Player share ≠ Value share

Explorer + Collector = 27% of players → 62.5% of value

Player share
Value share
Majority of value sits here: Explorer + Collector

Structure

Schéma

Dix champs par joueur et enregistrement. Tous les champs sont typés, documentés et prêts pour intégration directe.

ChampTypeDescriptionExemple
user_idstringIdentifiant unique haché par joueura3f8c1...
library_sizeintTotal d'enregistrements de titres possédés sur Steam247
total_hoursfloatHeures totales sur tous les enregistrements de titres possédés4832.5
top_game_hoursfloatHeures sur le jeu le plus joué1247.3
top_game_ratiofloatPart des heures totales sur le titre le plus joué (0,0 à 1,0)0.258
estimated_total_spendfloatValeur de propriété estimée (library_size × proxy de 20 $)4940.0
engagement_quartileintRang par quartile selon les heures totales (1 à 4)3
ownership_quartileintRang par quartile selon la taille de bibliothèque (1 à 4)4
focus_quartileintRang par quartile selon le ratio du titre principal (1 à 4)2
segmentstringÉtiquette de segment comportemental déterministeExplorer

Aperçu

Données d'échantillon (lignes représentatives)

Cinq lignes représentatives, une par segment. Tous les champs clés inclus.

user_idlibrary_sizetotal_hourstop_game_ratioestimated_total_spendsegment
a3f8c1...16238410.3123240Core
b7d2e4...483120230.1289660Explorer
c1a9f3...4233460.639840Focused
d4e6b8...64828910.12712960Collector
e9c3a7...147002940Dormant

Taxonomie

Définitions de segment

Core

Ampleur moyenne, profondeur moyenne, attention équilibrée. La base visible d'une audience Steam. Fiable, mais pas l'endroit où la valeur démesurée se concentre.

Explorer

Grande ampleur, grande profondeur, attention distribuée. Investit largement à travers de nombreux titres. Plus grande concentration de valeur de propriété dans le dataset.

Focused

Faible ampleur, grande profondeur, attention concentrée. S'engage intensément sur peu de titres. Forte densité d'engagement, faible ampleur économique.

Collector

Très grande ampleur, profondeur variable. Comportement piloté par la propriété. Plus haute valeur par joueur. Achète largement quelle que soit l'intensité de jeu.

Dormant

Bibliothèques moyennes à grandes, zéro heure récente. Auparavant actif, actuellement inactif. Valeur de propriété stockée sans engagement récent.

Définitions

Définitions de signal

Chaque signal comportemental documenté avec sa mesure, sa plage et son guide d'interprétation.

SignalTypePlageCe qu'il mesureInterprétation
library_sizeint1 to 15,000+Total d'enregistrements de titres possédés sur SteamAmpleur de propriété. Des valeurs plus élevées indiquent un investissement plus large dans l'écosystème.
total_hoursfloat0 to 50,000+Heures cumulées sur tous les enregistrements de titresProfondeur d'engagement. Temps total investi, pas la récence.
top_game_ratiofloat0.0 to 1.0Part des heures totales sur le jeu le plus jouéConcentration d'attention. Des valeurs basses indiquent une attention distribuée. Des valeurs élevées indiquent une focalisation sur un titre.
engagement_quartileint1 to 4Rang par quartile selon les heures totalesPosition relative d'engagement dans le dataset
ownership_quartileint1 to 4Rang par quartile selon la taille de bibliothèquePosition relative de propriété dans le dataset
focus_quartileint1 to 4Rang par quartile selon le ratio du jeu principalPosition relative de concentration d'attention
estimated_total_spendfloat$20 to $300,000+Proxy de valeur de propriété (library_size × 20 $)Valeur de propriété relative. Pas un revenu réel.

Applications

Applications acheteurs

Six flux concrets d'analyse B2B que le dataset prend en charge, chacun lié à un motif de signal spécifique et à un résultat de recherche mesurable.

ActionMotif de signalRésultat
Classer les segments de joueurs à haute valeur pour l'analyse de launch readinesssegment = Explorer or CollectorIdentifier les joueurs qui investissent largement dans l'écosystème
Identifier la valeur de propriété dormantesegment = Dormant, library_size > 100Quantifier la valeur stockée sans traiter l'inactivité comme une pertinence de marché nulle
Séparer les joueurs à fort engagement des joueurs à forte propriétéengagement_quartile = 4, top_game_ratio > 0.5Éviter d'utiliser la profondeur d'engagement comme proxy de la valeur de propriété
Analyser l'adjacence de bundles entre titreslibrary_size > 200, focus_quartile ≤ 2Localiser les joueurs portés par l'ampleur qui concentrent déjà la propriété sur des titres adjacents
Scorer les audiences contre la taxonomie de segments dans votre warehousejoin(player_id) → user_idRemplacer les paliers heuristiques de joueur par des segments déterministes et reproductibles
Valider les modèles de rétention et de LTV avec des features cross-bibliothèquelibrary_size, total_hours, top_game_ratioRéduire les angles morts dans les modèles bâtis uniquement sur l'engagement first-party

Méthodologie

Comment les segments sont construits

Trois signaux principaux — ampleur de propriété, profondeur d'engagement et concentration d'attention — sont calculés par joueur. Chaque signal est ensuite classé en quartile au sein du dataset.

L'affectation de segment est basée sur des règles : des combinaisons déterministes des trois rangs par quartile correspondent à un des cinq segments nommés. Pas de clustering. Pas de modèle statistique. La même entrée produit toujours la même sortie.

Le proxy de valeur estimée est library_size × 20 $, une base de propriété conservatrice. Ce n'est pas une prévision de revenus. C'est un point d'ancrage comparatif pour la valeur de propriété relative entre joueurs.

FAQ

Questions fréquentes

Est-ce des données d'engagement ?

Non. L'engagement est l'une des trois entrées. Le dataset est une classification structurelle de qui sont les joueurs, pas un flux d'activité en temps réel.

Le champ valeur est-il un revenu réel ?

Non. estimated_total_spend est un proxy de 20 $ par jeu. Utilisez-le pour des comparaisons relatives entre joueurs, pas comme prévision de revenus.

Les segments sont-ils stables dans le temps ?

Oui. Le mapping basé sur des règles est déterministe. Réexécuter le même joueur avec les mêmes signaux produit toujours le même segment.

Pouvons-nous étendre avec nos propres signaux ?

Oui. Le schéma est ouvert et joignable par user_id. La plupart des acheteurs combinent les segments GS avec leurs features first-party.

Ce dataset est la couche derrière le report GS.

27 % des joueurs. 62,5 % de la valeur.

L'accès est accordé en vertu d'un accord écrit d'utilisation des données. Les échantillons peuvent inclure une coupe représentative sur les quatre couches selon le cas d'usage de l'acheteur, les exigences de couverture et le statut d'approbation.

Nous ne vendons ni ne partageons jamais ces données de formulaire. Voir la page Confidentialité pour plus de détails.