Dataset comportamentale

Il Dataset Distribuzione del Valore

Basato sul report di segmentazione GS, mostra dove il valore si concentra tra i giocatori Steam.

46.157 giocatori|5 segmenti|Deterministico|Pronto per lo schema

Panoramica

Cosa ottieni

Un dataset di 46.157 profili di giocatori Steam. Ogni record include segnali comportamentali, classifiche per quartile, un'assegnazione deterministica al segmento e un proxy di valore standardizzato.

Non solo dati di engagement. È struttura: quali giocatori sono economicamente diversi e perché.

10

Campi per giocatore

5

Segmenti comportamentali

46K+

Profili giocatore

3

Segnali principali

Player share ≠ Value share

Explorer + Collector = 27% of players → 62.5% of value

Player share
Value share
Majority of value sits here: Explorer + Collector

Struttura

Schema

Dieci campi per record giocatore. Tutti i campi sono tipizzati, documentati e pronti per integrazione diretta.

CampoTipoDescrizioneEsempio
user_idstringIdentificatore univoco hash per giocatorea3f8c1...
library_sizeintNumero totale di record di titoli posseduti su Steam247
total_hoursfloatOre totali su tutti i record di titoli posseduti4832.5
top_game_hoursfloatOre sul gioco più giocato1247.3
top_game_ratiofloatQuota delle ore totali sul titolo più giocato (0,0 a 1,0)0.258
estimated_total_spendfloatValore di proprietà stimato (library_size × proxy di 20 $)4940.0
engagement_quartileintRango per quartile in base alle ore totali (1 a 4)3
ownership_quartileintRango per quartile in base alla dimensione della libreria (1 a 4)4
focus_quartileintRango per quartile in base al ratio del titolo principale (1 a 4)2
segmentstringEtichetta deterministica del segmento comportamentaleExplorer

Anteprima

Dati di esempio (righe rappresentative)

Cinque righe rappresentative, una per segmento. Tutti i campi chiave inclusi.

user_idlibrary_sizetotal_hourstop_game_ratioestimated_total_spendsegment
a3f8c1...16238410.3123240Core
b7d2e4...483120230.1289660Explorer
c1a9f3...4233460.639840Focused
d4e6b8...64828910.12712960Collector
e9c3a7...147002940Dormant

Tassonomia

Definizioni dei segmenti

Core

Ampiezza media, profondità media, attenzione equilibrata. La baseline visibile di un'audience Steam. Affidabile, ma non dove si concentra il valore sproporzionato.

Explorer

Alta ampiezza, alta profondità, attenzione distribuita. Investe ampiamente su molti titoli. Massima concentrazione del valore di proprietà nel dataset.

Focused

Bassa ampiezza, alta profondità, attenzione concentrata. Si impegna intensamente su pochi titoli. Alta densità di engagement, bassa ampiezza economica.

Collector

Ampiezza molto alta, profondità variabile. Comportamento guidato dalla proprietà. Massimo valore per giocatore. Acquista ampiamente indipendentemente dall'intensità di gioco.

Dormant

Librerie da medie a grandi, zero ore recenti. Precedentemente attivo, attualmente inattivo. Valore di proprietà conservato senza engagement recente.

Definizioni

Definizioni dei segnali

Ogni segnale comportamentale documentato con la sua misurazione, intervallo e guida all'interpretazione.

SegnaleTipoIntervalloCosa misuraInterpretazione
library_sizeint1 to 15,000+Totale dei record di titoli posseduti su SteamAmpiezza di proprietà. Valori più alti indicano un investimento più ampio nell'ecosistema.
total_hoursfloat0 to 50,000+Ore cumulative su tutti i record di titoliProfondità di engagement. Tempo totale investito, non recency.
top_game_ratiofloat0.0 to 1.0Quota delle ore totali sul gioco più giocatoConcentrazione dell'attenzione. Valori bassi indicano attenzione distribuita. Valori alti indicano focus su un titolo.
engagement_quartileint1 to 4Rango per quartile in base alle ore totaliPosizione relativa di engagement nel dataset
ownership_quartileint1 to 4Rango per quartile in base alla dimensione della libreriaPosizione relativa di proprietà nel dataset
focus_quartileint1 to 4Rango per quartile in base al ratio del gioco principalePosizione relativa di concentrazione dell'attenzione
estimated_total_spendfloat$20 to $300,000+Proxy di valore di proprietà (library_size × 20 $)Valore relativo di proprietà. Non è ricavo reale.

Applicazioni

Applicazioni per acquirenti

Sei flussi concreti di analisi B2B che il dataset supporta, ciascuno legato a un pattern di segnale specifico e a un esito di ricerca misurabile.

AzionePattern di segnaleEsito
Classificare segmenti di giocatori ad alto valore per analisi di launch readinesssegment = Explorer or CollectorIdentificare giocatori che investono ampiamente nell'ecosistema
Identificare valore di proprietà dormientesegment = Dormant, library_size > 100Quantificare il valore conservato senza trattare l'inattività come rilevanza di mercato nulla
Separare giocatori ad alto engagement da giocatori ad alta proprietàengagement_quartile = 4, top_game_ratio > 0.5Evitare di usare la profondità di engagement come proxy del valore di proprietà
Analizzare l'adiacenza di bundle tra titolilibrary_size > 200, focus_quartile ≤ 2Individuare giocatori spinti dall'ampiezza che già concentrano la proprietà su titoli adiacenti
Assegnare punteggio alle audience rispetto alla tassonomia di segmenti nel proprio warehousejoin(player_id) → user_idSostituire i tier euristici di giocatore con segmenti deterministici e riproducibili
Validare modelli di retention e LTV su feature cross-librerialibrary_size, total_hours, top_game_ratioRidurre i punti ciechi nei modelli costruiti solo sull'engagement first-party

Metodologia

Come vengono costruiti i segmenti

Tre segnali principali — ampiezza di proprietà, profondità di engagement e concentrazione dell'attenzione — vengono calcolati per giocatore. Ogni segnale viene poi classificato per quartile all'interno del dataset.

L'assegnazione del segmento è basata su regole: combinazioni deterministiche dei tre rangi per quartile mappano a uno di cinque segmenti nominati. Nessun clustering. Nessun modello statistico. Lo stesso input produce sempre lo stesso output.

Il proxy di valore stimato è library_size × 20 $, una baseline conservativa di proprietà. Non è una previsione di ricavi. È un riferimento comparativo per il valore di proprietà relativo tra giocatori.

FAQ

Domande frequenti

Sono dati di engagement?

No. L'engagement è uno di tre input. Il dataset è una classificazione strutturale di chi sono i giocatori, non un feed di attività in tempo reale.

Il campo valore è ricavo reale?

No. estimated_total_spend è un proxy di 20 $ a gioco. Usalo per confronti relativi tra giocatori, non come previsione di ricavi.

I segmenti sono stabili nel tempo?

Sì. La mappatura basata su regole è deterministica. Rieseguendo lo stesso giocatore con gli stessi segnali si ottiene sempre lo stesso segmento.

Possiamo estendere con i nostri segnali?

Sì. Lo schema è aperto e unibile su user_id. La maggior parte degli acquirenti combina i segmenti GS con le proprie feature first-party.

Questo dataset è il livello dietro il report GS.

27% dei giocatori. 62,5% del valore.

L'accesso è concesso tramite un accordo scritto di utilizzo dei dati. I campioni possono includere uno spaccato rappresentativo di tutti e quattro i livelli a seconda del caso d'uso dell'acquirente, dei requisiti di copertura e dello stato di approvazione.

Non vendiamo né condividiamo mai i dati del modulo. Vedi la pagina Privacy per i dettagli.