Dataset conductual

El Dataset de Distribución de Valor

Basado en el report de segmentación GS, muestra dónde se concentra el valor entre los jugadores de Steam.

46.157 jugadores|5 segmentos|Determinista|Listo para esquema

Resumen

Qué obtienes

Un dataset de 46.157 perfiles de jugadores de Steam. Cada registro incluye señales conductuales, rangos por cuartil, una asignación de segmento determinista y un proxy de valor estandarizado.

No son solo datos de engagement. Es estructura: qué jugadores son económicamente diferentes y por qué.

10

Campos por jugador

5

Segmentos conductuales

46K+

Perfiles de jugador

3

Señales principales

Player share ≠ Value share

Explorer + Collector = 27% of players → 62.5% of value

Player share
Value share
Majority of value sits here: Explorer + Collector

Estructura

Esquema

Diez campos por jugador y registro. Todos los campos están tipados, documentados y listos para integración directa.

CampoTipoDescripciónEjemplo
user_idstringIdentificador único hash por jugadora3f8c1...
library_sizeintTotal de registros de títulos en propiedad en Steam247
total_hoursfloatHoras totales en todos los registros de títulos4832.5
top_game_hoursfloatHoras en el juego más jugado1247.3
top_game_ratiofloatProporción de horas totales en el título más jugado (0,0 a 1,0)0.258
estimated_total_spendfloatValor estimado de propiedad (library_size × proxy de 20 $)4940.0
engagement_quartileintRango por cuartil según horas totales (1 a 4)3
ownership_quartileintRango por cuartil según tamaño de biblioteca (1 a 4)4
focus_quartileintRango por cuartil según ratio del título principal (1 a 4)2
segmentstringEtiqueta determinista de segmento conductualExplorer

Vista previa

Datos de muestra (filas representativas)

Cinco filas representativas, una por segmento. Todos los campos clave incluidos.

user_idlibrary_sizetotal_hourstop_game_ratioestimated_total_spendsegment
a3f8c1...16238410.3123240Core
b7d2e4...483120230.1289660Explorer
c1a9f3...4233460.639840Focused
d4e6b8...64828910.12712960Collector
e9c3a7...147002940Dormant

Taxonomía

Definiciones de segmento

Core

Amplitud media, profundidad media, atención equilibrada. La línea base visible de una audiencia de Steam. Fiable, pero no donde se concentra el valor desproporcionado.

Explorer

Alta amplitud, alta profundidad, atención distribuida. Invierte ampliamente en muchos títulos. Mayor concentración de valor de propiedad en el dataset.

Focused

Baja amplitud, alta profundidad, atención concentrada. Se compromete intensamente con pocos títulos. Alta densidad de engagement, baja amplitud económica.

Collector

Amplitud muy alta, profundidad variable. Comportamiento dirigido por la propiedad. Mayor valor por jugador. Compra ampliamente sin importar la intensidad de juego.

Dormant

Bibliotecas medianas a grandes, cero horas recientes. Antes activo, ahora inactivo. Valor de propiedad almacenado sin engagement reciente.

Definiciones

Definiciones de señal

Cada señal conductual documentada con su medición, rango y guía de interpretación.

SeñalTipoRangoQué mideInterpretación
library_sizeint1 to 15,000+Total de registros de títulos en propiedad en SteamAmplitud de propiedad. Valores más altos indican una inversión más amplia en el ecosistema.
total_hoursfloat0 to 50,000+Horas acumuladas en todos los registros de títulosProfundidad de engagement. Tiempo total invertido, no recencia.
top_game_ratiofloat0.0 to 1.0Proporción de horas totales en el juego más jugadoConcentración de atención. Valores bajos indican atención distribuida. Valores altos indican foco en un título.
engagement_quartileint1 to 4Rango por cuartil según horas totalesPosición relativa de engagement dentro del dataset
ownership_quartileint1 to 4Rango por cuartil según tamaño de bibliotecaPosición relativa de propiedad dentro del dataset
focus_quartileint1 to 4Rango por cuartil según ratio del juego principalPosición relativa de concentración de atención
estimated_total_spendfloat$20 to $300,000+Proxy de valor de propiedad (library_size × 20 $)Valor relativo de propiedad. No es ingreso real.

Aplicaciones

Aplicaciones para compradores

Seis flujos concretos de análisis B2B que el dataset soporta, cada uno ligado a un patrón de señal específico y a un resultado medible de investigación.

AcciónPatrón de señalResultado
Rankear segmentos de jugadores de alto valor para análisis de launch readinesssegment = Explorer or CollectorIdentificar jugadores que invierten ampliamente en el ecosistema
Identificar valor de propiedad inactivosegment = Dormant, library_size > 100Cuantificar valor almacenado sin tratar la inactividad como nula relevancia de mercado
Separar jugadores de alto engagement de jugadores de alta propiedadengagement_quartile = 4, top_game_ratio > 0.5Evitar usar la profundidad de engagement como proxy del valor de propiedad
Analizar adyacencia de bundles entre títuloslibrary_size > 200, focus_quartile ≤ 2Localizar jugadores impulsados por amplitud que ya concentran propiedad en títulos adyacentes
Puntuar audiencias contra la taxonomía de segmentos en tu warehousejoin(player_id) → user_idReemplazar tiers heurísticos de jugador por segmentos deterministas y reproducibles
Validar modelos de retención y LTV con features cross-librarylibrary_size, total_hours, top_game_ratioReducir puntos ciegos en modelos basados solo en engagement first-party

Metodología

Cómo se construyen los segmentos

Tres señales principales —amplitud de propiedad, profundidad de engagement y concentración de atención— se calculan por jugador. Cada señal se ordena luego por cuartil dentro del dataset.

La asignación de segmento es basada en reglas: combinaciones deterministas de los tres rangos por cuartil mapean a uno de cinco segmentos nombrados. Sin clustering. Sin modelo estadístico. La misma entrada produce siempre la misma salida.

El proxy de valor estimado es library_size × 20 $, una línea base conservadora de propiedad. No es una predicción de ingresos. Es un anclaje comparativo del valor relativo de propiedad entre jugadores.

FAQ

Preguntas frecuentes

¿Es esto datos de engagement?

No. Engagement es una de tres entradas. El dataset es una clasificación estructural de quiénes son los jugadores, no un feed de actividad en tiempo real.

¿El campo de valor es ingreso real?

No. estimated_total_spend es un proxy de 20 $ por juego. Úsalo para comparaciones relativas entre jugadores, no como pronóstico de ingresos.

¿Los segmentos son estables en el tiempo?

Sí. El mapeo basado en reglas es determinista. Volver a ejecutar el mismo jugador con las mismas señales produce siempre el mismo segmento.

¿Podemos extender con nuestras propias señales?

Sí. El esquema es abierto y se puede unir por user_id. La mayoría de los compradores combinan los segmentos de GS con sus features first-party.

Este dataset es la capa detrás del report GS.

27 % de los jugadores. 62,5 % del valor.

El acceso se concede mediante un acuerdo escrito de uso de datos. Las muestras pueden incluir un corte representativo de las cuatro capas según el caso de uso del comprador, los requisitos de cobertura y el estado de aprobación.

Nunca vendemos ni compartimos estos datos del formulario. Consulte la página de Privacidad para más detalles.