Dataset comportamental

O Dataset Distribuição de Valor

Baseado no report de segmentação GS, mostra onde o valor se concentra entre os jogadores Steam.

46.157 jogadores|5 segmentos|Determinístico|Pronto para schema

Visão geral

O que você recebe

Um dataset com 46.157 perfis de jogadores Steam. Cada registro inclui sinais comportamentais, posicionamentos por quartil, uma atribuição determinística de segmento e um proxy de valor padronizado.

Não é só dado de engajamento. É estrutura: quais jogadores são economicamente diferentes e por quê.

10

Campos por jogador

5

Segmentos comportamentais

46K+

Perfis de jogador

3

Sinais principais

Player share ≠ Value share

Explorer + Collector = 27% of players → 62.5% of value

Player share
Value share
Majority of value sits here: Explorer + Collector

Estrutura

Schema

Dez campos por registro de jogador. Todos os campos tipados, documentados e prontos para integração direta.

CampoTipoDescriçãoExemplo
user_idstringIdentificador único hash por jogadora3f8c1...
library_sizeintTotal de registros de títulos possuídos no Steam247
total_hoursfloatHoras totais em todos os registros de títulos possuídos4832.5
top_game_hoursfloatHoras no jogo mais jogado1247.3
top_game_ratiofloatParcela das horas totais no título mais jogado (0,0 a 1,0)0.258
estimated_total_spendfloatValor estimado de propriedade (library_size × proxy de 20 $)4940.0
engagement_quartileintPosição por quartil pelas horas totais (1 a 4)3
ownership_quartileintPosição por quartil pelo tamanho da biblioteca (1 a 4)4
focus_quartileintPosição por quartil pelo ratio do título principal (1 a 4)2
segmentstringEtiqueta determinística do segmento comportamentalExplorer

Prévia

Dados de amostra (linhas representativas)

Cinco linhas representativas, uma por segmento. Todos os campos-chave incluídos.

user_idlibrary_sizetotal_hourstop_game_ratioestimated_total_spendsegment
a3f8c1...16238410.3123240Core
b7d2e4...483120230.1289660Explorer
c1a9f3...4233460.639840Focused
d4e6b8...64828910.12712960Collector
e9c3a7...147002940Dormant

Taxonomia

Definições de segmento

Core

Amplitude média, profundidade média, atenção equilibrada. A linha de base visível de uma audiência Steam. Confiável, mas não é onde o valor desproporcional se concentra.

Explorer

Alta amplitude, alta profundidade, atenção distribuída. Investe amplamente em muitos títulos. Maior concentração de valor de propriedade no dataset.

Focused

Baixa amplitude, alta profundidade, atenção concentrada. Compromete-se intensamente com poucos títulos. Alta densidade de engajamento, baixa amplitude econômica.

Collector

Amplitude muito alta, profundidade variável. Comportamento orientado por propriedade. Maior valor por jogador. Compra amplamente independentemente da intensidade de jogo.

Dormant

Bibliotecas médias a grandes, zero horas recentes. Antes ativo, atualmente inativo. Valor de propriedade armazenado sem engajamento recente.

Definições

Definições de sinal

Cada sinal comportamental documentado com sua medição, faixa e guia de interpretação.

SinalTipoFaixaO que medeInterpretação
library_sizeint1 to 15,000+Total de registros de títulos possuídos no SteamAmplitude de propriedade. Valores mais altos indicam investimento mais amplo no ecossistema.
total_hoursfloat0 to 50,000+Horas cumulativas em todos os registros de títulosProfundidade de engajamento. Tempo total investido, não recência.
top_game_ratiofloat0.0 to 1.0Parcela das horas totais no jogo mais jogadoConcentração de atenção. Valores baixos indicam atenção distribuída. Valores altos indicam foco em um título.
engagement_quartileint1 to 4Posição por quartil pelas horas totaisPosição relativa de engajamento dentro do dataset
ownership_quartileint1 to 4Posição por quartil pelo tamanho da bibliotecaPosição relativa de propriedade dentro do dataset
focus_quartileint1 to 4Posição por quartil pelo ratio do jogo principalPosição relativa de concentração de atenção
estimated_total_spendfloat$20 to $300,000+Proxy de valor de propriedade (library_size × 20 $)Valor relativo de propriedade. Não é receita real.

Aplicações

Aplicações para compradores

Seis fluxos concretos de análise B2B suportados pelo dataset, cada um ligado a um padrão de sinal específico e a um resultado de pesquisa mensurável.

AçãoPadrão de sinalResultado
Rankear segmentos de jogadores de alto valor para análise de prontidão para launchsegment = Explorer or CollectorIdentificar jogadores que investem amplamente no ecossistema
Identificar valor de propriedade dormentesegment = Dormant, library_size > 100Quantificar valor armazenado sem tratar inatividade como zero relevância de mercado
Separar jogadores de alto engajamento de jogadores de alta propriedadeengagement_quartile = 4, top_game_ratio > 0.5Evitar usar profundidade de engajamento como proxy do valor de propriedade
Analisar adjacência de bundles entre títuloslibrary_size > 200, focus_quartile ≤ 2Localizar jogadores movidos pela amplitude que já concentram propriedade em títulos adjacentes
Pontuar audiências contra a taxonomia de segmentos no seu warehousejoin(player_id) → user_idSubstituir tiers heurísticos de jogador por segmentos determinísticos e reproduzíveis
Validar modelos de retenção e LTV em features cross-bibliotecalibrary_size, total_hours, top_game_ratioReduzir pontos cegos em modelos baseados apenas em engajamento first-party

Metodologia

Como os segmentos são construídos

Três sinais principais — amplitude de propriedade, profundidade de engajamento e concentração de atenção — são calculados por jogador. Cada sinal é então classificado em quartis dentro do dataset.

A atribuição de segmento é baseada em regras: combinações determinísticas dos três rankings por quartil mapeiam para um de cinco segmentos nomeados. Sem clusterização. Sem modelo estatístico. A mesma entrada produz sempre a mesma saída.

O proxy de valor estimado é library_size × 20 $, uma linha de base conservadora de propriedade. Não é uma previsão de receita. É uma âncora comparativa para o valor relativo de propriedade entre jogadores.

FAQ

Perguntas comuns

Isso são dados de engajamento?

Não. Engajamento é uma de três entradas. O dataset é uma classificação estrutural de quem são os jogadores, não um feed de atividade em tempo real.

O campo de valor é receita real?

Não. estimated_total_spend é um proxy de 20 $ por jogo. Use-o para comparações relativas entre jogadores, não como previsão de receita.

Os segmentos são estáveis ao longo do tempo?

Sim. O mapeamento baseado em regras é determinístico. Reexecutar o mesmo jogador com os mesmos sinais sempre produz o mesmo segmento.

Podemos estender com nossos próprios sinais?

Sim. O schema é aberto e juntável por user_id. A maioria dos compradores combina os segmentos GS com suas features first-party.

Este dataset é a camada por trás do report GS.

27% dos jogadores. 62,5% do valor.

O acesso é concedido sob acordo escrito de uso de dados. As amostras podem incluir um recorte representativo das quatro camadas, dependendo do caso de uso do comprador, dos requisitos de cobertura e do status de aprovação.

Nunca vendemos nem compartilhamos esses dados do formulário. Veja a página de Privacidade para detalhes.