Dataset behawioralny

Dataset Rozkład Wartości

Oparty na raporcie segmentacji GS, pokazuje, gdzie wartość koncentruje się wśród graczy Steam.

46 157 graczy|5 segmentów|Deterministyczny|Gotowy schemat

Przegląd

Co otrzymujesz

Dataset 46 157 profili graczy Steam. Każdy rekord zawiera sygnały behawioralne, rangi kwartylowe, deterministyczne przypisanie segmentu i znormalizowany proxy wartości.

To nie tylko dane o zaangażowaniu. To struktura: którzy gracze są ekonomicznie różni i dlaczego.

10

Pól na gracza

5

Segmentów behawioralnych

46K+

Profili graczy

3

Sygnałów głównych

Player share ≠ Value share

Explorer + Collector = 27% of players → 62.5% of value

Player share
Value share
Majority of value sits here: Explorer + Collector

Struktura

Schemat

Dziesięć pól na rekord gracza. Wszystkie pola są typowane, udokumentowane i gotowe do bezpośredniej integracji.

PoleTypOpisPrzykład
user_idstringHashowany unikalny identyfikator graczaa3f8c1...
library_sizeintŁączna liczba rekordów tytułów posiadanych na Steamie247
total_hoursfloatŁączne godziny na wszystkich posiadanych rekordach tytułów4832.5
top_game_hoursfloatGodziny w najczęściej granej grze1247.3
top_game_ratiofloatUdział łącznych godzin w najczęściej granym tytule (0,0 do 1,0)0.258
estimated_total_spendfloatSzacowana wartość posiadania (library_size × proxy 20 $)4940.0
engagement_quartileintRanga kwartylowa wg łącznych godzin (1 do 4)3
ownership_quartileintRanga kwartylowa wg rozmiaru biblioteki (1 do 4)4
focus_quartileintRanga kwartylowa wg ratio głównego tytułu (1 do 4)2
segmentstringDeterministyczna etykieta segmentu behawioralnegoExplorer

Podgląd

Dane przykładowe (reprezentatywne wiersze)

Pięć reprezentatywnych wierszy, jeden na segment. Wszystkie kluczowe pola dołączone.

user_idlibrary_sizetotal_hourstop_game_ratioestimated_total_spendsegment
a3f8c1...16238410.3123240Core
b7d2e4...483120230.1289660Explorer
c1a9f3...4233460.639840Focused
d4e6b8...64828910.12712960Collector
e9c3a7...147002940Dormant

Taksonomia

Definicje segmentów

Core

Średnia szerokość, średnia głębokość, zrównoważona uwaga. Widoczna baza odbiorców Steam. Wiarygodny, ale nie tam koncentruje się ponadprzeciętna wartość.

Explorer

Wysoka szerokość, wysoka głębokość, rozproszona uwaga. Inwestuje szeroko w wiele tytułów. Największa koncentracja wartości posiadania w datasetcie.

Focused

Niska szerokość, wysoka głębokość, skoncentrowana uwaga. Intensywnie angażuje się w niewiele tytułów. Wysoka gęstość zaangażowania, niska szerokość ekonomiczna.

Collector

Bardzo wysoka szerokość, zmienna głębokość. Zachowanie napędzane posiadaniem. Najwyższa wartość na gracza. Kupuje szeroko niezależnie od intensywności gry.

Dormant

Średnie do dużych biblioteki, zero ostatnich godzin. Wcześniej aktywny, obecnie nieaktywny. Przechowywana wartość posiadania bez ostatniego zaangażowania.

Definicje

Definicje sygnałów

Każdy sygnał behawioralny udokumentowany pomiarem, zakresem i wskazówką interpretacji.

SygnałTypZakresCo mierzyInterpretacja
library_sizeint1 to 15,000+Łączna liczba rekordów tytułów posiadanych na SteamieSzerokość posiadania. Wyższe wartości wskazują szerszą inwestycję w ekosystem.
total_hoursfloat0 to 50,000+Skumulowane godziny na wszystkich rekordach tytułówGłębokość zaangażowania. Łączny zainwestowany czas, nie świeżość.
top_game_ratiofloat0.0 to 1.0Udział łącznych godzin w najczęściej granej grzeKoncentracja uwagi. Niskie wartości oznaczają rozproszoną uwagę. Wysokie wartości oznaczają skupienie na jednym tytule.
engagement_quartileint1 to 4Ranga kwartylowa wg łącznych godzinWzględna pozycja zaangażowania w datasetcie
ownership_quartileint1 to 4Ranga kwartylowa wg rozmiaru bibliotekiWzględna pozycja posiadania w datasetcie
focus_quartileint1 to 4Ranga kwartylowa wg ratio głównej gryWzględna pozycja koncentracji uwagi
estimated_total_spendfloat$20 to $300,000+Proxy wartości posiadania (library_size × 20 $)Względna wartość posiadania. Nie jest to faktyczny przychód.

Zastosowania

Zastosowania dla nabywców

Sześć konkretnych przepływów analizy B2B wspieranych przez dataset, każdy powiązany z konkretnym wzorcem sygnału i mierzalnym wynikiem badawczym.

DziałanieWzorzec sygnałuWynik
Rangować segmenty graczy o wysokiej wartości pod kątem analizy gotowości do launchusegment = Explorer or CollectorIdentyfikować graczy szeroko inwestujących w ekosystem
Identyfikować uśpioną wartość posiadaniasegment = Dormant, library_size > 100Kwantyfikować przechowywaną wartość bez traktowania nieaktywności jako zerowego znaczenia rynkowego
Oddzielać graczy o wysokim zaangażowaniu od graczy o wysokim posiadaniuengagement_quartile = 4, top_game_ratio > 0.5Unikać używania głębokości zaangażowania jako proxy wartości posiadania
Analizować sąsiedztwo bundli między tytułamilibrary_size > 200, focus_quartile ≤ 2Lokalizować graczy napędzanych szerokością, którzy już koncentrują posiadanie wokół sąsiednich tytułów
Punktować audiencje względem taksonomii segmentów we własnym warehouse'iejoin(player_id) → user_idZastąpić heurystyczne tier'y graczy deterministycznymi, odtwarzalnymi segmentami
Walidować modele retencji i LTV na cechach cross-bibliotecznychlibrary_size, total_hours, top_game_ratioZmniejszyć martwe punkty w modelach budowanych wyłącznie na zaangażowaniu first-party

Metodologia

Jak budowane są segmenty

Trzy główne sygnały — szerokość posiadania, głębokość zaangażowania i koncentracja uwagi — są obliczane na gracza. Każdy sygnał jest następnie rangowany w kwartyle w obrębie datasetu.

Przypisanie segmentu jest oparte na regułach: deterministyczne kombinacje trzech rang kwartylowych mapowane są na jeden z pięciu nazwanych segmentów. Bez klastrowania. Bez modelu statystycznego. Te same dane wejściowe dają zawsze ten sam wynik.

Proxy wartości szacowanej to library_size × 20 $, konserwatywna baza posiadania. To nie prognoza przychodów. To porównawczy punkt odniesienia dla względnej wartości posiadania między graczami.

FAQ

Częste pytania

Czy to dane o zaangażowaniu?

Nie. Zaangażowanie jest jednym z trzech wejść. Dataset to strukturalna klasyfikacja kim są gracze, a nie strumień aktywności w czasie rzeczywistym.

Czy pole wartości to faktyczny przychód?

Nie. estimated_total_spend to proxy 20 $ na grę. Używaj go do porównań względnych między graczami, nie jako prognozy przychodów.

Czy segmenty są stabilne w czasie?

Tak. Mapowanie oparte na regułach jest deterministyczne. Ponowne uruchomienie tego samego gracza z tymi samymi sygnałami zawsze daje ten sam segment.

Czy możemy rozszerzać o własne sygnały?

Tak. Schemat jest otwarty i łączalny po user_id. Większość nabywców łączy segmenty GS z własnymi cechami first-party.

Ten dataset to warstwa stojąca za raportem GS.

27% graczy. 62,5% wartości.

Dostęp jest udzielany na podstawie pisemnej umowy o korzystanie z danych. Próbki mogą obejmować reprezentatywny wycinek wszystkich czterech warstw, zależnie od przypadku użycia nabywcy, wymagań pokrycia i statusu zatwierdzenia.

Nigdy nie sprzedajemy ani nie udostępniamy tych danych z formularza. Szczegóły na stronie Prywatności.