Dataset behawioralny
Oparty na raporcie segmentacji GS, pokazuje, gdzie wartość koncentruje się wśród graczy Steam.
Przegląd
Dataset 46 157 profili graczy Steam. Każdy rekord zawiera sygnały behawioralne, rangi kwartylowe, deterministyczne przypisanie segmentu i znormalizowany proxy wartości.
To nie tylko dane o zaangażowaniu. To struktura: którzy gracze są ekonomicznie różni i dlaczego.
Pól na gracza
Segmentów behawioralnych
Profili graczy
Sygnałów głównych
Explorer + Collector = 27% of players → 62.5% of value
Struktura
Dziesięć pól na rekord gracza. Wszystkie pola są typowane, udokumentowane i gotowe do bezpośredniej integracji.
| Pole | Typ | Opis | Przykład |
|---|---|---|---|
| user_id | string | Hashowany unikalny identyfikator gracza | a3f8c1... |
| library_size | int | Łączna liczba rekordów tytułów posiadanych na Steamie | 247 |
| total_hours | float | Łączne godziny na wszystkich posiadanych rekordach tytułów | 4832.5 |
| top_game_hours | float | Godziny w najczęściej granej grze | 1247.3 |
| top_game_ratio | float | Udział łącznych godzin w najczęściej granym tytule (0,0 do 1,0) | 0.258 |
| estimated_total_spend | float | Szacowana wartość posiadania (library_size × proxy 20 $) | 4940.0 |
| engagement_quartile | int | Ranga kwartylowa wg łącznych godzin (1 do 4) | 3 |
| ownership_quartile | int | Ranga kwartylowa wg rozmiaru biblioteki (1 do 4) | 4 |
| focus_quartile | int | Ranga kwartylowa wg ratio głównego tytułu (1 do 4) | 2 |
| segment | string | Deterministyczna etykieta segmentu behawioralnego | Explorer |
Podgląd
Pięć reprezentatywnych wierszy, jeden na segment. Wszystkie kluczowe pola dołączone.
| user_id | library_size | total_hours | top_game_ratio | estimated_total_spend | segment |
|---|---|---|---|---|---|
| a3f8c1... | 162 | 3841 | 0.312 | 3240 | Core |
| b7d2e4... | 483 | 12023 | 0.128 | 9660 | Explorer |
| c1a9f3... | 42 | 3346 | 0.639 | 840 | Focused |
| d4e6b8... | 648 | 2891 | 0.127 | 12960 | Collector |
| e9c3a7... | 147 | 0 | 0 | 2940 | Dormant |
Taksonomia
Średnia szerokość, średnia głębokość, zrównoważona uwaga. Widoczna baza odbiorców Steam. Wiarygodny, ale nie tam koncentruje się ponadprzeciętna wartość.
Wysoka szerokość, wysoka głębokość, rozproszona uwaga. Inwestuje szeroko w wiele tytułów. Największa koncentracja wartości posiadania w datasetcie.
Niska szerokość, wysoka głębokość, skoncentrowana uwaga. Intensywnie angażuje się w niewiele tytułów. Wysoka gęstość zaangażowania, niska szerokość ekonomiczna.
Bardzo wysoka szerokość, zmienna głębokość. Zachowanie napędzane posiadaniem. Najwyższa wartość na gracza. Kupuje szeroko niezależnie od intensywności gry.
Średnie do dużych biblioteki, zero ostatnich godzin. Wcześniej aktywny, obecnie nieaktywny. Przechowywana wartość posiadania bez ostatniego zaangażowania.
Definicje
Każdy sygnał behawioralny udokumentowany pomiarem, zakresem i wskazówką interpretacji.
| Sygnał | Typ | Zakres | Co mierzy | Interpretacja |
|---|---|---|---|---|
| library_size | int | 1 to 15,000+ | Łączna liczba rekordów tytułów posiadanych na Steamie | Szerokość posiadania. Wyższe wartości wskazują szerszą inwestycję w ekosystem. |
| total_hours | float | 0 to 50,000+ | Skumulowane godziny na wszystkich rekordach tytułów | Głębokość zaangażowania. Łączny zainwestowany czas, nie świeżość. |
| top_game_ratio | float | 0.0 to 1.0 | Udział łącznych godzin w najczęściej granej grze | Koncentracja uwagi. Niskie wartości oznaczają rozproszoną uwagę. Wysokie wartości oznaczają skupienie na jednym tytule. |
| engagement_quartile | int | 1 to 4 | Ranga kwartylowa wg łącznych godzin | Względna pozycja zaangażowania w datasetcie |
| ownership_quartile | int | 1 to 4 | Ranga kwartylowa wg rozmiaru biblioteki | Względna pozycja posiadania w datasetcie |
| focus_quartile | int | 1 to 4 | Ranga kwartylowa wg ratio głównej gry | Względna pozycja koncentracji uwagi |
| estimated_total_spend | float | $20 to $300,000+ | Proxy wartości posiadania (library_size × 20 $) | Względna wartość posiadania. Nie jest to faktyczny przychód. |
Zastosowania
Sześć konkretnych przepływów analizy B2B wspieranych przez dataset, każdy powiązany z konkretnym wzorcem sygnału i mierzalnym wynikiem badawczym.
| Działanie | Wzorzec sygnału | Wynik |
|---|---|---|
| Rangować segmenty graczy o wysokiej wartości pod kątem analizy gotowości do launchu | segment = Explorer or Collector | Identyfikować graczy szeroko inwestujących w ekosystem |
| Identyfikować uśpioną wartość posiadania | segment = Dormant, library_size > 100 | Kwantyfikować przechowywaną wartość bez traktowania nieaktywności jako zerowego znaczenia rynkowego |
| Oddzielać graczy o wysokim zaangażowaniu od graczy o wysokim posiadaniu | engagement_quartile = 4, top_game_ratio > 0.5 | Unikać używania głębokości zaangażowania jako proxy wartości posiadania |
| Analizować sąsiedztwo bundli między tytułami | library_size > 200, focus_quartile ≤ 2 | Lokalizować graczy napędzanych szerokością, którzy już koncentrują posiadanie wokół sąsiednich tytułów |
| Punktować audiencje względem taksonomii segmentów we własnym warehouse'ie | join(player_id) → user_id | Zastąpić heurystyczne tier'y graczy deterministycznymi, odtwarzalnymi segmentami |
| Walidować modele retencji i LTV na cechach cross-bibliotecznych | library_size, total_hours, top_game_ratio | Zmniejszyć martwe punkty w modelach budowanych wyłącznie na zaangażowaniu first-party |
Metodologia
Trzy główne sygnały — szerokość posiadania, głębokość zaangażowania i koncentracja uwagi — są obliczane na gracza. Każdy sygnał jest następnie rangowany w kwartyle w obrębie datasetu.
Przypisanie segmentu jest oparte na regułach: deterministyczne kombinacje trzech rang kwartylowych mapowane są na jeden z pięciu nazwanych segmentów. Bez klastrowania. Bez modelu statystycznego. Te same dane wejściowe dają zawsze ten sam wynik.
Proxy wartości szacowanej to library_size × 20 $, konserwatywna baza posiadania. To nie prognoza przychodów. To porównawczy punkt odniesienia dla względnej wartości posiadania między graczami.
FAQ
Nie. Zaangażowanie jest jednym z trzech wejść. Dataset to strukturalna klasyfikacja kim są gracze, a nie strumień aktywności w czasie rzeczywistym.
Nie. estimated_total_spend to proxy 20 $ na grę. Używaj go do porównań względnych między graczami, nie jako prognozy przychodów.
Tak. Mapowanie oparte na regułach jest deterministyczne. Ponowne uruchomienie tego samego gracza z tymi samymi sygnałami zawsze daje ten sam segment.
Tak. Schemat jest otwarty i łączalny po user_id. Większość nabywców łączy segmenty GS z własnymi cechami first-party.
Ten dataset to warstwa stojąca za raportem GS.
27% graczy. 62,5% wartości.