Témata:
- Použití rutiny analýzy tržního koše pro bodování
Jak na to:
- Vytvořit asociační model pomocí analýzy tržního koše
- Vytvořit pravidla
- Vytvořit graf četností
Odkaz:
- Výstup z analýzy tržního koše
Co je analýza tržního koše?
Analýza tržního koše je technika, která identifikuje sílu asociace mezi dvojicemi společně nakupovaných produktů a identifikuje vzorce společného výskytu. Společný výskyt je, když se dvě nebo více věcí vyskytují společně.
Analýza tržního koše vytváří pravidla scénářů If-Then, například pokud je zakoupena položka A, pak je pravděpodobné, že bude zakoupena i položka B. Pravidla mají pravděpodobnostní povahu nebo, jinými slovy, jsou odvozena z četností společného výskytu v pozorování. Frekvence je podíl košů, které obsahují zájmové položky. Pravidla lze využít v cenových strategiích, při umisťování produktů a v různých typech strategií křížového prodeje.
Jak funguje analýza tržního koše
Pro snazší pochopení si představte analýzu tržního koše jako nakupování v supermarketu. Analýza tržního koše přebírá údaje na úrovni transakce, která obsahuje seznam všech položek zakoupených zákazníkem při jednom nákupu. Tato technika určuje vztahy, jaké výrobky byly zakoupeny s jakým dalším výrobkem (výrobky). Tyto vztahy jsou pak použity k vytvoření profilů obsahujících pravidla If-Then zakoupených položek.
Pravidla lze zapsat takto:
If {A} Then {B}
Část pravidla If (výše uvedený {A}) je známá jako antecedent a část pravidla THEN je známá jako consequent (výše uvedený {B}). Antecedent je podmínka a consequent je výsledek. Asociační pravidlo má tři míry, které vyjadřují míru důvěry v pravidlo: Support, Confidence a Lift.
Příklad: Jste v supermarketu, abyste si koupili mléko. Je na základě analýzy pravděpodobnější, že si při stejné transakci koupíte jablka nebo sýr, než někdo, kdo mléko nekoupil?
V následující tabulce (tabulka 1) je devět košíků obsahujících různé kombinace mléka, sýra, jablek a banánů.

Dalším krokem je určení vztahů a pravidel. Pro vysvětlení jsou v následující tabulce uvedeny některé vztahy. Celkem existuje 22 pravidel pro devět košů. Kompletní soubor pravidel je uveden ve vysvětlení výstupu RStat.

Prvním měřítkem nazývaným podpora je počet transakcí, které obsahují položky v částech {A} a {B} pravidla, jako procento z celkového počtu transakcí. Je to míra toho, jak často se soubor položek vyskytuje společně jako procento všech transakcí.
Vypsaný vzorec podpory by vypadal asi takto:

Interpretováno jako:

:
Druhá míra nazývaná důvěryhodnost pravidla je poměr počtu transakcí, které obsahují všechny položky v {B}, jakož i počtu transakcí, které obsahují všechny položky v {A}, k počtu transakcí, které obsahují všechny položky v {A}.
Vypsaný vzorec důvěryhodnosti by vypadal nějak takto:

Interpretováno jako:

Interpretováno jako: Jak často se položky B objevují v transakcích, které obsahují pouze A.
Třetí míra nazývaná lift nebo lift ratio je poměr důvěryhodnosti k očekávané důvěryhodnosti. Očekávaná důvěra je důvěra vydělená četností B. Lift nám říká, o kolik lépe pravidlo předpovídá výsledek než pouhý předpoklad výsledku na prvním místě. Větší hodnoty liftů ukazují na silnější asociace.
Vypsaný vzorec pro lift by vypadal asi takto:

Interpretováno jako:

: Jak moc se zvýšila naše jistota, že bude nakoupeno B, vzhledem k tomu, že bylo nakoupeno A.
Praktické aplikace analýzy tržního koše
Když se řekne analýza tržního koše, vybaví se nám nákupní košíky a nakupující v supermarketech. Je důležité si uvědomit, že existuje mnoho dalších oblastí, v nichž lze Analýzu tržního koše uplatnit. Příkladem Analýzy tržního koše pro většinu uživatelů internetu je seznam potenciálně zajímavých produktů pro Amazon. Amazon informuje zákazníka o tom, že lidé, kteří si koupili jím nakupované zboží, si prohlédli nebo koupili také jiný seznam zboží. Seznam aplikací Market Basket Analysis v různých odvětvích je uveden níže:
- Maloobchod. V maloobchodě může analýza tržního koše pomoci určit, jaké položky jsou nakupovány společně, nakupovány postupně a nakupovány podle ročních období. To může maloobchodníkům pomoci při určování rozmístění výrobků a optimalizaci propagace (například kombinování produktových pobídek). Má smysl prodávat limonádu a chipsy nebo limonádu a krekry?
- Telekomunikace. V oblasti telekomunikací, kde je vysoká míra odchodu zákazníků stále větším problémem, lze pomocí analýzy tržního koše zjistit, jaké služby jsou využívány a jaké balíčky zákazníci kupují. Tyto znalosti mohou využít k nasměrování marketingového úsilí na zákazníky, u nichž je větší pravděpodobnost, že se vydají stejnou cestou.
Například telekomunikace v těchto dnech nabízejí také televizi a internet. Vytváření nákupních balíčků lze určit na základě analýzy toho, co zákazníci nakupují, čímž společnost získá představu o tom, jak balíčky nacenit. Tato analýza může vést také k určení požadavků na kapacitu.
- Banky. Ve finančnictví (například v bankovnictví) lze analýzu tržního koše použít k analýze nákupů zákazníků kreditními kartami za účelem vytvoření profilů pro účely odhalování podvodů a příležitostí ke křížovému prodeji.
- Pojištění. V pojišťovnictví lze analýzu tržního koše použít k sestavení profilů pro odhalování podvodů s nároky na zdravotní pojištění. Vytvořením profilů pojistných událostí jste pak schopni pomocí profilů zjistit, zda určitému žadateli o pojistné plnění náleží více než 1 pojistná událost v určitém časovém období.
- Zdravotnictví. V oblasti zdravotnictví nebo lékařství lze analýzu tržního koše použít pro analýzu komorbidních stavů a symptomů, pomocí níž lze lépe určit profil nemoci. Lze ji také použít k odhalení biologicky relevantních asociací mezi různými geny nebo mezi vlivy prostředí a genovou expresí.
Požadavek na data
- Koše
- Tento sloupec identifikuje jednotlivé koše.
- Hodnoty mohou být kategoriální nebo číselné pro identifikaci košů.
- Produkty
- Tento sloupec obsahuje všechny položky, které jsou součástí jednotlivých košů.
- Hodnoty položek mohou být kategoriální nebo číselné.
Například z tabulky 1 níže:
