Předpoklad: Analýza hlavních komponent
Analýza nezávislých komponent (ICA) je technika strojového učení pro oddělení nezávislých zdrojů ze smíšeného signálu. Na rozdíl od analýzy hlavních komponent, která se zaměřuje na maximalizaci rozptylu datových bodů, se analýza nezávislých komponent zaměřuje na nezávislost, tj. na nezávislé komponenty.
Problém: Extrahovat signály nezávislých zdrojů ze smíšeného signálu složeného ze signálů těchto zdrojů.
Dáno: Cíl: Rozložit smíšený signál na nezávislé zdroje:
- Zdroj 1
- Zdroj 2
- Zdroj 3
- Zdroj 4
- Zdroj 5
Řešení: Analýza nezávislých komponent (ICA).
Podívejte se na problém koktejlové párty nebo problém slepé separace zdrojů, abyste pochopili problém, který se řeší analýzou nezávislých komponent.
Tady se chystá párty v místnosti plné lidí. V této místnosti je „n“ řečníků, kteří na večírku hovoří současně. Ve stejné místnosti je také ‚n‘ mikrofonů umístěných v různých vzdálenostech od řečníků, které zaznamenávají hlasové signály ‚n‘ řečníků. Počet mluvčích je tedy roven počtu mikrofonů v místnosti.
Nyní chceme pomocí záznamů těchto mikrofonů oddělit hlasové signály všech „n“ mluvčích v místnosti vzhledem k tomu, že každý mikrofon zaznamenal hlasové signály pocházející od každého mluvčího s různou intenzitou v důsledku rozdílných vzdáleností mezi nimi. Dekompozici smíšeného signálu ze záznamu každého mikrofonu na řečový signál nezávislého zdroje lze provést pomocí techniky strojového učení, analýzy nezávislých komponent.
=>
kde, X1, X2, …, Xn jsou původní signály přítomné ve smíšeném signálu a Y1, Y2, …, Yn jsou nové prvky a jsou nezávislé komponenty, které jsou na sobě nezávislé.
Omezení pro ICA –
- Předpokládá se, že nezávislé složky generované ICA jsou na sobě statisticky nezávislé.
- Nezávislé složky generované ICA musí mít negaussovské rozdělení.
- Počet nezávislých složek generovaných ICA je roven počtu pozorovaných směsí.
Rozdíl mezi PCA a ICA –
Analýza hlavních komponent | Analýza nezávislých komponent |
---|---|
Snižuje dimenze, aby se zabránilo problému nadměrného přizpůsobení. | Rozkládá smíšený signál na signály jeho nezávislých zdrojů. |
Pracuje s hlavními komponentami. | Pracuje s nezávislými komponentami. |
Soustřeďuje se na maximalizaci rozptylu. | Nezaměřuje se na otázku rozptylu mezi datovými body. |
Soustřeďuje se na vlastnost vzájemné ortogonality hlavních komponent. | Nezaměřuje se na vzájemnou ortogonalitu komponent. |
Nezaměřuje se na vzájemnou nezávislost komponent. | Zaměřuje se na vzájemnou nezávislost komponent. |