Forudsætning: Principal Component Analysis
Independent Component Analysis (ICA) er en maskinlæringsteknik til at adskille uafhængige kilder fra et blandet signal. I modsætning til hovedkomponentanalyse, der fokuserer på at maksimere datapunkternes varians, fokuserer independent component analysis på uafhængighed, dvs. uafhængige komponenter.
Problem: At udtrække uafhængige kilders signaler fra et blandet signal, der er sammensat af signalerne fra disse kilder.
Givet: Blandet signal fra fem forskellige uafhængige kilder.
Sigte: At dekomponere det blandede signal i uafhængige kilder:
- Kilde 1
- Kilde 1
- Kilde 2
- Kilde 3
- Kilde 4
- Kilde 5
Løsning: Uafhængig komponentanalyse (ICA).
Se på Cocktail Party Problem eller Blind Source Separation problem for at forstå det problem, som løses ved hjælp af uafhængig komponentanalyse.

Her, Der er en fest, der foregår i et rum fuld af mennesker. Der er ‘n’ antal højttalere i dette rum, og de taler samtidig til festen. I samme rum er der også ‘n’ antal mikrofoner placeret i forskellige afstande fra højttalerne, som optager ‘n’ højttaleres stemmesignaler. Derfor er antallet af højttalere lig med antallet must af mikrofoner i rummet.
Nu ønsker vi ved hjælp af disse mikrofoners optagelser at adskille alle ‘n’ højttaleres stemmesignaler i rummet, da hver mikrofon optog stemmesignalerne fra hver højttaler med forskellig intensitet på grund af forskellen i afstandene mellem dem. Dekomponering af det blandede signal fra hver mikrofonoptagelse til uafhængige kildes talesignaler kan ske ved hjælp af maskinlæringsteknikken independent component analysis.
=>
hvor X1, X2, …, Xn er de oprindelige signaler i det blandede signal, og Y1, Y2, …, Yn er de nye funktioner og er uafhængige komponenter, som er uafhængige af hinanden.
Begrænsninger for ICA –
- De uafhængige komponenter, der genereres ved ICA, antages at være statistisk uafhængige af hinanden.
- De uafhængige komponenter, der genereres ved ICA, skal have en ikke-gaussisk fordeling.
- Antallet af uafhængige komponenter, der genereres ved ICA, er lig med antallet af observerede blandinger.
Forskellen mellem PCA og ICA –
Principal Component Analysis | Independent Component Analysis |
---|---|
Den reducerer dimensionerne for at undgå problemet med overfitting. | Det dekomponerer det blandede signal i dets uafhængige kildesignaler. |
Det beskæftiger sig med de primære komponenter. | Det beskæftiger sig med de uafhængige komponenter. |
Den fokuserer på at maksimere variansen. | Den fokuserer ikke på spørgsmålet om varians mellem datapunkterne. |
Den fokuserer på den gensidige ortogonalitetsegenskab for hovedkomponenterne. | Den fokuserer ikke på den gensidige ortogonalitet af komponenterne. |
Den fokuserer ikke på den gensidige uafhængighed af komponenterne. | Den fokuserer på den gensidige uafhængighed af komponenterne. |