Softvér na analýzu hlavných komponentov

Autor: Lewis Jackson
Dátum Stvorenia: 5 Smieť 2021
Dátum Aktualizácie: 15 Smieť 2024
Anonim
Softvér na analýzu hlavných komponentov - Články
Softvér na analýzu hlavných komponentov - Články

Obsah

Analýza hlavných zložiek redukuje množinu premenných, ktoré súvisia s menším súborom nekorelujúcich premenných, čím sa zjednodušuje komplexný súbor údajov pre neskoršiu analýzu. Tento komplexný štatistický postup môže byť vykonaný mnohými programami analýzy dát, alebo doplnkovými programami, ktoré rozširujú ich schopnosti a pridávajú nové funkcie.


Tabuľkové programy, ako napríklad Excel, môžu vykonať analýzu hlavných komponentov pomocou rozšírenia (Obrázok Flickr.com, s láskavým dovolením Casey Serin)

Zjednodušenie súboru údajov

Analýza hlavných zložiek je technika prieskumu a redukcie údajov. Analytik môže použiť techniku ​​na získanie relevantných informácií z veľkého a mätúceho súboru údajov. Táto technika sa bežne používa, keď je počet pozorovaných premenných veľmi veľký a korelácie medzi nimi robia údaje ťažko analyzovateľnými priamo. Napríklad v niektorých prípadoch môže korelácia medzi premennými vytvoriť falošný dojem nadbytočnosti údajov, čo sťažuje technickú analýzu alebo sťažuje hodnotenie údajov. Analýza hlavných komponentov zjednodušuje premenné, ktoré ich vyjadrujú ako funkciu menšieho počtu prvkov, hlavných komponentov, ktoré predstavujú väčšinu zmien v meraniach údajov.


Použitie v programe

Zložitosť analýzy hlavných zložiek vyžaduje použitie špecifického programu. Existuje široká škála štatistických programov a väčšina z nich je schopná vykonávať túto techniku. Najobľúbenejšie programy sú SAS, Stata a SPSS. Tieto špecifické programy využívajú univerzity, výskumné centrá, konzultačné organizácie a iní odborníci. Všetci traja môžu vykonávať analýzu hlavných komponentov súboru údajov vložených do pracovného hárka, v ktorom riadky predstavujú jednotlivé pozorovania a stĺpce predstavujú samostatné premenné.

znak

Väčšina softvérových programov na analýzu hlavných komponentov, vrátane SAS, Stata a SPSS, bude prezentovať výsledky vo forme tabuliek, ktoré obsahujú vlastné hodnoty alebo miery rozptylu. Mnohé programy tiež poskytujú vizuálne zobrazenie výsledkov vo forme scree grafu.


úvahy

Analýza hlavných zložiek je často zamieňaná s faktoriálnou analýzou, ďalšou technikou redukcie údajov, ktorá vysvetľuje korelované pozorovania z hľadiska základných faktorov. Tieto dva spôsoby sú vlastne oddelené postupy, hoci analýza hlavných zložiek je krokom faktorovej analýzy. Mnohé balíky však kombinujú tieto dva postupy.

Ďalšou dôležitou úvahou je, že špecializované programy ako SAS, SPSS a Stata sú drahé. Preto tieto programy nemusia byť užitočné pre ľudí, ktorí nemajú v úmysle vykonávať štatistické analýzy často.

vynikať

Ľudia, ktorí potrebujú vykonať nejakú štatistickú analýzu, ale radšej nekupujú špecializovaný program, môžu spochybniť, či široko používané tabuľkové programy, ako napríklad Excel, sú schopné vykonať analýzu hlavných komponentov. Odpoveď je áno a nie. Hoci program Excel obsahuje niektoré nástroje na analýzu údajov, ktoré môžu byť prístupné z inštalácie balíka štatistickej analýzy, program nie je určený na štatistický program. Analýza hlavných komponentov a analýza faktorov nepatria medzi funkcie nástroja na analýzu údajov.

Prevencia / riešenie

Existuje program, ktorý si užívatelia môžu stiahnuť a nainštalovať na zlepšenie funkcií programu Excel ako nástroja na analýzu dát. Spoločnosť Addinsoft, ktorá sa špecializuje na analytické programy, vytvorila XLSTAT. Tento program umožňuje Excel vykonávať hlavné komponenty analýzy a ďalšie štatistické postupy. Má tiež užívateľsky príjemné postupy, ktoré umožňujú užívateľovi vybrať údaje na analýzu jednoduchým kliknutím a ťahaním bunky cez požadované polia. Užívatelia si môžu zakúpiť a stiahnuť XLSTAT z webovej stránky Addinsoft. K dispozícii je tiež bezplatná verzia, ktorú môžu používatelia vyskúšať skôr, ako sa rozhodnú kúpiť.