Pomoc statystyczna przy analizie czynnikowej

Analiza czynnikowa – pomoc statystyczna w formie poradnika

Pomoc statystyczna to jedno, a analiza czynnikowa jest to metoda służąca do redukcji danych. W naukach społecznych ma zastosowanie do konstrukcji kwestionariuszy, inwentarzy, testów i innych narzędzi pomiarowych które w swej logice dążą do pomiaru zachowań.

Analiza czynnikowa w swych metodach obliczeniowych zmierza do zredukowania dużej ilości danych, wskazuje które zmienne mają wspólny mianownik. Zamiast analizować odpowiedzi 12 pytań, możemy analizować wyniki 3 wskaźników które są zagregowanymi próbkami informacji w ów 12 pytaniach.

Finałem analizy czynnikowej jest odnalezienie danych które są związane z wymiarem nadrzędnym oraz nie są lub są słabo powiązane z   innym czynnikiem. Wymiar nadrzędny możemy zdefiniować jako konstrukt teoretyczny wyjaśniający wyniki odpowiedzi na pozycje testowe w kwestionariuszu.

Mamy dwa rodzaje analiz czynnikowych. Pierwszą jest eksploracyjna analiza. Dzięki niej poznajemy kształt badanego zjawiska. Drugą jest konfirmacyjna analiza czynnikowa, dzięki której możemy odwzorować teoretyczną strukturę zmiennych w modelu matematycznym za pomocą ścieżek wpływu i korelacji między zmiennymi jawnymi i ukrytymi. W tym odcinku zaprezentuje tylko eksploracyjną analizę czynnikową.

 

Na potrzeby tego spiwsu przygotowałem  kwestionariusz 3 rodzajów postaw wobec zimy roku 2013-2014. Bada on 3 niezależne rodzaje postaw przy pomocy 12 pytań testowych, po 4 próbki zachowania na wymiar. Pomiar dotyczył postawy

– emocjonalnej, mierzącej emocjonalny stosunek do zimy pytaniami typu „ Uśmiech nie schodził mi z twarzy kiedy spacerowałem/am przy – 20″

-postawy poznawczej, która mierzy przekonania na temat zimy pytaniami typu

Zima jest moją ulubioną porą roku.”

– oraz behawioralną która jest pomiarem zachowań wobec zimy

„Robiłem/am sobie selfie fotki przy termometrze kiedy było -15.”

Odpowiedzi były mierzone na ilościowej poszerzonej skali likerta. Spektrum odpowiedzi przyjmowało wartości od  1 do 7  czyli od twierdzenia że pozycja mnie zupełnie nie opisuje do twierdzenie że w pełni mnie opisuje..

Wysoki wynik w danej skali będzie świadczyć o przychylniejszej postawie wobec zimy .

Aby wykonać statystyczną analizę czynnikową w SPSS klikamy analiza (pomoc statystyczna), redukcja wymiarów, analiza czynnikowa. W pierwszym kroku przerzucamy zmienne które są naszymi pomiarami. – Niezła pomoc statystyczna?

W oknie statystyki zaznaczamy statystyki opisowe, współczynniki, poziomy istotności, wyznacznik oraz KMO i test Sferyczności Bartelatta.

W wyodrębnieniu zaznaczamy macierz korelacji, nierotowane rozwiązanie czynnikowe oraz wykres osypiska. Musimy też wybrać metodę obliczeniową. Spośród 7 metod musimy wybrać najbardziej odpowiadającą naszym przewidywaniom i danym. W naszym przypadku wybierzemy metodę największej wiarygodności. Wybranie jej warunkuje duża liczba badanych obserwacji i spełnione założenie o wielowymiarowym rozkładzie normalnym. Spełnienie tych założeń zmaksymalizuje nam prawdopodobieństwo że nasza analiza czynnikowa odwzoruje realne związki między zmiennymi a wymiarami. Jeśli chcesz dowiedzieć się więcej o tych metodach możesz zajrzeć do naszego słownika na stronie. Wpisujemy też cyfrę 3 w ilości czynników do wyodrębnienia. Czemu ? Bo zakładamy że w naszym kwestionariuszu mamy 3 postawy.

Musimy wybrać jeszcze metodę rotacji czynników, czyli innymi słowy sprowadzić strukturę ładunków czynnikowych do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników. Wybór rotacji zależy od tego jakie mamy przewidywania. W naszym przypadku musimy wybrać rotację ortogonalną, ponieważ mamy niezależne od siebie czynniki. Możemy kliknąć Varimax lub Quartimax. W momencie kiedy przewidujemy wzajemną korelację czynników wybieramy metodę skośną Oblimin lub Promax. Wybierzemy rotację Varimax która zmaksymalizuje nam korelacje pytań z ich czynnikiem i zminimalizuje korelacje z innymi czynnikami. Na koniec klikamy też wykresy ładunków. Dobra pomoc statystyczna?

W opcjach ukrywamy małe wartości współczynników.  Przyjmijmy że wartość korelacji mniejsza niż 0,3 nie będzie nas interesować. Zaznaczamy też opcję sortowania, aby wyniki w tabeli przyjęły pożądaną strukturę. Klikamy ok.

Okno raportu.

1) Pierwszą tabelą są statystyki opisowe wraz z liczbą wziętych pod lupę obserwacji na każde pytanie.

2) Kolejna tabela to macierz korelacji każdego pytania z każdym wraz z informacją o wartości wyznacznika.

3) Ważną tabelą jest miara adekwatności doboru próby Kaisera Mayera Olkina, która informuje nas o jakości danych wejściowych i sensowności redukcji danych. Jeśli wartość KMO jest mniejsza niż 0,5 powinniśmy przestać liczyć lub  sprawdzić dane pod kątem poprawności i braków danych, dążąc tym samym aby wartość zbliżała się do jedynki. Test sferyczności Bartletta informuje nas o tym, czy zmienne włączone do analizy czynnikowej są ze sobą istotnie powiązane. Jeśli wynik testu Chi Kwadrat jest nieistotny nie ma sensu liczyć analizy czynnikowej.

4) Nastepną informacją są zasoby zmienności wspólnej. Wartości w niej pozwalają ocenić jak dane pozycje wpływają na wyniki analizy czynnikowej. Im wyższa wartość tym większy wkład. Im mniejszy wynik tym zmienna dzieli więcej zemienności z innymi wymiarami. U nas największy wkład ma pytanie EMO3 a najmniejszy BEH1.

5) Kolejna tabela to całkowita wyjaśniona wariancja. Przedstawia wyniki o tym ile zmienności wyjaśniają dane czynniki przed rotacją i po rotacji. Zobaczymy ile wariancji wyjaśniają wymiary po rotacji. W naszym przypadku pozycje czynnika pierwszego wyjaśniają 32% zmienności, drugiego 27% a trzeciego 22%. Koniec końców nasz trój czynnikowy test wyjaśnia około 82% wariancji wyników.

6) Kolejnym etapem jest wykres osypiska nazywany kryterium Cattela.

Na podstawie tego wykresu możemy określić liczbę czynników którą skrywają dane. Określamy to za pomocą wyobrażenia sobie spadających z góry wykresu kamieni. Tam gdzie się zatrzymają lub odbiją jest informacja o liczbie czynników do wyodrębnienia. U nas liczba ta wynosi 3, co jest zbieżne z planowaną strukturą testu postaw.

7) Macierz składowych przedstawia nam korelacje pozycji testowych bez rotacji.

8) Macierz rotowanych skladowych przedstawia nam ostateczne rozwiązanie czynnikowe. Mamy tu do czynienia z korelacjami pytań testowych z czynnikami.

Widzimy że pozycje EMO1, 2, 3, 4, związane są silnie z pierwszą składową, pozycje poz1, 2, 3, 4 ze składową numer dwa, oraz BEH1, 2, 3, 4 ze składową 3. Widzimy że pozycja BEH 3 jest związana ze składową nr jeden i trzy i tworząc pewien konflikt klasyfikacji. W przypadku kiedy siła korelacji beh 3 z wymiarem 1 była  by większa moglibyśmy się zastanowić nad usunięciem tej pozycji z testu. Lecz tutaj widać że ów pozycja jest o wiele bardziej związana z trzecim wymiarem. Wyniki zbieżne z tabelą przedstawia wykres.

 

 

9) Dzięki ten analizie statystycznej sprawdziliśmy poprawność naszego narzędzia badawczego. Teraz można zsumować pozycje danych czynników i poddać je dalszej analizie. Na przykład zrobić analizę regresji lub korelacji i sprawdzić czy postawy wobec zimy 2013-2014 wpływają lub są związane z  czasem spędzonym przed telewizorem lub komputerem w okresie zimowym.

Potrzebna pomoc statystyczna w analizie danych? Skontaktuj się z nami 🙂

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *