Jak stosować i interpretować diagram korelacji?
Definiowanie zależności występujących między różnymi zmiennymi może być pomocne podczas analizy problemów jakościowych lub biznesowych. W tym celu wykorzystać możemy jedno z tradycyjnych narzędzi zarządzania jakością – diagram korelacji.
Pozwala on stwierdzić nie tylko czy dany związek występuje, ale także określić jak silna dana korelacja jest. Przejdźmy zatem do meritum i sprawdźmy co to jest diagram korelacji oraz jak prawidłowo go stosować.
Aby stworzyć swój pierwszy diagram korelacji możecie skorzystać z gotowego rozwiązania opartego o arkusze Excel. Jest ono dostępne do pobrania całkowicie za darmo. Więcej szczegółów znajdziecie pod koniec tego materiału. Miłej lektury!
W skrócie
Czytając ten artykuł dowiesz się:
- Co to jest diagram korelacji oraz czym jest zmienna niezależna i zależna.
- Kiedy mówimy o korelacji dodatniej a kiedy ujemnej.
- O czym nam mówi współczynnik korelacji Pearsona.
- Jak prawidłowo stosować oraz interpretować diagram korelacji.
- Jakie są zalety i wady narzędzia.
Kolejne artykuły w każdy poniedziałek!
Obserwuj Jakościowca w mediach społecznościowych i bądź na bieżąco.
Co to jest diagram korelacji?
Diagram korelacji jest to wykres punktowy, który pokazuje nam zależność pomiędzy dwoma zmiennymi:
- niezależną
- zależną
Zmiana wartości zmiennej niezależnej ma wpływ na zmianę wartości zmiennej zależnej. Aby nie brzmiało to zbyt skomplikowanie przyjrzyjmy się prostemu przykładowi.
Wykonujemy operację szlifowania manualnego
- zmienna niezależna: czas szlifowania
- zmienna zależna: ilość usuniętego materiału.
Pomińmy oczywiście aspekty typu siła docisku albo zużycie narzędzia. Możemy zatem zaobserwować prostą korelację, o której wspominaliśmy. Im dłuższy jest czas szlifowania tym więcej materiału usuniemy. Mamy zatem wspomniany przed chwilą wpływ zmiany wartości zmiennej niezależnej na wartość zmiennej zależnej.
Kto jest autorem diagramu korelacji?
Jedno jest pewne – według aktualnej wiedzy nie można jednoznacznie stwierdzić czyim dziełem jest diagram korelacji. Są oczywiście pewne przypuszczenia jednak co do tego nie ma pełnej zgody w środowisku naukowym.
Skoro jednak wiemy, że diagram korelacji jest ściśle powiązany z wykresem punktowym to możemy postarać się w pewnym sensie odtworzyć jego historię.
Początki narzędzia związane są z opracowaniem kartezjańskiego układu współrzędnych, którego autorem jest René Descartes po polsku znany jako Kartezjusz. Miało to miejsce w XVII wieku, czyli około dwustu lat przed powstaniem wykresu rozrzutu, bo tak również nazywamy jest diagram korelacji.
Co prawda samo opracowanie układu współrzędnych właściwie było jednoznaczne z powstaniem wykresu punktowego jednak, aż do XIX wieku nikt nie stosował go w innym celu niż do badań matematycznych. Wówczas to za sprawą brytyjskiego inżyniera i statystyka Williama Playfair nastąpił przełom i zaczęto analizować dane bazując na wykresach słupkowych, kołowych, czy też liniowych.
Od tego dzielił nas już tylko mały krok do popularyzacji wykresów punktowych. Według większości dostępnych źródeł uczynił to John Frederick William Herschel, który opisał zależność pomiędzy kątem położenia gwiazd podwójnych a rokiem kiedy wykonano pomiar.
Tradycyjne narzędzia zarządzania jakością
Diagram korelacji zaliczany jest do grona siedmiu tradycyjnych narzędzi zarządzania jakością. Zestawienie to w 1968 roku przedstawił Kaoru Ishikawa. Mało kto jednak wie, że raptem kilka lat później a dokładniej 1976 roku ukazała się kolejna siódemka. Nazywana jest ona siedmioma nowymi narzędziami zarządzania jakością lub też ze względu na ich zastosowanie, nowymi narzędziami planowania i zarządzania.
Więcej na temat obu tych zestawień przeczytacie we wpisie:
- Narzędzia zarządzania jakością – klasyczna siódemka
- Nowe narzędzia zarządzania jakością
Obserwuj Jakościowca na Facebooku!
Bądź na bieżąco z nowymi wpisami na blogu.
Jak stosować diagram korelacji? Przykład praktyczny
Wspomnieliśmy przed chwilą o dwóch zmiennych: niezależnej i zależnej. Będą one stanowiły podstawę naszej analizy. Jednak zanim do tego przystąpimy konieczne będzie prawidłowe zdefiniowanie problemu oraz określenie celu jaki chcemy osiągnąć.
Naszym problemem będzie:
Wysoki odsetek niezgodnych części po obróbce szlifierskiej.
Wykonaliśmy również analizę stosując Diagram Ishikawy i określiliśmy kilka potencjalnych czynników, które mogą mieć wpływ na występowanie problemu. Jak dotąd sprawdziliśmy:
- ilość niezgodnych sztuk w przypadku każdego operatora – wyniki okazały się dość podobne
- żywotność narzędzia – nie stwierdzono wpływu na powstawanie niezgodnych sztuk
- inne przyczyny, jak na przykład awarie – nie stwierdzono w przeciągu ostatnich 12 miesięcy.
Postanowiliśmy więc zweryfikować wpływ czynnika ludzkiego na prawdopodobieństwo wystąpienia niezgodności.
Zdefiniujmy zatem zmienne:
- niezależna – czas pracy
- zależna – ilość niezgodnych sztuk.
Do zebrania niezbędnych danych zastosujemy arkusz kontrolny. Aby analiza była miarodajna zbieranie danych trwało będzie 5 dni roboczych, oczywiście osobno dla każdego operatora.
Diagram korelacji zostanie osobno przygotowany dla każdego operatora oraz za każdy dzień roboczy. Ponieważ w firmie pracuje 2 operatorów zatrudnionych na stanowisku szlifierza to niezbędne będzie stworzenie 10 osobnych diagramów. Oczywiście moglibyśmy wszystkie wyniki przedstawić stosując wyłącznie jeden diagram korelacji, jednak w tym przypadku łatwiej będzie nam zobrazować zebrane dane.
Otrzymane wyniki nałożone zostały na punktowy wykres współrzędnych. Wartości zmiennej niezależnej, czyli czasu pracy zostały naniesione na oś X. Natomiast wartość zmiennej zależnej określać będziemy na osi Y. Ponieważ wyniki okazały się dość zbieżne poniżej zamieszczono jeden diagram korelacji przedstawiający średni wynik. W następnym kroku przejdziemy do prawidłowej interpretacji otrzymanych wyników.

Zanim jednak do tego przejdziemy wróćmy jeszcze do tematu kumulowania danych na jednym diagramie. Jeśli podejmiemy taką decyzję to warto pamiętać o jednej regule. W przypadku, gdy kilka poszczególnych wyników jest zbieżnych to najlepszym rozwiązaniem będzie przedstawienie punktów jeden koło drugiego, tak aby mieć pewność, że wszystkie wyniki zostały oznaczone.
Aby poprawić czytelność możemy posłużyć się także różnymi kolorami. W takim wypadku pomocne będzie również narysowanie krzywej regresji, która jasno określi nam występujący trend oraz zdefiniuje stopień korelacji.

Jak interpretować zależność stosując diagram korelacji?
Diagram korelacji pozwala ocenić dwa aspekty pomocne podczas rozwiązywania problemów:
- czy między dwoma zmiennymi występuje korelacja
- jak silny jest związek między poszczególnymi czynnikami
Do określenia zarówno występowania zależności jak i jej siły posłuży współczynnik korelacji Pearsona rxy. Jego nazwa pochodzi od angielskiego matematyka Karla Pearsona, który go opracował.
Warto jednak wiedzieć, że współczynnik korelacji Pearsona ma zastosowanie w przypadku danych o rozkładzie normalnym oraz przy założeniu, że są one liniowe.
Współczynnik korelacji Pearsona może osiągać wartość od -1 do 1.
Jak określić występowanie korelacji między zmiennymi?
Wyróżnia się trzy rodzaje zależności jakie mogą występować między dwoma zmiennymi:
- korelacja dodatnia
- korelacja ujemna
- brak korelacji
| Zmienna niezależna | Zmienna niezależna | Współczynnik korelacji Pearsona rxy | |
|---|---|---|---|
| Korelacja dodatnia | rośnie | rośnie | rxy > 0 |
| Korelacja ujemna | rośnie | maleje | rxy < 0 |
| Brak korelacji | rośnie | rośnie i maleje | rxy = 0 |
W przypadku naszego problemu zaobserwować możemy trend rosnący. Mianowicie, im dłużej operator wykonuje pracę danego dnia tym większa jest ilość niezgodnych sztuk. Ponieważ analogiczne wyniki otrzymaliśmy dla każdego z operatorów możemy łatwo stwierdzić, że potencjalną przyczyną naszego problemu jest czynnik ludzki a dokładniej zmęczenie.
Pamiętajmy jednak, że może występować także inna dodatkowa zmienna, której nie wzięliśmy pod uwagę. Może mieć ona istotny wpływ na występowanie problemu. Dlatego otrzymane wyniki powinny zostać poddane dodatkowej analizie.
Wzrost wartości zmiennej niezależnej (upływ czasu pracy) oraz jednoczesny wzrost wartości zmiennej zależnej (ilość części niezgodnych) nazywamy korelacją dodatnią.
Przeciwieństwem do niej będzie korelacja ujemna, która występuje jeśli zmienna niezależna rośnie, zaś zmienna zależna maleje, lub odwrotnie.
Warto również pamiętać, że w przypadku korelacji dodatniej oraz ujemnej nie zawsze zauważymy wzrost prostoliniowy. W większości przypadków będzie to jednak krzywa, która będzie zachowywała charakterystyczną dla obu korelacji zależność. Jeśli jednak nie jesteśmy w stanie zaobserwować żadnej zależności to mówimy o braku korelacji.
Jakościowiec teraz także na LinkedIn!
Jak określić siłę korelacji?
Poza kierunkiem możemy również określić siłę korelacji. Wyróżnia się:
- korelację silną
- korelację słabą
| Współczynnik korelacji Pearsona rxy | Odległość od krzywej regresji | |
|---|---|---|
| Korelacja silna | wartości skrajne, bliskie -1 lub 1 | nieduża |
| Korelacja słaba | wartości zbliżone do 0 | duża |
Silna korelacja oznacza bardzo wąski rozrzut poszczególnych wartości i ich kumulację w pobliżu krzywej regresji. Im silniejsza jest korelacja tym większy również potencjalny wpływ danego czynnika na inny.
Natomiast o najsłabszej a wręcz braku korelacji mówimy, gdy współczynnik wynosi 0. W takim wypadku rozrzut wartości będzie dość szeroki a czasem także chaotyczny. W przypadku słabej korelacji wpływ danego czynnika może być niewielki lub nawet nie występować.
Jeśli chcecie się dowiedzieć więcej na temat tego jak liczy się współczynnik korelacji Pearsona to polecam zapoznać się z osobnym artykułem dostępnym w Wikipedii.

Jak prawidłowo używać diagram korelacji?
Diagram korelacji ma tą wadę, że potrafi znaleźć zależność między poszczególnymi czynnikami nawet jeśli wydają się one z pozoru absurdalne. Dlatego przed chwilą wspomnieliśmy, że przyczyna występowania problemu w postaci zmęczenia jest potencjalna. Wszystko zależy od tego jakie dane poddane zostaną analizie oraz jak skrupulatnie będą one również zbierane.
Dla lepszego zrozumienia spróbujmy postawić pewną tezę: wzrost temperatury otoczenia jest przyczyną wzrostu liczby utonięć. Wydaje się to niedorzeczne, ale zastanówmy się, czy nie takie wyniki otrzymamy jeśli wykonamy diagram korelacji zakładając, że:
- zmienna niezależna to temperatura otocznia
- zamienna zależna to ilość utonięć
Nie będziemy zbierać tych danych, ale odpowiemy sobie na dwa pytania:
- kiedy występuje największa ilość utonięć – w miesiącach letnich
- w jakim okresie występują najwyższe temperatury – wakacyjnym
Widzimy zatem zależność. Pomimo tego, że rzeczywistą przyczyną wzrostu ilości utonięć jest wzrost liczby kąpiących się. A właśnie na to, że chętniej się kąpiemy wpływ ma wysoka temperatura a nie na liczbę utonięć.
Jest to o tyle istotne, że na siłę udowodnić możemy wiele rzeczy. Nie zawsze jednak wykonana przez nas analiza przysłuży się rozwiązaniu problemu. A taki mamy cel.
Innym tematem są wartości odstające. Są to pojedyncze wyniki, które znacząco różnią się od pozostałych. Mogą stanowić wynik pomyłki powstałej czy to podczas wykonywania pomiaru, czy też zbierania danych. Czyli wszędzie tam, gdzie mamy do czynienia z czynnikiem ludzkim. Jeśli nasz diagram zawiera takie wartości to warto je poddać analizie, aby określić przyczynę ich występowania. Jeśli jak wspomnieliśmy są wynikiem pomyłki to możemy je zastąpić prawidłową wartością, zaś w innym wypadku również usunąć z diagramu.

Jakie zalety posiada diagram korelacji?
Skoro znamy już wady jakie posiada diagram korelacji to przyjrzyjmy się również jego zaletom. W końcu nie bez powodu Ishikawa zaliczył go do siedmiu tradycyjnych narzędzi zarządzania jakością.
Diagram korelacji – zalety:
- wizualna forma – ułatwia interpretację zależności oraz umożliwia wykonanie szybkiej analizy
- łatwość – opracowanie diagramu nie jest czasochłonne
- ułatwia komunikację oraz upraszcza proces podejmowania decyzji
Diagram korelacji – inne przykłady zależności
Wspomnieliśmy między innymi o występowaniu zależności pomiędzy czasem szlifowania a ilością usuwanego materiału, czy też czasem pracy a prawdopodobieństwem wystąpienia niezgodnej sztuki. Sprawdźmy zatem jakie inne ciekawe korelacje możemy zaobserwować podczas wykonywania obróbki mechanicznej, czy też procesów specjalnych. Dobrym przykładem będzie najczęściej sam czas procesu i jego wpływ na osiągnięty rezultat.
Taką zależność możemy zaobserwować chociażby podczas różnych operacji trawienia danego stopu. Pomijając inne dodatkowe czynniki możemy zauważyć prostą korelację – im dłużej dana część znajduje się w kwasie tym więcej materiału usuniemy. Podobną zależność możemy zaobserwować podczas obróbki cieplnej, gdzie dłuższy czas procesu pozwala nam na osiągnięcie wymaganej temperatury w całym przekroju części.
W przypadku procesu kulowania odpowiednio długi czas umacniania zapewni nam wymagane pokrycie. Jednak jego przyrost nie będzie liniowy, ale będzie malał wraz z czasem procesu.
Jeśli chodzi o obróbkę mechaniczna to możemy zaobserwować przykładową korelację pomiędzy czasem skrawania a zużyciem danego narzędzia. Oczywiście będzie ona różna w zależności od obrabianego gatunku materiału oraz użytego narzędzia.
Innym przykładem korelacji może być czas obróbki części oraz jej ostateczna cena. Pomijając oczywiście koszty stałe oraz inne czynniki brane pod uwagę podczas kwotowania zamówień. Takie przykłady można mnożyć w nieskończoność. Ważne jednak, aby podczas opracowywania diagramu korelacji mieć dane numeryczne dla dwóch powiązanych ze sobą zmiennych
Excel – darmowy diagram korelacji do pobrania

Waszą codzienną pracę z diagramem korelacji w znacznym stopniu ułatwi gotowe narzędzie, które już teraz możecie pobrać. I to całkowicie za darmo. Oparte jest ono o arkusze Excel i składa się z dwóch części:
- arkusza kontrolnego, który ułatwia gromadzenie danych, oraz
- diagramu korelacji, który bez potrzeby dodatkowych obliczeń zostanie automatycznie narysowany
Więcej na jego temat dowiecie się klikając w poniższy baner. Znajdziecie tam również inne narzędzia jakościowe do pobrania.

Podsumowanie
Diagram korelacji to narzędzie służące do określania zależności między dwoma zmiennymi: zależną i niezależną. Metoda zaliczana jest do siedmiu tradycyjnych narzędzi zarządzania jakością.
Stosując diagram korelacji możemy zaobserwować korelację:
- dodatnią – wraz ze wzrostem zmiennej niezależnej rośnie również zmienna zależna, współczynnik korelacji Pearsona rxy > 0
- ujemną – wzrost zmiennej niezależnej powoduje spadek wartości zmiennej zależnej współczynnik korelacji Pearsona rxy < 0
Może występować także brak korelacji, z którym mamy do czynienia, gdy zmienna niezależna rośnie zaś zmienna zależna okresowo rośnie i maleje. W takich wypadkach rxy = 0.
Korelacja może być także:
- silna – współczynnik korelacji Pearsona rxy jest równy lub blisko wartości skrajnych 1 lub -1
- słaba – współczynnik korelacji Pearsona rxy jest równy zero lub oscyluje wokół tej wartości
Diagram korelacji pozwala udowodnić występowanie zależności pomiędzy dwoma badanymi zmiennymi. Oczywiście nie oznacza to jednak, że istnieje między nimi związek przyczynowo-skutkowy.
Otrzymane wyniki powinniśmy poddać dodatkowej analizie, aby wykluczyć prawdopodobieństwo występowania innych czynników, które w rzeczywistości mogą powodować istnienie danej korelacji.
A jakie są Wasze doświadczenie z używaniem diagramu korelacji? A może nie mieliście jeszcze okazji zastosować go w praktyce? Zastanówcie się także, czy kiedykolwiek spotkaliście się z występowaniem jakieś całkowicie absurdalnej korelacji, którą ktoś na siłę próbował Wam udowodnić. Jeśli znacie jakąś lub macie jakieś inne dodatkowe spostrzeżenia co do diagramu korelacji to podzielcie się nimi w poniższej sekcji komentarzy. Do zobaczenia już w następny poniedziałek!
FAQ, czyli najczęściej zadawane pytania
Czym jest diagram korelacji?
Diagram korelacji przedstawia w formie wykresu punktowego zależność występującą między zmienną zależną i niezależną.
Czym różni się korelacja dodatnia i ujemna?
Jeśli wzrost wartości zmiennej niezależnej powoduje także wzrost wartości zmiennej zależnej to mówimy o korelacji dodatniej. Jeśli zaś wartość zmiennej zależnej spada to jest to korelacja ujemna.
Co to jest brak korelacji?
Brak korelacji występuje jeśli w przypadku wzrostu wartości zmiennej niezależnej występuje okresowy wzrost i spadek wartości zmiennej zależnej.
Czym różni się korelacja silna i słaba?
Jeśli wartość korelacji Pearsona jest bliska 1 lub -1 to mówimy o korelacji silnej. Natomiast wynik bliski zero oznacza korelację słabą.



