Diagram korelacji – punktowy wykres, który przybliży nas do rozwiązania problemu
Często słyszymy o różnych zależnościach, czy to w życiu codziennym, czy też pracy zawodowej. Bazujemy na doświadczeniu naszym lub innych a nierzadko po prostu na przeczuciu. Najprostszym przykładem może być stwierdzenie, że im dalej w las tym więcej drzew. Oczywiście nie w każdym wypadku okaże się to prawdą. Jednak w większości przypadków tak będzie. Innym przykładem może być zależność między pierwszymi opadami śniegu a długością kolejek w punktach wymiany opon. Jak zatem prawidłowo zidentyfikować zależność pomiędzy różnymi czynnikami? Pomoże nam w tym opracowana prawie dwieście lat temu metodologia, która jednak coraz rzadziej wykorzystywana jest w przemyśle. Jest nią Diagram korelacji – jedno z siedmiu tradycyjnych narzędzi zarządzania jakością określonych przez japońskiego profesora Kaoru Ishikawe. W tym artykule powiemy sobie nie tylko czym ten diagram jest, ale również jak go stworzyć, stosować oraz zinterpretować. Sprawdzimy także z jakimi rodzajami korelacji się spotkamy oraz czy zawsze wynik analizy pokaże nam wiarygodne dane. Zanim przejdziemy jednak do meritum przyjrzymy się nieco historii samego narzędzia. Oczywiście nie braknie również przykładów praktycznych, aby lepiej przyswoić materiał. Miłej lektury!
W skrócie
Czytając ten artykuł dowiesz się:
- Co to jest diagram korelacji oraz czym jest zmienna niezależna i zależna.
- Kiedy mówimy o korelacji dodatniej a kiedy ujemnej.
- O czym nam mówi współczynnik korelacji Pearsona.
- Jak prawidłowo stosować oraz interpretować diagram korelacji.
- Jakie są zalety i wady narzędzia.
Diagram korelacji – definicja i historia
Jedno jest pewne – według aktualnej wiedzy nie można jednoznacznie stwierdzić czyim dziełem jest diagram korelacji. Są oczywiście pewne przypuszczenia jednak co do tego nie ma pełnej zgody w środowisku naukowym. Zanim jednak dojdziemy do jego powstania zastanówmy się, czym właściwie jest to narzędzie. Będzie to bowiem w pewnym sensie kluczowe.
Diagram korelacji to nic innego jak diagram w formie wykresu punktowego, który pokazuje nam zależność pomiędzy dwoma zmiennymi: niezależną oraz zależną. Zmiana wartości zmiennej niezależnej ma wpływ na zmianę wartości zmiennej zależnej. Aby nie brzmiało to zbyt skomplikowanie przyjrzyjmy się prostemu przykładowi.
Wykonujemy operację szlifowania manualnego
– zmienna niezależna: czas szlifowania
– zmienna zależna: ilość usuniętego materiału.
Pomińmy oczywiście aspekty typu siła docisku, albo zużycie narzędzia. Możemy zatem zaobserwować prostą korelację, o której wspominaliśmy. Im dłuższy jest czas szlifowania tym więcej materiału usuniemy. Mamy zatem wspomniany przed chwilą wpływ zmiany wartości zmiennej niezależnej na wartość zmiennej zależnej. W dalszej części materiału dowiemy się jak prawidłowo narysować wspomniany diagram korelacji oraz jak go zinterpretować, aby dojść do przyczny źródłowej naszego problemu. Wróćmy jednak jeszcze na chwilę do rysu historycznego narzędzia.
Skoro wiemy, że diagram korelacji jest ściśle powiązany z wykresem punktowym to możemy postarać się w pewnym sensie odtworzyć jego historię. Początki narzędzia związane są z opracowaniem kartezjańskiego układu współrzędnych, którego autorem jest René Descartes po polsku znany jako Kartezjusz. Miało to miejsce w XVII wieku, czyli około dwustu lat przed powstaniem wykresu rozrzutu, bo tak również nazywamy jest diagram korelacji. Co prawda samo opracowanie układu współrzędnych właściwie było jednoznaczne z powstaniem wykresu punktowego jednak, aż do XIX wieku nikt nie stosował go w innym celu niż do badań matematycznych. Wówczas to za sprawą brytyjskiego inżyniera i statystyka Williama Playfair nastąpił przełom im zaczęto analizować dane bazując na wykresach słupkowych, kołowych, czy też liniowych. Od tego dzielił nas już tylko mały krok do popularyzacji wykresów punktowych. Według większości dostępnych źródeł uczynił to John Frederick William Herschel, który opisał zależność pomiędzy kątem położenia gwiazd podwójnych a rokiem kiedy wykonano pomiar.
Kolejne artykuły w każdy poniedziałek!
Polub moją stronę na Facebooku i dowiedz się o nich jako pierwszy!
Diagram korelacji krok po kroku – przykład
Wspomnieliśmy przed chwilą o dwóch zmiennych: niezależnej i zależnej. Będą one stanowiły podstawę naszej analizy. Jednak zanim do tego przystąpimy konieczne będzie prawidłowe zdefiniowanie problemu oraz określenie celu jaki chcemy osiągnąć.
Naszym problemem będzie:
Wysoki odsetek niezgodnych części po obróbce szlifierskiej.
Wykonaliśmy również analizę stosując Diagram Ishikawy i określiliśmy kilka potencjalnych czynników, które mogą mieć wpływ na występowanie problemu. Jak dotąd sprawdziliśmy:
– ilość niezgodnych sztuk w przypadku każdego operatora – wyniki okazały się dość podobne
– żywotność narzędzia – nie stwierdzono wpływu na powstawanie niezgodnych sztuk
– inne przyczyny, jak na przykład awarie – nie stwierdzono w przeciągu ostatnich 12 miesięcy.
Postanowiliśmy więc zweryfikować wpływ czynnika ludzkiego na prawdopodobieństwo wystąpienia niezgodności.
Zdefiniujmy zatem zmienne:
– niezależna – czas pracy
– zależna – ilość niezgodnych sztuk.
Do zebrania niezbędnych danych zastosujemy arkusz kontrolny. Aby analiza była miarodajna zbieranie danych trwało będzie 5 dni roboczych, oczywiście osobno dla każdego operatora.
Diagram korelacji zostanie osobno przygotowany dla każdego operatora oraz za każdy dzień roboczy. Ponieważ w firmie pracuje 2 operatorów zatrudnionych na stanowisku szlifierza to niezbędne będzie stworzenie 10 osobnych diagramów. Oczywiście moglibyśmy wszystkie wyniki przedstawić stosując wyłącznie jeden diagram korelacji, jednak w tym przypadku łatwiej będzie nam zobrazować zebrane dane.
Otrzymane wyniki nałożone zostały na punktowy wykres współrzędnych. Wartości zmiennej niezależnej, czyli czasu pracy zostały naniesione na oś X. Natomiast wartość zmiennej zależnej określać będziemy na osi Y. Ponieważ wyniki okazały się dość zbieżne poniżej zamieszczono jeden diagram korelacji przedstawiający średni wynik. W następnym kroku przejdziemy do prawidłowej interpretacji otrzymanych wyników.
Zanim jednak do tego przejdziemy wróćmy jeszcze do tematu kumulowania danych na jednym diagramie. Jeśli podejmiemy taką decyzję to warto pamiętać o jednej regule. W przypadku, gdy kilka poszczególnych wyników jest zbieżnych to najlepszym rozwiązaniem będzie przedstawienie punktów jeden koło drugiego, tak aby mieć pewność, że wszystkie wyniki zostały oznaczone. Aby poprawić czytelność możemy posłużyć się także różnymi kolorami. W takim wypadku pomocne będzie również narysowanie krzywej regresji, która jasno określi nam występujący trend oraz zdefiniuje stopień korelacji.
Diagram korelacji – korelacja dodatnia i ujemna
W przypadku naszego problemu zaobserwować możemy trend rosnący. Mianowicie, im dłużej operator wykonuje pracę danego dnia tym większa jest ilość niezgodnych sztuk. Ponieważ analogiczne wyniki otrzymaliśmy dla każdego z operatorów możemy łatwo stwierdzić, że potencjalną przyczyną naszego problemu jest czynnik ludzki a dokładniej zmęczenie. Pamiętajmy jednak, że może występować także inna dodatkowa zmienna, której nie wzięliśmy pod uwagę. Może mieć ona istotny wpływ na występowanie problemu. Dlatego otrzymane wyniki powinny zostać poddane dodatkowej analizie.
Wzrost wartości zmiennej niezależnej (upływ czasu pracy) oraz jednoczesny wzrost wartości zmiennej zależnej (ilość części niezgodnych) nazywamy korelacją dodatnią.
Przeciwieństwem do niej będzie korelacja ujemna, która występuje jeśli zmienna niezależna rośnie, zaś zmienna zależna maleje, lub odwrotnie.
Warto również pamiętać, że w przypadku korelacji dodatniej oraz ujemnej nie zawsze zauważymy wzrost prostoliniowy. W większości przypadków będzie to jednak krzywa, która będzie zachowywała charakterystyczną dla obu korelacji zależność. Jeśli jednak nie jesteśmy w stanie zaobserwować żadnej zależności to mówimy o braku korelacji.
Diagram korelacji – korelacja silna i słaba
Poza kierunkiem możemy również określić współczynnik korelacji. Jedna z popularniejszych metod opracowana została przez angielskiego matematyka Karla Pearsona i to właśnie jego nazwiskiem jest oznaczona. Warto jednak wiedzieć, że współczynnik korelacji Pearsona ma zastosowanie w przypadku danych o rozkładzie normalnym oraz przy założeniu, że są one liniowe. Im silniejsza jest korelacja tym punkty na diagramie będą bliżej trendu. W przypadku słabej korelacji mówimy o zachowaniu całkowicie odwrotnym.
Współczynnik korelacji Pearsona oznacza się jako rxy. Może on osiągać wartość od -1 do 1. Przy czym im bardziej skrajny wynik otrzymamy typ silniejsza jest korelacja.
Silna korelacja oznacza bardzo wąski rozrzut poszczególnych wartości i ich kumulację w pobliżu krzywej regresji. Im silniejsza jest korelacja tym większy również potencjalny wpływ danego czynnika na inny. Jeśli wartość jest bliższa 1 to jest to wspomniana już korelacja dodatnia. Wynik równy lub zbliżony do „-1” określa korelacje ujemną.
Natomiast o najsłabszej a wręcz braku korelacji mówimy, gdy współczynnik wynosi 0. W takim wypadku rozrzut wartości będzie dość szeroki a czasem także chaotyczny. W przypadku słabej korelacji wpływ danego czynnika może być niewielki lub nawet nie występować.
Jeśli chcecie się dowiedzieć więcej na temat tego jak liczy się współczynnik korelacji Pearsona to polecam zapoznać się z osobnym artykułem dostępnym w Wikipedii.
Jak prawidłowo używać diagram korelacji?
Diagram korelacji ma tą wadę, że potrafi znaleźć zależność między poszczególnymi czynnikami nawet jeśli wydają się one z pozoru absurdalne. Dlatego przed chwilą wspomnieliśmy, że przyczyna występowania problemu w postaci zmęczenia jest potencjalna. Wszystko zależy od tego jakie dane poddane zostaną analizie oraz jak skrupulatnie będą one również zbierane.
Dla lepszego zrozumienia spróbujmy postawić pewną tezę: wzrost temperatury otoczenia jest przyczyną wzrostu liczby utonięć. Wydaje się to niedorzeczne, ale zastanówmy się, czy nie takie wyniki otrzymamy jeśli wykonamy diagram korelacji zakładając, że:
– zmienna niezależna to temperatura otocznia
– zamienna zależna to ilość utonięć.
Nie będziemy zbierać tych danych, ale odpowiemy sobie na dwa pytania:
– kiedy występuje największa ilość utonięć – w miesiącach letnich
– w jakim okresie występują najwyższe temperatury – wakacyjnym.
Widzimy zatem zależność. Pomimo tego, że rzeczywistą przyczyną wzrostu ilości utonięć jest wzrost liczby kąpiących się. A właśnie na to, że chętniej się kąpiemy wpływ ma wysoka temperatura a nie na liczbę utonięć.
Jest to o tyle istotne, że na siłę udowodnić możemy wiele rzeczy. Nie zawsze jednak wykonana przez nas analiza przysłuży się rozwiązaniu problemu. A taki mamy cel.
Innym tematem są wartości odstające. Są to pojedyncze wyniki, które znacząco różnią się od pozostałych. Mogą stanowić wynik pomyłki powstałej czy to podczas wykonywania pomiaru, czy też zbierania danych. Czyli wszędzie tam, gdzie mamy do czynienia z czynnikiem ludzkim. Jeśli nasz diagram zawiera takie wartości to warto je poddać analizie, aby określić przyczynę ich występowania. Jeśli jak wspomnieliśmy są wynikiem pomyłki to możemy je zastąpić prawidłową wartością, zaś w innym wypadku również usunąć z diagramu.
Diagram korelacji – zalety stosowania
Skoro znamy już wady jakie posiada diagram korelacji to przyjrzyjmy się również jego zaletom. W końcu nie bez powodu Ishikawa zaliczył go do siedmiu tradycyjnych narzędzi zarządzania jakością. Na pewno będzie to jego wizualna forma, która ułatwia zrozumienie oraz późniejszą interpretację. Przedstawione dane można poddać bardzo szybkiej analizie, dzięki czemu poznamy potencjalną zależność występującą pomiędzy poszczególnymi czynnikami. Również samo opracowanie diagramu nie jest zbyt czasochłonne. Możemy tego dokonać chociażby ręcznie na kartce papieru, czy za pomocą oprogramowania typu excel lub minitab. Zaś sam diagram stanowi także dużo skuteczniejszą formę komunikacji niż opis tekstowy. Dzięki temu może mieć pozytywny wpływ na proces podejmowania decyzji.
Diagram korelacji – inne przykłady zależności
Wspomnieliśmy między innymi o występowaniu zależności pomiędzy czasem szlifowania a ilością usuwanego materiału, czy też czasem pracy a prawdopodobieństwem wystąpienia niezgodnej sztuki. Sprawdźmy zatem jakie inne ciekawe korelacje możemy zaobserwować podczas wykonywania obróbki mechanicznej, czy też procesów specjalnych. Dobrym przykładem będzie najczęściej sam czas procesu i jego wpływ na osiągnięty rezultat.
Taką zależność możemy zaobserwować chociażby podczas różnych operacji trawienia danego stopu. Pomijając inne dodatkowe czynniki możemy zauważyć prostą korelację – im dłużej dana część znajduje się w kwasie tym więcej materiału usuniemy. Podobną zależność możemy zaobserwować podczas obróbki cieplnej, gdzie dłuższy czas procesu pozwala nam na osiągnięcie wymaganej temperatury w całym przekroju części.
W przypadku procesu kulowania odpowiednio długi czas umacniania zapewni nam wymagane pokrycie. Jednak jego przyrost nie będzie liniowy, ale będzie malał wraz z czasem procesu.
Jeśli chodzi o obróbkę mechaniczna to możemy zaobserwować przykładową korelację pomiędzy czasem skrawania a zużyciem danego narzędzia. Oczywiście będzie ona różna w zależności od obrabianego gatunku materiału oraz użytego narzędzia.
Innym przykładem korelacji może być czas obróbki części oraz jej ostateczna cena. Pomijając oczywiście koszty stałe oraz inne czynniki brane pod uwagę podczas kwotowania zamówień. Takie przykłady można mnożyć w nieskończoność. Ważne jednak, aby podczas opracowywania diagramu korelacji mieć dane numeryczne dla dwóch powiązanych ze sobą zmiennych
Podsumujmy omawiany temat…
Diagram korelacji stanowi dość ciekawe i pomocne narzędzie, które może okazać się skuteczne podczas rozwiązywania różnych problemów. Jego zastosowanie może udowodnić występowanie zależności pomiędzy dwoma badanymi zmiennymi. Oczywiście nie oznacza to jednak, że istnieje między nimi związek przyczynowo-skutkowy. Otrzymane wyniki powinniśmy bowiem poddać dodatkowej analizie, aby wykluczyć prawdopodobieństwo występowania innych czynników, które w rzeczywistości mogą powodować istnienie danej korelacji. Zatem diagram korelacji jest metodologią, która świetnie sprawdzi się podczas stosowania z innymi narzędziami służącymi zarówno do zbierania danych oraz rozwiązywania problemów. Przykładami mogą być wspomniany już wcześniej Arkusz kontrolny, czy też Diagram Ishikawy, czyli dwie inne metodologie zaliczane podobnie jak diagram korelacji do siedmiu tradycyjnych narzędzi zarządzania jakością. A jakie są Wasze doświadczenie z używaniem diagramu korelacji? A może nie mieliście jeszcze okazji zastosować go w praktyce? Zastanówcie się także, czy kiedykolwiek spotkaliście się z występowaniem jakieś całkowicie absurdalnej korelacji, którą ktoś na siłę próbował Wam udowodnić. Jeśli znacie jakąś lub macie jakieś inne dodatkowe spostrzeżenia co do diagramu korelacji to podzielcie się nimi w poniższej sekcji komentarzy. Do zobaczenia już w następny poniedziałek!