październik 2016 - współczynnik Giniego

Data ostatniej modyfikacji:
2016-11-16
Miniwykład o współczynniku Giniego

Współczynnik Giniego [czytaj: dżiniego] jest miernikiem statystycznym nierównomierności rozkładu pewnej cechy. Został wymyślony przez włoskiego statystyka Corrado Giniego (1884-1965). Najbardziej znanym zastosowaniem tego współczynnika jest pomiar nierównomierności rozkładu wysokości dochodów w społeczeństwie. Jego zadaniem jest zmierzenie, czy dochody ludności są mniej więcej na zbliżonym poziomie, czy występuje duże rozwarstwienie tych dochodów.

Niech y1, y2, ..., yn oznaczają wysokości dochodów w pewnej n-osobowej grupie, które są uporządkowane niemalejąco, tzn. że zachodzą nierówności y1 ≤ y2 ... yn. Wtedy współczynnik Giniego wyraża się wzorem [tex]G=\frac{(-n+1)y_1+(-n+3)y_2+(-n+5)y_3+\ldots+(n-3)y_{n-1}+(n-1)y_n}{n^2\overline{y}}[/tex], gdzie [tex]\overline{y}[/tex] jest średnią arytmetyczną dochodów, czyli [tex]\overline{y}=\frac{y_1+y_2+y_3+\ldots+y_n}{n}[/tex]. We wzorze, w liczniku, jako współczynniki przy zmiennych y występują symetrycznie (raz ze znakiem plus, a raz minus) kolejne liczby nieparzyste dla n parzystego i kolejne liczby parzyste dla n nieparzystego. Współczynnik Giniego przyjmuje wartości od 0 do 1. Czasem jego wartość
podawana jest w procentach (czyli jako ułamek o mianowniku 100).

Przykład 1. Oblicz liczby występujące w liczniku przy y1, y2,..., yn, we wzorze na współczynnik Giniego dla n=10 i n=11.
Rozwiązanie. Dla n=10 są to liczby -9, -7, -5, -3, -1, 1, 3, 5, 7, 9, a dla n=11 są to liczby -10, -8, -6, -4, -2, 0, 2, 4, 6, 8, 10.

Przykład 2. Oblicz współczynnik Giniego dla dochodów trzech osób zarabiających 3000 zł, 4000 zł i 5000zł.
Rozwiązanie. Grupa składa się z 3 osób, czyli n=3. Zarobki tych osób wynoszą y1=3000, y2=4000 oraz y3=5000 i są uporządkowane rosnąco. Średnia arytmetyczna tych zarobków to [tex]\overline{y}=\frac{3000+4000+5000}{3}=4000[/tex], a współczynnik Giniego wynosi [tex]G=\frac{(-2)\cdot 3000+0\cdot 4000+2\cdot 5000}{3^2\cdot 4000}=\frac{1}{9}[/tex].

Przykład 3. W grupie z poprzedniego przykładu osoba, która zarabiała 4000 zł, awansowała i jej zarobki wynoszą teraz 13 000 zł. Oblicz współczynnik Giniego dla tej samej grupy osób po awansie jednej z nich.
Rozwiązanie. Uporządkowane rosnąco nowe zarobki wynoszą to y1=3000, y2=5000 i y3=13000. Ich średnia arytmetyczna to [tex]\overline{y}=\frac{3000+5000+13000}{3}=7000[/tex], a współczynnik Giniego to [tex]G=\frac{(-2)\cdot 3000+0\cdot 5000+2\cdot 13000}{3^2\cdot 7000}=\frac{20}{63}[/tex].

Analizując powyższe przykłady widzimy, że współczynnik Giniego w drugim przypadku jest znacznie większy (7/63 < 20/63). Większa wartość tego współczynnika oznacza bardziej nierównomierny rozkład dochodów w grupie. I tak jest faktycznie: dochody osób z przykładu 1 są znacznie bardziej zbliżone.

Zadania dla SP

Zadanie 1. Oblicz współczynnik Giniego dla grupy czterech osób, które zarabiają 2000 zł, 3000 zł, 3500 zł i 120 000 zł.

Zadanie 2. Według danych opublikowanych przez Eurostat w Polsce współczynnik Giniego dochodów gospodarstw domowych w 2014 roku wyniósł 308/1000, a w 2013 roku wyniósł 307/1000. Co oznacza ta zmiana?

Zadanie 3. Ile wyniesie współczynnik Giniego dla dochodu grupy jednoosobowej?

Zadania dla GIM

Zadanie 1. Oblicz współczynnik Giniego dla grupy pięciu osób, które zarabiają 5000 zł, 2500 zł, 3000 zł, 2800 zł i 10 000 zł.

Zadanie 2. Ile wynosi współczynnik Giniego dla grupy n osób, z których każda zarabia tyle samo?

Zadanie 3. Uzasadnij, że współczynnik Giniego można również obliczyć ze wzoru [tex]G=\frac{1}{n}\left(n+1-2\left(\frac{ny_1+(n-1)y_2+(n-2)y_3+\ldots+y_n}{y_1+y_2+y_3+\ldots+y_n}\right)\right)[/tex].

Zadania dla LO

Zadanie 1. Oblicz współczynnik Giniego dla grupy 100 osób, wśród których jest po 20 osób, które zarabiają 4000 zł, 2500 zł, 3500 zł, 2000 zł i 6000 zł.

Zadanie 2. Ile wynosi współczynnik Giniego dla grupy n osób, z których tylko jedna zarabia, a pozostałe nie mają żadnych dochodów?

Zadanie 3. Uzasadnij, że współczynnik Giniego można również obliczyć ze wzoru [tex]G=\frac{2(y_1+2y_2+3y_3+\ldots+ny_n)}{n(y_1+y_2+y_3+\ldots+y_n)}-\frac{n+1}{n}[/tex].

 

Wyniki: 
Wyniki uzyskane w SP

 W tym miesiącu punkty zdobyli:

  • 3 - Paulina Fita SP 2 Syców, Jakub Ptak SP 64 Wrocław, Maciej Szczerczowski SP 2 Syców i Aleksandra Sznajder SP 4 Warszawa,
  • 2 - Wojciech Szwarczyński SP Kowalowa i Kacper Woszczek SP Mieroszów.

Pozostałym uczestnikom nie przyznano punktów.

Wyniki uzyskane w GIM

W tym miesiącu punkty zdobyli:

  • 3 - Weronika Szemplińska GM Drohiczyn,
  • 2,5 - Karol Szempliński GM Drohiczyn,
  • 2 - Michał Piórkowski GM sióstr Urszulanek Wrocław i  Mateusz Winiarski Dwujęzyczne GM Krosno.

Pozostałym uczestnikom nie przyznano punktów.

Wyniki uzyskane w LO

W tym miesiącu punkty zdobyli:

  • 3 - Natalia Cisowska I LO Kraków, Michał Ciurej V LO Kraków, Joanna Lisiowska XXI LO Warszawa, Monika Marusiak I LO Bolesławiec, Wioleta Nieruchalska ZS 1 Ostrzeszów i Mikołaj Pater III LO Opole;
  • 2  - Michał Korman V LO Kraków i Wojciech Wiśniewski I LO Giżycko,
  • 1,5 - Maciej Skrzynecki ZSO Góra.

Pozostałym uczestnikom nie przyznano punktów.

 

Odpowiedzi: 
Odpowiedzi dla SP

Zad. 1. Grupa składa się z 4 osób, czyli n=4. Zarobki tych osób wynoszą y1=2000, y2=3000, y3=3500 oraz y4=120000 i są uporządkowane rosnąco. Średnia arytmetyczna zarobków to
[tex]\overline{y}=\frac{2000+3000+3500+120000}{4}=32125[/tex], a współczynnik Giniego wynosi [tex]G=\frac{(-3)\cdot 2000+(-1)\cdot 3000+1\cdot
3500+3\cdot 120000}{4^2\cdot 32125}=\frac{709}{1028}\approx 0,6897[/tex].

Zad. 2. W 2014 roku współczynnik Giniego nieznacznie wzrósł w stosunku do 2013 roku. Oznacza to mały wzrost nierównomierności dochodów w 2014 roku.

Zad. 3. Zauważmy, że niezależnie od wartości dochodu tej jednej osoby (poza przypadkiem dochodu zerowego, bo wtedy nie można obliczyć współczynnika Giniego), w liczniku wzoru na G otrzymujemy 0·y1, czyli współczynnik  Giniego jest równy zero. I to jest poprawny wynik, ponieważ nie można mówić o nierównomierności dochodów, rozważając jedną osobę.

Odpowiedzi dla GIM

Zad. 1. Grupa składa się z 5 osób, czyli n=5. Zarobki tych osób po uporządkowaniu rosnąco wynoszą y1=2500, y2=2800, y3=3000, y4=5000 oraz y5=10000. Średnia arytmetyczna zarobków to
[tex]\overline{y}=\frac{2500+2800+3000+5000+10000}{5}=4660[/tex], a współczynnik Giniego wynosi [tex]G=\frac{(-4)\cdot 2500+(-2)\cdot 2800 +0\cdot
3000+2\cdot 5000+4\cdot 10000}{5^2\cdot 4660}=\frac{344}{1165}\approx 0,2953[/tex].

Zad. 2. Dla grupy n osób zarabiających po y zł, współczynnik Giniego wynosi [tex]G=\frac{(-n+1)y+(-n+3)y+(-n+5)y+\ldots+(n-3)y+(n-1)y}{n^2y} =\\ =\frac{(-n+1)+(-n+3)+(-n+5)+\ldots+(n-3)+(n-1)}{n^2}=\frac{0}{n^2}=0[/tex].

Zad. 3. Zauważmy, że [tex]n\overline{y}=y_1+y_2+y_3+\ldots+y_n[/tex]. Wtedy
[tex]\frac{1}{n}\left(n+1-2\left(\frac{ny_1+(n-1)y_2+(n-2)y_3+\ldots+y_n}{n\overline{y}}\right)\right)=\\=\frac{1}{n}\left(\frac{(n+1)(y_1+y_2+y_3+\ldots+y_n)-2ny_1-2(n-1)y_2-2(n-2)y_3-\ldots-2y_n}{n\overline{y}}\right)=\\=\frac{(-n+1)y_1+(-n+3)y_2+(-n+5)y_3+\ldots+(n-3)y_{n-1}+(n-1)y_n}{n^2\overline{y}}=G[/tex].

Odpowiedzi dla LO

Zad. 1. Średnia arytmetyczna zarobków to [tex]\overline{y}=\frac{20\cdot (2000+2500+3500+4000+6000)}{100}=3600[/tex], a współczynnik Giniego wynosi [tex]G=\frac{1}{100^2\cdot 3600}((-99-97- \ldots -61)\cdot 2000+(-59-57- \ldots -21)\cdot 2500 +\\+(-19-17- \ldots+17+19)\cdot
3500+(21+23+ \ldots +59)\cdot 4000+\\+(61+63+ \ldots +99)\cdot 6000)=\frac{19}{90}\approx 0,2111[/tex].

Zad. 2. W takim przypadku mamy y1=y2=...=yn-1=0 oraz yn=y. Średnia arytmetyczna zarobków wynosi [tex]\overline{y}=\frac{y}{n}[/tex]. Współczynnik Giniego wynosi [tex]G=\frac{0+(n-1)y}{n^2\frac{y}{n}}=\frac{n-1}{n}[/tex]. Zauważmy, że dla dużych n wartość ta jest bliska 1. Nierównomierność rozkładu dochodów jest bardzo duża, ponieważ jedna osoba gromadzi cały dochód, a pozostałe nie mają go wcale.

Zad. 3. Wystarczy sprowadzić oba ułamki do wspólnego mianownika i dokonać przekształceń analogicznie do rozwiązania zadania 3 dla gimnazjów.

 

Powrót na górę strony