Kod kota

Autor:

Krzysztof Omiljanowski

pracownik IM UWr

Poziom edukacyjny:

szkoła podstawowa

gimnazjum

szkoła średnia z maturą

szkoła profilowana zawodowa

szkoła wyższa

Dział matematyki:

kombinatoryka

zoom

Kot na ekranie to nic innego jak kolekcja zamalowanych kwadratów (pikseli). W powiększeniu widać to wyraźnie - wypróbuj na rysunku obok. Jak kodować takie obrazki? Tym zajmiemy się poniżej. Dla ułatwienia ograniczymy się do wersji czarno-białej i na początek rozważać będziemy ekrany o bardzo małej rozdzielczości (4×4).

Biało-czarny obrazek na 16 kratkach (pikselach) można zakodować binarnie (tzn. używając dwóch symboli):

c c b b b b c c b c c c b c b b
Wypisujemy po kolei kolory poszczególnych kratek (b - białe, c - czarne).
To najprostszy sposób kodowania.

Inny sposób kodowania, zwany metodą RLE (Run Length Encoding), ilustrują przykłady:

2c 4b 2c 1b 3c 1b 1c 2b

1b 1c 2b 4c 2b 5c 1b

3c 3b 3c 3b 3c 1b

3c 2b 3c 1b 2c 1b 4c

5c 6b 5c

1b 1c 2b 2c 6b 4c

W metodzie RLE kody są różnej długości. Powiemy, że pierwszy ma długość 16 (8 par: liczba i litera), kod 5c 6b 5c ma długość 6, a kod 12b 4c ma długość 4.
Uwaga! W długości kodu nie zliczamy cyfr, tylko liczby.

K O D O W N I K 4×4
(klikając, zmienisz
zaczernienie pól)

Ćwiczenie 1. Podaj kody i ich długości:

Ćwiczenie 2. Podaj kody i ich długości:
a) biały kwadrat z jedną czarną przekątną,
b) biały kwadrat z dwoma przekątnymi,
c) zaczerniony obwód kwadratu.

Ćwiczenie 3. Jakie kody są najkrótsze? Wypisz je wszystkie.

Ćwiczenie 4. Jakie kody są najdłuższe? Wypisz je wszystkie.

Ćwiczenie 5. Wypisz wszystkie kody długości 4.

Dość trudno wypisać wszystkie kody długości 6 - jest ich sporo. Spróbuj zacząć je wypisywać.
Widać, że trudność sprawia zadbanie o to, by wypisać je wszystkie i by żadne kody się nie powtarzały.
Można to zrobić schematycznie, na przykład tak

Podobnie schematycznie można przedstawić wszystkie kody długości 8.
(Nim klikniesz, spróbuj zrobić to samodzielnie.) Na przykład tak

Uwaga! Chyba jest już jasne, że zamiast o kodach obrazka 4×4 można myśleć o kodach paska złożonego z 16 kwadratów:

1c 1b 3c 4b 1c 1b 3c 1b 1c

Metoda RLE jest nieco bardziej skomplikowana niż kodowanie binarne.
Dla niektórych obrazków kod RLE jest dłuższy (nawet dwa razy dłuższy), a dla innych krótszy od kodu binarnego, w którym kod każdego obrazka ma długość 16 (na ekranie 4×4).
Czy jest 'opłacalne' stosowanie tego bardziej skomplikowanego sposobu kodowania? Jak zmierzyć tę 'opłacalność'?

Można ją zmierzyć porównując średnią długość kodu w obu sposobach kodowania.
W sposobie binarnym jest równa 16, a w metodzie RLE?

Twierdzenie 1. Dla obrazków złożonych z 16 kwadratów.
W metodzie RLE średnia długość kodu jest równa 17.

Ogólnie jest podobnie.

Twierdzenie 1'. Dla obrazków złożonych z n kwadratów.
W metodzie RLE średnia długość kodu jest równa n + 1.

(trudny, dla znających kombinatorykę)

(dla każdego)

Zatem metoda RLE jest w pewnym sensie gorsza niż metoda binarna. Kod losowo wybranego obrazka-paska będzie średnio o jeden dłuższy niż kod binarny. Nasuwa się naturalne pytanie:
Dlaczego więc stosuje się metodę RLE?

Można odpowiedzieć tak: obrazki zrobione 'ręką' człowieka nie są losowe, grafiki mają na ogół bardzo dużo obszarów tego samego koloru. Wtedy kod RLE jest istotnie krótszy. Inaczej jest w przypadku zdjęć - wtedy nie warto stosować tej metody.

K O D O W N I K 5×5
(klikając, zmienisz
zaczernienie pól)

Zobaczmy jeszcze pewną modyfikację zapisu metody RLE, na przykładzie obrazków na ekranie 5×5 (patrz obok).

Ćwiczenie 8. Podaj kody i ich długości:
a) biały kwadrat z jedną czarną przekątną,
b) biały kwadrat z dwoma przekątnymi,
c) zaczerniony obwód kwadratu.

Ćwiczenie 9. Jakie kody są najkrótsze? Wypisz je wszystkie.

Ćwiczenie 10. Jakie kody są najdłuższe? Wypisz je wszystkie.

Kody niektórych obrazków są bardzo regularne, nasuwa się pomysł, by je upraszczać, by zapisywać je tak, jakby to było potęgowanie, na przykład tak:

c⁴ b³ c² b³ c² b³ c² b³ c² b¹ = c⁴ ( b³ c² )⁴ b¹ ,
c⁴ b³ c² b³ c² b³ c² b³ c² b¹ = c³ ( c¹ b³ c¹ )⁴ c¹ b¹ ,
c¹ b² c² b³ c¹ b² c² b³ c¹ b² c² b³ c¹ = ( c¹ b² c² b³ )³ c¹ ,
b¹ c¹ b² c¹ b² c¹ b² c³ c¹ b² c¹ b² c¹ b² c³ = b¹ ( ( c¹ b² )³ c³ )² ,

Tak można bardzo prosto zakodować szachownicę: b¹ ( c¹ b¹ )¹² i inne 'rytmiczne' obrazki (przy czym trzeba pamiętać, że nie wolno stosować przemienności mnożenia!).
Nie jest to już metoda RLE ale 'przygrywka' do innych metod kodowania, takich jak LZ (skrót od nazwisk autorów: A. Lempel, J. Ziv). Wykracza to jednak poza ramy tego wstępnego artykułu.

Literatura
A. Drozdek, Wprowadzenie do kompresji danych, WNT, Warszawa 1999 r.

Impreza miesiąca

Arcydzieło miesiąca

Cytat miesiąca

Bohater miesiąca

Bryła miesiąca

Pytanie miesiąca

Dowcip miesiąca