Tipovi grešaka

Sadržaj

1.2. Tipovi grešaka#

U ovoj cjelini ćemo detaljnije opisati nekoliko vrsta grešaka koje se događaju prilikom numeričkog rješavanja nekog problema.

Greške modela#

Pojave iz stvarnog svijeta su često previše komplicirane da bismo ih u potpunosti i savršeno točno opisali matematičkim modelom (npr. diferencijalnim jednadžbama, sustavima (ne)linearnih jednadžbi, kao probleme optimizacije, itd.). S druge strane, čak i ako imamo matematički model koji dobro opisuje fizikalnu situaciju, on može biti previše složen da bismo ga bili u stanju riješiti, pa ga moramo dodatno pojednostavniti.

Tako nastaju greške modela:

Zbog zanemarivanja utjecaja nekih sila.
- Na primjer, zanemarivanje utjecaja otpora zraka ili trenja.
Zbog zamjene kompliciranog modela jednostavnijim.
- Na primjer, sustavi nelinearnih običnih ili parcijalnih diferencijalnih jednadžbi se lineariziraju, da bi se dobilo barem približno rješenje.
Zbog upotrebe modela u graničnim slučajevima.
- Na primjer, kod matematičkog njihala se \(\sin(x)\) aproksimira s \(x\), što vrijedi samo za male kutove.

Primjer 1.5

Jedan jednostavni primjer greške modela je zanemarivanje utjecaja otpora zraka kod kosog hica.

Ako projektil ispaljujemo prema cilju:

nekom početnom brzinom \(v_0\),
pod nekim kutem \(\alpha\), obzirom na horizontalnu ravninu,

onda elementarni račun (izvedite sami, srednjoškolska fizika!) daje da će projektil pod utjecajem gravitacije doletjeti do udaljenosti

\[ x_{\max} = \frac{v_0^2 \sin(2 \alpha)}{g}. \]

Uvrstimo li stvarne podatke za haubicu kalibra 155 mm, model H155 M65:

Početna brzina ispaljene granate je \(v_0\) = 564 m/s.
Uz gornji izračun, maksimalni domet se postiže za kut \(\alpha = 45^o = \pi/4\) i iznosi \(x_{\max} = \frac{564^2 \sin(\pi/2)}{9.81} \approx 32 425.69\) m.
Stvarni, eksperimentalno utvrđeni maksimalni domet postiže se za kut \(\alpha = 45^o 10'\) i
iznosi samo \(x_{\max} = 14 854\) m.

Ovako dramatična razlika nastala je zbog zanemarivanja otpora zraka - naš model i formula koju smo izveli ne odgovaraju stvarnosti gdje efekt otpora zraka ima veliki utjecaj.

Greške u ulaznim podacima#

Greške u ulaznim podacima javljaju se zbog nemogućnosti ili besmislenosti točnog mjerenja. Na primjer, tjelesna temperatura se obično mjeri na desetinku stupnja Celzija točno. Pacijent je podjednako loše ako ima temperaturu \(39.5^o\)C ili \(39.513462^o\)C.

Oprez!

Mogu li male greške u ulaznim podacima dovesti do jako velike greške u izlaznim podacima, odnosno, u rezultatu dobivenom na kraju računa?

Nažalost, MOGU! Takvi problemi zovu se loše uvjetovani problemi.

Sada ćemo vidjeti jedan primjer loše uvjetovanog problema, a kasnije ćemo preciznije definirati sam pojam uvjetovanosti.

Primjer 1.6

Zamislimo da se neki problem svodi na rješavanje sustava od 2 linearne jednadžbe s 2 nepoznanice čiji koeficijenti dolaze iz mjerenja.

Ako ne napravimo nikakvu grešku u mjerenju, „idealni” sustav bi glasio

\[\begin{split} \begin{align*} 2x + 6y &= 8, \\ 2x + 6.0001 y &= 8.0001. \end{align*}\end{split}\]

Uz minimalne greške u mjerenju koeficijenata druge jednadžbe, zamislimo da izmjereni sustav glasi

\[\begin{split} \begin{align*} 2x + 6y &= 8, \\ 2x + 5.9999 y &= 8.0002. \end{align*}\end{split}\]

Uočimo da je greška u mjerenju samo \(\approx 10^{-4}\). Da li je i razlika u rješenjima \(x\) i \(y\) prvog i drugog sustava također samo \(\approx 10^{-4}\)?

Ne!

Rješenje prvog sustava je \(x = 1\), \(y = 1\).
Rješenje drugog sustava je \(x = 10\), \(y = -2\).

Rješenje drugog sustava se drastično razlikuje od rješenja prvog, iako imaju gotovo identične koeficijente.

Ovo je tipičan primjer tzv. loše uvjetovanog problema: vrlo male promjene ulaznih podataka imaju za posljedicu velike promjene izlaznih podataka. Uzroke loše uvjetovanosti za problem rješavanja sustava linearnih jednadžbi ćemo detaljno razmatrati kasnije. Zasad dajemo samo intuitivno geometrijsko opravdanje: rješenje sustava dobivamo kao presjek dvaju pravaca u ravnini određenih jednadžbama sustava. Na slici lijevo su nacrtana dva (!) pravca koji odgovaraju jednadžbama prvog sustava i označena je točka njihovog presjeka, a na slici desno je isto napravljeno za drugi sustav. U oba slučaju se ti pravci gotovo podudaraju, pa se mjesto presjeka može drastično promijeniti samo malom promjenom koeficijenata.

Greške numeričkih metoda#

Greške numeričkih metoda najčešće nastaju kad se nešto beskonačno zamjenjuje nečim konačnim. Razlikujemo dvije kategorije:

Greške diskretizacije.
- Kontinuum (neprebrojiv skup) zamjenjujemo konačnim diskretnim skupom točaka.
  
  Na primjer, rješenje problema \(\min_{x \in [a, b]} f(x)\) aproksimiramo sa \(\min_{x \in \{x_1, x_2, \ldots, x_n\}} f(x)\) za neke \(x_1, \ldots, x_n \in [a, b]\).
- Beskonačno malu veličinu \(h\) ili \(\varepsilon \to 0\) zamijenjujemo nekim „konačno” malim brojem.
  
  Na primjer, \(f'(t)\) aproksimiramo sa \(\frac{f(t+h) - f(t)}{h}\) za neki mali \(h\).
Greške odbacivanja.
- Iterativni proces koji bi u limesu davao točno rješenje zaustavljamo nakon konačno mnogo koraka.
- Beskonačni niz ili red zamjenjujemo konačnim nizom ili parcijalnom sumom, tj. odbacujemo ostatak niza ili reda.

Pokažimo primjerom greške odbacivanja koje nastaju kada koristimo Taylorov red u svrhu računanja aproksimacije vrijednosti funkcije u nekoj točki.

Primjer 1.7

Za dovoljno glatku funkciju \(f\), Taylorov red oko točke \(x_0\)

\[ f(x) = \sum_{k = 0}^{\infty} \frac{f^{(k)}(x_0)}{k!} (x - x_0)^k\]

možemo aproksimirati Taylorovim polinomom

\[ p(x) = \sum_{k = 0}^{n} \frac{f^{(k)}(x_0)}{k!} (x - x_0)^k,\]

pri čemu smo napravili grešku odbacivanja \(R_{n+1}(x) = f(x) - p(x)\) za koju vrijedi:

\[ R_{n + 1}(x) = \frac{f^{(n + 1)}(\xi)}{(n + 1)!} (x - x_0)^{n + 1}.\]

Ovdje je \(\xi\) neki broj između \(x_0\) i \(x\).

Funkcije \(e^x\) i \(\sin(x)\) imaju Taylorove redove oko točke \(x_0=0\) koji konvergiraju za svaki \(x \in \R\). Te redove aproksimiramo sa:

\[ e^x \approx \displaystyle \sum_{k = 0}^{n} \frac{x^k}{k!}, \qquad \sin x \approx \displaystyle \sum_{k = 0}^{n} \frac{(-1)^k x^{2k + 1}}{(2k + 1)!}.\]

Kako znamo izračunati \(n\)-te derivacije: \((e^{x})^{(n)} = e^x\), \((\sin x)^{(n)} = \sin \Big(x + \frac{n \pi}{2} \Big)\), za greške odbacivanja vrijedi

\[ R_{n + 1}^{\text{exp}}(x) = \frac{e^{\xi} x^{n + 1}}{(n + 1)!}, \qquad R_{2n + 3}^{\text{sin}}(x) = \frac{\sin \big( \xi + \frac{2n + 3}{2} \, \pi \big) \, x^{2n + 3}} {(2n + 3)!}.\]

Pretpostavimo sada da je \(x > 0\). Iz \(\xi \leq x\) slijedi \(e^\xi \leq e^x\), pa dobivamo

\[ |R_{n + 1}^{\text{exp}}(x)| \leq \frac{e^x x^{n + 1}}{(n + 1)!}, \qquad |R_{2n + 3}^{\text{sin}}(x)| \leq \frac{x^{2n + 3}}{(2n + 3)!}.\]

Pretpostavimo da zbrajamo članove reda sve dok apsolutna vrijednost člana ne padne ispod zadane točnosti \(\varepsilon > 0\), tj. stanimo kada je \(\left|\frac{x^{n+1}}{(n+1)!}\right| < \varepsilon\) za \(e^x\), odnosno, \(\left|\frac{x^{2n+3}}{(2n+3)!}\right| < \varepsilon\) za \(\sin(x)\). Tada za greške odbacivanja vrijedi

\[ |R_{n + 1}^{\text{exp}}(x)| \leq e^x \varepsilon, \qquad |R_{2n + 3}^{\text{sin}}(x)| \leq \varepsilon,\]

to jest

\[ \frac{|e^x - p^{\text{exp}}(x)|}{e^x} \leq \varepsilon, \qquad |\sin(x) - p^{\text{sin}}(x)| \leq \varepsilon.\]

Kasnije ćemo vidjeti da to znači da u prvom slučaju osiguravamo malu relativnu, a u drugom malu apsolutnu grešku. Vidimo da izborom dovoljno malenog \(\varepsilon\) možemo po volji točno aproksimirati vrijednost funkcija \(e^x\) i \(\sin(x)\) uzimanjem dovoljnog broja članova Taylorovog polinoma.

Provjerimo kako teorija iz gornjeg primjera funkcionira u aritmetici računala.

Izračunajmo prvo \(e^{12 \pi}\) uz toleranciju \(\varepsilon = 5 \cdot 10^{-16}\).

Funkcija exp iz Pythona vraća (egzaktnu) vrijednost: 2.3578503968558192e+16.
Vrijednost izračunata pomoću Taylorovog polinoma:    2.3578503968558192e+16.
Apsolutna greška: 0.0000000000000000e+00.
Relativna greška: 0.0000000000000000e+00.
Taylorov polinom koristi 131 članova.
Najveći član reda (po modulu): 1.53290e+15.
Teorija daje da je greška odbacivanja manja od: 1.17893e+01.

_images/e8904a1a93d71e186c0d16980b02550a9a5c4aaf254da475ed63aee9368e67d6.png

Vidimo da je pomoću Taylorovog reda računalo uspjelo točno izračunati baš sve znamenke od \(e^{12 \pi}\). Uočimo da su svi članovi reda pozitivni brojevi; na slici lijevo vidimo da članovi prvo monotono rastu sve do \(\approx 1.5\cdot 10^{15}\) pa monotono padaju. Na slici desno vidimo da parcijalne sume monotono rastu.

Ponovimo sada numerički eksperiment za \(\sin(12 \pi)\) uz toleranciju \(\varepsilon = 5 \cdot 10^{-16}\).

Funkcija sin iz Pythona vraća (egzaktnu) vrijednost: -1.4695761589768238e-15.
Vrijednost izračunata pomoću Taylorovog polinoma:    -4.2275034358615959e-02.
Apsolutna greška: 4.2275034358614488e-02.
Relativna greška: 2.8766821032295473e+13.
Taylorov polinom koristi 65 članova.
Najveći član reda (po modulu): 1.53290e+15.
Teorija daje da je greška odbacivanja manja od: 5.00000e-16.

_images/35249ce5f2bada02171fcf90ad37b5afc20b198ebd5675dfd87528d353a73846.png

Za razliku od sume za eksponencijalnu funkciju, Taylorov polinom za sinus je dao potpuno pogrešan rezultat! Umjesto očekivane vrijednosti jako blizu nule, dobili smo \(\approx -4.23 \cdot 10^{-2}\), što je u realnoj aritmetici dvostruke točnosti (double) vrlo daleko od nule. Problem je nastao u sljedećem: u sumi se pojavljuju i pozitivni i negativni članovi pri čemu su neki od njih po modulu vrlo veliki (do \(\approx 10^{15}\), vidi sliku lijevo), a konačni rezultat treba ispasti jako maleni broj (\(\approx 0\)). Drugim riječima, konačni rezultat se dobije oduzimanjem bliskih jako velikih brojeva. Objasnit ćemo kasnije zbog čega je ovo veliki problem u aritmetici računala i prototip pojave koja se zove katastrofalno kraćenje.

Velika greška koju smo dobili u primjeru sa sinusom dakle nije posljedica grešaka numeričke metode niti grešaka odbacivanja. Iz (korektne!) teorijske analize koju smo proveli slijedi da bi apsolutna greška \(|\sin(x) - p^{\text{sin}}(x)|\) trebala biti malena (manja od \(5 \cdot 10^{-16}\)). Mogli smo uzeti tisuće ili milijune članova reda za sinus i ponovno bismo dobili isto u eksperimentu na računalu. Neočekivani pogrešni rezultat u ovom slučaju je posljedica grešaka aritmetike računala koje proučavamo u sljedećoj cjelini.