Statistická analýza

Vyhodnocení přesnosti měření pH pufrového roztoku

Statistická analýza je nezbytná pro vyhodnocení kvality a spolehlivosti experimentálních dat. V tomto příkladu analyzujeme sérii měření pH a určíme nejistotu výsledku pomocí základních statistických metod.

Úvod do problému

Při měření fyzikálních veličin vždy dochází k náhodným chybám. Statistická analýza nám pomáhá:

Základní statistické charakteristiky:
Aritmetický průměr: $\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i$
Směrodatná odchylka: $s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2}$
Směrodatná chyba průměru: $s_{\bar{x}} = \frac{s}{\sqrt{n}}$

Experimentální data

Deset po sobě jdoucích měření pH pufrového roztoku (teoretická hodnota pH = 7.00):

Měření č. pH [-] Odchylka od průměru (Odchylka)²
1 7.02 +0.01 0.0001
2 6.98 -0.03 0.0009
3 7.01 0.00 0.0000
4 6.99 -0.02 0.0004
5 7.03 +0.02 0.0004
6 7.00 -0.01 0.0001
7 6.97 -0.04 0.0016
8 7.02 +0.01 0.0001
9 7.01 0.00 0.0000
10 7.04 +0.03 0.0009

Výpočet základních statistik

Krok 1: Aritmetický průměr

$$\bar{x} = \frac{7.02 + 6.98 + 7.01 + 6.99 + 7.03 + 7.00 + 6.97 + 7.02 + 7.01 + 7.04}{10}$$ $$\bar{x} = \frac{70.07}{10} = 7.007 \text{ pH}$$

Krok 2: Směrodatná odchylka

$$s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}} = \sqrt{\frac{0.0045}{9}} = \sqrt{0.0005} = 0.022 \text{ pH}$$

Krok 3: Směrodatná chyba průměru

$$s_{\bar{x}} = \frac{s}{\sqrt{n}} = \frac{0.022}{\sqrt{10}} = \frac{0.022}{3.16} = 0.007 \text{ pH}$$

Statistické vyhodnocení

Statistická charakteristika Hodnota Interpretace
Průměr $\bar{x}$ 7.007 pH Nejlepší odhad skutečné hodnoty
Medián 7.005 pH Prostřední hodnota (5. a 6. hodnota)
Směrodatná odchylka $s$ 0.022 pH Rozptyl jednotlivých měření
Směrodatná chyba $s_{\bar{x}}$ 0.007 pH Nejistota průměru
Variační koeficient 0.31% Relativní rozptyl dat

Test normality a odlehlých hodnot

Grubbs test pro odlehlé hodnoty

Testujeme, zda nejextrémnější hodnoty (6.97 a 7.04) jsou statisticky významně odlišné:

Grubbs statistika:
$$G = \frac{|x_{ext} - \bar{x}|}{s}$$
Pro 6.97: $G_1 = \frac{|6.97 - 7.007|}{0.022} = 1.68$
Pro 7.04: $G_2 = \frac{|7.04 - 7.007|}{0.022} = 1.50$

Kritická hodnota pro n=10 a α=0.05 je G_krit = 2.29. Obě hodnoty jsou pod kritickou hodnotou, tudíž žádné odlehlé hodnoty nebyly detekovány.

Grafické znázornění

Interval spolehlivosti

Pro 95% interval spolehlivosti použijeme t-rozdělení:

95% interval spolehlivosti:
$$\bar{x} \pm t_{0.025,9} \cdot s_{\bar{x}}$$
kde $t_{0.025,9} = 2.262$ (tabulková hodnota)
$$CI_{95\%} = 7.007 \pm 2.262 \times 0.007 = 7.007 \pm 0.016$$ $$CI_{95\%} = [6.991; 7.023] \text{ pH}$$

Interaktivní kalkulátor

Statistická analýza dat






Výsledek analýzy

pH pufrového roztoku: 7.007 ± 0.016 (95% interval spolehlivosti)

Směrodatná odchylka: 0.022 pH

Přesnost měření: ±0.31%

Závěr: Měření je v souladu s teoretickou hodnotou pH = 7.00

Poznámky k statistické analýze