Statistická analýza
Vyhodnocení přesnosti měření pH pufrového roztoku
Statistická analýza je nezbytná pro vyhodnocení kvality a spolehlivosti experimentálních dat. V tomto příkladu analyzujeme sérii měření pH a určíme nejistotu výsledku pomocí základních statistických metod.
Úvod do problému
Při měření fyzikálních veličin vždy dochází k náhodným chybám. Statistická analýza nám pomáhá:
- Určit nejlepší odhad měřené veličiny
- Kvantifikovat nejistotu měření
- Identifikovat a vyloučit hrubé chyby
- Posoudit kvalitu experimentální metody
Aritmetický průměr: $\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i$
Směrodatná odchylka: $s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2}$
Směrodatná chyba průměru: $s_{\bar{x}} = \frac{s}{\sqrt{n}}$
Experimentální data
Deset po sobě jdoucích měření pH pufrového roztoku (teoretická hodnota pH = 7.00):
Měření č. | pH [-] | Odchylka od průměru | (Odchylka)² |
---|---|---|---|
1 | 7.02 | +0.01 | 0.0001 |
2 | 6.98 | -0.03 | 0.0009 |
3 | 7.01 | 0.00 | 0.0000 |
4 | 6.99 | -0.02 | 0.0004 |
5 | 7.03 | +0.02 | 0.0004 |
6 | 7.00 | -0.01 | 0.0001 |
7 | 6.97 | -0.04 | 0.0016 |
8 | 7.02 | +0.01 | 0.0001 |
9 | 7.01 | 0.00 | 0.0000 |
10 | 7.04 | +0.03 | 0.0009 |
Výpočet základních statistik
Krok 1: Aritmetický průměr
Krok 2: Směrodatná odchylka
Krok 3: Směrodatná chyba průměru
Statistické vyhodnocení
Statistická charakteristika | Hodnota | Interpretace |
---|---|---|
Průměr $\bar{x}$ | 7.007 pH | Nejlepší odhad skutečné hodnoty |
Medián | 7.005 pH | Prostřední hodnota (5. a 6. hodnota) |
Směrodatná odchylka $s$ | 0.022 pH | Rozptyl jednotlivých měření |
Směrodatná chyba $s_{\bar{x}}$ | 0.007 pH | Nejistota průměru |
Variační koeficient | 0.31% | Relativní rozptyl dat |
Test normality a odlehlých hodnot
Grubbs test pro odlehlé hodnoty
Testujeme, zda nejextrémnější hodnoty (6.97 a 7.04) jsou statisticky významně odlišné:
$$G = \frac{|x_{ext} - \bar{x}|}{s}$$
Pro 6.97: $G_1 = \frac{|6.97 - 7.007|}{0.022} = 1.68$
Pro 7.04: $G_2 = \frac{|7.04 - 7.007|}{0.022} = 1.50$
Kritická hodnota pro n=10 a α=0.05 je G_krit = 2.29. Obě hodnoty jsou pod kritickou hodnotou, tudíž žádné odlehlé hodnoty nebyly detekovány.
Grafické znázornění
Interval spolehlivosti
Pro 95% interval spolehlivosti použijeme t-rozdělení:
$$\bar{x} \pm t_{0.025,9} \cdot s_{\bar{x}}$$
kde $t_{0.025,9} = 2.262$ (tabulková hodnota)
Interaktivní kalkulátor
Statistická analýza dat
Výsledek analýzy
pH pufrového roztoku: 7.007 ± 0.016 (95% interval spolehlivosti)
Směrodatná odchylka: 0.022 pH
Přesnost měření: ±0.31%
Závěr: Měření je v souladu s teoretickou hodnotou pH = 7.00
Poznámky k statistické analýze
- Počet měření: Pro spolehlivou statistiku je potřeba alespoň 5-10 měření
- Normální rozdělení: Základní statistické metody předpokládají normální rozdělení dat
- Odlehlé hodnoty: Mohou významně ovlivnit průměr a směrodatnou odchylku
- Interval spolehlivosti: Rozsah, ve kterém se s danou pravděpodobností nachází skutečná hodnota