Interpolace a aproximace

Metody zpracování dat pro získání kontinuálních funkcí z diskrétních bodů

Co je interpolace a aproximace?

Představte si, že máte naměřená data v několika bodech a potřebujete odhadnout hodnoty mezi těmito body nebo najít obecný trend. Interpolace a aproximace jsou matematické metody, které nám pomohou vytvořit spojité funkce z diskrétních dat.

INTERPOLACE

Procházíme přesně všemi danými body

f(xi) = yi pro všechna i

APROXIMACE

Hledáme nejlepší celkový trend

Minimalizujeme celkovou chybu

Klíčový rozdíl

Interpolace přesně prochází všemi body, aproximace (regrese) hledá nejlepší celkový fit pro celý dataset. Interpolace je vhodná pro přesná data, aproximace pro data s chybami a pro hledání trendů.

Vizuální srovnání přístupů

1. Lineární interpolace

Princip: Nejjednodušší metoda interpolace. Spojujeme sousední body přímkami. Je to ekvivalent "spojování teček" rovnými čarami.

Matematický vzorec

Pro body (x₀, y₀) a (x₁, y₁): $$ y = y_0 + (y_1 - y_0) \cdot \frac{x - x_0}{x_1 - x_0} $$

Postup výpočtu:

  1. Najdeme dva nejbližší body (x₀, y₀) a (x₁, y₁)
  2. Použijeme vzorec pro přímku procházející těmito body
  3. Vypočteme hodnotu y pro požadované x

✅ Výhody:

  • Jednoduchost: Rychlá implementace a výpočet
  • Stabilita: Vždy funguje pro dva body
  • Monotónnost: Zachovává monotónnost dat

❌ Nevýhody:

  • Nespojitá derivace: "Zlomy" v bodech
  • Není hladká: Viditelné přechody mezi úseky
  • Omezená přesnost: Jen pro lokální aproximace

Kalkulátor lineární interpolace

Vizualizace metody

2. Polynomiální interpolace

Princip: Pro n bodů hledáme polynom stupně n-1, který prochází všemi body. Nejčastěji používáme Lagrangeovu metodu.

Lagrangeova metoda

Obecný vzorec: $$ L(x) = \sum_{i=0}^{n-1} y_i \cdot l_i(x) $$ kde $$ l_i(x) = \prod_{\substack{j=0 \\ j \neq i}}^{n-1} \frac{x - x_j}{x_i - x_j} $$

Vlastnosti polynomiální interpolace:

  • Jednoznačnost: Pro n bodů existuje jediný polynom stupně n-1
  • Hladkost: Polynom je nekonečněkrát diferencovatelný
  • Globální charakter: Změna jednoho bodu ovlivní celý polynom

✅ Výhody:

  • Hladká křivka: Nekonečněkrát diferencovatelná
  • Jednoznačnost: Vždy existuje jediné řešení
  • Analytická forma: Máme explicitní vzorec

❌ Nevýhody:

  • Rungeův fenomén: Oscilace na krajích intervalu
  • Vysoký stupeň: Pro více bodů nestabilní
  • Globální povaha: Změna jednoho bodu ovlivní vše

Příklad pro 3 body

Body: (0,1), (1,4), (2,1)

Polynom 2. stupně: \(y = -2x^2 + 5x + 1\)

Ověření: f(0)=1, f(1)=4, f(2)=1 ✓

Vizualizace metody

3. Kubické spliny

Princip: Nejlepší kompromis mezi hladkostí a stabilitou. Používáme kubické polynomy po částech s podmínkami spojitosti derivací.

Podmínky pro kubický spline

Na každém intervalu [xᵢ, xᵢ₊₁]: $$ S_i(x) = a_i + b_i(x - x_i) + c_i(x - x_i)^2 + d_i(x - x_i)^3 $$

Podmínky spojitosti:

  1. Interpolace: S(xᵢ) = yᵢ pro všechna i
  2. Spojitost funkce: S je spojitá
  3. Spojitost 1. derivace: S' je spojitá
  4. Spojitost 2. derivace: S'' je spojitá

✅ Výhody splinů:

  • Minimální oscilace: Nejhladší možná křivka
  • Lokální charakter: Změna bodu ovlivní jen okolí
  • Numerická stabilita: Dobře podmíněná úloha
  • Přirozený vzhled: Křivky vypadají "přirozeně"

Použití v praxi

  • CAD systémy: Návrh křivek a povrchů
  • Animace: Hladké trajektorie
  • Vědecké aplikace: Interpolace experimentálních dat
  • Grafika: Vyhlazování křivek

Srovnání s lineární interpolací

4. Lineární regrese (metoda nejmenších čtverců)

Princip: Hledáme přímku, která nejlépe popisuje trend v datech. Minimalizujeme součet čtverců odchylek od této přímky.

Matematické odvození

Hledáme přímku: \(y = ax + b\)

Minimalizujeme: \(\sum_{i=1}^{n} (y_i - (ax_i + b))^2\)

Řešení: $$ a = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{n\sum x_i^2 - (\sum x_i)^2} $$ $$ b = \frac{\sum y_i - a\sum x_i}{n} $$

Korelační koeficient

Míra lineární závislosti: $$ r = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{\sqrt{(n\sum x_i^2 - (\sum x_i)^2)(n\sum y_i^2 - (\sum y_i)^2)}} $$

Interpretace: r ∈ [-1, 1], |r| > 0.8 znamená silnou lineární závislost

Kalkulátor lineární regrese

Zadej body (x,y) oddělené čárkami a středníky:

Vizualizace metody

5. Polynomiální a exponenciální regrese

Princip: Rozšíření lineární regrese pro složitější trendy. Používáme vyšší stupně polynomů nebo exponenciální funkce.

Typy regresí

Polynomiální regrese

Obecný tvar: \(y = a_0 + a_1x + a_2x^2 + \ldots + a_nx^n\)

Použití: Data s více lokálními extrémy, křivky s inflexními body

Exponenciální regrese

Exponenciální: \(y = ae^{bx}\)

Mocninná: \(y = ax^b\)

Použití: Růstové procesy, rozpadové procesy, biologické modely

Koeficient determinace R²

Kvalita fitu: $$ R^2 = 1 - \frac{\sum(y_i - \hat{y}_i)^2}{\sum(y_i - \bar{y})^2} $$

Interpretace: R² ∈ [0, 1], vyšší hodnoty = lepší fit

Volba stupně polynomu

  • Stupeň 1: Lineární trend (přímka)
  • Stupeň 2: Parabola (jeden extrém)
  • Stupeň 3: Kubika (inflexní bod, dva extrémy)
  • Vyšší stupně: Pozor na přeučení (overfitting)!

Srovnání lineární a kvadratické regrese

6. Srovnání metod a praktické použití

Kdy použít kterou metodu?

Interpolace - kdy použít?

  • Máme přesné hodnoty v několika bodech
  • Chceme odhadnout hodnoty mezi měřeními
  • Data jsou bez chyb nebo s malými chybami
  • Příklady: tabulky funkcí, technické grafy, CAD systémy

Aproximace - kdy použít?

  • Máme velký dataset s experimentálními chybami
  • Chceme najít obecný trend v datech
  • Potřebujeme model pro předpovědi
  • Příklady: ekonomická data, biologické výzkumy, fyzikální experimenty

Srovnávací tabulka metod

MetodaTypVýhodyNevýhodyTypické použití
Lineární interpolaceInterpolaceJednoduchá, rychláNení hladkáZákladní odhady
Polynomiální interpolaceInterpolaceHladká křivkaOscilace, nestabilitaMálo bodů (< 6)
Kubické splinyInterpolaceHladké, stabilníSložitější výpočetTechnické aplikace
Lineární regreseAproximaceRobustní, interpretovatelnáPouze lineární trendyZákladní analýzy
Polynomiální regreseAproximaceSložitější trendyPřeučení, nestabilitaNelineární závislosti

Praktická doporučení

💡 Tip pro praxi
Začněte jednoduše, postupně přidávejte složitost
⚠️ Pozor
Vysoký stupeň ≠ lepší výsledek
📊 Validace
Vždy ověřte výsledky na testovacích datech

Rozhodovací strom pro výběr metody

  1. Máte přesná data bez chyb? → Interpolace
  2. Máte experimentální data s chybami? → Aproximace (regrese)
  3. Pro interpolaci: Kolik bodů máte?
    • 2 body → Lineární interpolace
    • 3-5 bodů → Polynomiální interpolace
    • Více bodů → Kubické spliny
  4. Pro regresi: Jaký trend vidíte?
    • Lineární → Lineární regrese
    • Zakřivený → Polynomiální regrese
    • Exponenciální růst → Exponenciální regrese