Matplotlib to potężna biblioteka do kreślenia używana w języku programowania Python. Zapewnia zorientowany obiektowo interfejs API do osadzania wykresów w aplikacjach korzystających z zestawów narzędzi GUI ogólnego przeznaczenia, takich jak Tkinter, wxPython lub Qt. Jednym z ważnych narzędzi udostępnianych przez Matplotlib jest możliwość tworzenia wykresu przedziału ufności.
Przedział ufności, jako termin statystyczny, odnosi się do stopnia pewności metody pobierania próbek. Poziom ufności mówi, jak bardzo możesz być pewien, wyrażony w procentach. Na przykład 99% poziom ufności sugeruje, że każde oszacowanie prawdopodobieństwa będzie prawdopodobnie dokładne w 99% przypadków.
Tworzenie wykresu przedziału ufności za pomocą Matplotlib
Tworzenie wykresu przedziału ufności w Matplotlib obejmuje kilka kroków. Zagłębmy się w wyjaśnienie odpowiedniego kodu Pythona, aby wykonać następujące kroki:
Najpierw musimy zaimportować niezbędne biblioteki:
import matplotlib.pyplot as plt import numpy as np from scipy.stats import sem, t from scipy import mean
Teraz możemy obliczyć przedział ufności, wykonując poniższe kroki.
1. Wyznacz losowy zbiór danych, dla którego obliczymy przedział ufności.
2. Oblicz średnią i błąd standardowy zbioru danych.
3. Wyznacz margines błędu przedziału ufności.
4. Na koniec oblicz zakres przedziału ufności.
Oto kod Pythona odpowiadający tym krokom.
confidence = 0.95 data = np.random.rand(100) n = len(data) m = mean(data) std_err = sem(data) h = std_err * t.ppf((1 + confidence) / 2, n - 1) start = m - h end = m + h
Zmienna „ufność” to poziom ufności wyrażony w procentach, a „dane” zawierają losowy zbiór danych. Średni i błąd standardowy są obliczane odpowiednio za pomocą funkcji „średnia” i „sem” biblioteki SciPy. Margines błędu „h” wyznacza się, mnożąc błąd standardowy przez wynik t, który otrzymujemy z rozkładu t za pomocą funkcji „ppf”. Na koniec obliczamy zakres przedziału ufności.
Wykreślanie przedziału ufności w Matplotlib
W ostatniej części kodu używamy Matplotlib do wizualizacji przedziału ufności.
plt.figure(figsize=(9,6)) plt.bar(np.arange(len(data)), data) plt.fill_between(np.arange(len(data)), start, end, color='b', alpha=0.1) plt.title('Confidence Interval') plt.show()
Wykorzystuje wykres słupkowy do wyświetlania danych i metodę „fill_between” do przedstawienia przedziału ufności. Funkcja „figura” inicjuje nową figurę, a funkcja „show” przedstawia wykres.
Tworzenie wykresu przedziału ufności w Matplotlib to wygodny sposób wizualnej analizy danych, zwłaszcza danych wymagających analizy statystycznej. To potężne narzędzie oferuje łatwy i intuicyjny sposób do prezentowania złożonych danych w formie, która może być łatwo zinterpretowana, co czyni go niezbędnym zestawem narzędzi dla każdego analityka danych Pythona lub naukowca. Rozumiejąc, jak nimi manipulować i wykorzystywać, możemy sprawić, że proces interpretacji danych będzie bardziej wydajny i dokładny.