Xác suất thống kê 1 – Các khái niệm cơ bản

Xác suất thống kê 1 – Các khái niệm cơ bản

Xác suất thống kê

Xác suất thống kê là nền tảng quan trọng cho các mô hình máy học và phân tích dữ liệu. Bài viết này của tôi ghi lại những kiến ​​thức và khái niệm cơ bản nhất về xác suất thống kê, giúp bạn đọc có thể tham khảo và ôn tập lại kiến ​​thức của môn học này.

Bạn Đang Xem: Xác suất thống kê 1 – Các khái niệm cơ bản

Xác suất, xác suất có điều kiện, công thức Bayes

1. thử nghiệm, sự kiện, không gian mẫu

Khái niệm

  • Thí nghiệm ngẫu nhiên là một loạt các phương pháp tiến hành và quan sát thí nghiệm cho chúng ta những kết quả không thể đoán trước.

  • Sự kiện chính là kết quả đơn giản nhất có thể quan sát được và không thể chia cắt của một thử nghiệm.

  • không gian mẫu ($s$) là tập hợp tất cả các sự kiện cơ bản của một thử nghiệm, mâu thuẫn với nhau, được ký hiệu là s.

  • Mọi tập hợp con của không gian mẫu được gọi là biến cố.

    thuộc tính

    • Không gian mẫu $omega$ là một tập hợp, thực tế nó là tập con của $omega$ nên mọi quan hệ (tập con, tương đương) và phép toán (hợp, giao, bù, phép trừ) tương tự như lý thuyết tập hợp.

    • Không tương thích: $ a_{1}, dots , a_{n}$ được gọi là không tương thích nếu $ a_{i} cap a_{j } = emptyset, forall i ne j$.

    • Tính đầy đủ: $ a_{1}, dots , a_{n} nếu $ a_{i} cup dots cup a_{ n} $ được coi là hoàn thành =s $.

    • Không gian sự kiện: $ a_{1}, dots , a_{n} $ Nếu vừa không tương thích vừa đủ đầy thì được gọi là không gian sự kiện.

      2. xác suất

      Khái niệm, tính chất

      xác suất của một phép thử là ánh xạ $p(.)$ từ không gian mẫu sang tập hợp các số thực sao cho:

        1. Đối với tất cả các sự kiện $a$ thì $p(a) geq 0$.
          1. $p(omega) = 1$.
            1. Đối với $a_{1}, a_{2},dots $ xung đột thì:
            2. $$ p(a_{1} cup a_{2} dots) = p(a_{1}) + p(a_{2}) + dots $$

              Theo 3 tiên đề trên, ta có thuộc tính:

                1. $p(emptyset) = 0$
                  1. $a, b$ không tương thích thì $p(a cup b) = p(a) + p(b)$.
                    1. $a, b$ bất kỳ $p(a cup b) = p(a) + p(b) – p(a cap b) $.
                    2. Định nghĩa xác suất cổ điển

                      Xác suất cổ điển dựa trên không gian mẫu hữu hạn và cũng có khả năng $omega = {w_1, w_2, dots, w_n}$.

                      Vì các sự kiện có khả năng xảy ra như nhau nên $p(w_1) = p(w_2) = dots = p(w_n)$.

                      Làm $1 = p(omega) = p({w_1}) + p({w_2}) + dots + p({w_n}) = np({w_1})$ nên $p({w_i} ) = frac{1}{n}, forall i = overline{1,n}$.

                      a là một sự kiện thì $p(a) = frac{#a}{#omega}$.

                      Xác suất có điều kiện

                      Một phép thử Nếu sự kiện $b,p(p)ne 0$ đã biết đã xảy ra, thì xác suất của sự kiện a xảy ra là xác suất có điều kiện $p(a|b)$ được xác định theo công thức:

                      $$ p(a|b) = frac{p(a cap b)}{p(b)} $$

                      • Công thức nhân:
                      • Xem Thêm: Điều chế N2 trong phòng thí nghiệm và công nghiệp ra sao?

                        $$ p(a cap b) = p(b).p(a|b) = p(a).p(b|a) $$

                        • Hai biến cố được gọi là độc lập khi và chỉ khi:
                        • $$ p(a cap b) = p(a).p(b) $$

                          3. Công thức Bayes

                          Tổng xác suất

                          $$ sum_{i=1}^n(p(a_i.p(b|a_i))) $$

                          Công thức Bayes

                          Công thức Bayes cho 2 biến cố $a$, $b$

                          Đối với hai biến cố $a, b$ và $p(a), p(b)$ là xác suất của hai quan sát độc lập.

                          • $p(a)$ được gọi là xác suất trước.
                          • $p(b)$ được gọi là xác suất hậu nghiệm.
                          • $p(b) = p(b|a) times p(a) + p(b|bar{a}) times p(bar{a})$.
                          • $p(a|b)$ được gọi là xác suất hậu nghiệm.
                          • $p(b|a)$ được gọi là xác suất đúng (khả năng xảy ra).
                          • Xem Thêm : Định luật Jun Len Xơ là gì? Công thức tính định luật Jun Len Xơ từ A – Z

                            Chúng ta có một công thức Bayesian cho 2 sự kiện $a$ và $b$

                            $$ p(a|b) = frac{p(a).p(b|a)}{p(b)} $$

                            $$ hậu thế = khả năng lần trước / bằng chứng $$

                            Công thức Bayes chung:

                            Đối với không gian sự kiện $a_1, dots, a_n$. b là một biến cố.

                            Ta có công thức tính tổng xác suất:

                            $$ p(b) = sum_{i=1}^{n}p(a_i).p(b|a_i) $$

                            Công thức Bayes chung cho nhiều biến cố:

                            $$ p(a_i|b) = frac{p(a_i cap b)}{p(b)} = frac{(p(a_i cap b))}{sum_{i=1 }^n(p(a_j).p(b|a_j))}$$

                            Biến ngẫu nhiên và phân phối xác suất

                            1. biến ngẫu nhiên

                            Khái niệm

                            Biến ngẫu nhiên là biến nhận các giá trị ngẫu nhiên đại diện cho kết quả của một phép thử. Mỗi giá trị $x$ nhận được của biến ngẫu nhiên $x$ được gọi là một thể hiện của $x$, cũng là kết quả của một phép thử hay còn gọi là một biến cố.

                            Có hai loại biến ngẫu nhiên:

                            • Rời rạc: Một tập hợp các giá trị rời rạc, đếm được. Khái niệm đếm được ở đây được hiểu theo nghĩa toán học, tức là nó có thể mô tả cách đếm không bỏ sót phần tử nào của tập hợp số, nhưng không thể bỏ sót phần tử nào của tập hợp số. number phải có hữu hạn phần tử. Bạn có thể đọc thêm về khái niệm này tại đây.
                            • Liên tục: Tập hợp các giá trị là liên tục, nghĩa là nó lấp đầy một khoảng và không đếm được.
                            • Ví dụ

                              Khi tung hai con xúc xắc, gọi x và y lần lượt là số xuất hiện trên mặt xúc xắc thứ nhất và thứ hai thì x và y là hai biến ngẫu nhiên vì chúng có kết quả bằng nhau. Các hàm như $x + y, 2xy, sin(xy)$ cũng là các biến ngẫu nhiên.

                              2. Phân phối xác suất

                              Hàm khối lượng xác suất (pmf)

                              Xét một biến ngẫu nhiên rời rạc $x$, có miền có thể nhận $(x_1, x_2, dots, x_n$. Hàm trọng số của biến ngẫu nhiên rời rạc được biểu thị như sau:

                              Xem Thêm: Giải SBT Vật lý 9: Bài 42-43. Thấu kính hội tụ. Ảnh của một vật tạo

                              $$ p_x(x) = p(x = x), forall x in mathbb{r} $$

                              Ý nghĩa: Hàm trọng số biểu thị xác suất của một điểm $x$.

                              Tính năng

                              • $p_x(x) geq 0, forall x in mathbb{r}$
                              • $sum_{i=1}^{n}p_x(x_i) = 1$
                              • Hàm phân phối tích lũy (cdf)

                                Hàm phân phối xác suất của biến ngẫu nhiên $x$ là một hàm được xác định bởi công thức:

                                $$ f_x(x) = p(x le x), forall x in mathbb{r} $$

                                Ý nghĩa: Hàm phân phối xác suất là xác suất của biến cố “biến ngẫu nhiên $x$ nhận giá trị trong khoảng từ $−infty$ đến $x$”. Khi có các hàm phân phối, chúng ta thực hiện với các hàm phân tích, thay vì làm toán với các dữ kiện.

                                Tính năng

                                • $f_x(-infty) = 0; f_x(+infty) = 1$
                                • $p(x leq a) = f_x(a); p(x > a) = 1 – f_x(a)$
                                • $p(a < x leq b) = f_x(b) – f_x(a)$
                                • $x$ là biến ngẫu nhiên rời rạc thì $f_x(x) = sum x_i <; xp_x(x_i)$

                                  Ví dụ về hàm trọng số và phân phối xác suất

                                  Tung xúc xắc. $x$ là số điểm xảy ra. Các giá trị x có thể là $s = {1, 2, 3, 4, 5, 6}$

                                  • Hàm trọng số
                                  • $$ p_x(x) = begin{cases} 1/6; & x in omega \ 0; & x notin omega end{cases} $$

                                    • Hàm phân phối xác suất $f_x(x) = begin{cases} 0; & x < 1 \ 1/6; & x < 2 \ 2/6; & x < 3 3/6; & x < 4 \ 4/6; & x < 5 \ 5/6; & x < sáu mươi mốt; & x geq 6; x in omega end{ trường hợp }$
                                    • Thí nghiệm ném xúc xắc mô phỏng

                                      Xem Thêm : Lời hỏi thăm tiếng Anh hay và phổ biến bạn cần biết

                                      Mô phỏng tung một con xúc xắc gần 5000 lần.

                                      • In bảng phân phối xác suất theo giá trị mô phỏng.
                                      • Viết hàm trọng số và hàm phân phối xác suất.
                                      • Tính xác suất để lần tung xúc xắc lớn hơn 2 và không lớn hơn 4.
                                      • Đồ thị hàm trọng số

                                        Đồ thị hàm phân phối xác suất

                                        Hàm xác suất mật độ (pdf)

                                        Với $x$ là một biến ngẫu nhiên liên tục, thì $p(x = x) = 0, forall x in mathbb{r}$. Do đó, sẽ không có ý nghĩa gì khi xem xét giá trị xác suất của một điểm với một biến ngẫu nhiên liên tục. Trong trường hợp này, chúng ta có khái niệm hàm mật độ xác suất (pdf – xác suất mật độ hàm) để ước tính mức độ tập trung của xác suất trong vùng lân cận của một điểm nhất định. Hàm mật độ xác suất $f(x)$ tại một điểm $x$ được xác định bằng cách lấy đạo hàm của hàm phân phối tích lũy $f(x)$ tại điểm đó:

                                        $$ f(x) = f^{prime}(x) $$

                                        Tính năng

                                        • Không có âm thanh: $f(x) ge 0 ~~~, forall x in mathbb{r}$
                                        • Tổng số miền bằng 1: $int_{-infty}^infty f(x)dx = 1$
                                        • $f(x)=int_{-infty}^xf(t)dt$
                                        • $p(a leq x < b) = f_x(a) – f_x(b) = int_a^b f_x(t)dt$
                                        • Đồ thị hàm mật độ xác suất

                                          Xem Thêm: Giải Toán lớp 6 Bài 16 Phép nhân số nguyên Sách Kết nối tri thức

                                          Sau đây là một ví dụ đồ thị về hàm mật độ xác suất của một phân bố chuẩn.

                                          Đồ thị hàm mật độ xác suất

                                          3. Giá trị riêng

                                          Mong chờ

                                          Kỳ vọng của một biến ngẫu nhiên chính là giá trị trung bình của biến ngẫu nhiên. Kỳ vọng của biến ngẫu nhiên $x$ được biểu thị bằng $e[x]$: $$e[x]=begin{cases} displaystylesum_{forall i} x_ip_i &text{với x rời rạc } cr displaystyleint_{-infty}^infty xf(x)dx &text{với x liên tục} end{cases} $$

                                          Lưu ý rằng giá trị trung bình của biến ngẫu nhiên ở đây là trung bình có trọng số, không phải trung bình của xác suất của biến ngẫu nhiên.

                                          Tính năng

                                          • $e(c) = c$ trong đó $c$ là hằng số
                                          • $e(cx) = ce(x)$ trong đó $c$ là hằng số
                                          • $e[ax+b] = ae[x]+b $ trong đó $a, b$ là các hằng số
                                          • $e[x+y] = e[x]+e[y]$
                                          • $e[xy] = e[x]e[y]$ trong đó $x, y$ độc lập
                                          • $e[g(x)] = begin{cases} displaystylesum_{forall i} g(x_i)p_x(x_i) &text{nếu x rời rạc} cr displaystyle int_ {-infty}^infty g(x)f(x)dx &text{nếu x liên tục} end{cases} $
                                          • Phương sai

                                            Dựa trên kỳ vọng, chúng ta sẽ nhận được giá trị trung bình của biến ngẫu nhiên, nhưng nó không cung cấp cho chúng ta thông tin về mức độ lan truyền của xác suất, vì vậy chúng ta cần một cách để đo lường mức chênh lệch này. Một trong những phương pháp này là phương sai.

                                            Phương sai $var(x)$ là giá trị trung bình của bình phương khoảng cách của biến ngẫu nhiên $x$ so với giá trị trung bình: $$var(x) = e[(x-e[x])^2] = e [ x^2 ]-e^2[x]$$

                                            Ta thấy rằng phương sai luôn là một giá trị không âm, phương sai càng lớn thì độ phân tán của dữ liệu càng rộng, tức là độ ổn định càng nhỏ.

                                            Tính năng

                                            • $var(c) = 0$ trong đó $c$ là hằng số
                                            • $var(cx) = c^2var(x)$ trong đó $c$ là hằng số
                                            • $var(ax+b) = a^2var(x)$ trong đó $a, b$ là các hằng số
                                            • $var(x+y) = var(x)+var(y)$ trong đó $x, y$ độc lập
                                            • Độ lệch chuẩn

                                              Vì đơn vị của phương sai là bình phương nên không thể tính được đơn vị của các biến ngẫu nhiên phù hợp, vì vậy khái niệm độ lệch chuẩn (sd-Standard Lệch) được thêm vào. ) bằng căn bậc hai của phương sai.

                                              $$sigma(x)=sqrt{var(x)}$$

                                              Người ta cũng sử dụng $sigma^2(x)$ để biểu thị phương sai của một biến ngẫu nhiên $x$.

                                              Trung bình

                                              Trung vị là điểm mà tại đó xác suất được chia thành 2 phần bằng nhau, được biểu thị bằng $med(x)$: $$p(x < med(x)) = p(x ge med( x ) ) = 0,5$$

                                              Vậy trung vị là nghiệm của phương trình xác suất tích lũy: $f_x(x) = 0,5$

                                              Ngay lập tức

                                              là khái niệm chung về kỳ vọng và phương sai. Định nghĩa về thời điểm $k$ xung quanh $c$ như sau:

                                              $$m_k = e[(x-a)^k]$$

                                              Như vậy:

                                              • Kỳ vọng là thời điểm của lệnh 1 tại đó $a=0$.
                                              • Phương sai là thời điểm thứ hai của $a=e[x]$.
                                              • Lưu ý: Mô tả này đang được xây dựng. Nếu bạn thấy lỗi, vui lòng cho tôi biết trong phần nhận xét bên dưới hoặc nhắn tin cho tôi qua trang liên hệ. Cảm ơn!

Nguồn: https://anhvufood.vn
Danh mục: Giáo Dục

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *