Phân Tích Khác Biệt Trung Bình One Way Anova Là Gì ? Các Bước Phân Tích Anova

Trong các bài viết với những chủ đề khác nhau ở mục Blog, mister-map.com đã giới thiệu đến các bạn những lý thuyết thống kê, statistics cơ bản từ tóm tắt, thống kê dữ liệu, thống kê mô tả để tìm hiểu những đối tượng trong mẫu dữ liệu cho đến thống kê suy luận bao gồm các phương pháp ước lượng, kiểm định.để đưa ra các kết luận về tổng thể nghiên cứu, và đánh giá chúng. Đến với bài viết lần này mister-map.com sẽ tiếp tục giới thiệu đến các bạn một mảng kiến thức quan trọng khác trong thống kê, và được ứng dụng ở nhiều lĩnh vực khác nhau chính là phân tích phương sai hay còn gọi với tên viết tắt là ANOVA.

Đang xem: One way anova là gì

Phân tích phương sai ANOVA là “phiên bản nâng cấp” của kiểm định tham số đặc biệt là kiểm định 2 mẫu kiểm định sự khác biệt giữa 2 đối tượng nghiên cứu khi có hoặc không có một yếu tố tác động nào đó (2 mẫu độc lập), hoặc 1 đối tượng nghiên cứu trước và sau khi có một yếu tố tác động nào đó (2 mẫu phụ thuộc).

Do đó trong trường hợp chúng ta muốn phân tích sự khác biệt giữa nhiều đối tượng nghiên cứu khác nhau, muốn xem xét tác động của hai yếu tố lên các đối tượng nghiên cứu khác nhau thì cần cách tiếp cận khác ngoài phương pháp kiểm định thông thường và đó chính là ANOVA – Analysis of Variance

Những bạn nào chưa biết gì về thống kê cũng như kiểm định thì nên tham khảo trước ở những tài liệu khác hoặc qua các bài viết của chúng tôi ở các link dưới đây trước khi tìm hiểu nội dung về ANOVA trong bài viết này để dễ nắm bắt hơn:

Tổng quan về Statistics: Khái niệm và ứng dụng của thống kê

Tổng quan về Statistics: Descriptive statistics (thống kê mô tả)

Tổng quan về Statistics: Inferential statistics (thống kê suy luận)

Tìm hiểu về phương pháp kiểm định tham số

Các dạng kiểm định tham số (trường hợp 1 mẫu)

Các dạng kiểm định tham số (trường hợp 2 mẫu)

*

Các bạn có thể nhìn thấy hình minh họa trên mô tả động cơ của phương pháp phân tích phương sai chính là so sánh giá trị trung bình của các tổng thể, và khi các tham số tổng thể là chưa biết, chúng ta sẽ sử dụng các trung bình mẫu để so sánh, kết hợp với phương pháp kiểm định giả thuyết, để đưa ra các kết luận sau cùng về các tổng thể. Cũng vì lý do này mà nhiều người thường gọi đây là kiểm định ANOVA. Tuy nhiên nếu gọi là kiểm định thì ANOVA lại mang khuynh hướng của Hypothesis test thông thường nhưng thực chất không phải như vậy. Cách thức vận hành của ANOVA là hoàn toàn khác biệt!

Nếu kiểm định thông thường sử dụng những tham số mẫu, chuyển đổi thành giá trị chuẩn hóa Z để xác định giá trị kiểm định thì ANOVA sử dụng các chênh lệch bình phương của những trung bình mẫu từ các tổng thể để tính toán phương sai, rồi giá trị kiểm định sau cùng. Chi tiết công thức chúng tôi sẽ trình bày ở các phần sau từ đó các bạn sẽ hiểu vì sao phương pháp này có tên gọi rất đẹp là ANOVA.

Để minh họa rõ hơn về ANOVA chúng ta cùng tìm hiểu qua một ví dụ thực tế trong lĩnh vực kinh doanh:

Một công ty thực phẩm sản xuất mỳ gói muốn tìm hiểu chi tiết về mỗi yếu tố tác động lên quyết định mua sản phẩm của người tiêu dùng ngoại trừ độ nổi tiếng thương hiệu, chỉ tập trung vào các đặc tính sản phẩm, cơ bản có 5 yếu tố chính:

Hương vị chính (vị lẩu thái, bò hầm, rau củ hầm chay, cay vị Hàn Quốc,…)Chất liệu mỳ, loại mỳCách thức đóng gói (mỳ đóng gói, đóng hộp cầu kỳ)Hình ảnh bên ngoài bao bìKhối lượng tịnhGiá bán

Với mỗi các yếu tố, công ty sẽ phân ra thành nhiều nhóm hay nhiều loại sản phẩm, tiến hành phân tích và kiểm tra sự khác biệt trong doanh thu trung bình.

Ví dụ: Hương vị, công ty sẽ so sánh sự khác biệt trong doanh thu trung bình giữa mỳ có hương vị lẩu thái, hương vị bò hầm, hay hải sản cay Hàn Quốc. Mẫu dữ liệu của mỗi loại sẽ có kích cỡ là n = 100, 100 ngày ghi nhận doanh thu cho mỗi loại lấy ngẫu nhiên từ dữ liệu giao dịch lịch sử qua các năm. Chúng ta sẽ sử dụng ANOVA – 1 yếu tố hay còn gọi one-way/ one-factor ANOVA. Nếu doanh thu trung bình 100 ngày của 3 loại mỳ này là khác nhau, thì kết luận Hương vị có tác động lên quyết định mua hàng của người tiêu dùng.

Tuy nhiên công ty nhận thấy rằng cần xét thêm các yếu tố khác nữa khi xu hướng cho thấy khách hàng ưa chuộng đóng hộp hơn, khối lượng nhiều hơn và giá rẻ hơn, vậy thì sẽ phải kết hợp với yếu tố Hương vị để đưa ra đánh giá chính xác hoặc xem giữa cách thức đóng gói, hình ảnh, khối lượng, giá có cái nào tương tác hay cộng hưởng với yếu tố Hương vị tác động lên quyết định mua hàng của khách hàng hay không. Lúc này chúng ta sẽ cần đến ANOVA – 2 yếu tố, two-way/ two-factor ANOVA.

Xem thêm: ” Normie Là Gì ? Ý Nghĩa Từ Này Là Sao

Nếu sử dụng phương pháp kiểm định thông thường, thì có lẽ “sẽ rất lâu” để công ty hoàn thành công trình nghiên cứu của mình. Ví dụ đơn giản Hypothesis test thông thường cao nhất chỉ có thể kiểm định sự khác biệt giữa 2 mẫu mà thôi như vậy chỉ có thể so sánh giữa 2 loại mỳ khác nhau, số lần so sánh sẽ là 3 lần, không kể kết hợp thêm yếu tố khác.

Các điều kiện để thực hiện phân tích phương sai hay còn gọi là những giả định ban đầu của bài toán:

Ở mỗi tổng thể nghiên cứu, những giá trị của các biến mục tiêu hay biến phụ thuộc hay đối tượng nghiên cứu chúng ta quan tâm phải có phân phối chuẩn (normal distribution).Phương sai, ký hiệu σ2 , phải bằng nhau ở tất cả các tổng thể σ12 = σ22 = σ32 = …. = σk2 với k là số tổng thể nghiên cứuCác mẫu dữ liệu được lấy ra từ các tổng thể nghiên cứu một cách ngẫu nhiên.Các quan sát bên trong mẫu phải độc lập với nhau

Ở 2 điều kiện ban đầu nếu dữ liệu không đáp ứng được yêu cầu thì chúng ta phải sử dụng đến phương pháp phân tích ANOVA kết hợp kiểm định phi tham số áp dụng với dữ liệu định tính sau khi đã được chuyển đổi từ dữ liệu định lượng ban đầu. Chúng tôi sẽ trình bày cụ thể phần này cùng với các cách kiểm tra 2 điều kiện kể trên ở bài viết về “Các dạng kiểm định phi tham số” sắp tới. Còn trong bài viết lần này chúng ta sẽ tìm hiểu ANOVA cho dữ liệu định lượng và tạm giả định các ví dụ tuân theo phân phối chuẩn và có cùng phương sai.

Tóm tắt tổng quan về các dạng phân tích ANOVA:

ANOVA áp dụng cho dữ liệu phân phối chuẩn, phương sai bằng nhau và ANOVA áp dụng cho dữ liệu không theo phân phối chuẩn, phương sai không bằng nhauANOVA áp dụng cho dữ liệu nghiên cứu có 1 yếu tố, và ANOVA áp dụng cho dữ liệu nghiên cứu có 2 yếu tốANOVA áp dụng cho nghiên cứu thực nghiệm (Experimental Study) – các yếu tố tác động được kiểm soát, và dữ liệu thu thập với mục đích so sánh tác động của chúng trên lên đối tượng nghiên cứu. ANOVA áp dụng cho nghiên cứu quan sát (Observational Study), các yếu tố không được kiểm soát chặt chẽ.

Trong bài viết phần 1 chúng ta sẽ làm quen trước với ANOVA 1 yếu tố, sử dụng ví dụ trong lĩnh vực kinh tế.

Xem thêm: Bói Bài Tarot Tình Yêu – Xem Bói Bài Tarot Hằng Ngày

One-way ANOVA/ ANOVA 1 yếu tố

Phân tích ANOVA 1 yếu tố là phân tích tác động của 1 yếu tố nguyên nhân nào đó lên một yếu tố kết quả đang quan tâm.

Bài toán ANOVA cũng giống bài toán kiểm định là chúng ta phải đưa ra ra giả thuyết ban đầu. Mục tiêu của ANOVA là so sánh các trung bình của tổng thể có khác biệt hay không nên chúng ta sẽ đặt giả thuyết như sau:

Related Posts