Hypotheses on research – kiểm định giả thuyết trong nghiên cứu

Hypotheses on research – kiểm định giả thuyết trong nghiên cứu

Estimated reading time: 14 minutes

Giả thuyết là gì?

Giả thuyết là một tuyên bố cụ thể về dự đoán (statement of prediction). Nó mô tả bằng những thuật ngữ cụ thể (chứ không phải lý thuyết) những gì bạn mong đợi sẽ xảy ra trong nghiên cứu của bạn. Một nghiên cứu đơn lẻ có thể có một hoặc nhiều giả thuyết.

Không phải tất cả các nghiên cứu đều có giả thuyết. Đôi khi một nghiên cứu được thuyết kế để khám phá (xem nghiên cứu quy nạp).

Các đặc tính của giả thuyết

  • Giả thuyết phải theo một nguyên lý chung và không thay trong suốt quá trình nghiên cứu.

  • Giả thuyết phải phù hợp với điều kiện thực tế và cơ sở lý thuyết.

  • Giả thuyết càng đơn giản càng tốt.

  • Giả thuyết có thể được kiểm nghiệm và mang tính khả thi.

Một giả thuyết tốt phải thoả mãn các yêu cầu sau:

  • Phải có mối quan hệ nhân – quả.

  • Có thể thực nghiệm để thu thập số liệu.

Cách đặt giả thuyết

Điều quan trọng trong cách đặt giả thuyết là phải đặt như thế nào để có thể thực hiện thí nghiệm kiểm chứng “đúng” hay “sai” giả thuyết đó. Vì vậy, trong việc xây dựng một giả thuyết cần trả lời các câu hỏi sau:

  • Giả thuyết nầy có thể tiến hành thực nghiệm được không?

  • Các biến hay các yếu tố nào cần được nghiên cứu?

  • Phương pháp thực nghiệm nào ( khảo sát, điều tra, bảng câu hỏi, phỏng vấn, …) được sử dụng trong nghiên cứu?

  • Các chỉ tiêu nào cần đo đạt trong suốt thực nghiệm?

  • Phương pháp xử lý số liệu nào mà người nghiên cứu dùng để bác bỏ hay chấp nhận giả thuyết?

Một giả thuyết hợp lý cần có các đặc điểm chính sau đây:

  • Giả thuyết đặt ra phải phù hợp và dựa trên quan sát hay cơ sở lý thuyết hiện tại (kiến thức vốn có, nguyên lý, kinh nghiệm, kết quả nghiên cứu tương tự trước đây, hoặc dựa vào nguồn tài liệu tham khảo), nhưng ý tưởng trong giả thuyết là phần lý thuyết chưa được chấp nhận.

  • Giả thuyết đặt ra có thể làm sự tiên đoán để thể hiện khả năng đúng hay sai.

  • Giả thuyết đặt ra có thể làm thí nghiệm để thu thập số liệu, để kiểm chứng hay chứng minh giả thuyết (đúng hay sai).

Tóm lại, giả thuyết đặt ra dựa trên sự quan sát, kiến thức vốn có, các nguyên lý, kinh nghiệm trước đây hoặc dựa vào nguồn tài liệu tham khảo, kết quả nghiên cứu tương tự trước đây để phát triển nguyên lý chung hay bằng chứng để giải thích, chứng minh câu hỏi nghiên cứu.

Xây dựng giả thuyết

  • Thực ra, bất cứ khi nào tôi nói về một giả thuyết, tôi thực sự đang suy nghĩ đồng thời về hai giả thuyết.

Giả sử rằng bạn dự đoán rằng sẽ có mối quan hệ giữa hai biến số trong nghiên cứu của bạn. Một câu mô tả dự đoán của bạn và một câu mô tả tất cả các kết quả có thể xảy ra khác liên quan đến giả thuyết mối quan hệ. Dự đoán của bạn là biến Abiến B sẽ có liên quan với nhau (bạn không quan tâm đó là mối quan hệ tích cực hay tiêu cực). Khi đó, kết quả duy nhất có thể xảy ra là biến Abiến B đó không liên quan với nhau.

  • Thông thường, chúng ta gọi là giả thuyết bạn ủng hộ (dự đoán của bạn) là giả thuyết thay thế (alternative hypothesis), và chúng ta gọi là giả thuyết mô tả các kết quả còn lại có thể là rỗng giả thuyết (null hypothesis). Đôi khi tôi sử dụng một ký hiệu HA đại diện cho giả thuyết thay thế hoặc dự đoán của bạn, và H0 đại diện cho trường hợp rỗng.

Bạn phải cẩn thận ở đây.

Trong một số nghiên cứu, dự đoán của bạn rất có thể là sẽ không có sự khác biệt hoặc thay đổi. Trong trường hợp này, về cơ bản bạn > đang cố gắng tìm kiếm sự hỗ trợ cho giả thuyết vô hiệu và bạn phản đối lựa chọn thay thế.

  • Nếu dự đoán của bạn xác định một hướng và do đó giá trị rỗng là dự đoán không có sự khác biệt và dự đoán về hướng ngược lại, chúng tôi gọi đây là giả thuyết một phía.

Ví dụ, hãy tưởng tượng rằng bạn đang điều tra tác động của một chương trình đào tạo nhân viên mới và bạn tin rằng một trong những kết quả là nhân viên vắng mặt ít hơn (employee absenteeism). Hai giả thuyết của bạn có thể được phát biểu như sau:

Giả thuyết rỗng (null hypothesis) cho nghiên cứu này:

H0: Kết quả của chương trình đào tạo nhân viên của công ty XYZ, không có sự khác biệt đáng kể về nhân viên vắng mặt không lý do tăng lên.

được kiểm tra dựa trên giả thuyết thay thế:

Ha: Kết quả của chương trình công ty XYZ đào tạo nhân viên, số nhân viên vắng mặt không lý do sẽ giảm đi.

employee absenteeism

Kiểm định giả thuyết (hypothesis testing)

Kiểm định giả thuyết là quá trình thiết lập và sử dụng các tiêu chuẩn thống kê để hỗ trợ cho việc đi đến quyết định về giá trị của giả thuyết trong điều kiện bất định. Trong những quyết định như thế, người ta có thể may mắn lựa chọn đúng, nhưng cũng có thể vấp phải rủi ro, tức lựa chọn sai lầm.

Giả thuyết thống kê có hai dạng:

  • Giả thuyết rỗng (null hypothesis), ký hiệu

    H0H_0

    H

    0

    – là một giả định thăm dò về tham số của tổng thể.

    (H0: p=0.5)

  • Đối thuyết, (alternative hypothesis) ký hiệu

    HAH_A

    H

    A

    – là khẳng định có trạng thái đối lập với giả thuyết.

    (Ha: p≠0.5)

Lưu ý

Đối thuyết là vấn đề người làm kiểm định cần thiết lập.

Giả thuyết rỗng

Giả thuyết rỗng đại diện cho một mệnh đề phủ định ý kiến tương phản với chứng cứ cụ thể. Xét hai ví dụ sau:

Ví dụ 1

  • Giả thuyết – Thêm nước vào kem đánh răng sẽ bảo vệ răng khỏi bị sâu.

  • Giả thuyết rỗng – Thêm nước vào kem đánh răng sẽ không có hiệu quả trong việc chống sâu răng.

Ví dụ 2

  • Giả thuyết – Thêm Floride vào kem đánh răng sẽ giúp bảo vệ răng khỏi bị sâu.

  • Giả thuyết rỗng – Thêm Floride vào kem đánh răng sẽ không có hiệu quả trong việc chống sâu răng.

Ở đây giả thuyết rỗng chỉ ra cần kiểm định lại với dữ liệu thực nghiệm nhằm phủ định tác dụng của floride và nước trong việc chống sâu răng.

Ý nghĩa và sự giải thích của giá trị xác suất p (p-values)

  • Về bản chất, p-value và α cùng là một thứ: mức ý nghĩa (level of significance). Điểm khác nhau là, α được chọn trước, còn p-value thì do tính toán mà ra. Khi kiểm nghiệm một giả thuyết, chúng ta chọn một mức ý nghĩa (α), và sau đó tính toán số liệu thống kê dựa trên các dữ liệu để lấy được một mức ý nghĩa quan sát được (p-value). Cuối cùng, bạn so sánh 2 mức này (α và p-value) để đưa ra quyết định bác bỏ giả thuyết hoặc không bác bỏ giả thuyết.

  • Giá trị ppp phụ thuộc trực tiếp vào mẫu nghiên cứu, nhằm cung cấp độ chắc chắn của kết quả kiểm định, cho phép đưa ra kết luận là bác bỏ hay không bác bỏ giả thuyết đưa ra.

  • Nếu giả thuyết H0H0H0 (giả thuyết không có sự khác biệt giữa các nhóm) là đúng và sự biến động ngẫu nhiên là lý do cho sự khác biệt củ( các mẫu, khi đó giá trị P là mức đo mà căn cứ vào đó chúng ta có thể đưa ra quyết định chấp thuận hay không.

Chú ý

Giá trị p là căn cứ để chúng ta bác bỏ giả thuyết H0, giá trị này càng nhỏ thì ta càng có căn cứ để bác bỏ giả thuyết hơn.

  • Người ta cũng có thể sử dụng giá trị

    pp

    p

    làm mức độ ý nghĩa thống kê của việc bác bỏ giả thuyết, trong trường hợp này giá trị

    pp

    p

    phải nhỏ hơn một ngưỡng giá trị (thường thì 0,05, thi thoảng cao hơn 0,1 hoặc thấp hơn 0,01) thì chúng ta bác bỏ giả thuyết

Ý nghĩa thống kê (statistical significance)

Ý nghĩa thống kê là một kết luận cho rằng kết quả từ kiểm định không xảy ra do ngẫu nhiên hay tình cờ, thay vào đó là do một nguyên nhân cụ thể.

  • Ý nghĩa thống kê có thể mạnh hoặc yếu.

  • Nếu thống kê có ý nghĩa càng cao thì nó được coi là càng đáng tin cậy.

  • Trong hầu hết các ngành khoa học, bao gồm cả kinh tế học, ý nghĩa thống kê là một kết luận được đưa ra ở mức 95% (hoặc đôi khi là 99%).

  • Từ có ý nghĩa thống kê (statistical significance) ở đây được dùng nhằm chỉ ra rằng chúng có giá trị về mặt thống kê (tức là nó sẽ có kết quả tương tự như vậy khi ta lựa chọn một mẫu khác để nghiên cứu) chứ không phải do cơ hội (may mắn) mà có sự khác biệt này.

Sai lầm loại I và II

Bởi vì kiểm định giả thuyết dựa trên số liệu mẫu, nên có khả năng xảy ra những sai lầm.

Lỗi loại I và II đại diện cho tính không chính xác của kết quả từ một phép kiểm thử giả thuyết thống kê.

  • Lỗi loại I đại diện cho sai lầm trong việc bác bỏ giả thuyết rỗng (H0H_0H0​) khi nó đúng, Ký hiệu α.

  • Lỗi loại II đại diện cho sai lầm trong việc chấp nhận giả thuyết rỗng (H0H_0H0​) khi nó sai, Ký hiệu β.

bảng ma trận sai lầm loại I và loại II trong kiểm định giả thuyết

Sai lầm loại I

Xét ví dụ 1. Ở đây giả thuyết rỗng là đúng, nghĩa là thêm nước vào kem đánh răng không hề có tác dụng bảo vệ răng khỏi bị sâu. Nhưng nếu sử dụng dữ liệu thực nghiệm, chúng ta phát hiện ra hiệu quả của nước trong việc chống lại sâu răng, vậy chúng ta cần loại bỏ giả thuyết rỗng đúng này.

Đây là lỗi loại I. Nó còn được gọi là điều kiện dương tính giả (một trường hợp thể hiện rằng một điều kiện nhất định xảy ra nhưng thực tế lại không).

Quan trọng

Thông thường, người ta có thể chấp nhận mức ý nghĩa của lỗi loại I là 0.05 hay >5%, nghĩa là có 5% xác suất loại trừ không chính xác giả thuyết rỗng là chấp nhận được.

Sai lầm loại II

Xét ví dụ 2. Ở đây giả thuyết rỗng là sai. Tức là thêm Floride vào kem đánh răng sẽ có hiệu quả chống lại sâu răng. Nhưng nếu sử dụng dữ liệu thực nghiệm, chúng ta không thể phát hiện ra hiệu quả của floride trong việc chống lại sâu răng thì khi đó chúng ta chấp nhận một giả thuyết rỗng không chính xác.

Đây là một lỗi loại II. Nó còn được gọi là điều kiện âm tính giả (một trường hợp thể hiện rằng một điều kiện nhất định không xảy ra nhưng thực tế lại có).

Quan trọng

Rất khó để kiểm soát được sai lầm loại II.
Mục tiêu của một phép kiểm thử thống kê là để xác định liệu một giả thuyết rỗng nên được loại trừ hay không.
Trong kiểm định, để hạn chế gặp phải sai lầm loại II, người ta thường sử dụng khẳng định không bác bỏ H0 và không dùng khẳng định chấp nhận H0.

Tóm lại ý chính

  • Nếu giả thuyết đúng và chúng ta chấp nhận hoặc giả thuyết sai và chúng ta từ bỏ nó, thì như vậy chúng ta đã quyết định đúng. Mặt khác, nếu từ bỏ giả thuyết khi nó cần được chấp nhận, chúng ta đã vấp phải sai lầm loại I. Còn nếu chấp nhận giả thuyết khi cần phải từ bỏ nó, chúng ta đã vấp phải sai lầm loại II.

  • Người ta có thể tối thiểu hóa rủi ro dẫn tới những sai lầm như thế trong quá trình kiểm định giả thuyết bằng cách sử dụng số liệu mẫu hiện có.