Tính hợp lệ (thống kê)

Tính hợp lệ là mức độ chính mà một khái niệm , kết luận hoặc phép đo có cơ sở và có khả năng tương ứng chính xác với thế giới thực. [1] [2] Từ "valid" có nguồn gốc từ tiếng Latin validus, có nghĩa là mạnh mẽ. Hiệu lực của một công cụ đo lường (ví dụ, một bài kiểm tra trong giáo dục) là mức độ mà công cụ đo lường những gì nó tuyên bố để đo lường. [3] Tính hợp lệ dựa trên sức mạnh của tập hợp các loại bằng chứng khác nhau (ví dụ giá trị bề mặt, giá trị cấu trúc, v.v.) được mô tả chi tiết hơn bên dưới.

Trong đo lường tâm lý , tính hợp lệ có một ứng dụng cụ thể được gọi là tính hợp lệ của bài kiểm tra : "mức độ mà bằng chứng và lý thuyết hỗ trợ việc giải thích điểm kiểm tra" ("như được đề xuất sử dụng các bài kiểm tra"). [4]

Người ta thường chấp nhận rằng khái niệm giá trị khoa học đề cập đến bản chất của thực tại dưới góc độ các thước đo thống kê và như vậy là một vấn đề nhận thức luậntriết học cũng như một vấn đề đo lường . Việc sử dụng thuật ngữ trong logichẹp hơn, liên quan đến mối quan hệ giữa tiền đề và kết luận của một lập luận. Về mặt logic, tính hợp lệ đề cập đến thuộc tính của một lập luận, theo đó nếu tiền đề là đúng thì sự thật của kết luận theo sau là cần thiết. Kết luận của một đối số là đúng nếu đối số đó là đúng, nghĩa là đối số đó có hợp lệ hay không và các tiền đề của nó là đúng. Ngược lại, "tính hợp lệ về mặt khoa học hoặc thống kê" không phải là một khẳng định có tính chất suy diễn nhất thiết phải bảo toàn sự thật, mà là một khẳng định quy nạp vẫn đúng hoặc sai một cách chưa quyết định. Đây là lý do tại sao "giá trị thống kê hoặc khoa học" là một tuyên bố đủ điều kiện là mạnh hoặc yếu về bản chất của nó, nó không bao giờ cần thiết và chắc chắn là đúng. Điều này có tác dụng đưa ra tuyên bố về "tính hợp lệ về mặt khoa học hoặc thống kê"

Tính hợp lệ rất quan trọng vì nó có thể giúp xác định loại thử nghiệm nào sẽ sử dụng và giúp đảm bảo các nhà nghiên cứu đang sử dụng các phương pháp không chỉ phù hợp với đạo đức và tiết kiệm chi phí mà còn là phương pháp thực sự đo lường ý tưởng hoặc cấu trúc được đề cập.

Hiệu lực [5] của một đánh giá là mức độ mà nó đo lường những gì nó được cho là phải đo lường. Điều này không giống với độ tin cậy , là mức độ mà phép đo cho kết quả rất nhất quán. Trong thời hạn hiệu lực, phép đo không phải lúc nào cũng giống nhau, vì nó có độ tin cậy. Tuy nhiên, chỉ vì một thước đo là đáng tin cậy, nó không nhất thiết phải có giá trị. Ví dụ: một cái cân giảm 5 pound là đáng tin cậy nhưng không hợp lệ. Một bài kiểm tra không thể có giá trị trừ khi nó đáng tin cậy. Tính hợp lệ cũng phụ thuộc vào phép đo đo lường thứ mà nó được thiết kế để đo lường chứ không phải thứ gì khác. [6] Tính hợp lệ (tương tự như độ tin cậy) là một khái niệm tương đối; hiệu lực không phải là một ý tưởng tất cả hoặc không có gì. Có nhiều loại hiệu lực khác nhau.

Tính hợp lệ của cấu trúc đề cập đến mức độ hoạt động của cấu trúc (ví dụ: các thử nghiệm thực tế được phát triển từ lý thuyết) đo lường cấu trúc như được xác định bởi lý thuyết. Nó thay thế tất cả các loại hiệu lực khác. Ví dụ, mức độ mà một bài kiểm tra đo lường trí thông minh là một câu hỏi về giá trị xây dựng. Một thước đo trí thông minh giả định rằng, trong số những thứ khác, thước đo được liên kết với những thứ mà nó nên được liên kết ( giá trị hội tụ ), không được liên kết với những thứ mà nó không nên được liên kết ( giá trị phân biệt ). [7]


TOP