• logo

Phân tích tổng hợp

Một phân tích meta là một nghiên cứu thống kê kết hợp các kết quả của nhiều nghiên cứu khoa học . Phân tích tổng hợp có thể được thực hiện khi có nhiều nghiên cứu khoa học giải quyết cùng một câu hỏi, với mỗi nghiên cứu riêng lẻ báo cáo các phép đo dự kiến ​​sẽ có một số sai số. Mục đích sau đó là sử dụng các phương pháp tiếp cận từ số liệu thống kê để đưa ra một ước tính tổng hợp gần nhất với sự thật chung chưa biết dựa trên cách nhận thức sai số này.

Tóm tắt bằng đồ thị về phân tích tổng hợp hơn 1.000 trường hợp u thần kinh đệm nội tại lan tỏa và u thần kinh đệm ở trẻ em khác, trong đó thông tin về các đột biến liên quan cũng như kết quả chung được chắt lọc từ các tài liệu cơ bản .

Các phương pháp hiện có để phân tích tổng hợp mang lại giá trị trung bình có trọng số từ các kết quả của các nghiên cứu riêng lẻ, và điều khác biệt là cách thức phân bổ các trọng số này và cũng là cách tính độ không đảm bảo đo xung quanh ước tính điểm được tạo ra. Ngoài việc cung cấp ước tính về sự thật phổ biến chưa được biết đến, phân tích tổng hợp có khả năng đối chiếu kết quả từ các nghiên cứu khác nhau và xác định các mẫu giữa các kết quả nghiên cứu, nguồn gốc của sự bất đồng giữa các kết quả đó hoặc các mối quan hệ thú vị khác có thể được đưa ra ánh sáng trong bối cảnh của nhiều nghiên cứu. [1]

Lợi ích chính của cách tiếp cận này là tổng hợp thông tin dẫn đến sức mạnh thống kê cao hơn và ước tính điểm mạnh mẽ hơn so với mức có thể có được từ phép đo rút ra từ bất kỳ nghiên cứu riêng lẻ nào. Tuy nhiên, khi thực hiện phân tích tổng hợp, điều tra viên phải đưa ra các lựa chọn có thể ảnh hưởng đến kết quả, bao gồm quyết định cách tìm kiếm nghiên cứu, lựa chọn nghiên cứu dựa trên một bộ tiêu chí khách quan, xử lý dữ liệu không đầy đủ, phân tích dữ liệu và tính toán hoặc chọn không tính đến sai lệch xuất bản . [2] Lời kêu gọi phán xét được thực hiện khi hoàn thành phân tích tổng hợp có thể ảnh hưởng đến kết quả. Ví dụ: Wanous và các đồng nghiệp đã kiểm tra bốn cặp phân tích tổng hợp về bốn chủ đề (a) hiệu suất công việc và mối quan hệ hài lòng, (b) bản xem trước công việc thực tế, (c) mối tương quan của xung đột vai trò và sự mơ hồ, và (d) công việc mối quan hệ giữa sự hài lòng và sự vắng mặt, và minh họa cách các cuộc gọi đánh giá khác nhau của các nhà nghiên cứu đã tạo ra các kết quả khác nhau. [3]

Phân tích tổng hợp thường, nhưng không phải lúc nào cũng là thành phần quan trọng của quy trình xem xét có hệ thống . Ví dụ, một phân tích tổng hợp có thể được tiến hành trên một số thử nghiệm lâm sàng của một phương pháp điều trị y tế, nhằm cố gắng hiểu rõ hơn về cách thức hoạt động của phương pháp điều trị. Ở đây, có thể thuận tiện theo thuật ngữ được sử dụng bởi Cochrane Collaboration , [4] và sử dụng "phân tích tổng hợp" để chỉ các phương pháp thống kê kết hợp bằng chứng, để lại các khía cạnh khác của ' tổng hợp nghiên cứu ' hoặc 'tổng hợp bằng chứng', chẳng hạn như kết hợp thông tin từ các nghiên cứu định tính, cho bối cảnh chung hơn của các đánh giá có hệ thống. Phân tích tổng hợp là một nguồn thứ cấp . [5] [6]

Lịch sử

Nguồn gốc lịch sử của phân tích tổng hợp có thể bắt nguồn từ các nghiên cứu về thiên văn học ở thế kỷ 17, [7] trong khi một bài báo xuất bản năm 1904 của nhà thống kê Karl Pearson trên Tạp chí Y khoa Anh [8] đã đối chiếu dữ liệu từ một số nghiên cứu về sự lây nhiễm bệnh thương hàn là được coi là lần đầu tiên phương pháp phân tích tổng hợp được sử dụng để tổng hợp các kết quả của nhiều nghiên cứu lâm sàng. [9] [10] Phân tích tổng hợp đầu tiên về tất cả các thí nghiệm giống hệt nhau về khái niệm liên quan đến một vấn đề nghiên cứu cụ thể, và được thực hiện bởi các nhà nghiên cứu độc lập, đã được xác định là ấn phẩm dài một cuốn sách năm 1940 Nhận thức ngoại cảm sau sáu mươi năm , do các nhà tâm lý học của Đại học Duke J.G. Pratt , JB Rhine , và các cộng sự. [11] Điều này bao gồm việc xem xét 145 báo cáo về các thí nghiệm ESP được xuất bản từ năm 1882 đến năm 1939, và bao gồm ước tính về ảnh hưởng của các bài báo chưa được xuất bản đối với hiệu ứng tổng thể ( vấn đề ngăn kéo tệp ). Mặc dù phân tích tổng hợp được sử dụng rộng rãi trong dịch tễ học và y học dựa trên bằng chứng ngày nay, nhưng phân tích tổng hợp về một phương pháp điều trị y tế đã không được công bố cho đến năm 1955. Vào những năm 1970, các kỹ thuật phân tích phức tạp hơn đã được giới thiệu trong nghiên cứu giáo dục , bắt đầu với công trình của Gene V. Glass , Frank L. Schmidt và John E. Hunter .

Thuật ngữ "phân tích tổng hợp" được đặt ra vào năm 1976 bởi nhà thống kê học Gene V. Glass , [12] người đã nói rằng "mối quan tâm chính của tôi hiện tại là cái mà chúng tôi gọi là ... phân tích tổng hợp của nghiên cứu. Thuật ngữ này là hơi hoành tráng, nhưng nó chính xác và phù hợp ... Meta-analysis đề cập đến việc phân tích các phân tích " . Mặc dù điều này đã khiến ông được mọi người công nhận là người sáng lập hiện đại của phương pháp này, nhưng phương pháp đằng sau cái mà ông gọi là "phân tích tổng hợp" đã có trước công trình của ông vài thập kỷ. [13] [14] Lý thuyết thống kê xoay quanh phân tích tổng hợp đã được nâng cao rất nhiều bởi công trình của Nambury S. Raju , Larry V. Hedges , Harris Cooper, Ingram Olkin , John E. Hunter , Jacob Cohen , Thomas C. Chalmers , Robert Rosenthal , Frank L. Schmidt và Douglas G. Bonett.

Các bước trong phân tích tổng hợp

Một phân tích tổng hợp thường được thực hiện trước một cuộc xem xét có hệ thống, vì điều này cho phép xác định và đánh giá quan trọng tất cả các bằng chứng liên quan (do đó hạn chế rủi ro sai lệch trong các ước tính tóm tắt). Các bước chung sau đó như sau:

  1. Xây dựng câu hỏi nghiên cứu, ví dụ như sử dụng mô hình PICO (Dân số, Can thiệp, So sánh, Kết quả).
  2. Tìm kiếm tài liệu
  3. Lựa chọn các nghiên cứu ('tiêu chí kết hợp')
    1. Dựa trên tiêu chí chất lượng, ví dụ như yêu cầu về ngẫu nhiên và làm mù trong thử nghiệm lâm sàng
    2. Lựa chọn các nghiên cứu cụ thể về một đối tượng được chỉ định rõ ràng, ví dụ như điều trị ung thư vú.
    3. Quyết định xem các nghiên cứu chưa được xuất bản có được đưa vào để tránh sai lệch về công bố hay không ( vấn đề ngăn kéo tệp )
  4. Quyết định các biến phụ thuộc hoặc các thước đo tóm tắt nào được phép. Ví dụ: khi xem xét phân tích tổng hợp dữ liệu đã xuất bản (tổng hợp):
    • Sự khác biệt (dữ liệu rời rạc)
    • Phương tiện (dữ liệu liên tục)
    • Hedges ' g là một thước đo tóm tắt phổ biến cho dữ liệu liên tục được chuẩn hóa để loại bỏ sự khác biệt về quy mô, nhưng nó kết hợp một chỉ số biến động giữa các nhóm:
      1. δ = μ t - μ c σ , {\ displaystyle \ delta = {\ frac {\ mu _ {t} - \ mu _ {c}} {\ sigma}},} \delta ={\frac {\mu _{t}-\mu _{c}}{\sigma }}, trong đó μ t {\ displaystyle \ mu _ {t}} \mu _{t} là phương pháp điều trị, μ c {\ displaystyle \ mu _ {c}} \mu _{c} là phương tiện kiểm soát, σ 2 {\ displaystyle \ sigma ^ {2}} \sigma ^{2} phương sai tổng hợp.
  5. Lựa chọn mô hình phân tích tổng hợp, ví dụ phân tích tổng hợp hiệu ứng cố định hoặc hiệu ứng ngẫu nhiên.
  6. Kiểm tra nguồn gốc của sự không đồng nhất giữa các nghiên cứu , ví dụ như sử dụng phân tích nhóm con hoặc hồi quy meta .

Hướng dẫn chính thức về việc tiến hành và báo cáo các phân tích tổng hợp được cung cấp bởi Sổ tay Cochrane .

Để biết các nguyên tắc báo cáo, hãy xem tuyên bố Mục Báo cáo Ưu tiên cho Đánh giá Hệ thống và Phân tích Tổng hợp (PRISMA). [15]

Phương pháp và giả định

Phương pháp tiếp cận

Nói chung, có thể phân biệt hai loại bằng chứng khi thực hiện phân tích tổng hợp: dữ liệu người tham gia cá nhân (IPD) và dữ liệu tổng hợp (AD). Dữ liệu tổng hợp có thể trực tiếp hoặc gián tiếp.

AD thường có sẵn hơn (ví dụ từ tài liệu) và thường đại diện cho các ước tính tóm tắt như tỷ lệ chênh lệch hoặc rủi ro tương đối. Điều này có thể được tổng hợp trực tiếp qua các nghiên cứu tương tự về mặt khái niệm bằng cách sử dụng một số cách tiếp cận (xem bên dưới). Mặt khác, dữ liệu tổng hợp gián tiếp đo lường hiệu quả của hai phương pháp điều trị, mỗi phương pháp được so sánh với một nhóm đối chứng tương tự trong một phân tích tổng hợp. Ví dụ: nếu phương pháp điều trị A và phương pháp điều trị B được so sánh trực tiếp với giả dược trong các phân tích tổng hợp riêng biệt, chúng tôi có thể sử dụng hai kết quả tổng hợp này để ước tính tác động của A và B trong một so sánh gián tiếp như hiệu quả A so với giả dược trừ đi hiệu quả B so với giả dược.

Bằng chứng IPD thể hiện dữ liệu thô do các trung tâm nghiên cứu thu thập. Sự khác biệt này đã làm tăng nhu cầu về các phương pháp phân tích tổng hợp khác nhau khi muốn tổng hợp bằng chứng, và đã dẫn đến sự phát triển của các phương pháp một giai đoạn và hai giai đoạn. [16] Trong phương pháp một giai đoạn, IPD từ tất cả các nghiên cứu được lập mô hình đồng thời trong khi tính đến việc phân nhóm những người tham gia trong các nghiên cứu. Phương pháp hai giai đoạn đầu tiên tính toán thống kê tóm tắt cho AD từ mỗi nghiên cứu và sau đó tính toán thống kê tổng thể dưới dạng trung bình có trọng số của thống kê nghiên cứu. Bằng cách giảm IPD thành AD, các phương pháp hai giai đoạn cũng có thể được áp dụng khi có IPD; điều này làm cho chúng trở thành một lựa chọn hấp dẫn khi thực hiện phân tích tổng hợp. Mặc dù thông thường người ta tin rằng phương pháp một giai đoạn và hai giai đoạn mang lại kết quả tương tự nhau, các nghiên cứu gần đây đã chỉ ra rằng đôi khi chúng có thể dẫn đến các kết luận khác nhau. [17] [18]

Mô hình thống kê cho dữ liệu tổng hợp

Bằng chứng trực tiếp: Các mô hình chỉ kết hợp các hiệu ứng nghiên cứu

Mô hình hiệu ứng cố định

Mô hình hiệu ứng cố định cung cấp giá trị trung bình có trọng số của một loạt các ước tính nghiên cứu. Nghịch đảo của phương sai ước tính thường được sử dụng làm trọng số nghiên cứu, do đó các nghiên cứu lớn hơn có xu hướng đóng góp nhiều hơn các nghiên cứu nhỏ hơn vào trung bình có trọng số. Do đó, khi các nghiên cứu trong phân tích tổng hợp bị chi phối bởi một nghiên cứu rất lớn, các phát hiện từ các nghiên cứu nhỏ hơn thực tế bị bỏ qua. [19] Quan trọng nhất, mô hình tác động cố định giả định rằng tất cả các nghiên cứu được bao gồm đều điều tra cùng một quần thể, sử dụng cùng một định nghĩa biến và kết quả, v.v. Giả định này thường không thực tế vì nghiên cứu thường có xu hướng dẫn đến một số nguồn không đồng nhất ; ví dụ: hiệu quả điều trị có thể khác nhau tùy theo vị trí, mức liều lượng, điều kiện nghiên cứu, ...

Mô hình hiệu ứng ngẫu nhiên

Một mô hình phổ biến được sử dụng để tổng hợp nghiên cứu không đồng nhất là mô hình tác động ngẫu nhiên của phân tích tổng hợp. Đây chỉ đơn giản là giá trị trung bình có trọng số của các kích thước ảnh hưởng của một nhóm nghiên cứu. Trọng số được áp dụng trong quá trình tính trung bình có trọng số này với phân tích tổng hợp các tác động ngẫu nhiên đạt được theo hai bước: [20]

  1. Bước 1: Trọng số phương sai nghịch đảo
  2. Bước 2: Bỏ trọng số của trọng số phương sai nghịch đảo này bằng cách áp dụng thành phần phương sai tác động ngẫu nhiên (REVC) được suy ra đơn giản từ mức độ biến thiên của kích thước ảnh hưởng của các nghiên cứu cơ bản.

Điều này có nghĩa là sự thay đổi về kích thước ảnh hưởng này càng lớn (hay còn gọi là tính không đồng nhất ), thì không có trọng số càng lớn và điều này có thể đạt đến điểm khi các tác động ngẫu nhiên kết quả phân tích tổng hợp trở thành kích thước ảnh hưởng trung bình không trọng số trong các nghiên cứu. Ở một khía cạnh khác, khi tất cả các kích thước ảnh hưởng đều giống nhau (hoặc độ biến thiên không vượt quá sai số lấy mẫu), không áp dụng REVC và phân tích tổng hợp ảnh hưởng ngẫu nhiên mặc định chỉ đơn giản là phân tích tổng hợp hiệu ứng cố định (chỉ trọng số phương sai nghịch đảo).

Mức độ của sự đảo ngược này chỉ phụ thuộc vào hai yếu tố: [21]

  1. Độ chính xác không đồng nhất
  2. Kích thước hiệu ứng không đồng nhất

Vì cả hai yếu tố này đều không tự động chỉ ra một nghiên cứu lớn hơn bị lỗi hoặc các nghiên cứu nhỏ hơn đáng tin cậy hơn, nên việc phân phối lại trọng số theo mô hình này sẽ không có mối quan hệ với những gì các nghiên cứu này thực sự có thể cung cấp. Thật vậy, người ta đã chứng minh rằng việc phân phối lại trọng số chỉ đơn giản là theo một hướng từ các nghiên cứu lớn hơn đến nhỏ hơn khi tính không đồng nhất tăng lên cho đến khi cuối cùng tất cả các nghiên cứu đều có trọng số bằng nhau và không thể phân phối lại được nữa. [21] Một vấn đề khác với mô hình hiệu ứng ngẫu nhiên là các khoảng tin cậy được sử dụng phổ biến nhất thường không giữ được xác suất bao phủ của chúng trên mức danh nghĩa quy định và do đó đánh giá thấp về cơ bản sai số thống kê và có khả năng tự tin quá mức vào các kết luận của chúng. [22] [23] Một số bản sửa lỗi đã được đề xuất [24] [25] nhưng cuộc tranh luận vẫn tiếp tục. [23] [26] Một mối quan tâm nữa là hiệu quả điều trị trung bình đôi khi thậm chí có thể kém bảo thủ hơn so với mô hình hiệu quả cố định [27] và do đó gây hiểu lầm trong thực tế. Một giải pháp giải thích đã được đề xuất là tạo khoảng dự đoán xung quanh ước tính tác động ngẫu nhiên để mô tả phạm vi ảnh hưởng có thể xảy ra trong thực tế. [28] Tuy nhiên, một giả định đằng sau việc tính toán khoảng thời gian dự đoán như vậy là các thử nghiệm được coi là thực thể ít nhiều đồng nhất và bao gồm quần thể bệnh nhân và phương pháp điều trị so sánh nên được coi là có thể trao đổi [29] và điều này thường không thể đạt được trong thực tế.

Phương pháp được sử dụng rộng rãi nhất để ước tính phương sai giữa các nghiên cứu (REVC) là phương pháp DerSimonian-Laird (DL). [30] Một số kỹ thuật lặp lại nâng cao (và tốn kém về mặt tính toán) để tính toán phương sai giữa các nghiên cứu tồn tại (chẳng hạn như khả năng xảy ra tối đa, khả năng hồ sơ và các phương pháp khả năng xảy ra tối đa bị hạn chế) và các mô hình hiệu ứng ngẫu nhiên sử dụng các phương pháp này có thể được chạy trong Stata với lệnh metaan. [31] Lệnh metaan phải được phân biệt với lệnh metan cổ điển (đơn "a") trong Stata sử dụng công cụ ước lượng DL. Các phương pháp nâng cao này cũng đã được triển khai trong tiện ích bổ sung Microsoft Excel miễn phí và dễ sử dụng, MetaEasy. [32] [33] Tuy nhiên, so sánh giữa các phương pháp tiên tiến này và phương pháp DL tính toán phương sai giữa các nghiên cứu đã chứng minh rằng có rất ít lợi ích và DL khá đầy đủ trong hầu hết các tình huống. [34] [35]

Tuy nhiên, hầu hết các phân tích tổng hợp bao gồm từ 2 đến 4 nghiên cứu và một mẫu như vậy thường không đủ để ước tính chính xác tính không đồng nhất . Do đó, có vẻ như trong các phân tích tổng hợp nhỏ, thu được một giá trị không chính xác giữa ước tính phương sai nghiên cứu, dẫn đến giả định về tính đồng nhất sai. Nhìn chung, có vẻ như tính không đồng nhất luôn bị đánh giá thấp trong các phân tích tổng hợp và phân tích độ nhạy trong đó các mức độ không đồng nhất cao được cho là có thể mang tính thông tin. [36] Các mô hình hiệu ứng ngẫu nhiên và gói phần mềm được đề cập ở trên liên quan đến phân tích tổng hợp nghiên cứu và các nhà nghiên cứu muốn tiến hành phân tích tổng hợp dữ liệu bệnh nhân (IPD) cá nhân cần phải xem xét các phương pháp tiếp cận mô hình hiệu ứng hỗn hợp. [37]

Mô hình IVhet

Doi & Barendregt làm việc với sự cộng tác của Khan, Thalib và Williams (từ Đại học Queensland, Đại học Nam Queensland và Đại học Kuwait), đã tạo ra một phương sai nghịch đảo dựa trên khả năng thay thế (IVhet) cho mô hình hiệu ứng ngẫu nhiên (RE) mà chi tiết có sẵn trực tuyến. [38] Điều này đã được tích hợp vào MetaXL phiên bản 2.0, [39] một phần bổ trợ Microsoft excel miễn phí để phân tích tổng hợp được sản xuất bởi Epigear International Pty Ltd và được cung cấp vào ngày 5 tháng 4 năm 2014. Các tác giả nói rằng một lợi thế rõ ràng của mô hình này là nó giải quyết được hai vấn đề chính của mô hình hiệu ứng ngẫu nhiên. Ưu điểm đầu tiên của mô hình IVhet là mức độ bao phủ vẫn ở mức danh định (thường là 95%) cho khoảng tin cậy không giống như mô hình hiệu ứng ngẫu nhiên giảm mức độ bao phủ với sự không đồng nhất ngày càng tăng. [22] [23] Ưu điểm thứ hai là mô hình IVhet duy trì trọng số phương sai nghịch đảo của các nghiên cứu riêng lẻ, không giống như mô hình RE cho phép các nghiên cứu nhỏ có trọng số hơn (và do đó các nghiên cứu lớn ít hơn) với tính không đồng nhất ngày càng tăng. Khi tính không đồng nhất trở nên lớn, trọng số của nghiên cứu riêng lẻ trong mô hình RE trở nên bằng nhau và do đó mô hình RE trả về giá trị trung bình số học hơn là trung bình có trọng số. Tác dụng phụ này của mô hình RE không xảy ra với mô hình IVhet, do đó khác với ước tính của mô hình RE ở hai khía cạnh: [38] Các ước tính gộp sẽ có lợi cho các thử nghiệm lớn hơn (trái ngược với việc phạt các thử nghiệm lớn hơn trong mô hình RE) và sẽ có khoảng tin cậy vẫn nằm trong vùng phủ danh định dưới độ không đảm bảo (không đồng nhất). Doi & Barendregt gợi ý rằng trong khi mô hình RE cung cấp một phương pháp thay thế để tổng hợp dữ liệu nghiên cứu, kết quả mô phỏng của họ [40] chứng minh rằng việc sử dụng một mô hình xác suất cụ thể hơn với các giả định không thể kiểm chứng được, như với mô hình RE, không nhất thiết mang lại kết quả tốt hơn. Nghiên cứu thứ hai cũng báo cáo rằng mô hình IVhet giải quyết các vấn đề liên quan đến việc đánh giá thấp sai số thống kê, độ bao phủ kém của khoảng tin cậy và tăng MSE được thấy với mô hình tác động ngẫu nhiên và các tác giả kết luận rằng các nhà nghiên cứu nên từ bỏ việc sử dụng mô hình tác động ngẫu nhiên trong phân tích tổng hợp. Mặc dù dữ liệu của họ rất thuyết phục, nhưng sự phân chia (về mức độ của các kết quả tích cực trong cơ sở dữ liệu Cochrane) là rất lớn và do đó việc chấp nhận kết luận này đòi hỏi sự xác nhận độc lập cẩn thận. Sự sẵn có của một phần mềm miễn phí (MetaXL) [39] chạy mô hình IVhet (và tất cả các mô hình khác để so sánh) tạo điều kiện thuận lợi cho cộng đồng nghiên cứu.

Bằng chứng trực tiếp: Các mô hình kết hợp thông tin bổ sung

Mô hình hiệu ứng chất lượng

Doi và Thalib ban đầu đã giới thiệu mô hình hiệu ứng chất lượng. [41] Họ [42] đã giới thiệu một cách tiếp cận mới để điều chỉnh sự biến đổi giữa các nghiên cứu bằng cách kết hợp sự đóng góp của phương sai do một thành phần liên quan (chất lượng) bên cạnh sự đóng góp của phương sai do lỗi ngẫu nhiên được sử dụng trong bất kỳ tác động cố định nào. mô hình phân tích tổng hợp để tạo ra trọng số cho mỗi nghiên cứu. Điểm mạnh của phân tích tổng hợp ảnh hưởng chất lượng là nó cho phép sử dụng bằng chứng phương pháp luận sẵn có thay vì các tác động ngẫu nhiên chủ quan, và do đó giúp thu hẹp khoảng cách thiệt hại vốn đã mở ra giữa phương pháp luận và thống kê trong nghiên cứu lâm sàng. Để làm được điều này, một phương sai thiên vị tổng hợp được tính toán dựa trên thông tin chất lượng để điều chỉnh trọng số phương sai nghịch đảo và trọng số điều chỉnh chất lượng của nghiên cứu thứ i được đưa vào. [41] Các trọng số đã điều chỉnh này sau đó được sử dụng trong phân tích tổng hợp. Nói cách khác, nếu nghiên cứu thứ i có chất lượng tốt và các nghiên cứu khác có chất lượng kém, thì một phần trọng số đã điều chỉnh chất lượng của chúng được phân phối lại theo toán học để nghiên cứu thứ i tạo ra trọng số nhiều hơn đối với kích thước hiệu ứng tổng thể. Khi các nghiên cứu ngày càng giống nhau về chất lượng, việc phân phối lại trở nên ít dần và chấm dứt khi tất cả các nghiên cứu đều có chất lượng như nhau (trong trường hợp chất lượng ngang nhau, mô hình hiệu ứng chất lượng được mặc định là mô hình IVhet - xem phần trước). Một đánh giá gần đây về mô hình hiệu ứng chất lượng (với một số bản cập nhật) cho thấy rằng mặc dù đánh giá chất lượng mang tính chủ quan, hiệu suất (MSE và phương sai thực dưới mô phỏng) cao hơn so với có thể đạt được với mô hình hiệu ứng ngẫu nhiên. [43] [44] Do đó, mô hình này thay thế các cách diễn giải không thể hiểu được có rất nhiều trong tài liệu và một phần mềm có sẵn để khám phá thêm phương pháp này. [39]

Bằng chứng gián tiếp: Các phương pháp phân tích tổng hợp mạng

Một phân tích tổng hợp mạng xem xét các so sánh gián tiếp. Trong hình ảnh, A đã được phân tích trong mối quan hệ với C và C đã được phân tích trong mối quan hệ với b. Tuy nhiên, mối quan hệ giữa A và B chỉ được biết một cách gián tiếp, và một phân tích tổng hợp mạng xem xét bằng chứng gián tiếp về sự khác biệt giữa các phương pháp và biện pháp can thiệp bằng phương pháp thống kê.

Phương pháp phân tích tổng hợp so sánh gián tiếp (còn được gọi là phân tích tổng hợp mạng, đặc biệt khi nhiều phương pháp điều trị được đánh giá đồng thời) thường sử dụng hai phương pháp chính. Đầu tiên, là phương pháp Bucher [45] , là sự so sánh đơn lẻ hoặc lặp lại của một vòng lặp khép kín gồm ba phương pháp xử lý sao cho một trong số chúng là chung cho hai nghiên cứu và tạo thành nút nơi vòng lặp bắt đầu và kết thúc. Do đó, cần nhiều phép so sánh hai nhân hai (3 vòng điều trị) để so sánh nhiều phương pháp điều trị. Phương pháp luận này yêu cầu rằng các thử nghiệm với nhiều hơn hai nhánh chỉ có hai nhánh được chọn làm các phép so sánh độc lập theo cặp khôn ngoan là bắt buộc. Phương pháp thay thế sử dụng mô hình thống kê phức tạp để bao gồm nhiều thử nghiệm nhánh và so sánh đồng thời giữa tất cả các phương pháp điều trị cạnh tranh. Chúng đã được thực hiện bằng phương pháp Bayes, mô hình tuyến tính hỗn hợp và phương pháp tiếp cận hồi quy meta. [ cần dẫn nguồn ]

Khung Bayes

Chỉ định mô hình phân tích tổng hợp mạng Bayes bao gồm việc viết mô hình đồ thị vòng có hướng (DAG) cho phần mềm Markov chain Monte Carlo (MCMC) có mục đích chung như WinBUGS. [46] Ngoài ra, các bản phân phối trước phải được chỉ định cho một số tham số và dữ liệu phải được cung cấp ở định dạng cụ thể. [46] Cùng với nhau, DAG, priors và data tạo thành một mô hình phân cấp Bayes. Để làm phức tạp thêm vấn đề, do bản chất của ước tính MCMC, các giá trị ban đầu phân tán quá mức phải được chọn cho một số chuỗi độc lập để có thể đánh giá sự hội tụ. [47] Hiện tại, không có phần mềm nào tự động tạo ra các mô hình như vậy, mặc dù có một số công cụ hỗ trợ trong quá trình này. Sự phức tạp của phương pháp Bayes đã hạn chế việc sử dụng phương pháp này. Phương pháp luận để tự động hóa phương pháp này đã được đề xuất [48] nhưng yêu cầu dữ liệu kết quả cấp nhánh phải có sẵn và điều này thường không có sẵn. Những tuyên bố tuyệt vời đôi khi được đưa ra về khả năng vốn có của khuôn khổ Bayes trong việc xử lý phân tích tổng hợp mạng và tính linh hoạt cao hơn của nó. Tuy nhiên, sự lựa chọn triển khai khuôn khổ cho suy luận này, Bayesian hoặc thường xuyên, có thể ít quan trọng hơn các lựa chọn khác liên quan đến mô hình hóa các hiệu ứng [49] (xem thảo luận về các mô hình ở trên).

Khung đa biến thường xuyên

Mặt khác, các phương pháp đa biến thường xuyên liên quan đến các ước tính và giả định không được nêu rõ ràng hoặc xác minh khi các phương pháp được áp dụng (xem thảo luận về các mô hình phân tích tổng hợp ở trên). Ví dụ: gói mvmeta cho Stata cho phép phân tích tổng hợp mạng trong khuôn khổ danh sách thường xuyên. [50] Tuy nhiên, nếu không có bộ so sánh chung trong mạng, thì điều này phải được xử lý bằng cách tăng cường tập dữ liệu với các nhánh hư cấu có phương sai cao, điều này không khách quan cho lắm và cần phải đưa ra quyết định xem điều gì tạo nên phương sai đủ cao. [51] Vấn đề khác là sử dụng mô hình hiệu ứng ngẫu nhiên trong cả khuôn khổ thường xuyên này và khuôn khổ Bayes. Senn khuyên các nhà phân tích nên thận trọng khi giải thích phân tích 'tác động ngẫu nhiên' vì chỉ cho phép một hiệu ứng ngẫu nhiên nhưng người ta có thể hình dung ra nhiều. [49] Senn tiếp tục nói rằng điều đó vẫn chưa xảy ra, ngay cả trong trường hợp chỉ có hai phương pháp điều trị được so sánh với giả định rằng phân tích tác động ngẫu nhiên giải thích cho tất cả sự không chắc chắn về cách thức các hiệu ứng có thể thay đổi từ thử nghiệm này sang thử nghiệm khác. Các mô hình phân tích tổng hợp mới hơn như đã thảo luận ở trên chắc chắn sẽ giúp giảm bớt tình trạng này và đã được triển khai trong khuôn khổ tiếp theo.

Khung mô hình theo cặp tổng quát

Một cách tiếp cận đã được thử từ cuối những năm 1990 là thực hiện phân tích vòng khép kín ba phương pháp điều trị. Điều này đã không được phổ biến vì quá trình này nhanh chóng trở nên quá tải khi độ phức tạp của mạng tăng lên. Sự phát triển trong lĩnh vực này sau đó đã bị bỏ rơi để ủng hộ các phương pháp Bayesian và các phương pháp thường xuyên đa biến, vốn nổi lên như một lựa chọn thay thế. Gần đây, một số nhà nghiên cứu đã phát triển tự động hóa phương pháp vòng kín ba xử lý cho các mạng phức tạp [38] như một cách để cung cấp phương pháp này cho cộng đồng nghiên cứu chính thống. Đề xuất này không hạn chế mỗi thử nghiệm ở hai lần can thiệp, nhưng cũng đưa ra giải pháp thay thế cho nhiều thử nghiệm nhánh: một nút điều khiển cố định khác nhau có thể được chọn trong các lần chạy khác nhau. Nó cũng sử dụng các phương pháp phân tích tổng hợp mạnh mẽ để tránh được nhiều vấn đề nêu trên. Cần phải nghiên cứu sâu hơn về khuôn khổ này để xác định xem điều này có thực sự vượt trội hơn so với khuôn khổ Bayesian hay đa biến số thường xuyên hay không. Các nhà nghiên cứu sẵn sàng thử điều này có quyền truy cập vào khuôn khổ này thông qua một phần mềm miễn phí. [39]

Phân tích tổng hợp phù hợp

Một dạng thông tin bổ sung khác đến từ cài đặt dự kiến. Nếu cài đặt mục tiêu cho việc áp dụng kết quả phân tích tổng hợp được biết thì có thể sử dụng dữ liệu từ cài đặt này để điều chỉnh kết quả, do đó tạo ra 'phân tích tổng hợp phù hợp'., [52] [53] Điều này đã được sử dụng trong Các phân tích tổng hợp về độ chính xác của kiểm tra, trong đó kiến ​​thức thực nghiệm về tỷ lệ dương tính của xét nghiệm và tỷ lệ phổ biến đã được sử dụng để lấy ra một vùng trong không gian Đặc tính hoạt động của máy thu (ROC) được gọi là 'vùng áp dụng'. Sau đó, các nghiên cứu được chọn cho cài đặt mục tiêu dựa trên so sánh với khu vực này và được tổng hợp lại để tạo ra một ước tính tóm tắt phù hợp với cài đặt mục tiêu.

Tổng hợp IPD và AD

Phân tích tổng hợp cũng có thể được áp dụng để kết hợp IPD và AD. Điều này thuận tiện khi các nhà nghiên cứu tiến hành phân tích có dữ liệu thô của riêng họ trong khi thu thập dữ liệu tổng hợp hoặc tóm tắt từ các tài liệu. Mô hình tích hợp tổng quát (GIM) [54] là sự tổng quát hóa của phân tích tổng hợp. Nó cho phép mô hình được trang bị trên dữ liệu người tham gia cá nhân (IPD) khác với mô hình được sử dụng để tính toán dữ liệu tổng hợp (AD). GIM có thể được xem như một phương pháp hiệu chỉnh mô hình để tích hợp thông tin với tính linh hoạt hơn.

Xác nhận kết quả phân tích tổng hợp

Ước tính phân tích tổng hợp đại diện cho giá trị trung bình có trọng số giữa các nghiên cứu và khi có sự không đồng nhất, điều này có thể dẫn đến ước tính tóm tắt không đại diện cho các nghiên cứu riêng lẻ. Đánh giá định tính các nghiên cứu sơ cấp bằng cách sử dụng các công cụ đã được thiết lập có thể phát hiện ra những sai lệch tiềm ẩn, [55] [56] nhưng không định lượng được ảnh hưởng tổng hợp của những sai lệch này đối với ước tính tóm tắt. Mặc dù kết quả phân tích tổng hợp có thể được so sánh với một nghiên cứu tiền cứu độc lập, nhưng việc xác nhận bên ngoài như vậy thường không thực tế. Điều này đã dẫn đến sự phát triển của các phương pháp khai thác hình thức xác thực chéo bỏ qua , đôi khi được gọi là xác thực chéo nội bộ - bên ngoài (IOCV). [57] Ở đây, mỗi k-nghiên cứu được đưa vào lần lượt bị bỏ qua và được so sánh với ước tính tóm tắt thu được từ việc tổng hợp k-1 nghiên cứu còn lại. Một thống kê xác thực chung , Vn dựa trên IOCV đã được phát triển để đo lường hiệu lực thống kê của các kết quả phân tích tổng hợp. [58] Để kiểm tra độ chính xác và dự đoán, đặc biệt khi có các tác động đa biến, các phương pháp tiếp cận khác nhằm ước tính sai số dự đoán cũng đã được đề xuất. [59]

Thách thức

Một phân tích tổng hợp của một số nghiên cứu nhỏ không phải lúc nào cũng dự đoán được kết quả của một nghiên cứu lớn. [60] Một số người cho rằng điểm yếu của phương pháp này là các nguồn sai lệch không được phương pháp kiểm soát: một phân tích tổng hợp tốt không thể sửa chữa thiết kế kém hoặc sai lệch trong các nghiên cứu ban đầu. [61] Điều này có nghĩa là chỉ những nghiên cứu đúng đắn về mặt phương pháp mới nên được đưa vào phân tích tổng hợp, một thực hành được gọi là 'tổng hợp bằng chứng tốt nhất'. [61] Các nhà phân tích tổng hợp khác sẽ bao gồm các nghiên cứu yếu hơn và thêm một biến số dự báo ở cấp độ nghiên cứu phản ánh chất lượng phương pháp luận của các nghiên cứu để kiểm tra ảnh hưởng của chất lượng nghiên cứu đối với quy mô hiệu ứng. [62] Tuy nhiên, những người khác lại lập luận rằng cách tiếp cận tốt hơn là lưu giữ thông tin về phương sai trong mẫu nghiên cứu, truyền vào mạng lưới càng rộng càng tốt và các tiêu chí lựa chọn phương pháp luận đưa ra tính chủ quan không mong muốn, đánh bại mục đích của phương pháp tiếp cận. [63]

Xu hướng xuất bản: vấn đề ngăn kéo tệp

Một biểu đồ kênh được mong đợi mà không có vấn đề về ngăn kéo tệp. Các nghiên cứu lớn nhất hội tụ ở phần đỉnh trong khi các nghiên cứu nhỏ hơn cho thấy ít nhiều sự phân tán đối xứng ở phần gốc
Biểu đồ kênh được mong đợi với sự cố ngăn kéo tệp. Các nghiên cứu lớn nhất vẫn tập trung xung quanh phần đầu, nhưng khuynh hướng chống lại việc xuất bản các nghiên cứu tiêu cực đã khiến các nghiên cứu nhỏ hơn nói chung có kết quả thuận lợi không chính đáng cho giả thuyết

Một cạm bẫy tiềm ẩn khác là sự phụ thuộc vào cơ sở có sẵn của các nghiên cứu đã được công bố, điều này có thể tạo ra các kết quả phóng đại do sai lệch về công bố , vì các nghiên cứu cho thấy kết quả tiêu cực hoặc kết quả không đáng kể ít có khả năng được công bố. Ví dụ, các công ty dược phẩm được biết đến là che giấu các nghiên cứu tiêu cực và các nhà nghiên cứu có thể đã bỏ qua các nghiên cứu chưa được công bố như nghiên cứu luận văn hoặc bản tóm tắt hội nghị không được công bố. Điều này không dễ giải quyết, vì người ta không thể biết có bao nhiêu nghiên cứu đã không được báo cáo. [64]

Đây vấn đề tập tin ngăn kéo (đặc trưng bởi tiêu cực hoặc không đáng kể kết quả được giấu đi trong tủ), có thể dẫn đến sự phân bố sai lệch về tác dụng kích thước do đó tạo ra một nghiêm trọng sai lầm lãi suất cơ bản , trong đó tầm quan trọng của nghiên cứu được công bố được đánh giá quá cao, như các nghiên cứu khác hoặc không được gửi để xuất bản hoặc bị từ chối. Điều này cần được xem xét nghiêm túc khi giải thích kết quả của một phân tích tổng hợp. [64] [65]

Sự phân bố của các kích thước hiệu ứng có thể được hình dung bằng một biểu đồ hình phễu (trong phiên bản phổ biến nhất của nó) là một biểu đồ phân tán của lỗi tiêu chuẩn so với kích thước hiệu ứng. Nó sử dụng thực tế là các nghiên cứu nhỏ hơn (do đó sai số tiêu chuẩn lớn hơn) có nhiều phân tán hơn về độ lớn của hiệu ứng (ít chính xác hơn) trong khi các nghiên cứu lớn hơn có ít phân tán hơn và hình thành đầu phễu. Nếu nhiều nghiên cứu tiêu cực không được công bố, các nghiên cứu tích cực còn lại sẽ tạo ra một biểu đồ hình phễu trong đó cơ sở bị lệch sang một bên (sự không đối xứng của biểu đồ hình phễu). Ngược lại, khi không có sai lệch về công bố, ảnh hưởng của các nghiên cứu nhỏ hơn không có lý do gì để bị lệch sang một bên và do đó, một biểu đồ hình phễu đối xứng cho kết quả. Điều này cũng có nghĩa là nếu không có sai lệch công bố thì sẽ không có mối quan hệ giữa sai số chuẩn và kích thước hiệu ứng. [66] Mối quan hệ âm hoặc dương giữa sai số tiêu chuẩn và kích thước hiệu ứng sẽ ngụ ý rằng các nghiên cứu nhỏ hơn chỉ phát hiện ra các tác động theo một hướng sẽ có nhiều khả năng được công bố và / hoặc được đệ trình để xuất bản.

Ngoài biểu đồ hình phễu trực quan, các phương pháp thống kê để phát hiện sai lệch xuất bản cũng đã được đề xuất. Những điều này còn gây tranh cãi vì chúng thường có công suất thấp để phát hiện sai lệch, nhưng cũng có thể tạo ra kết quả dương tính giả trong một số trường hợp. [67] Ví dụ: các hiệu ứng nghiên cứu nhỏ (thiên vị các nghiên cứu nhỏ hơn), trong đó tồn tại sự khác biệt về phương pháp luận giữa các nghiên cứu nhỏ hơn và lớn hơn, có thể gây ra sự không đối xứng về kích thước ảnh hưởng giống như độ lệch công bố. Tuy nhiên, các tác động nghiên cứu nhỏ có thể gây khó khăn cho việc giải thích các phân tích tổng hợp, và các tác giả phân tích tổng hợp bắt buộc phải điều tra các nguồn sai lệch tiềm năng.

Phương pháp Tandem để phân tích độ chệch xuất bản đã được đề xuất để giảm các vấn đề về lỗi dương tính giả. [68] Phương pháp Tandem này bao gồm ba giai đoạn. Đầu tiên, người ta tính toán N không an toàn của Orwin, để kiểm tra xem có bao nhiêu nghiên cứu nên được thêm vào để giảm thống kê thử nghiệm xuống một kích thước nhỏ. Nếu số lượng nghiên cứu này lớn hơn số lượng nghiên cứu được sử dụng trong phân tích tổng hợp, thì đó là một dấu hiệu cho thấy không có sai lệch về công bố, vì trong trường hợp đó, người ta cần nhiều nghiên cứu để giảm quy mô ảnh hưởng. Thứ hai, người ta có thể thực hiện kiểm tra hồi quy Egger, kiểm tra xem biểu đồ kênh có đối xứng hay không. Như đã đề cập trước đây: biểu đồ hình phễu đối xứng là một dấu hiệu cho thấy không có sai lệch về xuất bản, vì kích thước hiệu ứng và kích thước mẫu không phụ thuộc. Thứ ba, người ta có thể thực hiện phương pháp trim-and-fill, phương pháp này sẽ hiển thị dữ liệu nếu biểu đồ kênh không đối xứng.

Vấn đề thiên lệch xuất bản không phải là nhỏ vì người ta cho rằng 25% các phân tích tổng hợp trong khoa học tâm lý có thể đã mắc phải thiên vị xuất bản. [68] Tuy nhiên, công suất thấp của các thử nghiệm hiện tại và các vấn đề về hình thức trực quan của biểu đồ kênh vẫn còn là một vấn đề và ước tính về độ chệch xuất bản có thể vẫn thấp hơn những gì thực sự tồn tại.

Hầu hết các cuộc thảo luận về khuynh hướng xuất bản tập trung vào các thông lệ báo chí ủng hộ việc xuất bản các phát hiện có ý nghĩa thống kê. Tuy nhiên, các thực hành nghiên cứu có vấn đề, chẳng hạn như làm lại các mô hình thống kê cho đến khi đạt được mức ý nghĩa, cũng có thể ủng hộ những phát hiện có ý nghĩa thống kê để hỗ trợ giả thuyết của các nhà nghiên cứu. [69] [70]

Các vấn đề liên quan đến các nghiên cứu không báo cáo các tác động không có ý nghĩa thống kê

Các nghiên cứu thường không báo cáo các tác động khi chúng không đạt được ý nghĩa thống kê [ cần dẫn nguồn ] . Ví dụ, họ có thể chỉ đơn giản nói rằng các nhóm không cho thấy sự khác biệt có ý nghĩa thống kê, mà không báo cáo bất kỳ thông tin nào khác (ví dụ: thống kê hoặc giá trị p). Việc loại trừ các nghiên cứu này sẽ dẫn đến một tình huống tương tự như sai lệch về công bố, nhưng việc đưa chúng vào (giả sử các hiệu ứng vô hiệu) cũng sẽ làm sai lệch phân tích tổng hợp. MetaNSUE, một phương pháp được tạo ra bởi Joaquim Radua , đã cho phép các nhà nghiên cứu đưa vào các nghiên cứu này một cách khách quan. [71] Các bước của nó như sau:

  • Ước tính khả năng tối đa của hiệu ứng phân tích tổng hợp và sự không đồng nhất giữa các nghiên cứu.
  • Nhiều tác động của NSUE làm tăng thêm nhiễu để ước tính hiệu ứng.
  • Phân tích tổng hợp riêng biệt cho từng tập dữ liệu được đưa ra.
  • Tổng hợp các kết quả của các phân tích tổng hợp này.

Các vấn đề liên quan đến phương pháp thống kê

Các điểm yếu khác là nó chưa được xác định nếu phương pháp thống kê chính xác nhất để kết hợp các kết quả là mô hình hiệu ứng cố định, IVhet, ngẫu nhiên hoặc chất lượng, mặc dù sự chỉ trích chống lại mô hình hiệu ứng ngẫu nhiên đang gia tăng do nhận thức rằng các hiệu ứng ngẫu nhiên mới ( được sử dụng trong phân tích tổng hợp) về cơ bản là các thiết bị chính thức để tạo điều kiện làm mịn hoặc thu nhỏ và dự đoán có thể là không thể hoặc không được thông báo. [72] Vấn đề chính của phương pháp tiếp cận tác động ngẫu nhiên là nó sử dụng tư tưởng thống kê cổ điển để tạo ra một "công cụ ước lượng thỏa hiệp" làm cho các trọng số gần với công cụ ước tính có trọng số tự nhiên nếu sự không đồng nhất giữa các nghiên cứu là lớn nhưng gần với công cụ ước tính có trọng số phương sai nghịch đảo nếu sự không đồng nhất giữa các nghiên cứu là nhỏ. Tuy nhiên, điều đã bị bỏ qua là sự khác biệt giữa mô hình chúng tôi chọn để phân tích một tập dữ liệu nhất định và cơ chế mà dữ liệu ra đời . [73] Một hiệu ứng ngẫu nhiên có thể xuất hiện ở một trong hai vai trò này, nhưng hai vai trò khá khác biệt. Không có lý do gì để nghĩ rằng mô hình phân tích và cơ chế tạo dữ liệu (mô hình) giống nhau về hình thức, nhưng nhiều lĩnh vực con của thống kê đã phát triển thói quen giả định, đối với lý thuyết và mô phỏng, rằng cơ chế tạo dữ liệu (mô hình) là giống với mô hình phân tích mà chúng tôi chọn (hoặc muốn người khác chọn). Là một cơ chế được giả định để tạo ra dữ liệu, mô hình hiệu ứng ngẫu nhiên cho phân tích tổng hợp là ngớ ngẩn và phù hợp hơn nếu coi mô hình này như một mô tả hời hợt và một thứ mà chúng tôi chọn làm công cụ phân tích - nhưng lựa chọn này cho phân tích tổng hợp có thể không hoạt động bởi vì các hiệu ứng nghiên cứu là một đặc điểm cố định của phân tích tổng hợp tương ứng và phân phối xác suất chỉ là một công cụ mô tả. [73]

Các vấn đề phát sinh từ sự thiên vị do chương trình làm việc

Lỗi nghiêm trọng nhất trong phân tích tổng hợp [74] thường xảy ra khi cá nhân hoặc những người thực hiện phân tích tổng hợp có một chương trình nghị sự về kinh tế , xã hội hoặc chính trị như thông qua hoặc không thông qua luật pháp . Những người có các loại chương trình nghị sự này có thể có nhiều khả năng lạm dụng phân tích tổng hợp do thành kiến cá nhân . Ví dụ, các nhà nghiên cứu ủng hộ chương trình nghị sự của tác giả có khả năng sẽ chọn anh đào nghiên cứu của họ trong khi những nghiên cứu không thuận lợi sẽ bị bỏ qua hoặc bị dán nhãn là "không đáng tin cậy". Ngoài ra, bản thân các tác giả được yêu thích có thể bị thiên vị hoặc được trả tiền để tạo ra các kết quả hỗ trợ các mục tiêu chính trị, xã hội hoặc kinh tế tổng thể của họ theo những cách như chọn các tập dữ liệu nhỏ thuận lợi và không kết hợp các tập dữ liệu bất lợi lớn hơn. Có thể có ảnh hưởng của những thành kiến ​​như vậy đối với kết quả của một phân tích tổng hợp vì phương pháp của phân tích tổng hợp rất dễ uốn nắn. [75]

Một nghiên cứu năm 2011 được thực hiện để tiết lộ các xung đột lợi ích có thể xảy ra trong các nghiên cứu cơ bản được sử dụng cho các phân tích tổng hợp y tế đã xem xét 29 phân tích tổng hợp và phát hiện ra rằng các xung đột lợi ích trong các nghiên cứu nằm dưới phân tích tổng hợp hiếm khi được tiết lộ. 29 phân tích tổng hợp bao gồm 11 từ các tạp chí y học nói chung, 15 từ các tạp chí y học chuyên khoa, và ba từ Cơ sở dữ liệu Cochrane về các Tổng quan có hệ thống . 29 phân tích tổng hợp đã xem xét tổng số 509 thử nghiệm ngẫu nhiên có đối chứng (RCT). Trong số này, 318 RCT đã báo cáo các nguồn tài trợ, với 219 (69%) nhận được tài trợ từ ngành công nghiệp (tức là một hoặc nhiều tác giả có quan hệ tài chính với ngành dược phẩm). Trong số 509 RCT, 132 tác giả được báo cáo tiết lộ xung đột lợi ích, với 91 nghiên cứu (69%) tiết lộ một hoặc nhiều tác giả có quan hệ tài chính với ngành. Tuy nhiên, thông tin hiếm khi được phản ánh trong các phân tích tổng hợp. Chỉ có hai (7%) báo cáo các nguồn tài trợ RCT và không có báo cáo nào về mối quan hệ giữa tác giả và ngành của RCT. Các tác giả kết luận "mà không thừa nhận COI do tài trợ của ngành hoặc mối quan hệ tài chính của ngành tác giả từ RCT được đưa vào phân tích tổng hợp, sự hiểu biết và đánh giá của người đọc về bằng chứng từ phân tích tổng hợp có thể bị ảnh hưởng." [76]

Ví dụ, vào năm 1998, một thẩm phán liên bang Hoa Kỳ phát hiện ra rằng Cơ quan Bảo vệ Môi trường Hoa Kỳ đã lạm dụng quy trình phân tích tổng hợp để đưa ra một nghiên cứu khẳng định nguy cơ ung thư đối với những người không hút thuốc do khói thuốc trong môi trường (ETS) với mục đích gây ảnh hưởng đến các nhà hoạch định chính sách. để thông qua luật nơi làm việc không khói thuốc. Thẩm phán nhận thấy rằng:

Lựa chọn nghiên cứu của EPA là đáng lo ngại Đầu tiên, có bằng chứng trong hồ sơ ủng hộ cáo buộc rằng EPA đã "chọn" dữ liệu của mình. Nếu không có tiêu chí để gộp các nghiên cứu vào một phân tích tổng hợp, tòa án không thể xác định việc loại trừ các nghiên cứu có khả năng bác bỏ giả thuyết tiên nghiệm của EPA là trùng hợp hay cố ý. Thứ hai, việc EPA loại trừ gần một nửa số nghiên cứu hiện có mâu thuẫn trực tiếp với mục đích phân tích các nghiên cứu dịch tễ học của EPA và mâu thuẫn với Hướng dẫn Đánh giá Rủi ro của EPA. Xem Đánh giá rủi ro ETS ở 4-29 ("Những dữ liệu này cũng nên được kiểm tra với lợi ích là cân nhắc tất cả các bằng chứng sẵn có , theo khuyến nghị của hướng dẫn đánh giá nguy cơ gây ung thư của EPA (US EPA, 1986a) (nhấn mạnh thêm)). Thứ ba, EPA có chọn lọc sử dụng dữ liệu xung đột với Đạo luật Nghiên cứu Radon. Đạo luật quy định chương trình của EPA sẽ "thu thập dữ liệu và thông tin về tất cả các khía cạnh của chất lượng không khí trong nhà" (Đạo luật Nghiên cứu Radon § 403 (a) (1)) (nhấn mạnh thêm). [77]

Kết quả của việc lạm dụng, tòa án đã bỏ qua Chương 1–6 của và Phụ lục của EPA "Ảnh hưởng đến sức khỏe đường hô hấp của việc hút thuốc thụ động: Ung thư phổi và các rối loạn khác". [77]

Tiêu chuẩn hòa nhập yếu kém dẫn đến kết luận sai lầm

Các phân tích tổng hợp trong giáo dục thường không đủ hạn chế về chất lượng phương pháp luận của các nghiên cứu mà chúng bao gồm. Ví dụ, các nghiên cứu bao gồm các mẫu nhỏ hoặc các biện pháp do nhà nghiên cứu thực hiện dẫn đến ước tính kích thước hiệu ứng bị thổi phồng. [78]

Ứng dụng trong khoa học hiện đại

Phân tích tổng hợp thống kê hiện đại không chỉ kết hợp các kích thước ảnh hưởng của một tập hợp các nghiên cứu bằng cách sử dụng trung bình có trọng số. Nó có thể kiểm tra xem kết quả của các nghiên cứu có cho thấy nhiều sự thay đổi hơn so với sự thay đổi được mong đợi hay không do việc lấy mẫu các số lượng người tham gia nghiên cứu khác nhau. Ngoài ra, các đặc điểm nghiên cứu như công cụ đo lường được sử dụng, dân số được lấy mẫu hoặc các khía cạnh của thiết kế nghiên cứu có thể được mã hóa và sử dụng để giảm phương sai của công cụ ước lượng (xem các mô hình thống kê ở trên). Do đó, một số điểm yếu về phương pháp luận trong các nghiên cứu có thể được điều chỉnh về mặt thống kê. Các ứng dụng khác của phương pháp phân tích tổng hợp bao gồm phát triển và xác nhận các mô hình dự đoán lâm sàng, trong đó phân tích tổng hợp có thể được sử dụng để kết hợp dữ liệu của từng người tham gia từ các trung tâm nghiên cứu khác nhau và để đánh giá tính tổng quát của mô hình, [79] [80] hoặc thậm chí để tổng hợp các mô hình dự đoán hiện có. [81]

Phân tích tổng hợp có thể được thực hiện với thiết kế đơn chủ đề cũng như thiết kế nghiên cứu nhóm. Điều này rất quan trọng vì nhiều nghiên cứu đã được thực hiện với các thiết kế nghiên cứu đơn chủ đề . Tranh chấp đáng kể tồn tại đối với kỹ thuật phân tích tổng hợp thích hợp nhất cho nghiên cứu chủ đề đơn lẻ. [82]

Phân tích tổng hợp dẫn đến sự chuyển đổi trọng tâm từ các nghiên cứu đơn lẻ sang nhiều nghiên cứu. Nó nhấn mạnh tầm quan trọng thực tế của quy mô ảnh hưởng thay vì ý nghĩa thống kê của các nghiên cứu riêng lẻ. Sự thay đổi tư duy này được gọi là "tư duy phân tích tổng hợp". Kết quả của một phân tích tổng hợp thường được hiển thị trong một lô rừng .

Kết quả từ các nghiên cứu được kết hợp bằng cách sử dụng các cách tiếp cận khác nhau. Một cách tiếp cận thường được sử dụng trong phân tích tổng hợp trong nghiên cứu chăm sóc sức khỏe được gọi là ' phương pháp phương sai nghịch đảo '. Kích thước ảnh hưởng trung bình trên tất cả các nghiên cứu được tính như một giá trị trung bình có trọng số , theo đó các trọng số bằng phương sai nghịch đảo của công cụ ước tính ảnh hưởng của mỗi nghiên cứu. Các nghiên cứu lớn hơn và các nghiên cứu có ít biến động ngẫu nhiên hơn sẽ có trọng số lớn hơn các nghiên cứu nhỏ hơn. Các phương pháp tiếp cận phổ biến khác bao gồm phương pháp Mantel-Haenszel [83] và phương pháp Peto . [84]

Ánh xạ d dựa trên hạt giống (trước đây là ánh xạ vi phân có chữ ký, SDM) là một kỹ thuật thống kê để phân tích tổng hợp các nghiên cứu về sự khác biệt trong hoạt động hoặc cấu trúc của não sử dụng các kỹ thuật hình ảnh thần kinh như fMRI, VBM hoặc PET.

Các kỹ thuật thông lượng cao khác nhau như microarrays đã được sử dụng để hiểu sự biểu hiện của gen . Hồ sơ biểu hiện microRNA đã được sử dụng để xác định các microRNA được biểu hiện khác biệt trong các loại tế bào hoặc mô cụ thể hoặc các tình trạng bệnh hoặc để kiểm tra hiệu quả của một phương pháp điều trị. Một phân tích tổng hợp của các cấu hình biểu hiện như vậy đã được thực hiện để đưa ra các kết luận mới và xác nhận các phát hiện đã biết. [85]

Xem thêm

  • iconCổng toán học
  • Thống kê ước tính
  • Metascience
  • Thang đo Newcastle – Ottawa
  • Báo cáo thiên vị
  • Tạp chí đánh giá
  • Nghiên cứu thứ cấp
  • Nghiên cứu tính không đồng nhất
  • Đánh giá có hệ thống
  • Cốt truyện Galbraith
  • Tổng hợp dữ liệu

Người giới thiệu

  1. ^ Greenland S, O 'Rourke K: Phân tích tổng hợp. Trang 652 trong Dịch tễ học hiện đại, xuất bản lần thứ 3. Biên tập bởi Rothman KJ, Greenland S, Lash T. Lippincott Williams và Wilkins; Năm 2008.
  2. ^ Walker E, Hernandez AV, Kattan MW (2008). "Phân tích tổng hợp: Điểm mạnh và hạn chế của nó". Cleve Clin J Med . 75 (6): 431–9. doi : 10.3949 / ccjm.75.6.431 . PMID  18595551 .
  3. ^ Wanous, John P.; Sullivan, Sherry E.; Malinak, Joyce (1989). "Vai trò của phán đoán trong phân tích tổng hợp". Tạp chí Tâm lý học Ứng dụng . 74 (2): 259–264. doi : 10.1037 / 0021-9010.74.2.259 . ISSN  0021-9010 .
  4. ^ "Bảng chú giải thuật ngữ tại Cochrane Collaboration" . cochrane.org .
  5. ^ Gravetter, Frederick J.; Forzano, Lori-Ann B. (ngày 1 tháng 1 năm 2018). Phương pháp Nghiên cứu Khoa học Hành vi . Học tập Cengage. p. 36. ISBN 9781337613316. Một số ví dụ về các nguồn thứ cấp là (1) sách và sách giáo khoa trong đó tác giả mô tả và tóm tắt nghiên cứu trong quá khứ, (2) các bài báo đánh giá hoặc phân tích tổng hợp ...
  6. ^ Adams, Kathrynn A. .; Lawrence, Eva K. (ngày 2 tháng 2 năm 2018). Phương pháp nghiên cứu, thống kê và ứng dụng . Ấn phẩm SAGE. ISBN 9781506350462. Các loại nguồn thứ cấp phổ biến nhất được tìm thấy trong các tạp chí học thuật là các bài phê bình tài liệu và phân tích tổng hợp.
  7. ^ PLACKETT, RL (1958). "Các nghiên cứu trong lịch sử của xác suất và thống kê: Vii. Nguyên tắc của số học trung bình". Biometrika . 45 (1–2): 133. doi : 10.1093 / biomet / 45.1-2.130 .
  8. ^ Pearson K (1904). "Báo cáo về số liệu thống kê tiêm chủng bệnh sốt ruột nhất định" . BMJ . 2 (2288): 1243–1246. doi : 10.1136 / bmj.2.2288.1243 . PMC  2355479 . PMID  20761760 .
  9. ^ Nordmann AJ, Kasenda B, Briel M (ngày 9 tháng 3 năm 2012). "Phân tích tổng hợp: những gì họ có thể và không thể làm" . Tuần báo Y tế Thụy Sĩ . 142 : w13518. doi : 10.4414 / smw.2012.13518 . PMID  22407741 .
  10. ^ O'Rourke K (ngày 1 tháng 12 năm 2007). "Một quan điểm lịch sử về phân tích tổng hợp: xử lý một cách định lượng với các kết quả nghiên cứu khác nhau" . JR Soc Med . 100 (12): 579–582. doi : 10.1258 / jrsm.100.12.579 . PMC  2121629 . PMID  18065712 .
  11. ^ Pratt JG, Rhine JB, Smith BM, Stuart CE, Greenwood JA. Nhận thức ngoài giác quan sau 60 năm: Đánh giá quan trọng về nghiên cứu về nhận thức ngoài giác quan. New York: Henry Holt, 1940
  12. ^ Kính G. V (1976). "Phân tích chính, phụ và tổng hợp của nghiên cứu". Nhà nghiên cứu giáo dục . 5 (10): 3–8. doi : 10.3102 / 0013189X005010003 .
  13. ^ Cochran WG (1937). "Các vấn đề nảy sinh trong quá trình phân tích một loạt các thí nghiệm tương tự". Tạp chí của Hiệp hội Thống kê Hoàng gia . 4 (1): 102–118. doi : 10.2307 / 2984123 . 2984123 JSTOR  .
  14. ^ Cochran WG, Carroll SP (1953). "Điều tra lấy mẫu về hiệu quả của trọng số tỷ lệ nghịch với phương sai ước tính". Sinh trắc học . 9 (4): 447–459. doi : 10.2307 / 3001436 . JSTOR  3001436 .
  15. ^ "Tuyên bố PRISMA" . Prisma-statement.org. Ngày 2 tháng 2 năm 2012 . Truy cập ngày 2 tháng 2 năm 2012 .
  16. ^ Debray, Thomas PA; Moons, Karel GM; van Valkenhoef, Gert; Efthimiou, Orestis; Hummel, Noemi; Groenwold, Rolf HH; Reitsma, Johannes B.; thay mặt cho nhóm đánh giá các phương pháp GetReal (ngày 1 tháng 12 năm 2015). "Nhận thực trong phân tích tổng hợp dữ liệu người tham gia cá nhân (IPD): đánh giá phương pháp luận" . Phương pháp tổng hợp nghiên cứu . 6 (4): 293–309. doi : 10.1002 / jrsm.1160 . ISSN  1759-2887 . PMC  5042043 . PMID  26287812 .
  17. ^ Debray TP, Moons KG, Abo-Zaid GM, Koffijberg H, Riley RD (2013). "Phân tích tổng hợp dữ liệu người tham gia cá nhân cho kết quả nhị phân: một giai đoạn hay hai giai đoạn?" . PLOS One . 8 (4): e60650. Mã bib : 2013PLoSO ... 860650D . doi : 10.1371 / journal.pone.0060650 . PMC  3621872 . PMID  23585842 .
  18. ^ Burke, Danielle L.; Lính, Joie; Riley, Richard D. (ngày 28 tháng 2 năm 2017). "Phân tích tổng hợp bằng cách sử dụng dữ liệu người tham gia cá nhân: cách tiếp cận một giai đoạn và hai giai đoạn và tại sao chúng có thể khác nhau" . Thống kê trong Y học . 36 (5): 855–875. doi : 10.1002 / sim.7141 . ISSN  1097-0258 . PMC  5297998 . PMID  27747915 .
  19. ^ Helfenstein U (2002). "Dữ liệu và mô hình xác định đề xuất điều trị - một minh họa từ phân tích tổng hợp" . Thạc Med J . 78 (917): 131–4. doi : 10.1136 / pmj.78.917.131 . PMC  1742301 . PMID  11884693 .
  20. ^ Senn S (2007). "Cố chính xác mơ hồ". Thống kê Med . 26 (7): 1417–30. doi : 10.1002 / sim.2639 . PMID  16906552 .
  21. ^ a b Al Khalaf MM, Thalib L, Doi SA (2011). "Việc kết hợp các nghiên cứu không đồng nhất bằng cách sử dụng mô hình hiệu ứng ngẫu nhiên là một sai lầm và dẫn đến các phân tích tổng hợp không kết luận được" . Tạp chí Dịch tễ học Lâm sàng . 64 (2): 119–23. doi : 10.1016 / j.jclinepi.2010.01.009 . PMID  20409685 .
  22. ^ a b Brockwell SE; Gordon IR (2001). "So sánh các phương pháp thống kê để phân tích tổng hợp". Thống kê trong Y học . 20 (6): 825–840. doi : 10.1002 / sim.650 . PMID  11252006 .
  23. ^ a b c Noma H (tháng 12 năm 2011). "Khoảng tin cậy cho một phân tích tổng hợp hiệu ứng ngẫu nhiên dựa trên các hiệu chỉnh kiểu Bartlett". Thống kê Med . 30 (28): 3304–12. doi : 10.1002 / sim.4350 . hdl : 2433/152046 . PMID  21964669 .
  24. ^ Brockwell SE, Gordon IR (2007). "Một phương pháp đơn giản để suy luận về một hiệu ứng tổng thể trong phân tích tổng hợp". Thống kê trong Y học . 26 (25): 4531–4543. doi : 10.1002 / sim.2883 . PMID  17397112 .
  25. ^ Sidik K, Jonkman JN (2002). "Khoảng tin cậy đơn giản cho phân tích tổng hợp". Thống kê trong Y học . 21 (21): 3153–3159. doi : 10.1002 / sim.1262 . PMID  12375296 .
  26. ^ Jackson D, Bowden J (2009). "Đánh giá lại 'phương pháp xấp xỉ lượng tử' để phân tích tổng hợp các hiệu ứng ngẫu nhiên" . Thống kê Med . 28 (2): 338–48. doi : 10.1002 / sim.3487 . PMC  2991773 . PMID  19016302 .
  27. ^ Poole C, Greenland S (tháng 9 năm 1999). "Phân tích tổng hợp hiệu ứng ngẫu nhiên không phải lúc nào cũng bảo thủ" . Là J Epidemiol . 150 (5): 469–75. doi : 10.1093 / oxfordjournals.aje.a010035 . PMID  10472946 .
  28. ^ Riley RD, Higgins JP, Deeks JJ (2011). "Diễn giải các phân tích tổng hợp các hiệu ứng ngẫu nhiên" . Tạp chí Y học Anh . 342 : d549. doi : 10.1136 / bmj.d549 . PMID  21310794 .
  29. ^ Kriston L (2013). "Xử lý sự không đồng nhất trên lâm sàng trong phân tích tổng hợp. Giả định, phương pháp, diễn giải" . Phương pháp Int J Nhà tâm thần học Res . 22 (1): 1–15. doi : 10.1002 / mpr.1377 . PMC  6878481 . PMID  23494781 .
  30. ^ DerSimonian R , Laird N (1986). "Phân tích tổng hợp trong các thử nghiệm lâm sàng". Kiểm soát Thử nghiệm Clin . 7 (3): 177–88. doi : 10.1016 / 0197-2456 (86) 90046-2 . PMID  3802833 .
  31. ^ Kontopantelis, Evangelos; Reeves, David (ngày 1 tháng 8 năm 2010). "Metaan: Phân tích tổng hợp hiệu ứng ngẫu nhiên" . Tạp chí Stata . 10 (3): 395–407. doi : 10.1177 / 1536867X1001000307 - thông qua ResearchGate.
  32. ^ Kontopantelis, Evangelos; Reeves, David (2009). "MetaEasy: Phần bổ trợ Phân tích Siêu dành cho Microsoft Excel, Tạp chí Phần mềm Thống kê 2009" . Tạp chí Phần mềm Thống kê . 30 (7). doi : 10.18637 / jss.v030.i07 .
  33. ^ "Trang web của nhà phát triển" . Statanalysis.co.uk . Truy cập ngày 18 tháng 9 năm 2018 .
  34. ^ Kontopantelis E, Reeves D (2012). "Hiệu suất của các phương pháp thống kê để phân tích tổng hợp khi các hiệu ứng nghiên cứu thực sự không được phân phối chuẩn: Một nghiên cứu mô phỏng". Phương pháp thống kê trong nghiên cứu y học . 21 (4): 409–26. doi : 10.1177 / 0962280210392008 . PMID  21148194 .
  35. ^ Kontopantelis E, Reeves D (2012). "Hiệu suất của các phương pháp thống kê để phân tích tổng hợp khi các hiệu ứng nghiên cứu thực sự không được phân phối bình thường: so sánh giữa DerSimonian-Laird và khả năng tối đa bị hạn chế". SMMR . 21 (6): 657–9. doi : 10.1177 / 0962280211413451 . PMID  23171971 .
  36. ^ Kontopantelis E, Springate DA, Reeves D (2013). Friede T (biên tập). "Phân tích lại dữ liệu thư viện Cochrane: Nguy cơ của tính không đồng nhất không được quan sát trong phân tích tổng hợp" . PLOS One . 8 (7): e69930. Mã bibcode : 2013PLoSO ... 869930K . doi : 10.1371 / journal.pone.0069930 . PMC  3724681 . PMID  23922860 .
  37. ^ Kontopantelis, Evangelos; Reeves, David (ngày 27 tháng 9 năm 2013). "Hướng dẫn ngắn và lệnh lô rừng (ipdforest) để phân tích tổng hợp một giai đoạn" . Tạp chí Stata . 13 (3): 574–587. doi : 10.1177 / 1536867X1301300308 - thông qua ResearchGate.
  38. ^ a b c "Hướng dẫn Sử dụng MetaXL" (PDF) . Truy cập ngày 18 tháng 9 năm 2018 .
  39. ^ a b c d "Trang phần mềm MetaXL" . Epigear.com. Ngày 3 tháng 6 năm 2017 . Truy cập ngày 18 tháng 9 năm 2018 .
  40. ^ Doi SA, Barendregt JJ, Khan S, Thalib L, Williams GM (2015). "Những tiến bộ trong Phân tích gộp các thử nghiệm lâm sàng không đồng nhất I: Mô hình không đồng nhất phương sai nghịch đảo" (PDF) . Xem thử các thử nghiệm của Clin . 45 (Pt A): 130–8. doi : 10.1016 / j.cct.2015.05.009 . hdl : 1885/17083 . PMID  26003435 .
  41. ^ a b Doi SA, Thalib L (2008). "Mô hình hiệu ứng chất lượng cho phân tích tổng hợp". Dịch tễ học . 19 (1): 94–100. doi : 10.1097 / EDE.0b013e31815c24e7 . PMID  18090860 .
  42. ^ Doi SA, Barendregt JJ, Mozurkewich EL (2011). "Phân tích tổng hợp các thử nghiệm lâm sàng không đồng nhất: một ví dụ thực nghiệm". Xem thử các thử nghiệm của Clin . 32 (2): 288–98. doi : 10.1016 / j.cct.2010.12.006 . PMID  21147265 .
  43. ^ Doi SA, Barendregt JJ, Williams GM, Khan S, Thalib L (2015). "So sánh mô phỏng giữa các hiệu ứng chất lượng và các tác động ngẫu nhiên của phương pháp phân tích tổng hợp". Dịch tễ học . 26 (4): e42–4. doi : 10.1097 / EDE.0000000000000289 . PMID  25872162 .
  44. ^ Doi SA, Barendregt JJ, Khan S, Thalib L, Williams GM (2015). "Những tiến bộ trong phân tích tổng hợp các thử nghiệm lâm sàng không đồng nhất II: Mô hình hiệu ứng chất lượng". Xem thử các thử nghiệm của Clin . 45 (Pt A): 123–9. doi : 10.1016 / j.cct.2015.05.010 . PMID  26003432 .
  45. ^ Bucher HC; Guyatt GH; Griffith LE; Walter SD (1997). "Kết quả so sánh điều trị trực tiếp và gián tiếp trong phân tích tổng hợp các thử nghiệm ngẫu nhiên có đối chứng". J Clin Dịch tễ . 50 (6): 683–691. doi : 10.1016 / s0895-4356 (97) 00049-8 . PMID  9250266 .
  46. ^ a b Valkenhoef G.; Lu G.; Brock B.; Hillege H.; Ades AE; Welton NJ (2012). "Tự động hóa phân tích meta mạng". Phương pháp tổng hợp nghiên cứu . 3 (4): 285–299. doi : 10.1002 / jrsm.1054 . PMID  26053422 .
  47. ^ Brooks SP, Gelman A (1998). "Các phương pháp chung để giám sát sự hội tụ của mô phỏng lặp" (PDF) . Tạp chí Thống kê Tính toán và Đồ thị . 7 (4): 434–455. doi : 10.1080 / 10618600.1998.10474787 .
  48. ^ van Valkenhoef G, Lu G, de Brock B, Hillege H, Ades AE, Welton NJ. Tự động hóa phân tích tổng hợp mạng. Phương thức Res Synth. 2012 Tháng 12; 3 (4): 285-99.
  49. ^ a b Senn S, Gavini F, Magrez D, Scheen A (tháng 4 năm 2013). "Các vấn đề khi thực hiện phân tích tổng hợp mạng". Phương pháp thống kê Med Res . 22 (2): 169–89. doi : 10.1177 / 0962280211432220 . PMID  22218368 .
  50. ^ IR trắng (2011). "Hồi quy meta hiệu ứng ngẫu nhiên đa biến: cập nhật cho mvmeta" . Tạp chí Stata . 11 (2): 255–270. doi : 10.1177 / 1536867X1101100206 .
  51. ^ van Valkenhoef G, Lu G, de Brock B, Hillege H, Ades AE, Welton NJ. Tự động hóa phân tích tổng hợp mạng. Phương thức Res Synth. 2012 tháng 12; 3 (4): 285-99
  52. ^ Willis BH, Hyde CJ (2014). "Ước tính độ chính xác của bài kiểm tra bằng cách sử dụng phân tích tổng hợp được điều chỉnh - Cách dữ liệu cụ thể về cài đặt có thể hỗ trợ lựa chọn nghiên cứu" . Tạp chí Dịch tễ học Lâm sàng . 67 (5): 538–546. doi : 10.1016 / j.jclinepi.2013.10.016 . PMID  24447592 .
  53. ^ Willis BH, Hyde CJ (2015). "Độ chính xác của thử nghiệm trong dân số thực hành của tôi là bao nhiêu? Phân tích tổng hợp phù hợp cung cấp một ước tính hợp lý" . Tạp chí Dịch tễ học Lâm sàng . 68 (8): 847–854. doi : 10.1016 / j.jclinepi.2014.10.002 . PMID  25479685 .
  54. ^ Zhang H, Deng L, Schiffman M, Qin J, Yu K (2020). "Mô hình tích hợp tổng quát để cải thiện suy luận thống kê bằng cách tận dụng dữ liệu tóm tắt bên ngoài". Biometrika . doi : 10.1093 / biomet / asaa014 .
  55. ^ Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, Savovic J, Schulz KF, Weeks L, Sterne JA; Nhóm Phương pháp Bias Cochrane; Nhóm phương pháp thống kê Cochrane (2011). "Công cụ của Cochrane Collaboration để đánh giá nguy cơ sai lệch trong các thử nghiệm ngẫu nhiên" . BMJ . 343 : d5928. doi : 10.1136 / bmj.d5928 . PMC  3196245 . PMID  22008217 .Bảo trì CS1: nhiều tên: danh sách tác giả ( liên kết )
  56. ^ Whiting PF, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, Leeflang MM, Sterne JA, Bossuyt PM, QUADAS-2 Group (2011). "QUADAS-2: một công cụ sửa đổi để đánh giá chất lượng của các nghiên cứu độ chính xác chẩn đoán" . Biên niên sử của Y học Nội khoa . 155 (8): 529–36. doi : 10.7326 / 0003-4819-155-8-201110180-00009 . PMID  22007046 .Bảo trì CS1: nhiều tên: danh sách tác giả ( liên kết )
  57. ^ Royston P, Parmar MK, Sylvester R (2004). "Xây dựng và xác nhận mô hình tiên lượng qua một số nghiên cứu, với một ứng dụng trong ung thư bàng quang bề ngoài". Thống kê trong Y học . 23 (6): 907–26. doi : 10.1002 / sim.1691 . PMID  15027080 .
  58. ^ Willis BH, Riley RD (2017). "Đo lường hiệu lực thống kê của các kết quả phân tích tổng hợp và hồi quy tổng hợp để sử dụng trong thực hành lâm sàng" . Thống kê trong Y học . 36 (21): 3283–3301. doi : 10.1002 / sim.7372 . PMC  5575530 . PMID  28620945 .
  59. ^ Riley RD, Ahmed I, Debray TP, Willis BH, Noordzij P, Higgins JP, Deeks JJ (2015). "Tổng hợp và xác nhận kết quả độ chính xác của xét nghiệm qua nhiều nghiên cứu để sử dụng trong thực hành lâm sàng" . Thống kê trong Y học . 34 (13): 2081–2103. doi : 10.1002 / sim.6471 . PMC  4973708 . PMID  25800943 .
  60. ^ LeLorier J, Grégoire G, Benhaddad A, Lapierre J, Derderian F (1997). "Sự khác biệt giữa Phân tích tổng hợp và Thử nghiệm được kiểm soát, ngẫu nhiên lớn tiếp theo". Tạp chí Y học New England . 337 (8): 536–542. doi : 10.1056 / NEJM199708213370806 . PMID  9262498 .
  61. ^ a b Slavin RE (1986). "Tổng hợp bằng chứng tốt nhất: Một sự thay thế cho các bài đánh giá phân tích tổng hợp và truyền thống". Nhà nghiên cứu giáo dục . 15 (9): 5–9. doi : 10.3102 / 0013189X015009005 .
  62. ^ Hunter, Schmidt và Jackson, John E. (1982). Phân tích tổng hợp: Tổng hợp các kết quả nghiên cứu qua các nghiên cứu . Beverly Hills, California: Hiền nhân.Bảo trì CS1: nhiều tên: danh sách tác giả ( liên kết )
  63. ^ Glass, McGaw, & Smith (1981). Phân tích tổng hợp trong nghiên cứu xã hội . Beverly Hills, CA: Hiền giả.Bảo trì CS1: nhiều tên: danh sách tác giả ( liên kết )
  64. ^ a b Rosenthal R (1979). "" Vấn đề ngăn kéo tệp "và dung sai cho kết quả rỗng" . Bản tin Tâm lý . 86 (3): 638–641. doi : 10.1037 / 0033-2909.86.3.638 .
  65. ^ Thợ săn, John E ; Schmidt, Frank L (1990). Phương pháp phân tích tổng hợp: Sửa lỗi và sai lệch trong kết quả nghiên cứu . Công viên Newbury, California; London; New Delhi: Ấn phẩm SAGE .
  66. ^ Light & Pillemer (1984). Tóm lại: Khoa học nghiên cứu tổng kết . Cambridge, CA: Đại học Harvard Pree.
  67. ^ Ioannidis JP, Trikalinos TA (2007). "Sự phù hợp của các bài kiểm tra bất đối xứng đối với sự sai lệch công bố trong các phân tích tổng hợp: một cuộc khảo sát lớn" . CMAJ . 176 (8): 1091–6. doi : 10.1503 / cmaj.060410 . PMC  1839799 . PMID  17420491 .
  68. ^ a b Ferguson CJ, Brannick MT (2012). "Sự thiên vị xuất bản trong khoa học tâm lý: mức độ phổ biến, các phương pháp xác định và kiểm soát, và tác động của việc sử dụng các phân tích tổng hợp". Phương pháp Psychol . 17 (1): 120–8. doi : 10.1037 / a0024445 . PMID  21787082 .
  69. ^ Simmons JP, Nelson LD, Simonsohn U (2011). "Tâm lý tích cực giả: tính linh hoạt không được tiết lộ trong việc thu thập và phân tích dữ liệu cho phép trình bày bất cứ điều gì là quan trọng" . Khoa học viễn tưởng Psychol . 22 (11): 1359–66. doi : 10.1177 / 0956797611417632 . PMID  22006061 .
  70. ^ LeBel, E.; Peters, K. (2011). "Lo sợ tương lai của tâm lý học thực nghiệm: Bằng chứng của Bem (2011) về psi như một nghiên cứu điển hình về những khiếm khuyết trong thực hành nghiên cứu phương thức" (PDF) . Tổng quan về Tâm lý học đại cương . 15 (4): 371–379. doi : 10.1037 / a0025172 . Bản gốc lưu trữ (PDF) ngày 24 tháng 11 năm 2012.
  71. ^ Radua, J.; Schmidt, A. .; Borgwardt, S.; Heinz, A. .; Schlagenhauf, F.; McGuire, P.; Fusar-Poli, P. (2015). "Kích hoạt Striatal Ventral trong quá trình xử lý phần thưởng trong rối loạn tâm thần: Phân tích tổng hợp chức năng thần kinh" . JAMA Tâm thần học . 72 (12): 1243–1251. doi : 10.1001 / jamapsychiatry.2015.2196 . PMID  26558708 .
  72. ^ Hodges, Jim và Clayton, Murray K. Hiệu ứng ngẫu nhiên: Cũ và Mới. Khoa học thống kê XX: XX – XX. URL http: // www Được lưu trữ ngày 24 tháng 5 năm 2011 tại Wayback Machine . biostat. ừm. edu / ~ hodges / Hodges-ClaytonREONsubToStatSci (2011)
  73. ^ a b Hodges JS. Hiệu ứng ngẫu nhiên cũ và mới. Trong Hodges JS. Các mô hình tuyến tính được tham số hóa phong phú: mô hình cộng, chuỗi thời gian và mô hình không gian sử dụng các hiệu ứng ngẫu nhiên. Hoa Kỳ: CRC Press, 2013: 285–302.
  74. ^ H. Sabhan
  75. ^ Stegenga J (2011). "Phân tích tổng hợp có phải là tiêu chuẩn bằng chứng bạch kim không?" . Stud Hist Philos Biol Khoa học y sinh . 42 (4): 497–507. doi : 10.1016 / j.shpsc.2011.07.003 . PMID  22035723 .
  76. ^ Roseman M, Milette K, Bero LA, Coyne JC, Lexchin J, Turner EH, Thombs BD (2011), "Báo cáo Xung đột Lợi ích trong Phân tích tổng hợp các Thử nghiệm Điều trị Dược lý" , Tạp chí Hiệp hội Y khoa Hoa Kỳ , 305 ( 10): 1008–1017, doi : 10.1001 / jama.2011.257 , hdl : 11370 / d4a95ee2-429f-45a4-a917-d794ee954797 , PMID  21386079Bảo trì CS1: nhiều tên: danh sách tác giả ( liên kết )
  77. ^ a b "Quyết định Osteen" . Tòa án Khu vực Hoa Kỳ cho Khu vực Trung tâm của Bắc Carolina. Ngày 17 tháng 7 năm 1998 . Truy cập ngày 18 tháng 3 năm 2017 .
  78. ^ Cheung, Alan CK; Slavin, Robert E. (ngày 1 tháng 6 năm 2016). "Các Đặc điểm Phương pháp Ảnh hưởng Như thế nào đến Kích thước Hiệu quả trong Giáo dục" . Nhà nghiên cứu giáo dục . 45 (5): 283–292. doi : 10.3102 / 0013189X16656615 . ISSN  0013-189X .
  79. ^ Debray, Thomas PA; Riley, Richard D.; Rovers, Maroeska M.; Reitsma, Johannes B.; Moons, Karel GM (ngày 13 tháng 10 năm 2015). "Phân tích tổng hợp Dữ liệu Người tham gia Cá nhân (IPD) về Nghiên cứu Mô hình Chẩn đoán và Tiên lượng: Hướng dẫn Sử dụng Chúng" . Thuốc PLOS . 12 (10): e1001886. doi : 10.1371 / journal.pmed.1001886 . PMC  4603958 . PMID  26461078 .
  80. ^ Debray TP, Moons KG, Ahmed I, Koffijberg H, Riley RD (2013). "Một khuôn khổ để phát triển, triển khai và đánh giá các mô hình dự đoán lâm sàng trong phân tích tổng hợp dữ liệu của một người tham gia cá nhân". Thống kê trong Y học . 32 (18): 3158–80. doi : 10.1002 / sim.5732 . PMID  23307585 .
  81. ^ Debray TP, Koffijberg H, Vergouwe Y, Moons KG, Steyerberg EW (2012). "Tổng hợp các mô hình dự đoán đã xuất bản với dữ liệu người tham gia riêng lẻ: so sánh các phương pháp tiếp cận khác nhau". Thống kê trong Y học . 31 (23): 2697–2712. doi : 10.1002 / sim.5412 . PMID  22733546 .
  82. ^ Van den Noortgate W, Onghena P (2007). "Tổng hợp kết quả từng trường hợp" . Nhà phân tích hành vi ngày nay . 8 (2): 196–209. doi : 10.1037 / h0100613 .
  83. ^ Mantel N, Haenszel W (1959). "Các khía cạnh thống kê của việc phân tích dữ liệu từ phân tích hồi cứu về bệnh tật" . Tạp chí của Viện Ung thư Quốc gia . 22 (4): 719–748. doi : 10.1093 / jnci / 22.4.719 . PMID  13655060 .
  84. ^ "9.4.4.2 Phương pháp tỷ lệ chênh lệch Peto" . Sổ tay Cochrane về Đánh giá Hệ thống về Can thiệp v 5.1.0. Tháng 3 năm 2011.
  85. ^ Bargaje R, Hariharan M, Scaria V, Pillai B (2010). "Các cấu hình biểu hiện miRNA đồng thuận có nguồn gốc từ việc chuẩn hóa dữ liệu microarray giữa các tấm nền" . RNA . 16 (1): 16–25. doi : 10.1261 / rna.1688110 . PMC  2802026 . PMID  19948767 .

đọc thêm

  • Cooper, H. & Hedges, LV (1994). Sổ tay tổng hợp nghiên cứu . New York: Russell Sage.
  • Cornell, JE & Mulrow, CD (1999). Phân tích tổng hợp. Trong: HJ Adèr & GJ Mellenbergh (Eds). Phương pháp nghiên cứu trong khoa học xã hội, hành vi và đời sống (trang 285–323). Luân Đôn: Hiền giả.
  • Normand SL (1999). "Hướng dẫn Thống kê sinh học. Phân tích tổng hợp: Lập, Đánh giá, Kết hợp và Báo cáo". Thống kê trong Y học . 18 (3): 321–359. doi : 10.1002 / (SICI) 1097-0258 (19990215) 18: 3 <321 :: AID-SIM28> 3.0.CO; 2-P . PMID  10070677 .
  • Sutton, AJ, Jones, DR, Abrams, KR, Sheldon, TA, & Song, F. (2000). Phương pháp phân tích tổng hợp trong nghiên cứu y học . Luân Đôn: John Wiley. ISBN  0-471-49066-0
  • Higgins JPT, Green S (biên tập viên). Sổ tay Cochrane về Đánh giá Hệ thống về Can thiệp Phiên bản 5.0.1 [cập nhật tháng 9 năm 2008]. Hợp tác Cochrane, 2008. Có tại www.cochrane-handbook.org
  • Thompson SG, Pocock SJ; Pocock, Stuart J (ngày 2 tháng 11 năm 1991). "Phân tích meta có thể tin cậy được không?" (PDF) . Cây thương . 338 (8775): 1127–1130. doi : 10.1016 / 0140-6736 (91) 91975-Z . PMID  1682553 . Bản gốc lưu trữ (PDF) ngày 22 tháng 11 năm 2011 . Truy cập ngày 17 tháng 6 năm 2011 .. Khám phá hai quan điểm trái ngược nhau: liệu phân tích tổng hợp có cung cấp "phương pháp khách quan, định lượng để kết hợp bằng chứng từ các nghiên cứu riêng biệt nhưng tương tự" hay chỉ đơn thuần là "thủ thuật thống kê đưa ra các giả định không hợp lý trong việc tạo ra các khái quát đơn giản hóa từ một phức hợp các nghiên cứu khác nhau"?
  • Wilson, DB và Lipsey, MW (2001). Phân tích tổng hợp thực tế . Thousand Oaks: Sage xuất bản. ISBN  0-7619-2168-0
  • O'Rourke, K. (2007) Chỉ là lịch sử từ việc kết hợp thông tin: điều tra và tổng hợp những gì có thể phổ biến trong các quan sát hoặc nghiên cứu lâm sàng thông qua khả năng xảy ra. Oxford: Đại học Oxford, Khoa Thống kê. Cung cấp tài liệu nền tảng kỹ thuật và chi tiết về bài báo "Quan điểm lịch sử về phân tích tổng hợp" được trích dẫn trong tài liệu tham khảo.
  • Owen, AB (2009). "Đã xem lại phân tích tổng hợp của Karl Pearson". Biên niên sử Thống kê , 37 (6B), 3867–3892. Báo cáo bổ sung.
  • Ellis, Paul D. (2010). Hướng dẫn Cơ bản về Kích thước Hiệu ứng: Giới thiệu về Sức mạnh Thống kê, Phân tích Tổng hợp và Giải thích Kết quả Nghiên cứu . Vương quốc Anh: Nhà xuất bản Đại học Cambridge. ISBN  0-521-14246-6
  • Bonett, DG (2020) Tương quan lưỡng tính: Khoảng tin cậy, kiểm tra giả thuyết, phân tích tổng hợp và lập kế hoạch cỡ mẫu. Tạp chí Toán học và Tâm lý học Thống kê Anh 73. doi: 10.1111 / bmsp.12189
  • Bonett DG, Giá RM (2015). "Các phương pháp phân tích tổng hợp hệ số thay đổi cho các tỷ lệ chênh lệch và tỷ lệ rủi ro". Phương pháp Psychol . 20 (3): 394–406. doi : 10.1037 / met0000032 . PMID  25751513 .
  • Bonett DG, Giá RM (2014). "Phương pháp phân tích tổng hợp cho sự khác biệt rủi ro". Br J Toán Stat Psychol . 67 (3): 371–87. doi : 10.1111 / bmsp.12024 . PMID  23962020 .
  • Bonett DG (2010). "Hệ số thay đổi phương pháp phân tích tổng hợp cho độ tin cậy alpha" . Phương pháp Psychol . 15 (4): 368–85. doi : 10.1037 / a0020142 . PMID  20853952 .
  • Bonett DG (2009). "Ước tính khoảng phân tích tổng hợp cho sự khác biệt trung bình được chuẩn hóa và chưa chuẩn hóa". Phương pháp Psychol . 14 (3): 225–38. doi : 10.1037 / a0016619 . PMID  19719359 .
  • Bonett DG (2008). "Ước tính khoảng phân tích tổng hợp cho các mối tương quan hai biến" . Phương pháp Psychol . 13 (3): 173–81. doi : 10.1037 / a0012868 . PMID  18778150 .

liện kết ngoại

  • Sổ tay Cochrane về Đánh giá Hệ thống về Can thiệp
  • Phân tích meta ở 25 (Kính Gene V)
  • Các Mục Báo cáo Ưu tiên cho Tuyên bố Đánh giá Hệ thống và Phân tích Tổng hợp (PRISMA) , "một tập hợp các mục tối thiểu dựa trên bằng chứng để báo cáo trong các đánh giá có hệ thống và phân tích tổng hợp."
  • Gói “metansue” R và giao diện đồ họa
  • Bách khoa toàn thư về bằng chứng tốt nhất
Language
  • Thai
  • Français
  • Deutsch
  • Arab
  • Português
  • Nederlands
  • Türkçe
  • Tiếng Việt
  • भारत
  • 日本語
  • 한국어
  • Hmoob
  • ខ្មែរ
  • Africa
  • Русский

©Copyright This page is based on the copyrighted Wikipedia article "/wiki/Meta-analysis" (Authors); it is used under the Creative Commons Attribution-ShareAlike 3.0 Unported License. You may redistribute it, verbatim or modified, providing that you comply with the terms of the CC-BY-SA. Cookie-policy To contact us: mail to admin@tvd.wiki

TOP