Skip to main content
LibreTexts - Ukrayinska

5.8: Наслідки занадто малих випробувань

  • Page ID
    72277
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Методи, викладені в цьому розділі для вибору адекватного розміру вибірки, доступні протягом багатьох років, але, ймовірно, не є перебільшенням стверджувати, що більшість випробувань втручання занадто малі. Незважаючи на те, що зростає обізнаність про необхідність зарахування досить великої вибірки, ця глава завершується обговоренням наслідків вибору занадто малого розміру вибірки.

    По-перше, припустимо, що досліджуване втручання мало або зовсім не впливає на результат, що цікавить. Різниця, що спостерігається в суді, швидше за все, буде несуттєвою. Однак ширина КІ для міри ефекту (наприклад, відносний ризик) буде залежати від розміру вибірки. Якщо зразок невеликий, CI буде дуже широким, і тому, хоча він, ймовірно, буде включати нульове значення (нульова різниця між групами або відносний ризик 1), він буде поширюватися на включення великих значень міри ефекту. Іншими словами, випробування не зможе встановити, що втручання навряд чи матиме ефект охорони здоров'я чи клінічного значення. Наприклад, у дослідженні москітних сіток припустимо, що до кожної групи було включено лише 50 дітей, і припустимо, що спостерігаються показники селезінки в двох групах були однаковими на рівні 40%, що дає оцінений відносний ризик R = 1. Приблизний 95% CI для R поширився б від 0,62 до 1,62 (розділ 3.1). Відносний ризик 0,62 означатиме дуже істотний ефект, тобто зниження частоти селезінки з 40% до 25%, і це невелике дослідження не зможе виключити такий ефект, як дуже малоймовірний. Якби розмір вибірки в кожній групі був збільшений до 500, 95% CI поширився б лише від 0,86 до 1,16, набагато більш вузький інтервал.

    Припустимо, що втручання дійсно має помітний ефект. Занадто мале випробування матиме низьку потужність, тобто він матиме мало шансів дати статистично значущу різницю. Іншими словами, мало шансів продемонструвати, що втручання має ефект. У прикладі, якщо справжній ефект втручання полягає в зменшенні частоти селезінки з 40% до 25%, розмір вибірки 50 в кожній групі дасть силу лише 36%. Всього в кожній групі знадобиться 205 дітей, щоб дати 90% потужності (табл. 5.2). Навіть якщо буде виявлена значна різниця, КІ на ефект все одно буде дуже широкою, тому в кінці судового розгляду буде невизначеність, чи є ефект втручання малим і неважливим, або дуже великим і важливим.

    Проведення занадто малих випробувань має наслідки, що виходять за рамки результатів конкретного судового розгляду. Існують значні докази того, що випробування, що показують великі ефекти, швидше за все, будуть опубліковані, ніж ті, що демонструють незначний ефект або зовсім не мають ефекту. Припустимо, проводиться ряд невеликих випробувань конкретного втручання. Через велику помилку вибірки, що передбачається малими розмірами вибірки, деякі з цих випробувань дадуть оцінки ефекту втручання, які набагато більші за справжній ефект. Ці випробування, швидше за все, будуть опубліковані, і результат полягає в тому, що висновки в літературі, ймовірно, значно переоцінять справжні наслідки втручань. Ця публікаційна упередженість набагато менша для більших випробувань, оскільки великий судовий процес, який показує мало або взагалі не має ефекту, швидше за все, буде опублікований, ніж невеликий судовий розгляд з подібною різницею.