Skip to main content
LibreTexts - Ukrayinska

12.4: Симуляція надійності

Цілі навчання

  • Стан, коли неоднорідність дисперсії може призвести до дуже високого рівня помилок типу I
  • Вказати вплив перекісу на частоту помилок типу I

Інструкції

Ця демонстрація дозволяє досліджувати наслідки порушення припущень про нормальність і однорідність дисперсії. Коли починається моделювання, ви бачите розподіли двох популяцій. За замовчуванням вони обидва нормально розподілені, мають засоби0 і стандартні відхилення1. Типовий розмір вибірки для моделювання —5 для групи. Якщо натиснути кнопку «імітувати», проводяться2,000 модельовані експерименти. Ви можете налаштувати кількість симуляцій від2,000 до10,000. Для кожного експерименту обчислюєтьсяt -тест і відображається кількість тестів, які були значними, не значними, і коефіцієнт помилок типу I (пропорція значна).

Оскільки нульова гіпотеза вірна, і всі припущення виконуються за допомогою цих значень за замовчуванням, рівень помилок типу I повинен бути близьким до0.05, особливо якщо ви провели велику кількість симуляцій. Він не буде рівним0.05 через випадкових варіацій. Однак чим більша кількість симуляцій, які ви запускаєте, тим ближче рівень помилок типу I повинен прийти до0.05.

Ви можете вивчити наслідки порушення припущень тесту, зробивши один або обидва розподіли перекошені та/або зробивши стандартні відхилення розподілів різними. Ви також можете вивчити ефекти розміру вибірки та використовуваного рівня значущості (0.05або0.01).

Досліджуючи різні розподіли, розміри вибірки та рівні значущості, ви можете отримати відчуття того, наскільки добре працює тест при порушенні його порушень. Тест, який відносно не впливає на порушення його припущень, вважається «надійним».

Ілюстровані інструкції

Відео Демо

Відео нижче починається з проведення2000 моделювання з двома популяціями, кожна з яких має засоби0, стандартні відхилення2 без перекосу і розміри вибірки5. Відео продовжується, змінюючи різні аспекти дистрибутивів та запускати більше симуляцій. Зверніть увагу на кількість значущих тестів після кожного набору симуляцій.