Skip to main content
LibreTexts - Ukrayinska

14.2: Перевірка методу

  • Page ID
    24835
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Після розробки та оптимізації методу наступним кроком є визначення того, наскільки добре він працює в руках одного аналітика. Цей процес складають три етапи: визначення характеристик одного оператора, завершення сліпого аналізу стандартів та визначення міцності методу. Якщо доступний інший стандартний метод, то ми можемо проаналізувати один і той же зразок, використовуючи як стандартний метод, так і новий метод, і порівняти результати. Якщо результат для будь-якого разового тесту неприпустимий, то метод не є підходящим стандартним методом.

    Характеристики одного оператора

    Першим кроком перевірки методу є визначення точності, точності та межі виявлення, коли один аналітик використовує метод для аналізу стандартного зразка. Межа виявлення визначається шляхом аналізу відповідної заготовки реагенту. Точність визначається шляхом аналізу реплікованих ділянок зразка, бажано більше десяти. Точність оцінюється за допомогою t-тесту для порівняння експериментальних результатів з відомою кількістю аналіту в стандарті. Точність і точність оцінюються для декількох різних концентрацій аналіту, включаючи принаймні одну концентрацію поблизу межі виявлення, і для кожної різної матриці зразка. Включення різних концентрацій аналіту допомагає виявити постійні джерела детермінантної похибки і встановити діапазон концентрацій, для яких застосовується метод.

    Сліпий аналіз стандартних зразків

    Однооператорні характеристики визначаються шляхом аналізу стандартної вибірки, яка має відому аналітику концентрацію аналіту. Другим етапом перевірки методу є сліпий аналіз стандартних зразків. Хоча концентрація аналіту в стандарті відома керівнику, інформація утримується від аналітика. Після аналізу стандартного зразка кілька разів середня концентрація аналіта повідомляється керівнику тесту. Для прийняття експериментальне середнє має бути в межах трьох стандартних відхилень - як визначено з однооператорних характеристик - відомої концентрації аналіту.

    Ще більш сувора вимога полягає в тому, щоб вимагати, щоб експериментальне середнє значення знаходилося в межах двох стандартних відхилень відомої концентрації аналіту.

    Тестування на міцність

    Оптимізований метод може дати відмінні результати в лабораторії, яка розробляє метод, але погані результати в інших лабораторіях. Це не особливо дивно, оскільки метод, як правило, оптимізується одним аналітиком, використовуючи однакові реагенти, обладнання та прилади для кожного випробування. Будь-яка мінливість, внесена різними аналітиками, реактивами, обладнанням та приладобудуванням, не включається в характеристики одного оператора. Інші менш очевидні фактори можуть впливати на аналіз, включаючи фактори навколишнього середовища, такі як температура або відносна вологість в лабораторії; якщо процедура не вимагає контролю цих умов, то вони можуть сприяти мінливості. Нарешті, аналітик, який оптимізує метод, зазвичай особливо ретельно виконує аналіз точно так само під час кожного випробування, що може мінімізувати мінливість запуску до запуску.

    Важливим етапом розробки стандартного методу є визначення того, які чинники мають виражений вплив на якість результатів. Як тільки ми виявимо ці фактори, ми можемо написати конкретні інструкції, які вказують, як ці фактори повинні контролюватися. Процедура, яка при ретельному дотриманні дає результати високої якості в різних лабораторіях, вважається жорсткою. Метод, за допомогою якого виявляються критичні фактори, називається тестуванням на міцність [Youden, WJ Anal. Хім. 1960, 32 (13), 23—37А].

    Наприклад, якщо температура викликає занепокоєння, ми можемо вказати, що вона проводиться при\(25 \pm 2\) o C.

    Тестування на міцність зазвичай проводиться лабораторією, яка розробляє стандартний метод. Після виявлення потенційних факторів їх вплив на відповідь оцінюється шляхом проведення аналізу на двох рівнях для кожного фактора. Зазвичай один рівень - це той, що зазначений у процедурі, а інший - рівень, який, ймовірно, зустрічається, коли процедура використовується іншими лабораторіями.

    Такий підхід до тестування на міцність може зайняти багато часу. Якщо є сім потенційних факторів, наприклад, факторний дизайн 2 7 може оцінити ефект першого порядку кожного фактора. На жаль, для цього потрібно загалом 128 випробувань - занадто багато випробувань, щоб бути практичним рішенням. Простіший експериментальний дизайн наведено в таблиці Template:index, в якій два рівні факторів ідентифікуються великими та малими літерами. Ця конструкція, яка схожа на факторіальний дизайн 2 3, називається дробовим факторіальним дизайном. Оскільки він включає лише вісім пробігів, конструкція надає інформацію лише про середню реакцію та сім ефектів першого порядку. Він не надає достатньої інформації для оцінки ефектів вищого порядку або взаємодії між факторами, обидва з яких, ймовірно, менш важливі, ніж ефекти першого порядку.

    Таблиця Template:index. Експериментальна конструкція для випробування на міцність із залученням семи факторів
    бігти A Б C D Е F Г відповідь
    1 А Б C D Е F Г Р 1
    2 А Б c D е f г R 2
    3 А б C d Е f г R 3
    4 А б c d е F Г R 4
    5 a Б C d е F г R 5
    6 a Б c d Е f Г R 6
    7 a б C D е f Г R 7
    8 a б c D Е F г R

    Експериментальний дизайн у таблиці Template:index збалансований тим, що кожен з двох рівнів фактора поєднується рівну кількість разів із верхнім та нижнім регістрами для кожного іншого фактора. Для визначення ефекту E зміни рівня фактора віднімаємо середню реакцію, коли коефіцієнт знаходиться на верхньому регістрі від середнього значення, коли він знаходиться на нижньому регістрі.

    \[E = \frac {\left( \sum R_i \right)_\text{upper case}} {4} - \frac {\left( \sum R_i \right)_\text{lower case}} {4} \label{14.1}\]

    Оскільки конструкція збалансована, рівні для інших факторів з'являються однакову кількість разів в обох строках підсумовування, скасовуючи їх вплив на Е. Наприклад, для визначення ефекту фактора A, E A віднімаємо середній відгук для прогонів 5—8 із середнього відгуку для прогонів 1—4. Фактор B не впливає на E, оскільки його рівні верхнього регістру в прогоні 1 та 2 скасовуються верхніми рівнями регістру в прогоні 5 та 6, а рівні нижнього регістру в прогоні 3 та 4 скасовуються нижніми рівнями регістру в прогоні 7 та 8. Після того, як ми розрахуємо кожен з факторних ефектів, ми ранжуємо їх від найбільших до найменших без урахування знака, визначаючи ті фактори, вплив яких істотно більше, ніж інші фактори.

    Щоб побачити, що це дизайн збалансований, уважно придивіться до останніх чотирьох прогонів. Фактор А присутній на своєму рівні a для всіх чотирьох цих пробігів. Для кожного з інших факторів два рівні є верхнім регістром, а два рівні - нижнім регістром. Прогони 5—8 надають інформацію про вплив a на відповідь, але не дають інформації про вплив будь-якого іншого фактора. Прогони 1, 2, 5 і 6 дають інформацію про вплив B, але не про інші фактори. Спробуйте ще кілька прикладів, щоб переконати себе в тому, що ці відносини загальні.

    Ми також можемо використовувати цю експериментальну конструкцію для оцінки очікуваного стандартного відхилення методу через вплив невеликих змін неконтрольованих або погано контрольованих факторів [Youden, WJ. «Статистичні методи для спільних тестів» у Статистичному посібнику Асоціації офіційних аналітичних Хіміки, Асоціація офіційних хіміків-аналітиків: Вашингтон, округ Колумбія, 1975, стор. 35].

    \[s=\sqrt{\frac{2}{7} \sum_{i=1}^{n} E_{i}^{2}} \label{14.2}\]

    Якщо це стандартне відхилення занадто велике, то процедуру модифікують, щоб привести під контроль фактори, які надають найбільший вплив на реакцію.

    Чому ця модель оцінює сім ефектів факторів першого порядку, E, а не сім з 20 можливих взаємодій першого порядку? За допомогою восьми експериментів ми можемо вибрати лише для обчислення семи параметрів (плюс середня реакція). Розрахунок E D, наприклад, також дає значення для Е АВ. Ви можете переконати себе в цьому, замінивши кожну букву верхнього регістру на a\(+1\) і кожну букву нижнього регістру на a\(-1\) і зазначивши, що\(A \times B = D\). Ми вирішуємо повідомляти про ефекти факторів першого порядку, оскільки вони, ймовірно, важливіші за взаємодію між факторами.

    Приклад Template:index

    Концентрацію мікрометалів у зразках осаду, зібраних з річок та озер, визначають шляхом екстракції кислотою та аналізу екстракту методом атомно-абсорбційної спектрофотометрії. Одна процедура вимагає вилучення протягом ночі за допомогою розведеного HCl або HNO 3. Зразки поміщають в пластикові пляшки з 25 мл кислоти, а потім поміщають на шейкер, що працює на помірній швидкості і при температурі навколишнього середовища. Для визначення міцності методу було вивчено вплив наступних факторів за допомогою експериментального дизайну в таблиці Template:index.

    Фактор А: час видобутку А = 24 ч а = 12 ч
    Фактор B: швидкість струшування B = середній b = високий
    Фактор C: кислотний тип С = НСЛ c = ННО 3
    Фактор D: концентрація кислоти Д = 0,1 М д = 0,05 М
    Фактор Е: обсяг кислоти Е = 25 мл е = 35 мл
    Фактор F: тип контейнера F = пластик f = скло
    Фактор G: температура G = навколишнє середовище г = 25 о С

    Вісім реплік стандартного зразка, який містить відому кількість аналіту, проводяться через процедуру. Відсоток аналіту, відновленого у восьми зразках, наступний: R 1 = 98,9, R 2 = 99,0, R 3 = 97,5, R 4 = 97,7, R 5 = 97,4, R 6 = 97,3, R 7 = 98,6, а R 8 = 98,6. Визначте фактори, які суттєво впливають на реакцію, та оцініть очікуване стандартне відхилення методу.

    Рішення

    Для обчислення ефекту зміни рівня кожного фактора ми використовуємо Equation\ ref {14.1} і підставляємо відповідні значення. Наприклад, E A - це

    \[E_{A}=\frac{98.9+99.0+97.5+97.7}{4} - \frac{97.4+97.3+98.6+98.6}{4}=0.30 \nonumber\]

    Завершення інших розрахунків і впорядкування факторів за абсолютними значеннями їх ефектів

    Коефіцієнт D = 1,30, Коефіцієнт A = 0,35, Коефіцієнт E = - 0,10, Коефіцієнт B = 0,05, Коефіцієнт C = - 0,05, Коефіцієнт F = 0,05, Коефіцієнт G = 0,00

    показує нам, що концентрація кислоти (фактор D) суттєво впливає на реакцію, при цьому концентрація 0,05 М забезпечує набагато менший відсоток відновлення. Час екстракції (фактор А) також виявляється значним, але його ефект не настільки важливий, як концентрація кислоти. Всі інші фактори виявляються незначними. Орієнтовне стандартне відхилення методу є

    \[s = \sqrt{\frac {2} {7} \times \left[ (1.30)^2 + (0.35)^2 + (-0.10)^2 + (0.05)^2 + (-0.05)^2 + (0.05)^2 + (0.00)^2 \right]} = 0.72 \nonumber\]

    що для середнього відновлення 98,1% дає відносне стандартне відхилення приблизно 0,7%. Якщо контролювати концентрацію кислоти так, щоб її вплив наближався до того, що для факторів B, C і F, то відносне стандартне відхилення стає 0,18, або приблизно 0,2%.

    Тестування еквівалентності

    Якщо є затверджений стандартний метод, то новий метод повинен бути оцінений шляхом порівняння результатів з отриманими при використанні стандартного методу. Зазвичай це порівняння проводиться як мінімум в трьох концентраціях аналіту для оцінки нового методу в широкому динамічному діапазоні. Крім того, ми можемо побудувати результати, отримані за допомогою нового методу, на основі результатів, отриманих за затвердженим стандартним методом. Нахил 1,00 і y -перехоплення 0.0 дає докази того, що два методи еквівалентні.