Полный факторный эксперимент
В факторных экспериментах, в отличие от классических, происходит одновременное варьирование всеми независимыми переменными. Эксперимент, в результате которого все независимые переменные варьируются на всех выбранных уровнях, называется полным факторным экспериментом (ПФЭ). Количество опытов при ПФЭ подсчитывается так
N=kn,
где k- количество уровней, п -- число факторов.
Если эксперименты проводятся только на двух уровнях (при двух значениях факторов), это будет ПФЭ типа 2n, а для k уровней - ПФЭ типа kn . Условия эксперимента представлены в таблице - матрицы планирования, где строки соответствуют опыту, а столбцы значениям факторов.
Например, матрица планирования для ПФЭ 22 (таблица 2)
Таблица 2 Матрица планирования для ПФЭ 22
х1 |
х2 |
у |
|
1 |
-1 |
-1 |
у1 |
2 |
+1 |
+1 |
у2 |
3 |
-1 |
+1 |
у3 |
4 |
+1 |
-1 |
у4 |
Геометрически план такого эксперимента интерпретируется точками, расположенными в вершинах квадрата. Для плана 22 задается вершинами квадрата, для плана 23 задается координатами вершин куба, а при п>3 задается координатами вершин гиперкуба.
ПФЭ типа 2n обладает следующими свойствами:
Симметричность относительно центра эксперимента. Это значит, что алгебраическая сумма элементов вектор-столбца для каждого фактора равна нулю, то есть xij=0,
где j - номер фактора (j=1,2,…K)
i - номер опыта (i=1,2,…N)
Нормировка - это сумма квадратов элементов каждого столбца равна числу опытов, то есть x2ij=N
Сумма почленных произведений любых двух вектор-столбцов матрица равна нулю, то есть xij*хui=0, j=u, j,u=1,2,…k
Это важное свойство для обработки и интерпретации данных называется ортоганальностью матриц планов типа 2n.
ПФЭ позволяет количественно оценить все линейные эффекты факторов и их взаимодействия. Взаимодействие возникает в том случае, если эффект одного фактора зависит от уровня, на котором находится другой фактор.
Для ПФЭ типа 22 матрица планирования (таблица 3) с учетом свободного члена b12 вычисляется так
Таблица 3 Матрица планирования для ПФЭ типа 22 с учетом свободного члена b12
N опыта |
х0 |
х1 |
х2 |
х1*х2 |
у |
1 |
+1 |
-1 |
-1 |
+1 |
у1 |
2 |
+1 |
+1 |
+1 |
+1 |
у2 |
3 |
+1 |
-1 |
+1 |
-1 |
у3 |
4 |
+1 |
+1 |
-1 |
-1 |
у4 |
Этот план соответствует модели y=b0*x0+b1*x1+b2*x2+b12*x1*x2
Столбцы x1 и x2 задают планирование - определяют условия проведения опытов.
Столбцы x0 и x1*x2 служат для расчета. Эффект взаимодействия двух факторов называется эффектом взаимодействия первого порядка, трех факторов - второго порядка и так далее.
Обработка результатов эксперимента.
Основной целью регрессионного анализа является получение по результатам активного эксперимента модели, адекватно описывающей поведение исследуемого объекта. Проведение эксперимента должно строго соответствовать выбранному случайному порядку. Установка уровней факторов Xj должна происходить в соответствии с теоретическими предпосылками регрессионного анализа и быть, возможно, более точной. Регистрация результатов измерения выхода Y должна соответствовать реально обеспечиваемой в опыте точности измерения. Если нет уверенности, что условия проведения опытов остаются постоянными, то опыты в каждой точке факторного пространства дублируются (проводится серия опытов). Предположим, что в каждой точке факторного пространства, которой соответствует одна из строк матрицы планирования, проводится серия из опытов. Для любой 1-й точки вычисляется среднее значение выходной величины
у= yiu/m
и построчную дисперсию выходной величины (точнее ее оценку):
S2{y}= (yi-y)2/m-1
Найденные таким образом построчные дисперсии используются для проверки воспроизводимости опытов, заключающейся в проверке однородности построчных дисперсии -- одной из основных предпосылок множественного регрессионного анализа.
Среди всей совокупности рассчитанных построчных дисперсии выбирается максимальная S2{y}max и берется отношение данной дисперсии к сумме всех построчных дисперсий S2{y}, то есть определяют расчетное значение коэффициента Кохрэйна
Gр = S2{y}max/ S2{y},
который показывает, какую долю общей сумме построчных дисперсий занимает максимальная из них - эта доля взята как мера различия между дисперсиями. Расчетное значение коэффициента Кохрэйна сравнивается с табличным (критическим) значением G-критерия, которое выбирается из таблиц. Если выполняется условие Gр < Gт, то с выбранным уровнем статистической значимости все построчные дисперсии признаются однородными. В противном случае следует отвергнуть гипотезу об однородности построчных дисперсии, что является нарушением одной из главных предпосылок регрессионного анализа - дальнейшая статистическая обработка результатов не имеет смысла.
Убедившись в однородности, переходят к определению оценок коэффициентов по формулам
а0= yi /N
aj= =xi* yi /N,
где j - номер вектора столбца.
Найденные таким образом коэффициенты регрессии необходимо оценит на статистическую значимость. Оценка производится по t-критерию Стъюдента. Для каждого коэффициента аj вычисляется коэффициент
tр= tр= S{ак},
S{ак}-оценка среднего квадратичного отклонения погрешности определения коэффициента (дисперсия адекватности)
S{ак}= S2в/N*m,
где S2в- дисперсия воспроизводимости,
S2в= S2{y}/N
При выбранном уровне статистической значимости по таблицам распределения Стъюдента при числе степеней свободы f=N*(m-1) находят табличное значение коэффициента tт. Найденное табличное значение сравнивается с расчетным значением коэффициента. Если выполняется неравенство
tт> tр,
то принимается нуль-гипотеза, то есть с принятым уровнем статистической значимости (статистической достоверностью 1- ) и числе степеней свободы f считается, что найденный коэффициент ак является статистическим незначительным и его следует исключить из уравнения регрессии.
Затем рассчитывают теоретическое значение у для каждого из экспериментов и относительную погрешность по формуле:
E= уi-уi / max{yi,yi}
Полученное уравнение регрессии необходимо проверить на адекватность исследуемому объекту, то есть установить, насколько хорошо оно аппроксимирует полученные экспериментальные данные. Для этой цели необходимо оценить, насколько отличаются средние значения у выходной величины, полученной в точках факторного пространства в результате проведения опытов, и значении у, полученного из уравнения регрессии в тех точках факторного пространства.
Для этого вычисляют остаточную дисперсию, которую чаще называют дисперсией адекватности
S2ад =m/N-L (yi-yi)2,
где m - число параллельных опытов i-й точке факторного пространства; l- число определенных в результате проведения N опытов значимых коэффициентов.
Отличие S2ад от нуля объясняется тем, в общем случае, двумя причинами: действительно неадекватность уравнения регрессии физическому объекту и наличием случайной погрешности восприятия, характеризуемой S2в.
Адекватность полученной модели проверяют путем сравнения оценок двух дисперсий S2ад и S2в и F-критерию Фишера
Fр= S2ад/ S2в ,
Найденное расчетным путем Fр сравнивают с табличным значением Fт, которое определяется при уровне статистической значимости и числе степеней свободы f ад =N-l и fв= N*(m-1). Если
Fр< Fт,
то полученная математическая модель с принятым уровнем статистической значимости адекватна экспериментальным данным, и ее можно использовать для дальнейших исследований.