Математическое планирование экспериментов. Планирование экспериментов Классификация методов планирования эксперимента

1. История возникновения планирования эксперимента

Планирование эксперимента – продукт нашего времени, однако истоки его теряются в глубине веков.

Истоки планирования эксперимента уходят в глубокую древность и связаны с числовой мистикой, пророчествами и суевериями.

Это собственно не планирование физического эксперимента, а планирование числового эксперимента, т.е. расположение чисел так, чтобы выполнялись некоторые строгие условия, например, на равенство сумм по строкам, столбцам и диагоналям квадратной таблицы, клеточки которой заполнены числами натурального ряда.

Такие условия выполняются в магических квадратах, которым, по-видимому, принадлежит первенство в планировании эксперимента.

Согласно одной легенде примерно в 2200 г. до н.э. китайский император Ю выполнял мистические вычисления с помощью магического квадрата, который был изображен на панцире божественной черепахи.

Квадрат императора Ю

Клетки этого квадрата заполнены числами от 1 до 9, и суммы чисел по строкам, столбцам и главным диагоналям равны 15.

В 1514 г. немецкий художник Альбрехт Дюрер изобразил магический квадрат в правом углу своей знаменитой гравюры-аллегории «Меланхолия». Два числа в нижнем горизонтальном ряду A5 и 14) составляют год создания гравюры. В этом состояло своеобразное «приложение» магического квадрата.

Квадрат Дюрера

В течение нескольких веков построение магических квадратов занимало умы индийских, арабских, немецких, французских математиков.

В настоящее время магические квадраты используются при планировании эксперимента в условиях линейного дрейфа, при планировании экономических расчетов и составлении рационов питания, в теории кодирования и т.д.

Построение магических квадратов является задачей комбинаторного анализа, основы которого в его современном понимании заложены Г. Лейбницем. Он не только рассмотрел и решил основные комбинаторные задачи, но и указал на большое практическое применение комбинаторного анализа: к кодированию и декодированию, к играм и статистике, к логике изобретений и логике геометрии, к военному искусству, грамматике, медицине, юриспруденции, технологии и к комбинации наблюдений. Последняя область применения наиболее близка к планированию эксперимента.

Одной из комбинаторных задач, имеющей прямое отношение к планированию эксперимента, занимался известный петербургский математик Л. Эйлер. В 1779 г. он предложил задачу о 36 офицерах как некоторый математический курьез.

Он поставил вопрос, можно ли выбрать 36 офицеров 6 рангов из 6 полков по одному офицеру каждого ранга от каждого полка и расположить их в каре так, чтобы в каждом ряду и в каждой шеренге было бы по одному офицеру каждого ранга и по одному от каждого полка. Задача эквивалентна построению парных ортогональных 6x6 квадратов. Оказалось, что эту задачу решить невозможно. Эйлер высказал предположение, что не существует пары ортогональных квадратов порядка п=1 (mod 4).

Задачей Эйлера, в частности, и латинскими квадратами вообще занимались впоследствии многие математики, однако почти никто из них не задумывался над практическим применением латинских квадратов.

В настоящее время латинские квадраты являются одним из наиболее популярных способов ограничения на рандомизацию при наличии источников неоднородностей дискретного типа в планировании эксперимента. Группировка элементов латинского квадрата, благодаря своим свойствам (каждый элемент появляется один и только один раз в каждой строке и в каждом столбце квадрата), позволяет защитить главные эффекты от влияния источника неоднородностей. Широко используются латинские квадраты и как средство сокращения перебора в комбинаторных задачах.

Возникновение современных статистических методов планирования эксперимента связано с именем Р. Фишера.

С 1918 г. он начал свою известную серию работ на Рочемстедской агробиологической станции в Англии. В 1935 г. появилась его монография «Design of Experiments», давшая название всему направлению.

Среди методов планирования первым был дисперсионный анализ (кстати, Фишеру принадлежит и термин «дисперсия»). Фишер создал основы этого метода, описав полные классификации дисперсионного анализа (однофакторный и многофакторный эксперименты) и неполные классификации дисперсионного анализа без ограничения и с ограничением на рандомизацию. При этом он широко использовал латинские квадраты и блок-схемы. Вместе с Ф. Йетсом он описал их статистические свойства. В 1942 г. А. Кишен рассмотрел планирование по латинским кубам, которое явилось дальнейшим развитием теории латинских квадратов.

Затем Р. Фишер независимо опубликовал сведения об ортогональных гипер-греко-латинских кубах и гипер-кубах. Вскоре после этого 1946–1947 гг.) Р. Рао рассмотрел их комбинаторные свойства. Дальнейшему развитию теории латинских квадратов посвящены работы X. Манна A947–1950 гг.).

Исследования Р. Фишера, проводившиеся в связи с работами по агробиологии, знаменуют начало первого этапа развития методов планирования эксперимента. Фишер разработал метод факторного планирования. Йегс предложил для этого метода простую вычислительную схему. Факторное планирование получило широкое распространение. Особенностью полного факторного эксперимента является необходимость ставить сразу большое число опытов.

В 1945 г. Д. Финни ввел дробные реплики от факторного эксперимента. Это позволило резко сократить число опытов и открыло дорогу техническим приложениям планирования. Другая возможность сокращения необходимого числа опытов была показана в 1946 г. Р. Плакеттом и Д. Берманом, которые ввели насыщенные факторные планы.

В 1951 г. работой американских ученых Дж. Бокса и К. Уилсона начался новый этап развития планирования эксперимента.

Эта работа подытожила предыдущие. В ней ясно сформулирована и доведена до практических рекомендаций идея последовательного экспериментального определения оптимальных условий проведения процессов с использованием оценки коэффициентов степенных разложений методом наименьших квадратов, движения по градиенту и отыскания интерполяционного полинома (степенного ряда) в области экстремума функции отклика («почти стационарной» области).

В 1954–1955 гг. Дж. Бокс, а затем Дж. Бокс и П. Юл показали, что планирование эксперимента можно использовать при исследовании физико-химических механизмов процессов, если априори высказаны одна или несколько возможных гипотез. Здесь планирование эксперимента пересекалось с исследованиями по химической кинетике. Интересно отметить, что кинетику можно рассматривать как метод описания процесса с помощью дифференциальных уравнений, традиции которого восходят к И. Ньютону. Описание процесса дифференциальными уравнениями, называемое детерминистическим, нередко противопоставляется статистическим моделям.

Бокс и Дж. Хантер сформулировали принцип ротатабельности для описания «почти стационарной» области, развивающейся в настоящее время в важную ветвь теории планирования эксперимента. В той же работе показана возможность планирования с разбиением на ортогональные блоки, указанная ранее независимо де Бауном.

Дальнейшим развитием этой идеи было планирование, ортогональное к неконтролируемому временному дрейфу, которое следует рассматривать как важное открытие в экспериментальной технике – значительное увеличение возможностей экспериментатора.

2. Математическое планирование эксперимента в научных исследованиях

2.1 Основные понятия и определения

Под экспериментом будем понимать совокупность операций совершаемых над объектом исследования с целью получения информации о его свойствах. Эксперимент, в котором исследователь по своему усмотрению может изменять условия его проведения, называется активным экспериментом. Если исследователь не может самостоятельно изменять условия его проведения, а лишь регистрирует их, то это пассивный эксперимент.

Важнейшей задачей методов обработки полученной в ходе эксперимента информации является задача построения математической модели изучаемого явления, процесса, объекта. Ее можно использовать и при анализе процессов и при проектировании объектов. Можно получить хорошо аппроксимирующую математическую модель, если целенаправленно применяется активный эксперимент. Другой задачей обработки полученной в ходе эксперимента информации является задача оптимизации, т.е. нахождения такой комбинации влияющих независимых переменных, при которой выбранный показатель оптимальности принимает экстремальное значение.

Опыт – это отдельная экспериментальная часть.

План эксперимента – совокупность данных определяющих число, условия и порядок проведения опытов.

Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям, совокупность действий направленных на разработку стратегии экспериментирования (от получения априорной информации до получения работоспособной математической модели или определения оптимальных условий). Это целенаправленное управление экспериментом, реализуемое в условиях неполного знания механизма изучаемого явления.

В процессе измерений, последующей обработки данных, а также формализации результатов в виде математической модели, возникают погрешности и теряется часть информации, содержащейся в исходных данных. Применение методов планирования эксперимента позволяет определить погрешность математической модели и судить о ее адекватности. Если точность модели оказывается недостаточной, то применение методов планирования эксперимента позволяет модернизировать математическую модель с проведением дополнительных опытов без потери предыдущей информации и с минимальными затратами.

Цель планирования эксперимента – нахождение таких условий и правил проведения опытов при которых удается получить надежную и достоверную информацию об объекте с наименьшей затратой труда, а также представить эту информацию в компактной и удобной форме с количественной оценкой точности.

Пусть интересующее нас свойство (Y) объекта зависит от нескольких (n ) независимых переменных (Х 1 , Х 2 , …, Х n ) и мы хотим выяснить характер этой зависимости – Y=F(Х 1 , Х 2 , …, Х n) , о которой мы имеем лишь общее представление. Величина Y – называется «отклик», а сама зависимость Y=F(Х 1 , Х 2 , …, Х n) – «функция отклика».

Отклик должен быть определен количественно. Однако могут встречаться и качественные признаки Y . В этом случае возможно применение рангового подхода. Пример рангового подхода – оценка на экзамене, когда одним числом оценивается сложный комплекс полученных сведений о знаниях студента.

Независимые переменные Х 1 , Х 2 , …, Х n – иначе факторы, также должны иметь количественную оценку. Если используются качественные факторы, то каждому их уровню должно быть присвоено какое-либо число. Важно выбирать в качестве факторов лишь независимые переменные, т.е. только те которые можно изменять, не затрагивая другие факторы. Факторы должны быть однозначными. Для построения эффективной математической модели целесообразно провести предварительный анализ значимости факторов (степени влияния на функцию), их ранжирование и исключить малозначащие факторы.

Диапазоны изменения факторов задают область определения Y . Если принять, что каждому фактору соответствует координатная ось, то полученное пространство называется факторным пространством. При n=2 область определения Y представляется собой прямоугольник, при n=3 – куб, при n >3 – гиперкуб.

При выборе диапазонов изменения факторов нужно учитывать их совместимость, т.е. контролировать, чтобы в этих диапазонах любые сочетания факторов были бы реализуемы в опытах и не приводили бы к абсурду. Для каждого из факторов указывают граничные значения

, i =1,… n .

Регрессионный анализ функции отклика предназначен для получения ее математической модели в виде уравнения регрессии

где В 1 , …, В m – некоторые коэффициенты; е – погрешность.

Среди основных методов планирования, применяемых на разных этапах исследования, используют:

· планирование отсеивающего эксперимента, основное значение которого выделение из всей совокупности факторов группы существенных факторов, подлежащих дальнейшему детальному изучению;

· планирование эксперимента для дисперсионного анализа, т.е. составление планов для объектов с качественными факторами;

· планирование регрессионного эксперимента, позволяющего получать регрессионные модели (полиномиальные и иные);

· планирование экстремального эксперимента, в котором главная задача – экспериментальная оптимизация объекта исследования;

· планирование при изучении динамических процессов и т.д.

Инициатором применения планирования эксперимента является Рональд А. Фишер, другой автор известных первых работ – Френк Йетс. Далее идеи планирования эксперимента формировались в трудах Дж. Бокса, Дж. Кифера. В нашей стране – в трудах Г.К. Круга, Е.В. Маркова и др.

В настоящее время методы планирования эксперимента заложены в специализированных пакетах, широко представленных на рынке программных продуктов, например: StatGrapfics, Statistica, SPSS, SYSTAT и др.

2.2 Представление результатов экспериментов

При использовании методов планирования эксперимента необходимо найти ответы на 4 вопроса:

· Какие сочетания факторов и сколько таких сочетаний необходимо взять для определения функции отклика?

· Как найти коэффициенты В 0 , В 1 , …, B m ?

· Как оценить точность представления функции отклика?

· Как использовать полученное представление для поиска оптимальных значений Y ?

Геометрическое представление функции отклика в факторном пространстве Х 1 , Х 2 , …, Х n называется поверхностью отклика (рис. 1).

Рис. 1. Поверхность отклика

Если исследуется влияние на Y лишь одного фактора Х 1 , то нахождение функции отклика – достаточно простая задача. Задавшись несколькими значениями этого фактора, в результате опытов получаем соответствующие значения Y и график Y =F(X) (рис. 2).

Рис. 2. Построение функции отклика одной переменной по опытным данным

По его виду можно подобрать математическое выражение функции отклика. Если мы не уверены, что опыты хорошо воспроизводятся, то обычно опыты повторяют несколько раз и получают зависимость с учетом разброса опытных данных.

Если факторов два, то необходимо провести опыты при разных соотношениях этих факторов. Полученную функцию отклика в 3 х -мерном пространстве (рис. 1) можно анализировать, проводя ряд сечений с фиксированными значениями одного из факторов (рис. 3). Вычлененные графики сечений можно аппроксимировать совокупностью математических выражений.

Рис. 3. Сечения поверхности отклика при фиксированных откликах (а) и переменных (б, в)

При трех и более факторах задача становится практически неразрешимой. Если и будут найдены решения, то использовать совокупность выражений достаточно трудно, а часто и не реально.

2.3 Применение математического планирования эксперимента в научных исследованиях

В современной математической теории оптимального планирования эксперимента существует 2 основных раздела:

1. планирование эксперимента для изучения механизмов сложных процессов и свойств многокомпонентных систем.

2. планирование эксперимента для оптимизации технологических процессов и свойств многокомпонентных систем.

Планирование эксперимента – это выбор числа опытов и условий их проведения необходимых и достаточных для решения поставленной задачи с требуемой точностью.

Эксперимент, который ставится для решений задач оптимизации, называется экстремальным. Примерами задач оптимизации являются выбор оптимального состава многокомпонентных смесей, повышение производительности действующей установки, повышение качества продукции и снижение затрат на её получение. Прежде чем планировать эксперимент необходимо сформулировать цель исследования. От точной формулировки цели зависит успех исследования. Необходимо также удостовериться, что объект исследования соответствует предъявляемым ему требованиям. В технологическом исследовании целью исследования при оптимизации процесса чаще всего является повышение выхода продукта, улучшение качества, снижение себестоимости.

Эксперимент может проводиться непосредственно на объекте или на его модели. Модель отличается от объекта не только масштабом, а иногда природой. Если модель достаточно точно описывает объект, то эксперимент на объекте может быть перенесён на модель. Для описания понятия «объект исследования» можно использовать представление о кибернетической системе, которая носит название чёрный ящик.

Стрелки справа изображают численные характеристики целей исследования и называются выходными параметрами ( y ) или параметрами оптимизации .

Для проведения эксперимента необходимо воздействовать на поведение чёрного ящика. Все способы воздействия обозначаются через «x» и называются входными параметрами или факторами . Каждый фактор может принимать в опыте одно из нескольких значений, и такие значения называются уровнями . Фиксированный набор уровней и факторов определяет одно из возможных состояний чёрного ящика, одновременно они являются условиями проведения одного из возможных опытов. Результаты эксперимента используются для получения математической модели объекта исследования. Использование для объекта всех возможных опытов приводит к абсурдно большим экспериментам. В связи с этим эксперименты необходимо планировать.

Задачей планирования является выбор необходимых для эксперимента опытов, методов математической обработки их результатов и принятия решений. Частный случай этой задачи – планирование экстремального эксперимента. То есть эксперимента поставленного с целью поиска оптимальных условий функционирования объекта. Таким образом, планирование экстремального эксперимента – это выбор количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий. При планировании эксперимента объект исследования должен обладать обязательными свойствами:

1.управляемым

2.результаты эксперимента должны быть воспроизводимыми.

Эксперимент называется воспроизводимым , если при фиксированных условиях опыта получается один и тот же выход в пределах заданной относительно небольшой ошибки эксперимента (2%-5%). Эксперимент проводят при выборе некоторых уровней для всех факторов, затем он повторяется через неравные промежутки времени. И значения параметров оптимизации сравниваются. Разброс этих параметров характеризует воспроизводимость результатов. Если он не превышает заранее заданной величины, то объект удовлетворяет требованию воспроизводимости результатов.

При планировании эксперимента активное вмешательство предполагает процесс и возможность выбора в каждом опыте тех факторов, которые представляют интерес. Экспериментальное исследование влияния входных параметров (факторов) на выходные может производиться методом пассивного или активного эксперимента. Если эксперимент сводится к получению результатов наблюдения за поведение системы при случайных изменениях входных параметров, то он называется пассивным . Если же при проведении эксперимента входные параметры изменяются по заранее заданному плану, то такой эксперимент называется активным. Объект, на котором возможен активный эксперимент, называется управляемым. На практике не существует абсолютно управляемых объектов. На реальный объект обычно действуют как управляемый, так и неуправляемый факторы. Неуправляемые факторы действуют на воспроизводимость эксперимента. Если все факторы неуправляемы, возникает задача установления связи между параметром оптимизации и факторами по результатам наблюдений или по результатам пассивного эксперимента. Возможна также плохая воспроизводимость изменения факторов во времени.

3. Параметры оптимизации

3.1 Виды параметров оптимизации

Параметр оптимизации – это признак, по которому мы хотим оптимизировать процесс. Он должен быть количественным, задаваться числом. Множество значений, которые может принимать параметр оптимизации, называется областью его определения. Области определения могут быть непрерывными и дискретными, ограниченными и неограниченными. Например, выход реакции – это параметр оптимизации с непрерывной ограниченной областью определения. Он может изменяться в интервале от 0 до 100%. Число бракованных изделий, число кровяных телец в пробе крови – вот примеры параметров с дискретной областью определения, ограниченной снизу.

В зависимости от объекта и цели исследования параметры оптимизации могут быть весьма разнообразными (рис. 1).

Прокомментируем некоторые элементы схемы. Экономические параметры оптимизации, такие, как прибыль, себестоимость и рентабельность, обычно используются при исследовании действующих промышленных объектов, тогда как затраты на эксперимент имеет смысл оценивать в любых исследованиях, в том числе и лабораторных. Если цена опытов одинакова, затраты на эксперимент» пропорциональны числу опытов, которые необходимо поставить для решения данной задачи. Это в значительной мере определяет выбор плана эксперимента.

Среди технико-экономических параметров наибольшее распространение имеет производительность. Такие параметры, как долговечность, надежность и стабильность, связаны с длительными наблюдениями. Имеется некоторый опыт их использования при изучении дорогостоящих ответственных объектов, например радиоэлектронной аппаратуры.

Почти во всех исследованиях приходится учитывать количество и качество получаемого продукта. Как меру количества продукта используют выход, например, процент выхода готовой продукции.

Показатели качества чрезвычайно разнообразны. В нашей схеме они сгруппированы по видам свойств. Характеристики количества и качества продукта образуют группу технико-технологических параметров.

В группе «прочие» сгруппированы различные параметры, которые реже встречаются, но не являются менее важными. Сюда попали статистические параметры, используемые для улучшения характеристик случайных величин или случайных функций.

3.2 Требования к параметру оптимизации

Параметр оптимизации – это признак, по которому мы хотим оптимизировать процесс. Он должен быть количественным, задаваться числом. Мы должны уметь его измерять при любой возможной комбинации выбранных уровней факторов. Множество значений, которые может принимать параметр оптимизации, будем называть областью его определения. Области определения могут быть непрерывными и дискретными, ограниченными и неограниченными. Например, выход реакции – это параметр оптимизации с непрерывной ограниченной областью определения. Он может изменяться в интервале от 0 до 100%. Число бракованных изделий, число зерен на шлифе сплава, число кровяных телец в пробе крови – вот примеры параметров с дискретной областью определения, ограниченной снизу.

Уметь измерять параметр оптимизации – это значит располагать подходящим прибором. В ряде случаев такого прибора может не существовать или он слишком дорог. Если нет способа количественного измерения результата, то приходится воспользоваться приемом, называемым ранжированием (ранговым подходом). При этом параметрам оптимизации присваиваются оценки – ранги по заранее выбранной шкале: двухбалльной, пятибалльной и т.д. Ранговый параметр имеет дискретную ограниченную область определения. В простейшем случае область содержит два значения (да, нет; хорошо, плохо). Это может соответствовать, например, годной продукции и браку.

Ранг – это количественная оценка параметра оптимизации, но она носит условный (субъективный) характер. Мы ставим в соответствие качественному признаку некоторое число – ранг. Для каждого физически измеряемого параметра оптимизации можно построить ранговый аналог. Потребность в построении такого аналога возникает, если имеющиеся в распоряжении исследователя численные характеристики неточны или неизвестен способ построения удовлетворительных численных оценок. При прочих равных условиях всегда нужно отдавать предпочтение физическому измерению, так как ранговый подход менее чувствителен и с его помощью трудно изучать тонкие эффекты.

Пример: Технолог разработал новый вид продукта. Вам необходимо оптимизировать этот процесс.

Цель процесса – получение вкусного продукта, но такая формулировка цели еще не дает возможности приступить к оптимизации: необходимо выбрать количественный критерий, характеризующий степень достижения цели. Можно принять следующее решение: очень вкусный продукт получает отметку 5, просто вкусный продукт – отметку 4 и т.д.

Можно ли после такого решения переходить к оптимизации процесса? Нам важно количественно оценить результат оптимизации. Решает ли отметка эту задачу? Конечно, потому что, как мы договорились, отметка 5 соответствует очень вкусному продукту и т.д. Другое дело, что этот подход, называемый ранговым, часто оказывается грубым, нечувствительным. Но возможности такой количественной оценки результатов не должна вызывать сомнений.

Следующее требование: параметр оптимизации должен выражаться одним числом. Например: регистрация показания прибора.

Еще одно требование, связанное с количественной природой параметра оптимизации, – однозначность в статистическом смысле. Заданному набору значений факторов должно соответствовать одно с точностью до ошибки эксперимента значение параметра оптимизации. (Однако обратное неверно: одному и тому же значению параметра могут соответствовать разные наборы значений факторов.)

Для успешного достижения цели исследования необходимо, чтобы параметр оптимизации действительно оценивал эффективность функционирования системы в заранее выбранном смысле. Это требование является главным, определяющим корректность постановки задачи.

Представление об эффективности не остается постоянным в ходе исследования. Оно меняется по мере накопления информации и в зависимости от достигнутых результатов. Это приводит к последовательному подходу при выборе параметра оптимизации. Так, например, на первых стадиях исследования технологических процессов в качестве параметра оптимизации часто используется выход продукта. Однако в дальнейшем, когда возможность повышения выхода исчерпана, нас начинают интересовать такие параметры, как себестоимость, чистота продукта и т.д.

Говоря об оценке эффективности функционирования системы, важно помнить, что речь идет о системе в целом. Часто система состоит из ряда подсистем, каждая из которых может оцениваться своим локальным параметром оптимизации.

Следующее требование к параметру оптимизации – требование универсальности или полноты. Под универсальностью параметра оптимизации понимается его способность всесторонне характеризовать объект. В частности, технологические параметры оптимизации недостаточно универсальны: они не учитывают экономику. Универсальностью обладают, например, обобщенные параметры оптимизации, которые строятся как функции от нескольких частных параметров.

Желательно, чтобы параметр оптимизации имел физический смысл, был простым и легко вычисляемым.

Требование физического смысла связано с последующей интерпретацией результатов эксперимента.

Таким образом, параметр оптимизации должен быть:

– эффективным с точки зрения достижения цели;

– универсальным;

– количественным и выражаться одним числом;

– статистически эффективным;

– имеющим физический смысл, простым и легко вычисляемым.

В тех случаях, когда возникают трудности с количественной оценкой параметров оптимизации, приходится обращаться к ранговому подходу. В ходе исследования могут меняться априорные представления об объекте исследования, что приводит к последовательному подходу при выборе параметра оптимизации.

Из многих параметров, характеризующих объект исследования, только один, часто обобщенный, может служить параметром оптимизации. Остальные рассматриваются как ограничения.

4. Факторы оптимизации

4.1 Определение фактора

Фактором называется измеряемая переменная величина, принимающая в некоторый момент времени определенное значение. Факторы соответствуют способам воздействия на объект исследования.

Так же, как и параметр оптимизации, каждый фактор имеет область определения. Фактор считают заданным, если вместе с его названием указана область его определения.

Под областью определения понимается совокупность всех значений, которые в принципе может принимать данный фактор.

Совокупность значений фактора, которая используется в эксперименте, является подмножеством из множества значений, образующих область определения. Область определения может быть непрерывной и дискретной. Однако в основном, в задачах планирования эксперимента, используются дискретные области определения. Так, для факторов с непрерывной областью определения, таких, как температура, время, количество вещества и т.п., всегда выбираются дискретные множества уровней.

В практических задачах области определения факторов, как правило, ограничены. Ограничения могут носить принципиальный либо технический характер.

Факторы классифицируют в зависимости от того, является ли фактор переменной величиной, которую можно оценивать количественно: измерять, взвешивать, титровать и т.п., или же он – некоторая переменная, характеризующаяся качественными свойствами.

Факторы разделяются на количественные и качественные.

Качественные факторы – это разные вещества, разные технологические способы, аппараты, исполнители и т.д.

Хотя качественным факторам не соответствует числовая шкала в том смысле, как это понимается для количественных факторов, однако можно построить условную порядковую шкалу, которая ставит в соответствие уровням качественного фактора числа натурального ряда, т.е. производит кодирование. Порядок уровней может быть произволен, но после кодирования он фиксируется.

Качественным факторам не соответствует числовая шкала, и порядок уровней факторов не играет роли.

Время реакции, температура, концентрация реагирующих веществ, скорость подачи веществ, величина рН – это примеры наиболее часто встречающихся количественных факторов. Различные реагенты, адсорбенты, вулканизующие агенты, кислоты, металлы являются примером уровней качественных факторов.

4.2 Требования, предъявляемые к факторам при планировании эксперимента

При планировании эксперимента факторы должны быть управляемыми. Это значит, что экспериментатор, выбрав нужное значение фактора, может его поддерживать постоянным в течение всего опыта, т.е. может управлять фактором. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора.

Пример: Вы изучаете процесс синтеза аммиака. Колонна синтеза установлена на открытой площадке. Является ли температура воздуха фактором, который можно включить в планирование эксперимента?

Температура воздуха – фактор неуправляемый. Мы еще не научились делать погоду по заказу. А в планировании могут участвовать только те факторы, которыми можно управлять, – устанавливать и поддерживать на выбранном уровне в течение опыта или менять по заданной программе. Температурой окружающей среды в данном случае управлять невозможно. Ее можно только контролировать.

Чтобы точно определить фактор, нужно указать последовательность действий (операций), с помощью которых устанавливаются его конкретные значения (уровни). Такое определение фактора будем называть операциональным. Так, если фактором является давление в некотором аппарате, то совершенно необходимо указать, в какой точке и с помощью какого прибора оно измеряется и как оно устанавливается. Введение операционального определения обеспечивает однозначное понимание фактора.

С операциональным определением связаны выбор размерности фактора и точность его фиксирования.

Точность замера факторов должна быть возможно более высокой. Степень точности определяется диапазоном изменения факторов. При изучении процесса, который длится десятки часов, нет необходимости учитывать доли минуты, а в быстрых процессах необходимо учитывать, быть может, доли секунды.

Факторы должны быть непосредственными воздействиями на объект. Факторы должны быть однозначны. Трудно управлять фактором, который, является функцией других факторов. Но в планировании могут участвовать сложные факторы, такие, как соотношения между компонентами, их логарифмы и т.п.

При планировании эксперимента обычно одновременно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъявляются к совокупности факторов. Прежде всего выдвигается требование совместимости. Совместимость факторов означает, что все их комбинации осуществимы и безопасны. Это очень важное требование.

При планировании эксперимента важна независимость факторов, т.е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов. Если это условие невыполнимо, то невозможно планировать эксперимент.

Таким образом, установили, что факторы – это переменные величины, соответствующие способам воздействия внешней среды на объект.

Они определяют как сам объект, так и его состояние. Требования к факторам: управляемость и однозначность.

Управлять фактором – это значит установить нужное значение и поддерживать его постоянным в течение опыта или менять по заданной программе. В этом состоит особенность «активного» эксперимента. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора.

Факторы должны непосредственно воздействовать на объект исследования.

Требования к совокупности факторов: совместимость и отсутствие линейной корреляции. Выбранное множество факторов должно быть достаточно полным. Если какой-либо существенный фактор пропущен, это приведет к неправильному определению оптимальных условий или к большой ошибке опыта. Факторы могут быть количественными и качественными.

5. Ошибки опыта

Изучение всех влияющих на исследуемый объект факторов одновременно провести невозможно, поэтому в эксперименте рассматривается их ограниченное число. Остальные активные факторы стабилизируются, т.е. устанавливаются на каких-то одинаковых для всех опытов уровнях.

Некоторые факторы не могут быть обеспечены системами стабилизации (например, погодные условия, самочувствие оператора и т.д.), другие же стабилизируются с какой-то погрешностью (например, содержание какого-либо компонента в среде зависит от ошибки при взятии навески и приготовления раствора). Учитывая также, что измерение параметра у осуществляется прибором, обладающим какой-то погрешностью, зависящей от класса точности прибора, можно прийти к выводу, что результаты повторностей одного и того же опыта у к будут приближенными и должны отличаться один от другого и от истинного значения выхода процесса. Неконтролируемое, случайное изменение и множества других влияющих на процесс факторов вызывает случайные отклонения измеряемой величины у к от ее истинного значения – ошибку опыта.

Каждый эксперимент содержит элемент неопределенности вследствие ограниченности экспериментального материала. Постановка повторных (или параллельных) опытов не дает полностью совпадающих результатов, потому что всегда существует ошибка опыта (ошибка воспроизводимости). Эту ошибку и нужно оценить по параллельным опытам. Для этого опыт воспроизводится по возможности в одинаковых условиях несколько раз и затем берется среднее арифметическое всех результатов. Среднее арифметическое у равно сумме всех n отдельных результатов, деленной на количество параллельных опытов n:

Отклонение результата любого опыта от среднего арифметического можно представить как разность y 2 – , где y 2 – результат отдельного опыта. Наличие отклонения свидетельствует об изменчивости, вариации значений повторных опытов. Для измерения этой изменчивости чаще всего используют дисперсию.

Дисперсией называется среднее значение квадрата отклонений величины от ее среднего значения. Дисперсия обозначается s 2 и выражается формулой:

где (n-1) – число степеней свободы, равное количеству опытов минус единица. Одна степень свободы использована для вычисления среднего.

Корень квадратный из дисперсии, взятый с положительным знаком, называется средним квадратическим отклонением, стандартом или квадратичной ошибкой:

Ошибка опыта является суммарной величиной, результатом многих ошибок: ошибок измерений факторов, ошибок измерений параметра оптимизации и др. Каждую из этих ошибок можно, в свою очередь, разделить на составляющие.

Все ошибки принято разделять на два класса: систематические и случайные (рисунок 1).

Систематические ошибки порождаются причинами, действующими регулярно, в определенном направлении. Чаще всего эти ошибки можно изучить и определить количественно. Систематическая ошибка – это ошибка, которая остаётся постоянно или закономерно изменяется при повторных измерениях одной и той же величины. Эти ошибки появляются вследствие неисправности приборов, неточности метода измерения, какого либо упущения экспериментатора, либо использования для вычисления неточных данных. Обнаружить систематические ошибки, а также устранить их во многих случаях нелегко. Требуется тщательный разбор методов анализа, строгая проверка всех измерительных приборов и безусловное выполнение выработанных практикой правил экспериментальных работ. Если систематические ошибки вызваны известными причинами, то их можно определить. Подобные погрешности можно устранить введением поправок.

Систематические ошибки находят, калибруя измерительные приборы и сопоставляя опытные данные с изменяющимися внешними условиями (например, при градуировке термопары по реперным точкам, при сравнении с эталонным прибором). Если систематические ошибки вызываются внешними условиями (переменной температуры, сырья и т.д.), следует компенсировать их влияние.

Случайными ошибками называются те, которые появляются нерегулярно, причины, возникновения которых неизвестны и которые невозможно учесть заранее. Случайные ошибки вызываются и объективными причинами и субъективными. Например, несовершенством приборов, их освещением, расположением, изменением температуры в процессе измерений, загрязнением реактивов, изменением электрического тока в цепи. Когда случайная ошибка больше величины погрешности прибора, необходимо многократно повторить одно и тоже измерение. Это позволяет сделать случайную ошибку сравнимой с погрешностью вносимой прибором. Если же она меньше погрешности прибора, то уменьшать её нет смысла. Такие ошибки имеют значение, которое отличается в отдельных измерениях. Т.е. их значения могут быть неодинаковыми для измерений сделанных даже в одинаковых условиях. Поскольку причины, приводящие к случайным ошибкам неодинаковы в каждом эксперименте, и не могут быть учтены, поэтому исключить случайные ошибки нельзя, можно лишь оценить их значения. При многократном определении какого-либо показателя могут встречаться результаты, которые значительно отличаются от других результатов той же серии. Они могут быть следствием грубой ошибки, которая вызвана невнимательностью экспериментатора.

Систематические и случайные ошибки состоят из множества элементарных ошибок. Для того чтобы исключать инструментальные ошибки, следует проверять приборы перед опытом, иногда в течение опыта и обязательно после опыта. Ошибки при проведении самого опыта возникают вследствие неравномерного нагрева реакционной среды, разного способа перемешивания и т.п.

При повторении опытов такие ошибки могут вызвать большой разброс экспериментальных результатов.

Очень важно исключить из экспериментальных данных грубые ошибки, так называемый брак при повторных опытах. Грубые ошибки легко обнаружить. Для выявления ошибок необходимо произвести измерения в других условиях или повторить измерения через некоторое время. Для предотвращения грубых ошибок нужно соблюдать аккуратность в записях, тщательность в работе и записи результатов эксперимента. Грубая ошибка должна быть исключена из экспериментальных данных. Для отброса ошибочных данных существуют определённые правила.

Например, используют критерий Стьюдента t(Р; f): Опыт считается бракованным, если экспериментальное значение критерия t по модулю больше табличного значения t(Р; f).

Если в распоряжении исследователя имеется экспериментальная оценка дисперсии S 2 (y k) с небольшим конечным числом степеней свободы, то доверительные ошибки рассчитываются с помощью критерий Стьюдента t(Р; f):

ε() = t (Р; f)* S(y k)/ = t (Р; f)* S()

ε(y k) = t(Р; f)* S(y k)

6. Результат прямого измерения – случайная величина, подчиняющаяся нормальному закону распределения

Результаты, которые получаются при экспериментальном исследовании какого-либо технологического процесса, зависят от целого ряда факторов. Поэтому результат исследования является случайной величиной, распределённой по нормальному закону распределения. Оно названо нормальным, т. к. именно это распределение для случайной величины является обычным и называется гаусовским или лапласским. Под распределением случайной величины понимают совокупность всех возможных значений случайной величины и соответствующих им вероятностей.

Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующим им вероятностям.

При экспериментальном исследовании какого-либо технологического процесса измеряемый результат последнего является случайной величиной, на которую оказывает влияние огромное число факторов (изменение погодных условий, самочувствие оператора, неоднородность сырья, влияние износа измерительной и стабилизирующей аппаратуры и т.д. и т.п.). Именно поэтому результат исследования является случайной величиной, распределенной по нормальному закону. Однако если исследователь какой-либо активный фактор не заметил или отнес его к неактивным, а неконтролируемое изменение этого фактора может вызвать несоразмерно большое изменение эффективности процесса и параметра, характеризующего эту эффективность, то распределение вероятности последнего может нормальному закону не подчиниться.

Точно так же приведет к нарушению нормальности закона распределения наличие в массиве экспериментальных данных грубых ошибок. Именно поэтому в первую очередь проводят анализ на наличие в экспериментальных данных грубых ошибок с принятой доверительной вероятностью.

Случайная величина будет распределена по нормальному закону, если она представляет собой сумму очень большого числа взаимно зависимых случайных величин, влияния каждой из которых ничтожно мало. Если измерения искомой величины y проведены много раз, то результат можно наглядно представить, построив диаграмму, которая показывала бы, как часто получались те или иные значения. Такая диаграмма называется гистограммой. Что бы построить гистограмму нужно разбить весь диапазон измеренных значений на равные интервалы. И посчитать сколько раз каждая величина попадает в каждый интервал.

Если измерения продолжать до тех пор, пока число измеренных значений n не станет очень большим, то ширину интервала можно сделать очень малой. Гистограмма перейдёт в непрерывную прямую, которая называется кривой распределения .

В основе теории случайных ошибок лежат два предположения:

1.при большом числе измерений случайные погрешности одинаково велики, но с разными знаками встречаются одинаково часто;

2.большие (по абсолютной величине) погрешности встречаются реже, чем малые. Т. е. вероятность появления погрешности уменьшается с ростом её величины.

Согласно закону больших чисел при бесконечно большом числе измерений n, истинное значение измеряемой величины y равно среднеарифметическому значению всех результатов измерений ỹ

Для всех m-повторностей можно записать:

Разделив это уравнение на число повторностей m, получим после подстановки:

За экспериментальную оценку истинного значения (математического ожидания) критерия оптимальности у принимается среднеарифметическая оценка результатов всех т повторностей:

Если число m велико (m→∞), то будет справедливо равенство:

Таким образом, при бесконечно большом числе измерений истинное значение измеряемой величины y равно среднеарифметическому значению ỹ всех результатов произведённых измерений: y═ỹ, при m→∞.

При ограниченном числе измерений (m≠∞) среднеарифметическое значение y будет отличаться от истинного значения, т.е. равенство y═ỹ будет неточным, а приближённым: y≈ỹ и величину этого расхождения необходимо оценить.

Если в распоряжении исследователя имеется только единичный результат измерения y k , то оценка истинного значения измеряемой величины будет менее точной. чем среднеарифметическая оценка при любом числе повторностей: |y─ỹ|<|y-yk|.

Появление того или иного значения yk в процессе измерения является случайным событием. Функция плотности нормального распределения случайной величины характеризуется двумя параметрами:

· истинным значением y;

· среднеквадратичным отклонением σ.

Рисунок – 1а – кривая плотности нормального распределения; 1б –кривая плотности вероятности нормально распределенной случайной величины при различных дисперсиях

Плотность нормального распределения (рис. 1а) симметрична относительно y и достигает максимального значения при yk= y, стремится к 0 при увеличении.

Квадрат среднеквадратичного отклонения называется дисперсией случайной величины и является количественной характеристикой разброса результатов вокруг истинного значения y. Мера рассеяния результатов отдельных измерений yk от среднего значения ỹ должна выражаться в тех же единицах, то и значения измеряемой величины. В связи с этим в качестве показателя разброса гораздо чаще используют величину σ:

Значения этой величины определяют форму кривой распределения py. Площади под тремя кривыми одинаковы, но при малых значения σ кривые идут более круто и имеют большее значение py. С увеличением σ значение py уменьшается и кривая распределения растягивается вдоль оси y. Т.о. кривая 1 характеризует плотность распределения случайной величины, воспроизводимость которой в повторных измерениях лучше, чем воспроизводимость случайных величин имеющих плотность распределения 2, 4. На практике не возможно произвести слишком много замеров. Поэтому нельзя построить нормальное распределение, чтобы точно определить истинное значение y. В этом случае хорошим приближением к истинному значению можно считать ỹ, а достаточно точной оценкой ошибки выборочную дисперсию ρ²n, вытекающую из закона распределения, но относящуюся к конечному числу измерения. Такое название величины ρ²n объясняется тем, что из всего множества возможных значений yk, т.е. из генеральной совокупности выбирают лишь конечное число значений равное m, называемых выборкой, которая характеризуется выборочным средним значением и выборочной дисперсией.

7. Экспериментальные оценки истинных значений измеряемой случайной величины и её среднеквадратичного отклонения

Если в распоряжении исследователя находится конечное число независимых результатов повторности одного и того же опыта, то он может получить лишь экспериментальные оценки истинного значения и дисперсии результата опыта.

Оценки должны обладать следующими свойствами:

1.Несмещённости, проявляющейся в том, что теоретическое среднее совпадает с истинным значением измеряемого параметра.

2.Состоятельности, когда оценки при неограниченном увеличении числа измерений могут иметь сколь угодно малый доверительный интервал при доверительной вероятности.

3.Эффективности, проявляющейся в том, что из всех несмешанных оценок данная оценка будет иметь наименьшее рассеяние (дисперсию).

Экспериментальная оценка среднеквадратичного отклонения обозначается S с указанием в скобках символа анализируемой величины, т.е.

S (yk) – среднеквадратичного отклонение единичного результата.

S (y) – среднеквадратичное отклонение среднего результата.

Квадрат экспериментальной оценки среднеквадратичного отклонения S² является экспериментальной оценкой дисперсии:

Для обработки результатов наблюдения можно использовать следующую схему:

Определение среднего значения полученных результатов:

Определение отклонения от среднего значения для каждого результата:

Эти отклонения характеризуют абсолютную ошибку определения. Случайные ошибки имеют разные знаки, когда значение результата опыта превышает среднее значение, ошибка опыта считается положительной, когда значение результата опыта меньше среднего значения, ошибка считается отрицательной.

Чем точнее произведены измерения, тем ближе значение отдельных результатов и среднее значение.

Если по m результатам рассчитывают оценку истинного значения , а затем, используя те же результаты, рассчитывают оценки абсолютных отклонений:

то оценку дисперсии единичного результата находят по зависимости:

Разность между числом т независимых результатов у к и числом уравнений, в которых эти результаты уже были использованы для расчета неизвестных оценок, называют числом степеней свободы f :

Для оценки дисперсии эталонного процесса f=m.

Поскольку средняя оценка является более точной, чем единичная у к, дисперсия средних будет меньше дисперсииединичных результатов в m раз, если рассчитано по всем m единичным результатам у к :

Если в распоряжении исследователя имеется экспериментальная оценка дисперсии S 2 (y к) с небольшим конечным числом степеней свободы, то доверительные ошибки рассчитывают с помощью критерия Стьюдента t(P; f):

где Р – доверительная вероятность (Р=1-q, q– уровень значимости).

Проверка надёжности полученных результатов по критерию Стьюдента для проведенного числа опытов m при избранной доверительной вероятности (надёжности) Р=0,95; 0,99. Это значит, что 95% или 99% абсолютных отклонений результатов лежит в указанных пределах. Критерий t(P; f) с доверительной вероятностью Р показывает во сколько раз модуль разности между истинным значением определённой величины y и средним значением ỹ больше стандартного отклонения среднего результата.

8. Определение грубых ошибок среди результатов повторностей опыта

При статистическом анализе экспериментальных данных для процессов, негативный результат которых не создает ситуаций, опасных для жизни людей или утраты больших материальных ценностей, доверительная вероятность обычно принимают равной Р=0,95

Среди результатов y k повторностей опыта могут быть результаты, значительно отличающиеся от других. Это может быть связано либо с какой-то грубой ошибкой, либо с неизбежным случайным влиянием неучтенных факторов на результат данной повторности опыта.

Признаком наличия «выделяющегося» результата среди других является большая величина отклонения │▲y k │= y k – yˉ.

Если ▲y k >y пред, то такие результаты относятся к грубым ошибкам. Предельное абсолютное отклонение определяют в зависимости от сложившейся ситуации различными методами. Если, например, проводиться статистический анализ экспериментальных данных опыта с эталонным процессом (известно истинное значение результата опыта и ▲y k =y k -y) и если исследователь имеет в своем распоряжении оценку дисперсии S 2 (y k) с таким большим числом степеней свободы, то может принять f→∞ и S 2 (y k)=σ 2 , то для определения грубых ошибок можно применить правило «2-х сигм»: все результаты, абсолютные отклонения которых по модулю превышают величину двух среднеквадратичных отклонений с надежностью 0,95 считаются грубыми ошибками и исключаются из массива экспериментальных данных (вероятность исключения достоверных результатов равна уровню значимости q=0,05).

Если доверительная вероятность отличается от 0,95 то пользуются правилом «одной сигмы» (Р=0,68) или правилом «трех сигм» (Р=0,997), или по заданной вероятности Р=2Ф(t) – 1 находят Ф(t) по справочным данным и параметр t, по которому и рассчитывают абсолютное отклонение:

Если в распоряжении исследователя имеется лишь приближенная оценка дисперсии с небольшим (конечным) числом степеней свободы, то применение правила «сигм» может привести либо к необоснованному исключению достоверных результатов либо к необоснованному оставлению ошибочных результатов.

В этой ситуации для определения грубых ошибок можно применить критерий максимального отклонения r max (P, m), взятый из соответствующих таблиц. Для этого r max сравнивают с величиной r, равной

(22)

Если r > r max , то данный результат должен исключаться из дальнейшего анализа, оценка y ˉ должна быть пересчитана, изменяются абсолютные отклонения ▲y k и соответственно оценка дисперсии S 2 (y k) и S 2 (yˉ). Анализ на грубые ошибки повторяют при новых значениях оценок yˉ и S 2 (y k), прекращают его при r <= r max .

При пользовании формулой (22) следует применять оценку дисперсии, полученную по результатам повторностей опыта, среди которых находится сомнительный результат.

Для определения грубых ошибок существуют и другие методы, среди которых наиболее быстрым является метод «по размаху» , основанный на оценке максимальных различий полученных результатов. Анализ по этому методу проводят в такой последовательности:

1)располагают результаты y k в упорядоченный ряд, в котором максимальному результату присваивается номер первый (y1), а максимальному – наибольший (y m).

2)Если результатом, вызывающим сомнение, будет y m , рассчитывают отношение

если сомнительным результатом будет y 1 – отношение

3)при заданном уровни значимости q и известном числе повторностей m по приложению 6 находят табличное значение критерия α Т.

4)если α > α Т, то подозреваемый результат является ошибочным и его следует исключить.

После исключения грубой ошибки находят по таблице новую величину α Т и решают судьбу следующего «подозреваемого» результата, сравнивая α Т и рассчитанный для него α.

Если есть основание предполагать, что 2 наибольших (2 наименьших) результата являются «промахами», то их можно выявить в один прием, используя соответствующий столбец таблицы приложения 6 для определения α Т и рассчитывая α по формуле:

Средневзвешенные оценки дисперсии. Анализ однородности исходных оценок дисперсии

Если в распоряжении экспериментатора имеются результаты многократных измерений величин критерия оптимальности в опытах при различных условиях ведения процесса, то появляется возможность расчета средневзвешенной оценки дисперсии единичного результата, единой для всех опытов эксперимента.

В каждом из N опытов (номер опыта и = 1+ N ) оценка дисперсии единичного результата равна

где т и – число повторностей и-го опыта.

Средневзвешенная оценка дисперсии единичного результата рассчитывается по всем оценкам дисперсии единичного результата опытов:

а) при различных т и

где - число степеней свободы средневзвешенной оценки дисперсии; т и – 1 = f u – «вес» соответствующей и-ой оценки дисперсии, равный числу степеней свободы f u ;

б) прит и = т = const

где N(m-1)=f– число степеней свободы средневзвешенной оценки дисперсии.

Прежде чем пользоваться соотношениями (28) и (29) для расчета средневзвешенных уточненных оценок дисперсии (чем больше число степеней свободы, тем более точной будет оценка дисперсии), надо доказать однородность исходных оценок дисперсии.

Определение «однородные» в статистике означает «являющиеся оценкой одного и того же параметра» (в данном случае – дисперсии σ 2).

Если измеряемая случайная величина у ик распределена по нормальному закону во всем исследуемом диапазоне, то независимо от значений и дисперсия σ не будет изменять своей величины и оценки этой дисперсии должны быть однородными. Однородность этих оценок проявляется в том, что они могут отличаться друг от друга лишь незначительно, в пределах, зависящих от принятой вероятности и объема экспериментальных данных.

Если т и = т и f = const, то однородность оценок дисперсий можно проанализировать при помощи критерия Кохрена G kp . Вычисляют отношение максимальной дисперсии S 2 ( y uk ) max к сумме всех дисперсий

и сравнивают это отношение с величиной критерия Кохрена G kp ( P ; f ; N ). Если G < Gkp , то оценки однородны.

Таблица значений критерия Кохрена в зависимости от числа степеней свободы числителя f u , числа сравниваемых дисперсий N и принятого уровня значимости q = 1 – Р дана в приложении.

Если число повторностей в опытах различно ( f lt ≠ const), однородность оценок дисперсии можно проанализировать с помощью критерия Фишера F Т. Для этого из N оценок дисперсии выбирают 2: максимальную S 2 (y uk) max и минимальную S 2 (y uk) min . Если вычисленное значение F их отношения меньше Ft ,

то все N оценок дисперсии будут однородны.

Значения критерия Фишера F T даны в приложении в зависимости от принятого уровня значимости q и числа степеней свободы f 1 иf 2 оценок S 2 (y uk) max и S 2 (y uk) min соответственно.

Если оценки дисперсии непосредственно измеряемого параметра у оказались неоднородными, т.е. оценками различных дисперсий, то средневзвешенная оценка не может быть рассчитана. И кроме того, величины у к уже нельзя считать подчиняющимися нормальному закону, при котором дисперсия может быть лишь одной и неизменной при любом у.

Причиной нарушения нормального закона распределения может быть наличие оставшихся грубых ошибок (анализ на грубые ошибки либо не проводился, либо проведен недостаточно тщательно).

Другой причиной может быть наличие активного фактора, ошибочно отнесенного исследователем к неактивным и не снабженного системой стабилизации. Поскольку условия изменились, этот фактор стал значимо влиять на процесс.

9. Планирование и обработка результатов однофакторных экспериментов

9.1 Формализация экспериментальных данных методом наименьших квадратов

Влияние какого-либо фактора на выход процесса может быть выражено зависимостью у = f(C). Если конкретному значению С и соответствует единственное значение у и, то такая зависимость называется функциональной. Эту зависимость получают путем строгих логических доказательств, не нуждающихся в опытной проверке. Например, площадь квадрата ω может быть представлена функциональной зависимостью от размера стороны квадрата а: ω = а 2 .

Если у и остается неизменным в то время как С и изменяется, то у не зависит от С. Например, угол при вершине квадрата равный π/2, не зависит от размера стороны а и.

Если для оценки величин у и и С и используются данные наблюдений, величины случайные, то функциональная зависимость между ними существовать не может.

Измерив отдельно сторону а и площадь ω квадрата, можно убедиться, что полученные результаты не могут быть представлены с абсолютной точностью зависимостью ω = а 2 .

К формализации экспериментальных данных, т.е. построению по ним описывающей процесс зависимости, исследователь прибегает, когда не может составить эвристическую (детерминированную) математическую модель из-за недостаточного понимания механизма процесса или его чрезмерной сложности.

Полученная в результате формализации экспериментальных данных эмпирическая математическая модель имеет меньшую ценность, чем отражающая механизм процесса эвристическая математическая модель, которая может предсказать поведение объекта за пределами изученного диапазона изменения переменных.

Приступая к эксперименту с целью получения эмпирической математической модели, исследователь должен определить необходимый объем опытных данных с учетом количества принятых к исследованию факторов, воспроизводимости процесса, предполагаемой структуры модели и обеспечения возможности проверки адекватности уравнения.

Если по результатам эксперимента, состоящего из двух опытов, получено линейное однофакторное уравнение у = b 0 + b 1 С , то построенная по этому уравнению прямая обязательно пройдет через эти экспериментальные точки. Следовательно, для того чтобы проверить, насколько хорошо эта зависимость описывает данный процесс, надо поставить опыт хотя бы еще в одной точке. Этот дополнительный опыт дает возможность осуществить корректную процедуру проверки пригодности уравнения. Однако проверку обычно проводят не по одной дополнительной точке, которая не участвовала в определении коэффициентов уравнения, а по всем экспериментальным точкам, число которых (N) должно превышать число коэффициентов уравнения (N ")

Так как N > N ", решение такой системы требует специального подхода.

9.2 Симметричный и равномерный план однофакторного эксперимента

Задача в значительной степени упростится, если при планировании эксперимента, можно будет обеспечить условие:

При натуральной размерности факторов выполнить условие ΣC u =0 невозможно, т. к. в этом случае величина фактора должна иметь как положительные значения, так и отрицательные.

Если же точку отсчета величины фактора перенести в середину диапазона изменения фактора (центр эксперимента)

то появляется возможность удовлетворить условию в виде , где С " u =С u – С 0.

Для равномерного плана С u – С (u -1) = λ = const,

где λ – интервал варьирования фактора.

Условие может быть выполнено, если для обозначения величины фактора использовать безразмерные выражения:

отсюда легко увидеть, что условие эквивалентно условию и такие планы называют симметричными.

При составлении плана диапазон фактора ориентировочно ограничивают величинами С min и С max , назначенными после изучения литературы по теме исследования. От опыта к опыту предусматривают такое изменение величины фактора, которое позволило бы достоверно уловить имеющимися в распоряжении исследователя приборами изменение выхода процесса .

С учетом величины λ и диапазона (С max – C min) определяют число опытов, округляя его до нечетного N:

Затем определяют величины факторов в каждом из N опытов и уточняют исследуемый диапазон фактора С N – С 1:

где х u – безразмерное выражение фактора, аналогичное полученному по соотношению

Для расчета коэффициентов уравнения используем формулу:

множители а ju и знаменатель l j берем из приложения.

Число опытов эксперимента может быть четным или нечетным, и, как правило, должно быть больше числа коэффициентов N" уравнения.

Чем больше разность (N – N"), тем с большей точностью можно получить оценки коэффициентов данного уравнения и тем в большей степени эти оценки будут освобождены от влияния случайных неуточненных факторов.

Планирование эксперимента - один из важнейших этапов организации психологического исследования, на котором исследователь пытается сконструировать наиболее оптимальную для воплощения на практике модель (то есть план) эксперимента. Грамотно составленная схема исследования, план, позволяет добиться оптимальных значений валидности, надёжности и точности в исследовании, предусмотреть нюансы, за которыми сложно уследить при бытовом «спонтанном экспериментировании». Зачастую, чтобы скорректировать план, экспериментаторы проводят так называемое пилотажное, или пробное, исследование, которое можно рассматривать как «черновик» будущего научного эксперимента.
Экспериментальный план создаётся для того, чтобы ответить на основные вопросы о:

· количестве независимых переменных, которые используются в эксперименте (одна или несколько?);

· количестве уровней независимой переменной (изменяется ли независимая переменная или остаётся постоянной?);

· методах контроля дополнительных, или возмущающих, переменных (какие необходимо и целесообразно применить?):

o метод прямого контроля (прямое исключение известной дополнительной переменной),
o метод выравнивания (учитывать известную дополнительную переменную при невозможности её исключения),
o метод рандомизации (случайный отбор групп в случае неизвестности дополнительной переменной).
Одним из самых важных вопросов, на которые должен ответить экспериментальный план, - определить, в какой последовательности должно происходить изменение рассматриваемых стимулов (независимых переменных), воздействующих на зависимую переменную. Последовательность предъявления стимулов - очень важный вопрос, напрямую касающийся соблюдения валидности исследования: к примеру, если постоянно предъявлять человеку один и тот же стимул, он может стать менее восприимчив к нему.
Виды планов:
1. Простые (однофакторные) планы – предусматривают изучение влияния на зависимую переменную только одной независимой переменной. Преимущество таких планов состоит в их эффективности при установлении влияния независимой переменной, а также в лёгкости анализа и интерпретации результатов. Недостаток заключается в невозможности сделать вывод о функциональной зависимости между независимой и зависимой переменными.
- Опыты с воспроизводимыми условиями. В сравнении с опытами с привлечением двух независимых групп такие планы требуют меньшего количества участников. План не подразумевает наличия разных групп (например, экспериментальной и контрольной). Цель таких опытов - установить воздействие одного фактора на одну переменную.
- Опыты с привлечением двух независимых групп (экспериментальной и контрольной) – опыты, в которых экспериментальному воздействию подвергается лишь экспериментальная группа, в то время как контрольная группа продолжает делать то, что она обычно делает. Цель - проверка действия одной независимой переменной.
2. Комплексные планы составляются для экспериментов, в которых изучается либо воздействие нескольких независимых переменных (факторные планы), либо последовательное воздействие различных градаций одной независимой переменной (многоуровневые планы).
- Планы для многоуровневых экспериментов. Если в экспериментах используется одна независимая переменная, ситуация, когда изучаются только два её значения, считается скорее исключением, чем правилом. В большинстве однофакторных исследований используется три или более значений независимой переменной, - такие планы часто называют однофакторными многоуровневыми. Такие планы могут использоваться как для исследования нелинейных эффектов (то есть случаев, когда независимая переменная принимает более двух значений), так и для проверки альтернативных гипотез. Преимущество - в возможности определить вид функциональной зависимости между независимой и зависимой переменными. Недостаток заключается в больших временных затратах, а также в необходимости привлечь больше участников.
- Факторные планы подразумевают использование более чем одной независимой переменной. Таких переменных, или факторов, может быть сколько угодно, но обычно ограничиваются использованием двух, трёх, реже - четырёх. Факторные планы описываются с помощью системы нумерации, показывающей количество независимых переменных и количество значений (уровней), принимаемых каждой переменной. Например, факторный план 2х3 имеет две независимые переменные (факторы), первая из которых принимает два значения («2»), а вторая - три значения («3»).
3. Квазиэкспериментальные планы - планы для экспериментов, в которых вследствие неполного контроля за переменными нельзя сделать выводы о существовании причинно-следственной связи. Эти планы часто применяются в прикладной психологии.
- Планы ex post facto. - исследования, в которых сбор и анализ данных производится после того, как событие уже свершилось, многие относят их к квазиэкспериментальным. Суть исследования в том, что экспериментатор сам не воздействует на испытуемых: в качестве воздействия выступает некоторое реальное событие из их жизни. При планировании исследования имитируется схема строгого эксперимента с уравниванием или рандомизацией групп и тестированием после воздействия.
- Планы экспериментов с малым N также называют «планами с одним субъектом», так как индивидуально рассматривается поведение каждого испытуемого. Одной из главных причин использования экспериментов с малым N считается невозможность в некоторых случаях применить результаты, полученные из обобщений на больших группах людей, ни к одному из участников индивидуально (что, таким образом, приводит к нарушению индивидуальной валидности). Интроспективные исследования Эббингауза можно отнести к экспериментам с малым N (только исследуемым им субъектом был он сам). План с одним субъектом должен учитывать как минимум три условия:
1. Необходимо точно определить целевое поведение в терминах событий, которые легко зафиксировать.
2. Необходимо установить базовый уровень реакции.
3. Необходимо произвести воздействие на испытуемого и зафиксировать его поведение.
4. Планы корреляционных исследований - исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи (корреляции) между несколькими (двумя или более) переменными. От квазиэкспериментального отличается тем, что в нём отсутствует управляемое воздействие на объект исследования. В корреляционном исследовании учёный выдвигает гипотезу о наличии статистической связи между несколькими психическими свойствами индивида или между определёнными внешними уровнями и психическими состояниями. Испытуемые должны быть в эквивалентных неизменных условиях. Виды корреляционных исследований:

· Сравнение двух групп

· Одномерное исследование

· Корреляционное исследование попарно эквивалентных групп

· Многомерное корреляционное исследование

· Структурное корреляционное исследование

· Лонгитюдное корреляционное исследование*

Планирование включает в себя два этапа.

1- Определение состава выборки.
2- Определение объёма выборки.
3- Определение способа формирования выборки.

Формальное планирование эксперимента
1. Содержательное планирование эксперимента:
- Определение ряда теоретических и экспериментальных положений, образующих теоретическую основу исследования.
- Формулировка теоретических и экспериментальных гипотез исследования.
- Выбор необходимого метода эксперимента.
- Решение вопроса выборки испытуемых: Определение состава, объёма и способа формирования выборки.
2. Формальное планирование эксперимента:
- Достижение возможности сравнения результатов.
- Достижение возможности обсуждения полученных данных.
- Обеспечение экономичного проведения исследования.
Формальное планирование включает выбор экспериментальной схемы, или плана варьирования условий независимой переменной (НП), и определение величины минимального эффекта ожидаемого результата действия НП. План сбора данных является одновременно планом, в соответствии с которым измеряется ЗП. Главной целью формального планирования считается исключение максимально возможного числа причин искажения результатов.
Задачи формального планирования исследователя.
- обеспечить валидность эксперимента
- обеспечить условие для принятия решения об экспериментальном эффекте, или эффекте действия НП.
- применение схем обработки данных, адекватных метрике использование напр., шкал и способ сбора данных.
В узком смысле к планированию эксперимента относят 2 момента, связанных с учетом последующего статистического решения.
1. как будет оцениваться экспериментальный эффект Между НП и ЗП
2. установление минимального эффекта, достаточного для вынесения суждения о полученных различиях в экспериментах и контрольных условиях или наблюдаемой связи между измерениями НП и ЗП (установление минимального эффекта включает определение вероятности ошибок первого (альфа) и второго (бетта – уровня) рода).
Есть экспериментальные эффекты, которые определяются только при помощи статистических методов, а есть такие, в которых изменение ЗП на столько заметны, что не надо никакой статистики.
Величина минимального эффекта связана с количеством опытных данных, т.е. с числом выборочных значений показателей ЗП. Психологическая величина выборки (числа испытуемых или числа опытов) м. существенно снизить величину эффекта, достаточно для принятия решения о действии НП, но это таки связано с содержанием планирования. (контроль факторов времени, репрезентация выборки и т.д.)
Формальное планирование для проверки психологической гипотезы возможно в психологических случаях исследования, где принимается традиционный подход: переменные представлены и управляемы независимо др. от др.
I Решение проблем содержат план эксперимента представленный на этапе конкретизации и гипотез и переменных,т.о. чтобы не было утеряна специфика исследуемой психологической реальности: психологическое объяснение, заданное в гипотетических конструктах и формулировке причинно-следственной зависимости, содержательно соотносится с видом установления эмпирической зависимости и условиями ее выявления, включая способы задания условий НП и выбор методик фиксации показателя ЗП. Это первый этап планирования эксперимента.
II Определение адекватной схемы сбора данных, количества необходимых проб контроля факторов, угрожающих валидности эксперимента и т.д. психолог принимает условность ряда положений.
В качестве этапов формального планирования выделяют решения о величине минимального эффекта Х-воздействий или о величине сдвига ЗП, которые измерила на разных уровнях НП, которые принимается в качестве достаточной или разумной с т.з. возможности отвергнуть нуль-гипотезу, а также об уровнях допустимых ошибок при проверке статистической гипотезы.

Содержательное планирование эксперимента
Планирование включает в себя два этапа:
1. Содержательное планирование эксперимента:
- Определение ряда теоретических и экспериментальных положений, образующих теоретическую основу исследования. Постановка задачи или определение темы. Любое исследование начинается с определения темы (она ограничивает то, что будем исследовать). Исследование проводится в трех случаях:
1-проверка гипотезы о существовании явления;
2-проверка гипотезы о существовании связи между явлениями;
3-проверка гипотезы о причинной зависимости явления А от явления В.
Первичная постановка проблемы заключается в постановке гипотезы. Психологическая гипотеза, или экспериментальная, - гипотеза о психическом явлении, инструментом проверки которой служит психологическое исследование.
- Формулировка теоретических и экспериментальных гипотез исследования. Этап уточнения гипотезы и определения переменных. Определение экспериментальной гипотезы.
- Выбор необходимого метода эксперимента.
- Выбор экспериментального инструмента и условий эксперимента (отвечает на вопрос – «как организовать исследование?»):
Позволяет управлять независимой переменной. Независимая переменная - в научном эксперименте переменная, которая намеренно манипулируется или выбирается экспериментатором с целью выяснить ее влияние на зависимую переменную.
Позволяет регистрировать зависимую переменную. Зависимая переменная - в научном эксперименте измеряемая переменная, изменения которой связывают с изменениями независимой переменной
- Решение вопроса выборки испытуемых:
- Определение состава выборки.
- Определение объёма выборки.
- Определение способа формирования выборки.
- Рандомизация (случайный отбор). Используется для создания простых случайных выборок, основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза, можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек - это будет случайным отбором.
- Попарный отбор - стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп с лучшим вариантом - привлечением близнецовых пар (моно- и дизиготных), так как позволяет создать.
- Стратометрический отбор. Стратометрический отбор - рандомизация с выделением страт (или кластеров). При данном способе формирования выборки генеральная совокупность делится на группы (страты), обладающие определёнными характеристиками (пол, возраст, политические предпочтения, образование, уровень доходов и др.), и отбираются испытуемые с соответствующими характеристиками.
- Приближённое моделирование. Приближённое моделирование - составление ограниченных выборок и обобщение выводов об этой выборке на более широкую популяцию. Например, при участии в исследовании студентов 2-го курса университета, данные этого исследования распространяются на «людей в возрасте от 17 до 21 года». Допустимость подобных обобщений крайне ограничена.
- Привлечение реальных групп
2. Формальное планирование эксперимента:
- Достижение возможности сравнения результатов.
- Достижение возможности обсуждения полученных данных.
- Обеспечение экономичного проведения исследования.
Главной целью формального планирования считается исключение максимально возможного числа причин искажения результатов.

Факторное планирование эксперимента
Факторные эксперименты применяются тогда, когда необходимо проверить сложные гипотезы о взаимосвязях между переменными. Общий вид подобной гипотезы: «Если А1, А2,..., Аn, то В». Такие гипотезы называются комплексными, комбинированными и др. При этом между независимыми переменными могут быть различные отношения: конъюнкции, дизъюнкции, линейной независимости, аддитивные или мультипликативные и др. Факторные эксперименты являются частным случаем многомерного исследования, в ходе проведения которого пытаются ус¬тановить отношения между несколькими независимыми и несколькими зависимы¬ми переменными. В факторном эксперименте проверяются одновременно, как правило, два типа гипотез:
1) гипотезы о раздельном влиянии каждой из независимых переменных;
2) гипотезы о взаимодействии переменных, а именно - как присутствие одной из независимых переменных влияет на эффект воздействия на другой.
Факторный эксперимент строится по факторному плану. Факторное планирование эксперимента заключается в том, чтобы все уровни независимых переменных сочетались друг с другом. Число экспериментальных групп равно числу сочетаний уровней всех независимых переменных.
Чаще всего используются факторные планы для двух независимых переменных и двух уровней типа 2х2. Для составления плана применяется принцип балансировки. План 2х2 используется для выявления эффекта воздействия двух независимых переменных на одну зависимую. Экспериментатор манипулирует возможными сочетаниями переменных и уровней. Данные приведены в простейшей таблице.
2-я переменная 1-я переменная
Есть Нет
Есть 1 2
Нет 3 4
Для обработки результатов применяется дисперсионный анализ по Фишеру.
Так же редко используются другие версии факторного плана, а именно: 3х2 или 3х3. План 3х2 применяется в тех случаях, когда нужно установить вид зависимости одной зависимой переменной от одной независимой, а одна из независимых переменных представлена дихотомическим параметром. Пример такого плана - эксперимент по выявлению воздействия внешнего наблюдения на успех решения интеллектуальных задач. Первая независимая переменная варьируется просто: есть наблюдатель, нет наблюдателя. Вторая независимая переменная - уровни трудности задачи. В этом случае мы получаем план 3х2.
1-я переменная 2-я переменная
Легкая Средняя Трудная
Есть наблюдатель 1 2 3
Нет наблюдателя 4 5 6
Вариант плана 3х3 применяется в том случае, если обе независимые переменные имеют несколько уровней и есть возможность выявить виды связи зависимой переменной от независимых. Этот план позволяет выявлять влияние подкрепления на успешность выполнения задании разной трудности.
Уровень сложности задачи Интенсивность стимуляции
Низкая Средняя Высокая
Низкий 1 2 3
Средний 4 5 6
Высокий 7 8 9
В общем случае план для двух независимых переменных выглядит как N х М. Применимость таких планов ограничивается только необходимостью набора большого числа рандомизированных групп. Объем экспериментальной работы чрезмерно возрастает с добавлением каждого уровня любой независимой переменной.
В случае, когда нас интересует успешность выполнения экспериментальной серии заданий, зависящая не только от общей стимуляции, которая производится в форме наказания - удара током, но и от соотношения поощрения и наказания, мы применяем план 3х3х3.
L1 L2 L3
М1 A1 В2 С3
М2 В2 С3 А1
м3 С3 А1 В2
2 признака многоуровневого эксперимента:
1. НП имеет более чем 2 уровня
2. порядок предъявления этих трех или более условий одной и той же НП контролируется спец схемой, подразумевающей уравнивание порядковой позиции каждого уровня в общей последовательности условий
Эти многоуровневые эксперименты противопоставляют бивалентному (здесь 2 уровня НП, экспериментальная и контрольная могут отличаться качеством и количеством)
Количественная оценка это оценка по шкалам порядка, отношений, интервалов.
Классификация уровней НП – это качественная оценка, может быть по одному или более признакам.
Не число НП определяет переход к количественному эксперименту, а возможность измерения хотя бы одной из НП как количественной.
Многоуровневый эксперимент часто строиться по факторным схемам, поскольку второй переменной выступает «порядок уровней» первой НП
Есть 2 наиболее поп схемы:
1. полного уравнивания по схеме лат квадрата
2. уравнивание по схеме сбалансированного лат квадрата
Обе эти схемы представляют собой варианты экспериментальных планов, в которых все уровни первой НП предъявляются каждому испытуемому, но вторая НП образуется благодаря разбиению испытуемых на группы, которым предъявляется одна из возможных последовательностей уровневой первой НП
Рассмотрим возможные результаты простейшего факторного эксперимента 2х2 с позиций взаимодействий переменных. Для этого нам надо представить результаты опытов на графике, где по оси абсцисс отложены значения первой независимой переменной, а по оси ординат - значения зависимой переменной. Каждая из двух прямых, соединяющих значения зависимой переменной при разных значениях первой независимой переменной (А), характеризует один из уровней второй независимой переменной (В). Применим для простоты результаты не экспериментального, а корреляционного исследования. Условимся, что мы исследовали зависимость статуса ребенка в группе от состояния его здоровья и уровня интеллекта. Рассмотрим варианты возможных отношений между переменными.
Первый вариант: прямые параллельны - взаимодействия переменных нет.
Больные дети имеют более низкий статус, чем здоровые, независимо от уровня интеллекта. Интеллектуалы имеют всегда более высокий статус (независимо от здоровья).
Второй вариант: физическое здоровье при наличии высокого уровня интеллекта увеличивает шанс получить более высокий статус в группе(рис 5.2).
В этом случае получен эффект расходящегося взаимодействия двух независимых переменных. Вторая переменная усиливает влияние первой на зависимую переменную.
Третий вариант: сходящееся взаимодействие - физическое здоровье уменьшает шанс интеллектуала приобрести более высокий статус в группе. Переменная «здоровье» уменьшает влияние переменной «интеллект» на зависимую переменную. Есть и другие случаи этого варианта взаимодействия:
Переменные взаимодействуют так, что увеличение значения первой приводит к уменьшению влияния второй с изменением знака зависимости (рис. 5.3).
У больных детей, обладающих высоким уровнем интеллекта, меньше шанс полу¬чить высокий статус, чем у больных детей с низким интеллектом, а у здоровых - связь интеллекта и статуса позитивная.
Теоретически возможно представить, что больные дети будут иметь больший шанс получить высокий статус при высоком уровне интеллекта, чем их здоровые низкоинтеллектуальные сверстники.
Последний, четвертый, возможный вариант наблюдаемых в исследованиях отношений между независимыми переменными: случай, когда между ними существует пересекающееся взаимодействие, представленное на последнем графике (рис. 5.4).
Оценка величины взаимодействия проводится с помощью дисперсионного ана¬лиза, а t-критерий Стьюдента используется для оценки значимости X.`различий груп¬повых
Во всех рассмотренных вариантах планирования эксперимента применяется способ балансировки: различные группы испытуемых ставятся в разные экспериментальные условия. Процедура уравнивания состава групп позволяет производить сравнение результатов.
Однако во многих случаях требуется планировать эксперимент так, чтобы все его участники получили все варианты воздействия независимых переменных. Тогда на помощь приходит техника контрбалансировки.

Психофизика. Методы измерения порогов чувствительности
Психофи́зика, раздел психологии, изучающий количественные отношения между силой раздражителя и величиной возникающего ощущения с помощью количественных методов. Основана Г.Фехнером во 2-й половине XIX в.. Она ищет ответы на следующие вопросы:
1) Какой уровень стимуляции необходим для того, чтобы вызвать ощущение или сенсорную реакцию?
2) Насколько должна измениться величина раздражителя, чтобы можно было обнаружить изменение?
4) Как меняется ощущение или сенсорная реакция с изменением величины раздражителя?
Для ответа на эти и другие вопросы используют психофизические методы. В состав этих методов входят: 3 классических метода определения порогов, введенные в психофизику Г.Фехнером; многочисленные психофизические методы шкалирования надпороговых раздражителей, используемые для получения мер величины ощущения, и методы теории обнаружения сигналов (ТОС), применяемые для получения мер "номинальной" сенсорной чувствительности, минимально искаженной мотивами и установками испытуемых. Так называемые классические методы - метод границ, метод установки и метод постоянных раздражителей - впервые были сведены вместе и представлены Фехнером в его труде "Элементы психофизики". Они использовались для определения абсолютных и разностных порогов. Абсолютный порог определяется как величина раздражителя, дающего 50% случаев обнаружения. Аналогично этому дифференциальный порог - это минимальное изменение раздражения, обнаруживаемое в 50% случаев.
Метод границ. При использовании этого метода наблюдателю в каждой отдельной пробе предъявляют либо монотонно возрастающую (восходящие пробы), либо монотонно убывающую (нисходящие пробы) дискретную последовательность раздражителей, величина которых изменяется до тех пор, пока не произойдет изменение реакции наблюдателя с "да" на "нет" (в нисходящих пробах) или с "нет" на "да" (в восходящих пробах). Уровень стимуляции, соответствующее половине интервала, на котором происходит изменение реакции, принимается за величину порога для данной пробы.
Метод установки. В противоположность методу границ, этот метод дает возможность самому наблюдателю регулировать непрерывно изменяемый раздражитель, с тем чтобы уравнять его с заданным эталоном. Каждая проба заключается в корректировке наблюдателем переменного раздражителя от точки явного неравенства до точки субъективного равенства с эталоном. Восходящие и нисходящие пробы чередуются вместе со случайно изменяемым начальным отклонением переменного раздражителя от эталона.
Метод постоянных раздражителей. Этот метод предписывает предъявление наблюдателю в каждой отдельной пробе только одного раздражителя, выбранного из фиксированного набора, включающего от 4 до 9 раздражителей. При определении абсолютного порога наблюдатель в каждой пробе дает ответ в форме "да/нет". При определении дифференциального порога наблюдатель, сравнивая тестовый раздражитель из определенного набора с предъявляемым в каждой пробе эталоном, дает ответ в форме "больше чем/меньше чем". После предварительного опробования тестовых раздражителей их набор формируется т. о., чтобы они заключали порог в вилку и чтобы все они (в идеале) давали какой-то процент реакций обнаружения или различения, но ни один из них не воспринимался в 100% случаев.
Психофизические методы шкалирования надпороговых раздражителей. Представляют собой собрание самых различных методов, общее у которых только то, что они предписывают правила, по которым испытуемые (прямо или косвенно) присваивают значения числовой шкалы физическим стимулам. Эти методы часто использовались для проверки некоторых психофизических законов. Среди них - методы бисекции, субъективно равных интервалов, фракционирования и оценки величины. При использовании метода бисекции испытуемому дается инструкция отрегулировать величину переменного раздражителя т. о., чтобы результирующее ощущение казалось ему равноудаленным от ощущений, вызываемых двумя постоянными раздражителями, задающими границы интервала, который нужно разделить пополам. Эта процедура многократно повторяется, после чего вычисляется среднее арифметическое подобранных испытуемым значений переменного раздражителя. Метод субъективно равных интервалов - разновидность метода категорий - предоставляет наблюдателю возможность относить предъявляемые раздражители к одной из "равношироких" категорий, число которых (напр., 5) задается экспериментатором и не меняется в ходе опыта. Первыми предъявляются крайние по величине раздражители и идентифицируются как таковые, чтобы служить опорными точками для последующих суждений. После классификации наблюдателем всех раздражителей их субъективные значения, определяемые как усредненные, или медианные, категории, представляются графически в виде функции от объективной величины раздражителя. Метод фракционирования требует от наблюдателя в каждой пробе создавать (путем регулировки или подстройки) новый раздражитель, составляющий заранее определенную часть (напр., половину) предъявляемого ему раздражителя. Это делается для каждого из раздражителей, входящих в стимульный набор. Метод оценки величины - широко используемая процедура, предоставляющая возможность наблюдателю оценивать величину раздражителей, приписывая им числа. Более сильные по сравнению с эталонным стимулом раздражители получают обычно большие числовые значения, а более слабые - меньшие. Для каждого раздражителя вычисляется среднее арифметическое или среднее геометрическое числовых оценок, полученных на группе испытуемых. Полученные средние субъективных оценок величины раздражителя представляются графически в виде функции от реальной величины раздражителя. Теория обнаружения сигналов Мотивация, ожидание и отношение наблюдателя вызывают смещение результатов измерения относительно истинного значения в психофизических экспериментах по определению порогов. Так, при использовании метода постоянных раздражителей, в пустых пробах ("пробах-ловушках"), когда наблюдателю не предъявляют никаких раздражителей, все равно появляются ответы "да". Такая реакция в теории обнаружения сигналов (ТОС) называется ложной тревогой. Безошибочное обнаружение раздражителя (ответ "да" при его наличии) называется попаданием. Изменения мотивации, ожиданий или отношения могут увеличивать процент попаданий, но ценой повышения доли ложных тревог. В каждом из трех основных методов ТОС - "да - нет", оценки и вынужденного выбора - задается случайная последовательность проб (напр., 200), в которых сигнал либо подается на фоне каких-то др., случайных сигналов (пробы "сигнал + шум"), либо отсутствует (пробы "чистого шума"). При использовании метода "да - нет" задача наблюдателя - давать ответ "да" в пробах с наличием сигнала и ответ "нет" в пробах с его отсутствием. В процедуре оценивания реакция наблюдателя сводится к выбору из заданного набора оценочных категорий той, которая отражает степень его уверенности в наличии сигнала в данной пробе. В эксперименте с вынужденным выбором предлагаются ситуации выбора из двух или более альтернатив (напр., при разнесении интервалов наблюдения во времени), одна и только одна из которых содержит сигнал плюс шум. Наблюдатель должен выбрать ту из них, в которой вероятнее всего содержится сигнал. Влияние мотивации, ожиданий и отношения на реакции испытуемых в психофизических экспериментах трактуется как критерий наблюдателя, оцениваемый по проценту ложных тревог. На этот критерий можно влиять, изменяя долю проб с сигналом (и соответственно информируя наблюдателя), инструктируя наблюдателя быть более расслабленным либо, наоборот, более внимательным и точным или изменяя выплаты за возможные реакции. Если процент попаданий откладывать по оси ординат, а процент ложных тревог - по оси абсцисс, полученные точки будут соответствовать различным уровням критерия наблюдателя, а построенная по ним кривая будет называться рабочей характеристикой приемника. Различные кривые порождаются сигналами разного уровня, тогда как все точки одной кривой отображают один уровень обнаружительной способности наблюдателя. Т.о., появляется возможность разграничить действие сенсорных и внесенсорных факторов. Приложения Помимо использования для поиска ответов на вопросы теоретической психофизики, различные П. м. широко применяются для решения практических задач как в области психологии, так и за ее пределами. Сведения о нормальных зрительных и слуховых порогах (и, в несколько меньшей степени, о порогах др. органов чувств) учитываются при проектировании оборудования и анализе человеческих факторов в инженерной психологии, а также используются практической медициной в качестве эталонов сравнения при постановке клинического диагноза. Методы шкалирования надпороговых раздражителей применяются в промышленности и торговле для оценки предпочтений. Методы ТОС также находят самое широкое применение: от оценки пределов "чистой" сенсорной чувствительности до принятия решений в медицине.

Психофизические законы. Бугера - Вебера, Вебера - Фехнера, Стивенса, обобщённый психофизический закон
Основной психофизический закон. Исходя из закона Вебера, Фехнер сделал допущение, что едва заметные разницы в ощущениях можно рассматривать как равные, поскольку все они - величины бесконечно малые, и принять их как единицу меры, при помощи которой можно численно выразить интенсивность ощущений как сумму (или интеграл) едва заметных (бесконечно малых) увеличений, считая от порога абсолютной чувствительности. В результате он получил два ряда переменных величин - величины раздражителей и соответствующие им величины ощущений. Ощущения растут в арифметической прогрессии, когда раздражители растут в геометрической прогрессии. Отношение этих двух переменных величин можно выразить в логарифмической формуле:
Е = KlogJ + С,
где К и С суть некоторые константы. Эта формула, определяющая зависимость интенсивности ощущений (в единицах едва заметных перемен) от интенсивности соответственности раздражителей, и представляет собой так называемый психофизический закон Вебера-Фехнера.
Порогу чувствительности соответствует точка в сенсорном пространстве. В этой точке отражается значение стимула, при котором сенсорная система переходит из одного состояния в другое. В случае абсолютного порога она переходит от отсутствия ощущения к появлению едва заметного ощущения, В случае разностного порога - от отсутствия ощущения разницы к появлению ощущения различия. Таким образом, пороговые измерения - измерения точечные. Их результаты могут очертить границы (диапазон изменений величины стимулов), в которых действует сенсорная система, но они ничего не говорят о ее структуре.
Три самых известных психофизических закона представляют собой теоретические модели структуры сенсорного пространства. В основе этих моделей лежит эмпирический закон Бугера - Вебера. На границе XVIII - XIX вв. французский физик Бугер открыл некий эффект для зрительной модальности, а немецкий физиолог Вебер проверил его действие для других модальностей. Этот эффект заключается в том, что отношение величины едва заметного увеличения стимула к исходному его значению остается постоянным в весьма широком диапазоне значений величины стимула, т.е.
R/R=k
Это соотношение получило название закона Бугера - Вебера.
Закон Фехнера. Решая свою задачу о взаимоотношении субъективного и объективного, Фехнер рассуждал примерно следующим образом. Предположим, что наше сенсорное пространство состоит из очень маленьких дискретных элементов е - едва заметных различений. Эти элементы равны между собой, т.е. постоянны:
e=k,
где k - константа.
С учетом коэффициента пропорциональности две константы можно приравнять друг другу. Таким образом, постоянное отношение закона Бугера - Вебера можно приравнять константе, связанной с едва заметным различением:
R/R=Ke,
где К - коэффициент пропорциональности.
Далее Фехнер сделал шаг, от этого уравнения, связывающего малые величины е и R, он перешел к дифференциальному уравне¬нию
dR/R=K×dE
где dE - дифференциал, соответствующий очень маленькой величине е. Решением этого уравнения будет соотношение
E=C1×LnR+C2
где C1 и C2 - константы интегрирования.
Определим C2. Ощущение начинается с какого-то значения стимула, соответствующего пороговому (R1). При R=R1 ощущение отсутствует и появляется только при малейшем превышении R над R1, т.е. в этом случае Е=0. Подставим в полученное решение:
О = C1 x InR1+C2,
отсюда C2 = - C1 x InR1, следовательно,
Е = C1 x InR- C1x In R1 = C1 x ln(R/ R1).
Соотношение E = C1x ln (R/ R1) называется законом Фехнера или иногда законом Вебера - Фехнера. Отметим, что закон Фехнера активно использует понятие порога. R1 - это, очевидно, абсолютный порог; е-элементарные ощущения, аналог порога различения.
Закон Стивенса. Американский психофизик Стивенс предложил свое решение задачи. Исходным пунктом для него был также закон Бугера - Вебера. Но модель сенсорного пространства он представлял себе иначе. Стивенс предположил, что в сенсорном пространстве действует отношение, аналогичное закону Бугера - Вебера в пространстве стимулов:
E/E=k
т.е. оглашение едва заметного приращения ощущения к его исходной величине является постоянной величиной. Опять же с точностью до коэффициента пропорциональности мы можем приравнять две постоянные величины:
E/E=K R/R
Так как Стивенс не постулировал дискретность сенсорного про¬странства, он вполне корректно мог перейти к дифференциальному уравнению
dE/E=dR/R
решение этого уравнения Е = k x Rn получило название закона Стивенса. Показатель степени n для каждой модальности имеет свое значение, но, как правило, меньше единицы.
Американские ученые Р. и Б. Тетсунян предложили объяснение смысла показателя степени n. Составим систему уравнений для двух крайних случаев - минимального и максимального ощущения:
Emin=k xRnmin xEmax=K x Rnmax
Прологарифмируем обе части уравнения и получим:
LnEmin=n x LnRmin+Lnk
LnEmax=n x LnRmax+Lnk
Решив систему уравнений относительно n, получаем
n=(LnEmax-LnEmin)/Ln(Rmax-Rmin),
или
n=Ln(Emax/Emin)/Ln(Rmax/Rmin)
Таким образом, по мнению Тетсунян, значение n для каждой модальности определяет соотношение между диапазоном ощущений и диапазоном воспринимаемых стимулов.
Сто с лишним лет не прекращаются споры между сторонниками логарифмической зависимости силы ощущения от величины стимула (закон Фехнера) и степенной (закон Стивенса). Результаты экспериментов с одними модальностями лучше аппроксимируются логарифмом, с другими - степенной функцией.
Рассмотрим один из подходов, примиряющих эти две крайности.
Обобщенный психофизический закон. Ю.М.Забродин предложил свое объяснение психофизического соотношения. Мир стимулов представляет опять закон Бугера - Вебера, а структуру сенсорного пространства Забродин предложил в следующем виде:
E/Ez
т.е. добавил константу. Отсюда обобщенный психофизический закон записывается:
dEz/E=dR/R
Очевидно, при z = 0 формула обобщенного закона переходит в логарифмический закон Фехнера, а при z = 1 - в степенной закон Стивенса. Величина этой константы определяет степень осведомленности испытуемого о целях, задачах и ходе проведения эксперимента. В экспериментах Фехнера принимали участие "наивные" испытуемые, которые попали в абсолютно незнакомую экспериментальную ситуацию и ничего, кроме инструкции, не знали о предстоящем эксперименте. Это требование работы с "наивными" испытуемыми следует, во-первых, из постулирования Фехнером невозможности проведения человеком прямых количественных оценок величины ощущения, во-вторых, из его надежды выделить в эксперименте работу сенсорной системы в "чистом" виде, исключив влияние других психических систем. Таким образом, в законе Фехнера z = 0, что означает полную неосведомленность испытуемых.
Стивенc решал более прагматические задачи. Его скорее интересовало, как воспринимает сенсорный сигнал человек в реальной жизни, а не абстрактные проблемы работы сенсорной системы. Он доказывал возможность прямых оценок величины ощущений, точность которых увеличивается при надлежащей тренировке испытуемых. В его экспериментах принимали участие испытуемые, прошедшие предварительную подготовку, обученные действовать в ситуации психофизического эксперимента. Поэтому в законе Стивенса z = 1, что показывает полную осведомленность испытуемого.
Обобщенный психофизический закон Забродина снимает противоречие между законами Стивенса и Фехнера, но для этого он вынужден выйти за рамки парадигм классической психофизики. Очевидно, что понятия "осведомленность", "неосведомленность" относятся к работе интегральных психических образований, включающих сенсорную систему только как канал получения информации о внешнем мире.
Психофизические законы устанавливают связь между психофизическими коррелятами. При этом ощущение измеряется в физических величинах, Т.е. в значениях вызывающего это ощущение стимула. Например, значению высоты звука в один сон (субъективная величина) соответствует частота звука в 1000 Гц при силе звука в 40 дБ (объективная величина). Психофизические законы показывают, как пространство стимулов (внешних раздражителей) преобразуется в сенсорное пространство. При этом благодаря виду функции преобразования (психофизическому закону) происходит "сжатие" диапазона изменений значений стимулов.
Но в реальной жизни почти не встречаются в чистом виде пары психофизических коррелятов. Даже сигналы одной модальности представляют собой весьма сложную совокупность физических характеристик, результирующая величина которых не аддитивна относительно своих составляющих. Это хорошо видно на примере тембра звука, физическим коррелятом которого служит совокупность гармоник, составляю¬щих звуковой сигнал, причем эту характеристику невозможно измерить в простой физической шкале. Не имея физической шкалы, измерения психических величин теряют основу, «повисают в воздухе». Как быть в этом случае? Классическая психофизика, ограниченная рамками своих двух основных парадигм, не смогла ответить на этот вопрос.

Психофизическое шкалирование
Психофизические методы шкалирования надпороговых раздражителей. Представляют собой собрание самых различных методов, общее у которых только то, что они предписывают правила, по которым испытуемые (прямо или косвенно) присваивают значения числовой шкалы физическим стимулам. Эти методы часто использовались для проверки некоторых психофизических законов.
Среди них - методы бисекции, субъективно равных интервалов, фракционирования и оценки величины. При использовании метода бисекции испытуемому дается инструкция отрегулировать величину переменного раздражителя т. о., чтобы результирующее ощущение казалось ему равноудаленным от ощущений, вызываемых двумя постоянными раздражителями, задающими границы интервала, который нужно разделить пополам. Эта процедура многократно повторяется, после чего вычисляется среднее арифметическое подобранных испытуемым значений переменного раздражителя.
Метод субъективно равных интервалов - разновидность метода категорий - предоставляет наблюдателю возможность относить предъявляемые раздражители к одной из "равношироких" категорий, число которых (напр., 5) задается экспериментатором и не меняется в ходе опыта. Первыми предъявляются крайние по величине раздражители и идентифицируются как таковые, чтобы служить опорными точками для последующих суждений. После классификации наблюдателем всех раздражителей их субъективные значения, определяемые как усредненные, или медианные, категории, представляются графически в виде функции от объективной величины раздражителя.
Метод фракционирования требует от наблюдателя в каждой пробе создавать (путем регулировки или подстройки) новый раздражитель, составляющий заранее определенную часть (напр., половину) предъявляемого ему раздражителя. Это делается для каждого из раздражителей, входящих в стимульный набор.
Метод оценки величины - широко используемая процедура, предоставляющая возможность наблюдателю оценивать величину раздражителей, приписывая им числа. Более сильные по сравнению с эталонным стимулом раздражители получают обычно большие числовые значения, а более слабые - меньшие. Для каждого раздражителя вычисляется среднее арифметическое или среднее геометрическое числовых оценок, полученных на группе испытуемых. Полученные средние субъективных оценок величины раздражителя представляются графически в виде функции от реальной величины раздражителя.
Теория обнаружения сигналов. Мотивация, ожидание и отношение наблюдателя вызывают смещение результатов измерения относительно истинного значения в психофизических экспериментах по определению порогов. Так, при использовании метода постоянных раздражителей, в пустых пробах ("пробах-ловушках"), когда наблюдателю не предъявляют никаких раздражителей, все равно появляются ответы "да". Такая реакция в теории обнаружения сигналов (ТОС) называется ложной тревогой. Безошибочное обнаружение раздражителя (ответ "да" при его наличии) называется попаданием. Изменения мотивации, ожиданий или отношения могут увеличивать процент попаданий, но ценой повышения доли ложных тревог.

Планирование эксперимента

Планирование эксперимента (англ. experimental design techniques) - комплекс мероприятий, направленных на эффективную постановку опытов. Основная цель планирования эксперимента - достижение максимальной точности измерений при минимальном количестве проведенных опытов и сохранении статистической достоверности результатов.

Планирование эксперимента применяется при поиске оптимальных условий, построении интерполяционных формул, выборе значимых факторов, оценке и уточнении констант теоретических моделей и др.

История

Планирование эксперимента возникло в 20-х годах XX века из потребности устранить или хотя бы уменьшить систематические ошибки в сельскохозяйственных исследованиях путем рандомизации условий проведения эксперимента. Процедура планирования оказалась направленной не только на уменьшение дисперсии оцениваемых параметров, но также и на рандомизацию относительно сопутствующих, спонтанно изменяющихся и неконтролируемых переменных. В результате удалось избавится от смещения в оценках.

Этапы планирования эксперимента

Методы планирования эксперимента позволяют минимизировать число необходимых испытаний, установить рациональный порядок и условия проведения исследований в зависимости от их вида и требуемой точности результатов. Если же по каким-либо причинам число испытаний уже ограничено, то методы дают оценку точности, с которой в этом случае будут получены результаты. Методы учитывают случайный характер рассеяния свойств испытываемых объектов и характеристик используемого оборудования. Они базируются на методах теории вероятности и математической статистики .

Планирование эксперимента включает ряд этапов.

1. Установление цели эксперимента (определение характеристик, свойств и т. п.) и его вида (определительные, контрольные, сравнительные, исследовательские).

2. Уточнение условий проведения эксперимента (имеющееся или доступное оборудование, сроки работ, финансовые ресурсы, численность и кадровый состав работников и т. п.). Выбор вида испытаний (нормальные, ускоренные, сокращенные в условиях лаборатории, на стенде , полигонные , натурные или эксплуатационные).

6. Статистическая обработка результатов эксперимента, построение математической модели поведения исследуемых характеристик.
Необходимость обработки вызвана тем, что выборочный анализ отдельных данных, вне связи с остальными результатами, или же некорректная их обработка могут не только снизить ценность практических рекомендаций, но и привести к ошибочным выводам. Обработка результатов включает:

определение доверительного интервала среднего значения и дисперсии (или среднего квадратичного отклонения) величин выходных параметров (экспериментальных данных) для заданной статистической надежности;
проверка на отсутствие ошибочных значений (выбросов), с целью исключения сомнительных результатов из дальнейшего анализа. Проводится на соответствие одному из специальных критериев, выбор которого зависит от закона распределения случайной величины и вида выброса;
проверка соответствия опытных данных ранее априорно введенному закону распределения. В зависимости от этого подтверждаются выбранный план эксперимента и методы обработки результатов, уточняется выбор математической модели.

Для оценки степени взаимосвязанности факторов или выходных параметров проводят корреляционный анализ результатов испытаний. В качестве меры взаимосвязанности используют коэффициент корреляции: для независимых или нелинейно зависимых случайных величин он равен или близок к нулю, а его близость к единице свидетельствует о полной взаимосвязанности величин и наличии между ними линейной зависимости.
При обработке или использовании экспериментальных данных, представленных в табличном виде, возникает потребность получения промежуточных значений. Для этого применяют методы линейной и нелинейной (полиноминальной) интерполяции (определение промежуточных значений) и экстраполяции (определение значений, лежащих вне интервала изменения данных).

7. Объяснение полученных результатов и формулирование рекомендаций по их использованию, уточнению методики проведения эксперимента.

Снижение трудоемкости и сокращение сроков испытаний достигается применением автоматизированных экспериментальных комплексов. Такой комплекс включает испытательные стенды с автоматизированной установкой режимов (позволяет имитировать реальные режимы работы), автоматически обрабатывает результаты, ведет статистический анализ и документирует исследования. Но велика и ответственность инженера в этих исследованиях: четкое поставленные цели испытаний и правильно принятое решение позволяют точно найти слабое место изделия, сократить затраты на доводку и итерационность процесса проектирования.

Планирование эксперимента (англ. experimental design techniques) -- комплекс мероприятий, направленных на эффективную постановку опытов. Основная цель планирования эксперимента -- достижение максимальной точности измерений при минимальном количестве проведенных опытов и сохранении статистической достоверности результатов.Планирование эксперимента применяется при поиске оптимальных условий, построении интерполяционных формул, выборе значимых факторов, оценке и уточнении констант теоретических моделей и др.

Планирование эксперимента возникло в 50-х годах XX века из потребности устранить или хотя бы уменьшить систематические ошибки в сельскохозяйственных исследованиях путем рандомизации условий проведения эксперимента. Процедура планирования оказалась направленной не только на уменьшение дисперсии оцениваемых параметров, но также и на рандомизацию относительно сопутствующих, спонтанно изменяющихся и неконтролируемых переменных. В результате удалось избавиться от смещения в оценках. Исследования Р. Фишера знаменуют начало первого этапа развития методов планирования эксперимента. Фишер разработал метод факторного планирования. Йетс предложил для этого метода простую вычислительную схему. Факторное планирование получило широкое распространение. Особенностью факторного эксперимента является необходимость ставить сразу большое число опытов. Развитие теории планирование эксперимента в СССР отражено в работах В. В. Налимова, Ю. П. Адлера, Ю. В. Грановского, Е. В. Марковой, В. Б. Тихомирова.

Планирование эксперимента включает ряд этапов.

1. Установление цели эксперимента (определение характеристик, свойств и т. п.) и его вида (определительные, контрольные, сравнительные, исследовательские).
2. Уточнение условий проведения эксперимента (имеющееся или доступное оборудование, сроки работ, финансовые ресурсы, численность и кадровый состав работников и т. п.). Выбор вида испытаний (нормальные, ускоренные, сокращенные в условиях лаборатории, на стенде, полигонные, натурные или эксплуатационные).
3. Выявление и выбор входных и выходных параметров на основе сбора и анализа предварительной (априорной) информации. Входные параметры (факторы) могут быть детерминированными, то есть регистрируемыми и управляемыми (зависимыми от наблюдателя), и случайными, то есть регистрируемыми, но неуправляемыми. Наряду с ними на состояние исследуемого объекта могут оказывать влияние нерегистрируемые и неуправляемые параметры, которые вносят систематическую или случайную погрешность в результаты измерений. Это -- ошибки измерительного оборудования, изменение свойств исследуемого объекта в период эксперимента, например, из-за старения материала или его износа, воздействие персонала и т. д.
4. Установление потребной точности результатов измерений (выходных параметров), области возможного изменения входных параметров, уточнение видов воздействий. Выбирается вид образцов или исследуемых объектов, учитывая степень их соответствия реальному изделию по состоянию, устройству, форме, размерам и другим характеристикам.

На назначение степени точности влияют условия изготовления и эксплуатации объекта, при создании которого будут использоваться эти экспериментальные данные. Условия изготовления, то есть возможности производства, ограничивают наивысшую реально достижимую точность. Условия эксплуатации, то есть условия обеспечения нормальной работы объекта, определяют минимальные требования к точности.

Точность экспериментальных данных также существенно зависит от объёма (числа) испытаний -- чем испытаний больше, тем (при тех же условиях) выше достоверность результатов. Для ряда случаев (при небольшом числе факторов и известном законе их распределения) можно заранее рассчитать минимально необходимое число испытаний, проведение которых позволит получить результаты с требуемой точностью.

5. Составление плана и проведение эксперимента -- количество и порядок испытаний, способ сбора, хранения и документирования данных.

Порядок проведения испытаний важен, если входные параметры (факторы) при исследовании одного и того же объекта в течение одного опыта принимают разные значения. Например, при испытании на усталость при ступенчатом изменении уровня нагрузки предел выносливости зависит от последовательности нагружения, так как по-разному идет накопление повреждений, и, следовательно, будет разная величина предела выносливости.

В ряде случаев, когда систематически действующие параметры сложно учесть и проконтролировать, их преобразуют в случайные, специально предусматривая случайный порядок проведения испытаний (рандомизация эксперимента). Это позволяет применять к анализу результатов методы математической теории статистики.

Порядок испытаний также важен в процессе поисковых исследований: в зависимости от выбранной последовательности действий при экспериментальном поиске оптимального соотношения параметров объекта или какого-то процесса может потребоваться больше или меньше опытов. Эти экспериментальные задачи подобны математическим задачам численного поиска оптимальных решений. Наиболее хорошо разработаны методы одномерного поиска (однофакторные однокритериальные задачи), такие как метод Фибоначчи, метод золотого сечения.

6. Статистическая обработка результатов эксперимента, построение математической модели поведения исследуемых характеристик.

Необходимость обработки вызвана тем, что выборочный анализ отдельных данных, вне связи с остальными результатами, или же некорректная их обработка могут не только снизить ценность практических рекомендаций, но и привести к ошибочным выводам. Обработка результатов включает:

· определение доверительного интервала среднего значения и дисперсии (или среднего квадратичного отклонения) величин выходных параметров (экспериментальных данных) для заданной статистической надежности;
· проверка на отсутствие ошибочных значений (выбросов), с целью исключения сомнительных результатов из дальнейшего анализа. Проводится на соответствие одному из специальных критериев, выбор которого зависит от закона распределения случайной величины и вида выброса;
· проверка соответствия опытных данных ранее априорно введенному закону распределения. В зависимости от этого подтверждаются выбранный план эксперимента и методы обработки результатов, уточняется выбор математической модели.

Построение математической модели выполняется в случаях, когда должны быть получены количественные характеристики взаимосвязанных входных и выходных исследуемых параметров. Это -- задачи аппроксимации, то есть выбора математической зависимости, наилучшим образом соответствующей экспериментальным данным. Для этих целей применяют регрессионные модели, которые основаны на разложении искомой функции в ряд с удержанием одного (линейная зависимость, линия регрессии) или нескольких (нелинейные зависимости) членов разложения (ряды Фурье, Тейлора). Одним из методов подбора линии регрессии является широко распространенный метод наименьших квадратов. Для оценки степени взаимосвязанности факторов или выходных параметров проводят корреляционный анализ результатов испытаний. В качестве меры взаимосвязанности используют коэффициент корреляции: для независимых или нелинейно зависимых случайных величин он равен или близок к нулю, а его близость к единице свидетельствует о полной взаимосвязанности величин и наличии между ними линейной зависимости.

При обработке или использовании экспериментальных данных, представленных в табличном виде, возникает потребность получения промежуточных значений. Для этого применяют методы линейной и нелинейной (полиноминальной) интерполяции (определение промежуточных значений) и экстраполяции (определение значений, лежащих вне интервала изменения данных).

7. Объяснение полученных результатов и формулирование рекомендаций по их использованию, уточнению методики проведения эксперимента.

Прежде чем перейти к описанию конкретных используемых в психологии планов, перечислим принципы, на которые опирается построение экспериментальных схем.

1. Эксперимент возможен только в том случае, если имеется более чем одно условие НП. Вывод о результате действия НП основывается на сравнении показателей ЗП в отличающихся друг от друга условиях («контрольном» и «экспериментальном», «активном» и «пассивном» или в нескольких отличающихся по заданному критерию условиях).
2. Фиксация и измерение переменных осуществляются в классификации шкал, предложенной Стивенсом: наименований, порядка, интервалов и отношений. Вид переменной (учебные классы, градации яркости светового пятна и т.д.) не задает, однако, способа ее измерения (на качественных или количественных уровнях). Обычно «количественным» экспериментом называют такой, где именно НП измерена количественно.
3. Эксперимент возможен только в случае функционального контроля уровней НП. Это может быть изменение характеристик физических стимулов, управление условиями (и ситуациями) или контроль путем подбора состава групп. В эксперименте обычно используются стратегии уравнивания групп, и испытуемые эквивалентных групп попадают в разные экспериментальные условия. Обеспечение неравенства групп как способа задания НП (пол, возраст, личностные свойства и т.п.) принимает форму квазиэксперимента, или эксперимента с ограничениями форм контроля. Если изменения НП не зависят от исследователя, а берутся «готовыми» (например, как результаты психодиагностики), то у исследователя не может быть уверенности в том, что именно выбранная НП определила показатели ЗП.
4. Факторные (мультивариативные) эксперименты, включающие управление более чем одной НП, строятся как комбинации, повторы (репликации) и другие видоизменения исходных планов с одной НП. Статистические приемы обработки данных могут при этом как предполагать, так и исключать взаимодействия между отдельными переменными.
5. Вводимое экспериментальное воздействие выступает в планах, или схемах, в качестве НП даже в том случае, когда испытуемые не воспринимают разницы условий. Часто только после эксперимента делается вывод, можно ли осуществленную манипуляцию условиями рассматривать как «воздействие» или функциональный контроль НП не имеет результатом действие этой переменной.

Цель эксперимента: изучить эффективность нового метода преподавания психологии в вузе.

Независимая переменная: введение нового метода преподавания.

Зависимая переменная: успеваемость студентов в обучении.

Организация эксперимента: в одной из академических групп первого курса используется новый метод преподавания психологии. Вывод об эффективности метода делается на основе анализа результатов экзамена. Средний балл по группе – 4,2.

Артефакты:

фон (влияние личности преподавателя),

естественное развитие (интеллектуальное развитие студентов),

состав групп (высокий исходный уровень студентов),

отсеивание («слабые» студенты отказались от занятий),

взаимодействие состава групп с экспериментом (студенты экспериментальной группы – выпускники специализированного лицея).

Цель эксперимента: изучить влияние телепрограммы, посвященной Холокосту, на осведомленность населения об этом событии.

Независимая переменная: показ телепрограммы.

Зависимая переменная: осведомленность населения.

Организация эксперимента: по центральному телеканалу транслируется передача, в которой рассказывается про массовое уничтожение евреев (Холокост). После этого группе лиц рассылается опросник про события Холокоста. Вывод о влиянии передачи делается на основе анализа результатов опросника – 76% опрошенных знают о событиях Холокоста.

Угрозы валидности:

фон (участники были проинформированы раньше, или повлияло другое событие),

естественное развитие (участники - школьники),

эффект тестирования (на осведомленность повлиял опрос, а не просмотр передачи),

инструментальная погрешность (несовершенный опросник),

взаимодействие тестирования с независимой переменной (участники узнали о событии именно в результате опроса),

взаимодействие состава групп с независимой переменной (опросили только лиц с высшим образованием).

Цель эксперимента:

Независимая переменная:

Зависимая переменная: школьная успеваемость.

Организация эксперимента: в одном из классов школы все ученики прошли курс скоростного чтения, тогда как ученики второго класса такого курса не проходили. Вывод об эффективности курса делается на основе сопоставления результатов. Ученики первой группы получили средний балл успеваемости за четверть – 4,0; второй – 3,4.

Угрозы валидности:

Состав групп (исходный высокий уровень школьников, которые проходили курс),

отсеивание («слабые» ученики были переведены в класс, который не проходил курс),

Цель эксперимента: сравнить успеваемость школьников, которые прошли курс скоростного чтения, и тех, кто не проходил.

Независимая переменная: прохождение курса скоростного чтения.

Зависимая переменная: школьная успеваемость.

Организация эксперимента: ученики одного из классов школы были случайным образом разделены на две группы. Ученики группы А прошли курс скоростного чтения, тогда как ученики группы Б такого курса не проходили. Вывод об эффективности курса делается на основе сопоставления результатов. Ученики первой группы получили средний балл успеваемости за четверть – 4,0; второй – 3,4.

Угрозы валидности:

взаимодействие состава групп с независимой переменной (ученикам было обещано вознаграждение за прохождение курса).

Цель эксперимента: исследовать влияние метода двойного оценивания (каждая оценка удваивается) на успеваемость учеников.

Независимая переменная: метод двойного оценивания.

Зависимая переменная: успеваемость по предмету (английский язык).

Организация эксперимента: в эксперименте принимают участие ученики одного из классов общеобразовательной школы. Дети случайным образом делятся на две подгруппы, изучающие английский язык. Уроки проводит один и тот же учитель. Предварительно измеряется успеваемость детей. После этого в одной из групп используется метод двойного оценивания. Эксперимент длится в течение месяца. По завершению эксперимента снова осуществляется измерение в обеих группах. Установлено, что у участников экспериментальной группы бал успеваемости выше, чем у участников контрольной группы. При подсчете успеваемости учитывалась одна из «удвоенных» оценок.

Цель эксперимента: изучить влияние вербального поощрения на производительность изобразительной деятельности детей дошкольного возраста.

Независимая переменная: вербальное поощрение.

Зависимая переменная: производительность изобразительной деятельности детей дошкольного возраста.

Организация эксперимента: в эксперименте приняли участие дети, посещающие подготовительные группы одного из городских детских образовательных учреждений. Дети случайным образом были поделены на четыре группы по 10-12 человек в каждой (А, Б, В, Г). Предварительно анализировались рисунки, выполненные детьми двух групп на протяжении предыдущей недели (А, Б). Далее экспериментатор работал отдельно с детьми каждой из групп. Дети рисовали на свободную тему, при этом участников групп А и В постоянно поощряли, отмечали стиль рисования и общую старательность, тогда как дети других двух групп не поощрялись (Б, Г). Гипотеза подтвердилась: вербальное поощрение повышает производительность изобразительной деятельности детей.

Цель эксперимента:

Независимая переменная: антитабачная кампания.

Зависимая переменная:

Организация эксперимента: в одной из общеобразовательных школ была введена классическая антитабачная кампания. Детям читались лекции о последствиях курения, демонстрировались легкие курильщиков, проводилось индивидуальное консультирование. Измерения количества подростков, которые курят, проводились за 3, 2 и за 1 месяц до начала программы, а также через месяц после ее завершения. В результате оказалось, что кампания была эффективной и 30% подростков отказались от табакокурения.

Угрозы валидности:

Фон (администрацией школы были введены дисциплинарные мероприятия);

Взаимодействие тестирования с независимой переменной (предварительный опрос привел к осознанию последствий курения, которое было закреплено в эксперименте).

Цель эксперимента: исследовать влияние двухмесячной антитабачной кампании на подростковое табакокурение.

Независимая переменная: антитабачная кампания.

Зависимая переменная: злоупотребление табакокурением.

Организация эксперимента: в одной из общеобразовательных школ была введена классическая антитабачная кампания, а в другой школе такой кампании не было. Детям первой школы читались лекции о последствиях курения, демонстрировались легкие курильщиков, проводилось индивидуальное консультирование. Измерения количества подростков, которые курят, осуществлялись в обеих школа одновременно. В результате оказалось, что кампания была эффективной и 30% подростков отказались от табакокурения.

Угрозы валидности:

Взаимодействие тестирования с независимой переменной (предварительный опрос привел к осознанию последствий курения, которое было закреплено в эксперименте);

Взаимодействие состава групп с независимой переменной (с детьми школы, где проводилась кампания и раньше осуществлялись профилактические беседы).

Цель эксперимента: исследовать влияние музыки на производительность труда

Независимая переменная: музыкальное сопровождение.

Зависимая переменная: производительность труда.

Организация эксперимента: группа работников промышленного предприятия работала в разных режимах с музыкальным сопровождением (классическая музыка) и без него через день на протяжении ста дней. Сравнивалась производительность труда участников эксперимента каждый день. Оказалось, что музыкальное сопровождение стимулирует производительность труда.

Угрозы валидности:

Взаимодействие тестирования с независимой переменной (постоянное тестирование повышает производительность);

Реакция участников на независимую переменную (реакция участников на внимание, которое им уделяется).

Цель эксперимента: исследовать повышение производительности труда рабочих машиностроительного завода при оплате от выработки.

Независимая переменная: способ оплаты.

Зависимая переменная: производительность труда.

Организация эксперимента: в эксперименте принимали участие две группы работников завода. Предварительно измерялась производительность их труда. После этого для одной из групп, участники которой добровольно согласились на участие в эксперименте, была введена оплата от выработки (А). Измерение после эксперимента в обеих группах показало, что производительность работы участников группы А повысилась.

Угрозы валидности:

Взаимодействие тестирования с независимой переменной (предварительное измерение усилило экспериментальный эффект).

Цель эксперимента: исследовать влияние итоговых модульных контрольных работ (по каждой теме) на успеваемость студентов.

Независимая переменная: модульные контрольные работы (МКР).

Зависимая переменная: успеваемость студентов.

Организация эксперимента: в университете два факультета готовят студентов по специальности «Психология» (единые требования к набору, одинаковый преподавательский состав и учебные планы). На первом факультете (А) измеряли успеваемость студентов третьего курса за год. На втором факультете (Б) на следующий год ввели МКР для студентов третьего курса, после чего также измерили успеваемость. Оказалось, что введение МКР содействует повышению успеваемости.

Угрозы валидности:

Фон (на факультете Б строгая процедура исключения);

Естественное развитие (студенты факультета Б старше возрастом);

Отсеивание (слабые студенты факультета Б были исключены).

Цель эксперимента: исследовать особенности посттравматического стресса жертв физического насилия.

Независимая переменная: физическое насилие.

Зависимая переменная: посттравматический стресс.

Организация эксперимента: в эксперименте приняли участие люди, которые перенесли физическое насилие, обратились в центр реабилитации и дали согласие на участие в опросе. В контрольную группы были случайным образом отобраны испытуемые, которые никогда не переживали насилия. Участники обеих групп отвечали на серию вопросов относительно своего эмоционального состояния, реакции на возможное насилие, отношение к агрессору и пр.

Угрозы валидности:

Взаимодействие тестирования с независимой переменной (опрос актуализировал страхи).