Статобработка экспериментальных данных в ms excel

Статобработка экспериментальных данных в MS Excel, Учебное пособие, Бондарчук С.С., Бондарчук И.С., 2018.

 Издание охватывает базовые направления математической статистики, используемые при анализе экспериментальных данных в областях биологии, медицины, химии, при анализе физических и педагогических измерений. Каждый раздел издания посвящен конкретному аспекту анализа и обработки данных эксперимента. Теоретические положения сопровождается и дополняется методическими указаниями и примерами, реализованными исключительно в среде MS Ехсеl. Критические значения статистик, не поддерживаемых функциями электронных таблиц, представлены соответствующими аппроксимациями. Для студентов (бакалавров, магистрантов и аспирантов), преподавателей и научных работников, занимающихся анализом и статистической обработкой экспериментальных данных.

Статобработка экспериментальных данных в MS Excel, Учебное пособие, Бондарчук С.С., Бондарчук И.С., 2018

Исключение грубых погрешностей.
При экспериментальных измерениях могут появляться ошибки (выбросы, промахи), допущенные исследователем при фиксации измерений, при действиях с приборами и т.д. Выбросом (промахом) считается наблюдение, которое лежит аномально далеко от остальных из серии параллельных наблюдений. То есть выбросы – это значения количественного признака, располагающиеся на краях интервала допустимых значений. Выброс, промах – резко отклоняющееся значение наблюдаемой величины. В англоязычной литературе в качестве синонимического понятия используются термины maverick – резко выделяющийся результат; straggler – оторвавшийся результат.

Оглавление.
Предисловие.
1.Базовые термины.
2.Дисперсионный анализ. Однородность.
3.Критерии согласия.
4.Параметрические критерии.
5.Непараметрические критерии.
6.Линейные и нелинейные зависимости. Регрессия. Коэффициент корреляции.
7.Таблицы сопряженности. Корреляции качественных признаков.
8.Исключение грубых погрешностей.
9.Основы планирования эксперимента.
Приложения.
Вопросы для самопроверки.
Каталог примеров.
Предметный указатель.
Перечень использованных источников.

Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:

Скачать книгу Статобработка экспериментальных данных в MS Excel, Учебное пособие, Бондарчук С.С., Бондарчук И.С., 2018 — fileskachat.com, быстрое и бесплатное скачивание.

Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.Купить эту книгу

Скачать
— pdf — Яндекс.Диск.

Дата публикации: 21.10.2022 11:45 UTC

Теги:

Бондарчук :: статистика :: математика :: биология :: химия :: медицина :: excel


Следующие учебники и книги:

  • Компьютерное моделирование и конструирование наполненных композиций, Люкшин Б.А., 2015
  • Суперкомпьютерное моделирование в физике климатической системы, Лыкосов В.Н., 2012
  • Эффективные приемы набора и редактирования текста, Попов М.П., 2006
  • Компьютерная поддержка сложных организационно-технических систем, Борисов В.В., Бычков И.А., Дементьев А.В., Соловьев А.П., Федулов А.С., 2002

Предыдущие статьи:

  • Архитектура ЭВМ и систем, Громов Ю.Ю., Иванова О.Г., Серегин М.Ю., 2012
  • Логика и компьютер, Моделирование рассуждений и проверка правильности программ, Алешина Н.А., Анисов А.М., Быстров П.И., 1990
  • Моделирование антенных устройств в Matlab с использованием пакета расширения Antenna Toolbox, Типикин А.А., 2019
  • Информационно-управляющие системы, Архитектура и разработка, Учебное пособие, Александрова О.Н., Ваулин С.С., Папуловская Н.В., 2021


Статьи
Карта сайта
Главная страница

 

Ввод текста помогает оформлять заголовки таблиц, записывать
определенные пояснения. Допустим, нам надо рассчитать объем раствора по его
массе 10 г и плотности 1,25 г/мл, используя простейшую формулу V=m/d. Введем
в ячейки В5, С5, D5 заголовки столбцов будущей таблицы,
обозначения величин m, d и V, и приступим к вводу чисел. В
ячейку В6 введем численное значение массы 10. Заканчиваем ввод, нажимая Enter, и убеждаемся, что тест в ячейке, как правило, смещен к правой границе, а число к левой. Это удобно, так как позволяет замечать ошибки
ввода. В ячейку С6 введем дробное число 1,25. Здесь надо учесть, что в
зависимости от настройки конкретного компьютера для разделения целой и дробной
части числа может использоваться или запятая, или точка. При неправильном вводе
наши символы будут восприниматься как текст,  или даже как дата (янв.25).

Наконец, в ячейке D6 введем формулу, по
которой Excel будет проводить вычисления. Ввод формулы начинается со знака
равенства (=). Затем надо показать программе, где находится первое число в
нашей формуле, масса раствора, дать адрес этой ячейки  — В6. Конечно, можно
набрать этот адрес с клавиатуры, надо только учитывать, что В – это символ
английского алфавита. Поэтому, гораздо проще просто щелкнуть по нужной ячейке и
ее адрес будет введен автоматически (=В6). Далее надо ввести знак
арифметического действия. Эти знаки удобно вводить с правой части клавиатуры,
напоминающей клавиатуру калькулятора. Здесь есть клавиши со знаком сложения
(+), вычитания (-), умножения (*) и деления (/). И, наконец, надо показать
компьютеру, где находится делитель – щелкаем мышкой по ячейке С6 и получаем
окончательный вид формулы (=В6/С6). Нажимаем Enter, и,
если все было набрано правильно, получаем в ячейке D6 результат
(8). Таким образом, формулы возвращают в ячейку результат вычислений, число. Но
если щелкнуть по ячейке и посмотреть на строку формул, мы увидим, что на самом
деле находится в ней.

Иногда формула может возвращать и сообщение об ошибке. Щелкнем
по ячейке В6 и введем вместо числа 10 символы «10 г». В ячейке D6
тут же окажется сообщение #ЗНАЧ!, которое говорит о
неверном значении в одной из ячеек. Действительно, запись «10 г» воспринимается
уже как текст. Чтобы исправить ошибку надо снова вместо «10 г»  ввести число
10. (Для исправления неверных действий можно использовать и кнопку «Отменить»
на панели инструментов). Щелкнем теперь по ячейке С6 и нажмем клавишу “Del”. Этим мы удалим содержимое ячейки, и в соседней ячейке
тут же получим сообщение #ДЕЛ/0! (ошибка деления на 0). Действительно,
на ноль делить нельзя и ошибку надо исправить.

Итак, мы научились вводить числа и формулы, а значит и проводить
простейшие вычисления в Excel. Но как упростить эту процедуру, если таких
вычислений много? Здесь помогают приемы копирования, и автоматического
заполнения ячеек методом «протягивания». Пусть у нас 10 порций раствора массой 10 г, и в ячейки В6, В7 …, В16 надо ввести 10, 10, … и т.д. Щелкнем по ячейке В6, где число 10 уже
введено. В черной рамке выделенной ячейки, внизу справа, есть маленький черный
квадратик. При наведении на него указателя мышки, последний меняет форму. Если
в этот момент «взяться» (нажать левую кнопку мыши) и потянуть вниз, до ячейки
В16, то все десять ячеек окажутся автоматически заполнены нужным числом. Не
труднее заполнить и 100 ячеек!

А если массы растворов отличаются на некоторую постоянную
величину, например 10, 12,5, 15 г и т.д.? В этом случае достаточно ввести два
значения: число 10 в ячейку В6 и число 12,5 в ячейку В7. Теперь надо выделить
эти две ячейки. Для этого щелкаем по первой ячейке и, не отпуская кнопки, ведем
до второй. Теперь обе ячейки обведены жирной рамкой. Снова беремся за черный
квадратик и тянем вниз. Получаем ряд значений от 10 до 35.

Поскольку предполагается, что раствор у нас один и тот же,
оставим колонку С в покое и попробуем методом протягивания скопировать формулу,
которая у нас набрана в ячейке D6. Проделываем уже
описанную операцию: выделяем ячейку, беремся, протягиваем… и получаем во всех
ячейках, кроме первой, ошибку! Разберемся, почему это произошло, для чего
щелкнем по ячейке D7 и посмотрим на строку формул. В
ячейке D6 было написано «=В6/С6», а в ячейке D7 уже «=В7/С7»! То есть, при копировании формул Excel
автоматически меняет адреса ячеек, откуда он берет данные для расчетов. И это
совершенно правильно, когда речь идет о массе раствора. Но плотность раствора у
нас постоянная, как показать программе, что адрес этой ячейки менять не надо?

Для этого мы должны познакомиться с такими понятиями, как
относительный и абсолютный адрес. Те адреса, которые мы использовали,
называются относительными и меняются при копировании. Адрес в абсолютной форме
сопровождается знаками доллара и выглядит так: $C$6. Вот
эту поправку нам и надо внести в формулу в ячейке D6.

Исправлять записи в ячейках удобнее в строке формул. Щелкнем
сначала по ячейке D6, (формула появится в строке
формул), затем в нужном месте строки формул – там появится курсор. Конечно
знаки доллара можно ввести с клавиатуры, но проще, установив курсор на адресе
С6, нажать на клавиатуре клавишу F4. Понажимайте ее
несколько раз и посмотрите, как будет меняться адрес. Он может быть полностью
абсолютным, абсолютным по строчке, по колонке, и полностью относительным.
Добейтесь нужного вида и нажмите Enter. Формула
исправлена, теперь ее снова можно протянуть до ячейки D16.
Если все сделано правильно, вы получите ряд значений от 8 до 28 мл.

Итак, если Вы не только прочитали, но и проделали все, о чем шла
речь выше,  Вы научились многому. Вы умеете вводить текст, числа и формулы,
вносить исправления, устранять ошибки, копировать и заполнять ячейки рядами
данных. Не мешает сохранить результаты своей работы. Процедуры сохранения файла
и его открытия полностью совпадают с работой в Worde и не должны вызвать у Вас затруднений.

Формулы с
функциями.

Но в наших расчетах использовались только простейшие
арифметические действия. Для более сложных расчетов нужно научиться
использовать функции. Этим мы займемся на втором листе нашей книги.

Для перехода на нужный лист достаточно щелкнуть по его ярлычку.
Начнем работу с краткого повторения пройденного: дадим листу 2 имя «Ошибки», в
ячейку А3 введем текст «Данные эксперимента», в ячейки А5 и В5 — заголовки
новой таблицы «№» и «Х». Предполагается что мы проделали серию из 10 опытов,
измеряя некоторую величину Х (здесь не важно, что это, длина побега или объем
раствора). Номера опытов от 1 до 10 легко ввести протягиванием, а вот численные
значения Х надо последовательно ввести (табл.1).

Таблица 1. Примерный вид листа
«Ошибки»

Записи в колонках D и
Е – это подсказки, которые помогут разобраться с тем, какие характеристики мы
будем рассчитывать. Колонка F у
Вас должна быть пока пустой, в нее будем помещать наши формулы.

Обработку результатов начнем с расчета числа опытов n. Казалось бы это очевидное число, но в ходе работы, какой-то
результат мы можем отбросить, или провести еще пару опытов. Желательно, чтобы
нам не пришлось при этом переделывать все формулы. Для определения числа
значений используется специальная функция, которая называется СЧЕТ. Для ввода
формулы с функциями используется Мастер функций, который запускается командой
«Вставка функции» через меню «Вставка» – «Функция» или кнопкой на панели
инструментов с обозначением   fx. Щелкнем мышкой по ячейке F6,
где должен находиться результат и запустим Мастер функций.

Первый шаг работы (рисунок 1) служит
для выбора нужной функции. Все функции разделены, в зависимости от своего
назначения на несколько категорий (математические, логические и др.). Для
обработки данных эксперимента используются в основном статистические функции.
Поэтому, прежде всего в списке категорий выбираем категорию «Статистические».
Во втором окне появляется список статистических функций. Если щелкнуть по любой
из них, внизу появляется краткое описание функции. Специальной ссылкой можно
вызвать систему помощи Excel, в которой данная функция будет разобрана
подробно, с примерами. Список функций упорядочен по алфавиту, что позволяет без
труда нужную нам функцию СЧЕТ («Подсчитывает количество чисел в списке
аргументов»). Выделив щелчком эту функцию, нажимаем кнопку Ok и переходим к шагу 2.

Второй шаг (рисунок 2) служит для задания аргументов функции. 
Функции СЧЕТ надо указать, какие числа ей надо пересчитывать, или в каких
ячейках находятся эти числа. Диапазон ячеек указывается адресами первой и
последней ячейки, записанными через двоеточие, в нашем случае данные находятся
в ячейках В6:В15. Как и в других случаях эти адреса лучше не вводить, а показать
мышкой. Для этого устанавливаем указатель мышки на первую ячейку, нажимаем
левую кнопку и ведем до последней. Обратите внимание, что окно аргументов можно
перемещать, если оно заслоняет нужную часть экрана. Кроме того, рядом с полем
для ввода есть маленькая кнопка с красной стрелочкой. При щелчке по ней окно
аргументов сворачивается до узкой полоски. Когда мы показываем в основном окне
диапазон ячеек, в окне аргументов появляется запись диапазона адресов, а рядом
с ним – значения чисел из первых ячеек. Предварительное значение функции тоже
показывается после ввода ее аргументов. Это помогает избегать ошибок. Помогает
работе с мастером функций и подсказка под полем для ввода аргументов, в которой
разъясняется их смысл и возможные значения. Заканчивается работа с мастером
функций нажатием кнопки “Ok” или клавиши “Enter”. Если все сделано правильно, в ячейке F6 появится нужное значение “10”.

Следующие два этапа обработки серии опытов проводятся
аналогично. В ячейке F7 c
помощью функции СРЗНАЧ рассчитывается
среднее значение выборки, в ячейке F8 – стандартное
отклонение выборки, с помощью функции СТАНДОТКЛОН.
. Будьте аккуратны при выборе функций
– среди них есть очень похожие по названию. Аргументами этих функций служит все
тот же диапазон ячеек.

Следующая формула сложная, частично она набирается как обычная
формула, начиная с символа ”=”. Указав, где находится делимое S и набрав знак операции (=F8/), вызываем
мастер функций. Функция КОРЕНЬ – математическая, поэтому на первом шаге
выбираем категорию математических функций. Аргументом этой функции служит число
опытов, которое мы рассчитали в ячейке F6. Окончательный
вид формулы “=F8/ КОРЕНЬ(F6)”.

Для расчета доверительного интервала необходимо определить
коэффициент Стьюдента. Он зависит от вероятности ошибки (при обычно задаваемой
надежности 95% вероятность ошибки составляет 5%), и от числа степеней свободы n-1). Для нахождения коэффициента Стьюдента используется
статистическая функция Excel СТЬЮДРАСПОБР (“Стьюдента распределение обратное“).
Особенностью этой функции является то, что первый аргумент, число 5% (или 0,05)
вводится в соответствующее окно с клавиатуры. Для второго указываем адрес
ячейки, где находится значение n,
затем дописываем в окне “-1”. Получаем запись “F6-1”.

Для нахождения
доверительного интервала используется обычная формула умножения. Конечно,
вместо букв там должны стоять адреса ячеек, где находятся коэффициент Стьюдента
и стандартное отклонение среднего. Как правило, значение доверительного
интервала округляется до одной значащей цифры, такой же порядок окружения
должен быть и у среднего. Поэтому окончательный результат можно записать так: с
95%-ной надежностью Х = 14,80±0,05. В заключение посчитаем относительную ошибку определения Х: d = ДИ / Хср (формула: “=F11/F7”).
Значение относительной ошибки обычно выражают в процентах, у нас 0,3%.

Если Вы впервые
работаете в Excel, описанная процедура обработки данных эксперимента может
показаться очень сложной.  Но на практике, вводить формулы, с помощью мастера
функций, ничуть не сложнее, чем обычные арифметические. К тому же, один раз
подготовив лист Excel для обработки данных, можно скопировать его, и ввести
результаты новой серии опытов в колонку В. Результаты будут тут же рассчитаны
автоматически.

Изучение
зависимостей.

Часто в исследованиях изучается зависимость некоторой величины
от другой. Характер этих зависимостей стремятся выразить математическими
формулами, коэффициенты которой могут иметь определенный физический смысл.
Наиболее употребительна и проста в обработке линейная зависимость, которую
можно выразить уравнением прямой у = kx + b. При этом коэффициент k показывает
степень влияния х на у, а b – некоторое
начальное значение у. Поскольку значения, полученные в ходе эксперимента,
всегда включают некоторую ошибку,  экспериментальные точки не лежат строго на
прямой. Как же провести по этим разбросанным точкам наилучшую линию. Для этого
используется статистический метод «наименьших квадратов» предлагающий
достаточно сложные функции для нахождения коэффициентов k и b, а также для оценки их
достоверности.

В Excel эта
задача решается при помощи статистических функций НАКЛОН (наклон прямой
относительно оси Х, коэффициент k) и ОТРЕЗОК  (отрезок
отсекаемый прямой на оси Y, коэффициент b). Кроме того, Excel позволяет
построить график зависимости, саму прямую, которая называется линией тренда, а
также вывести уравнение прямой на график.

Для знакомства с этим возможностями перейдем на Лист 3 нашей
книги, назовем его «Зависимость» и введем необходимые исходные данные (таблица
2).

Таблица 2. Примерный вид листа
«Зависимость»

В колонках В и С вводятся данные эксперимента по измерению
величин Х и У, записи в колонке Е играют роль подсказок, колонка F заполняется по мере обработки.
Начнем с ячейки F3.

Ввод формул проводится с помощью мастера функций так, как это
описывалось ранее. Маленькое отличие заключается в том, что у функций НАКЛОН и ОТРЕЗОК два
аргумента: диапазон ячеек со значениями Y и диапазон ячеек со значениями Х.
Щелкаем мышкой сначала по полю для ввода первого аргумента, показываем нужный
диапазон (С3:С13). Затем щелкаем по второму поля и повторяем ввод (В3:В13).
Также рассчитывается и значение функции ОТРЕЗОК в ячейке F4.

Для оценки достоверности можно использовать квадрат коэффициента
корреляции Пирсона (R2). Если он равен 1, то
имеет место полная корреляция с моделью, т.е. точки лежат строго на прямой. В
противоположном случае, если коэффициент  равен 0, то уравнение линейной
зависимости полностью неудачно. Для его нахождения используется статистическая
функция КВПИРСОН. Таким образом, данные
нашего эксперимента с достоверностью 0,98 описываются уравнением у = 1,42х+0,905.

Рассмотрим теперь второй метод обработки и представления
результатов эксперимента в виде графика. Для построения графиков и диаграмм в Excel’e используется
Мастер диаграмм, который можно запустить, используя меню Вставка – Диаграмма,
или кнопки на панели инструментов с условным изображением диаграммы.
Предварительно щелкнем мышкой по любой свободной ячейке нашего листа.

Рисунок 3. 

На первом шаге (рисунок 3) выбирается тип и вид диаграммы. Для
построения графика зависимости одной величины от другой используются точечные
диаграммы, причем лучше (из-за разброса точек) выбирать вид «Точки не
соединенные линиями». Заканчиваем выбор, щелкая по кнопке «Далее».

На втором шаге необходимо указать, где у нас находится
независимая величина Х и зависящая от нее Y (рисунок 4).
Для этого щелкаем по ярлычку вкладки «Ряд» и затем по кнопке «Добавить».

Рисунок 4.

Открываются поля для указания Х и Y. Ввод
значений адресов в эти поля не отличаются от работы с Мастером функций (только
при вводе Y предварительно
сотрите условное значение “={1}”. Если Вы правильно выполните эту часть работы,
на поле вверху уже появится примерный вид графика.

Следующие два шага имеют отношение к оформлению и размещению
графика. На первый раз можно, ничего не меняя, просто нажимать кнопки «Далее» и
«Готово». Полученный черновой вариант графика всегда можно редактировать,
изменять или удалять его отдельные элементы. Обычно для этого щелкают по
нужному элементу графика правой (!) кнопкой мышки. При этом открывается
контекстное меню, в котором выбирают подходящую команду.

Если правой кнопкой мышки щелкнуть по одной из точек графика, то
в контекстном меню можно увидеть команду «Добавить линию тренда». Это и есть
необходимая нам линия. Добавляется она тоже в два шага. На первом выбирается
тип (линейный), на втором – параметры. На вкладке Параметры нам важно поставить
галочки против слов: «показывать уравнение» и «поместить величину
достоверности». Если из теоретических предпосылок понятно, что прямая должна
проходить через начало координат (при нулевой концентрации скорость реакции,
очевидно, равна нулю) поставим галочку и в данном пункте. Примерный вид графика
после добавления линии тренда представлен на рисунке 5. Выведенное уравнение
прямой и величины достоверности совпадает с рассчитанными ранее.

Рисунок 5.

Итак, мы рассмотрели важнейшие приемы работы в Microsoft Excel, необходимые для качественной
обработки данных эксперимента. Разумеется эти приемы не исчерпывают всех
возможностей Excel, и могут развиваться в ходе работы.
Автор статьи с удовольствием ответит на все вопросы, связанные с работой в
данной программе. Желаю успеха!


Задать вопрос.



Категории
Эзотерическая литература
[42]

На этой странице будут помещены ссылки на электронные книги по теме Эзотерические знания. Если Вас интересует книга, но ее нет, то пишите на vellior@inbox.ru и я попробую Вам помочь Удачи Всем!

Художественная литература
[143]

Здесь будут помещены ссылки на различные электронные книги. Если каких-то не хватает — пишите на vellior@inbox.ru — попробую помочь найти. Удачи Вам!!!!

Справочная литература
[25]

На этой странице помещены ссылки на справочную литературу. В случае, если нужной для Вас книги нет, то пишите на vellior@inbox.ru и я попробую Вам помочь

Бизнес литература
[3]

На данной странице будут помещены ссылки на литературу, относящуюся к категории «бизнес». Если необходимой книги нет, то обращайтесь на vellior@inbox.ru и я попробую Вам помочь. Удачи всем!

Учебная литература
[15]

На этой странице помещены ссылки на учебную литературу. В случае, если нужной для Вас книги нет, то пишите на vellior@inbox.ru и я попробую Вам помочь

Притчи
[639]

Притча — это маленький осколок зеркала Истины. В небольшом рассказе заключен и передается огромный смысл. Информационная нагрузка огромна, а суть ее легко усваивается даже не всегда посвященным человеком.

поздравления и пожелания
[15]

на все случаи жизни — мы найдем Вам поздравление!!!!

Книги для мужчин
[6]

книги для женщин
[3]

Книги для двоих
[6]

Книги для детей и их родителей
[275]

Развивающие книги, книги для развития интеллекта, игры, оригами, сказки, рассказы, романы.

Спортивная литература
[290]

Все о спорте. Тренировки своего тела. Гимнастические упражнения. Спортивные игры. Бодибилдинг.

Кулинария
[459]

Книги с кулинарными рецептами. Полезные программы.

Справочная информация
[1452]

Спасвочная и и интересная информация информация, которая будет полнезной всем

Биографии великих людей
[373]

биографии известных писателей, художников, музыкантов, политиков, историяческих личностей.

Детская литература
[735]

Книги для детей и их родителей.

Мемуарная литература
[4]

Воспоминания, мемуары

Программирование
[1239]

Программирование, языки программирования

детские страшилки
[14]

Истории, которые рассказывались и рассказываются в пионерских лагерях.

Документальная литература
[14]

Книги, содержание которых можно отнести к документальным, научно-популярным или другим темаатикам.

Журналы
[985]

Статистика


Онлайн всего: 1

Гостей: 1

Пользователей: 0


Статобработка экспериментальных данных в MS Excel


Статобработка экспериментальных данных в MS Excel — Издание охватывает базовые направления математической статистики, используемые при анализе экспериментальных данных в областях биологии, медицины, химии, при анализе физических и педагогических измерений.
Каждый раздел издания посвящен конкретному аспекту анализа и обработки данных эксперимента. Теоретические положения сопровождается и дополняется методическими указаниями и примерами, реализованными исключительно в среде MS Ехсеl. Критические значения статистик, не поддерживаемых функциями электронных таблиц, представлены соответствующими аппроксимациями.
Для студентов (бакалавров, магистрантов и аспирантов), преподавателей и научных работников, занимающихся анализом и статистической обработкой экспериментальных данных.

Название: Статобработка экспериментальных данных в MS Excel
Автор: Бондарчук С. С., Бондарчук И. С.
Издательство: Томск: Томский государственный педагогический университет (ТГПУ)
Год: 2018
Страниц: 433
Формат: PDF
Размер: 16,8 МБ
Качество: отличное
Язык: русский

Скачать Статобработка экспериментальных данных в MS Excel

Скачать с turbobit.net
https://turbobit.net/8mcp8q0dh5my.html

Скачать с salefiles.com
http://salefiles.com/rtks40r0vao6

Скачать с katfile.com
http://katfile.com/yafets3ff5vh.html

Скачать с file-upload.com
https://file-upload.com/v1d2uztc8mzu

  • 1
  • 2
  • 3
  • 4
  • 5

Категория: Программирование | Добавил: pmojka (15.09.2018)

Просмотров: 201

| Рейтинг: 0.0/0

Добавлять комментарии могут только зарегистрированные пользователи.

[

Регистрация

|

Вход

]

Copyright MyCorp © 2023 Конструктор сайтов — uCoz

дисперсионный анализ;

планирование регрессионных экспериментов и выборочных обследований и др.

Вспомогательные программы расширяют возможности статистических пакетов и реализуют, в частности, оптимизационные алгоритмы, вычислительные процедуры, основанные на нейросетях и генетических алгоритмах, задачи статистического моделирования на ЭВМ, которые являются полезными составными элементами компьютерных имитационных экспериментов, используемых при анализе сложных реальных систем.

Ниже в табл. 8.1 представлены адреса электронных ресурсов, содержащих информацию о некоторых распространенных статистических пакетах.

Таблица 8.1

Адрес

Название программы

Разработчик

www.statsoft.ru

STATISTICA

StatSoft Inc., США

www.spss.ru

SPSS

SPSS Inc., США

www.stat-

STATGRAPHICS Plus

Manugistics Inc.

graphics.com

www.sas.com

StatView

SAS Institute Inc.

www.ncss.com

NCSS

NCSS Statistical Software

www.minitab.co

Minitab

Minitab Inc.

На базе электронных таблиц можно провести некоторую статистическую обработку данных для большинства инженерных задач. Функции, реализующие статистические методы обработки и анализа данных, в Microsoft Excel реализованы в виде специального программного расширения — надстройки «Пакет анализа», которая

149

входит в поставку данного программного продукта и может устанавливаться по желанию пользователя.

Установка надстройки «Пакет анализа» производится из меню «Сервис/Надстройки», после чего в диалоговом окне «Надстройки» необходимо отметить флажок пункта «Пакет анализа» и нажать кнопку ОК.

Ниже в таблице 8.2. приведены основные функции пакета анализа.

Таблица 8.2

Функции

Описание

ВЕРОЯТНОСТЬ

Возвращает вероятность того, что значение из интервала

находится внутри заданных пределов. Если верхний_предел

не задан, то возвращается вероятность того, что значения в

аргументе х_интервал равняются значению аргумента

нижний_предел.

ВЕРОЯТНОСТЬ(х_интервал;

интервал_вероятностей; нижний_предел;верхний_предел).

ДИСП, ДИСПР

Вычисляет дисперсию для генеральной совокупности

ДИСПР(число1; число2; …)

ДОВЕРИТ

Возвращает доверительный интервал для среднего

генеральной

совокупности

ДОВЕРИТ(альфа;станд_откл;размер)

КВАДРОТКЛ

Возвращает сумму квадратов отклонений точек данных от

их среднего КВАДРОТКЛ(число1; число2;…)

КВПИРСОН

Возвращает квадрат коэффициента корреляции Пирсона для

точек данных в аргументах известные_значения_у и

известные_значения_х КВПИРСОН(известные_значения_у;

известные_значения_х)

КОРРЕЛ

Возвращает коэффициент корреляции между интервалами

ячеек массив1 и массив2 КОРРЕЛ(массив1; массив2)

ЛГРФПРИБЛ

В регрессионном анализе вычисляет экспоненциальную

кривую, аппроксимирующую

данные, и возвращает массив

значений, описывающий эту кривую. Поскольку данная

функция возвращает массив значений, она должна вводиться

как формула для работы с массивами. Уравнение кривой

150

следующее: y = b-mx или y = (b-(m1x1)-(m2x2)-…-(mnxn)) (при

наличии нескольких значений x), где зависимые значения y

являются функцией независимых значений x. Значения m

являются основанием для возведения в степень x, а значения

b постоянны. Отметим, что y, x и m могут быть векторами.

Функция ЛГРФПРИБЛ возвращает массив {mn;mn-1; … Jm1;

b}.

ЛГРФПРИБЛ(известные_значения_у;

известные_значения_x; конст; статистика)

ЛИНЕЙН

Рассчитывает статистику для ряда с применением метода

наименьших

квадратов, чтобы вычислить прямую линию, которая

наилучшим образом аппроксимирует имеющиеся данные.

Функция возвращает массив, который описывает

полученную прямую. Поскольку возвращается массив

значений, функция должна задаваться в виде формулы

массива.

ЛИНЕЙН(известные_значения_у;

известные_значения_x; конст; статистика)

МАКС

Возвращает

наибольшее значение из набора значений

МАКС(число1;число2; …)

МЕДИАНА

Возвращает

медиану

заданных

чисел

МЕДИАНА(число1;число2; …)

МИН

Возвращает

наименьшее значение в списке аргументов

МИН(число1;число2; …)

МОДА

Возвращает

наиболее

часто

встречающееся

или

повторяющееся значение в массиве или интервале данных

МОДА(число1; число2; … )

НАКЛОН

Возвращает наклон линии линейной регрессии для точек

данных

в

аргументах

известные_значения_у

и

известные_значения_x. Наклон определяется как частное от

деления расстояния по вертикали на расстояние по

горизонтали между двумя любыми точками прямой, то есть

наклон — это скорость изменения значений вдоль прямой

НАКЛОН(известные_значения_у; известные_значения_x)

НОРМАЛИЗАЦИЯ

Возвращает нормализованное значение для распределения,

характеризуемого средним и стандартным отклонением

НОРМАЛИЗАЦИЯ( ; среднее; стандартное_откл)

НОРМОБР

Возвращает

обратное

нормальное

распределение

для

указанного

среднего

и

стандартного

отклонения

НОРМОБР(вероятность; среднее; стандартное_откл)

НОРМРАСП

Возвращает значение нормальной функции распределения

151

для указанного среднего и стандартного отклонения

НОРМРАСП^; среднее; стандартное_откл; интегральная)

НОРМСТОБР

Возвращает обратное значение стандартного нормального

распределения u

НОРМСТОБР(вероятность)

НОРМСТРАСП

Возвращает

стандартное

нормальное

интегральное

распределение. Это распределение имеет среднее, равное

нулю, и стандартное отклонение, равное единице. Эта

функция используется вместо таблицы для стандартной

нормальной кривой НОРМСТРАСП^)

ОТРЕЗОК

Вычисляет точку пересечения линии с осью y, используя

известные_значения_x

и

известные_значения_у

ОТРЕЗОК(известные_значения_x;известные_значения_y)

ПИРСОН

Возвращает коэффициент корреляции Пирсона r

(выборочный

коэффициент

корреляции),

безразмерный

индекс в интервале от -1,0 до 1,0 включительно

ПИРСОН(массив1; массив2)

СРГЕОМ

Возвращает среднее геометрическое значений массива или

интервала положительных чисел СРГЕОМ(число1; число2;

… )

СРЗНАЧ

Возвращает среднее арифметическое своих аргументов

СРЗНАЧ(число1; число2; …)

СРОТКЛ

Среднее абсолютных значений отклонений точек данных от

среднего СРОТКЛ(число1; число2; … )

СТАНДОТКЛОН

Оценивает стандартное отклонение по выборке

СТАНДОТКЛОН(число1; число2; …)

СТАНДОТКЛОНП

Вычисляет

стандартное

отклонение

по

генеральной

совокупности

СТАНДОТКЛОНП(число1; число2; …)

СТЬЮДРАСП

Возвращает t-распределение Стьюдента

СТЬЮДРАСП(x;

степени_свободы; хвосты)

СТЬЮДРАСПОБ

Возвращает

обратное

распределение

Стьюдента для

заданного

числа

степеней

свободы

СТЬЮДРАСПОБР(вероятность; степени_свободы)

ТЕНДЕНЦИЯ

Определяет предсказанные значения в соответствии с

линейным трендом для заданного массива (методом

наименьших

квадратов)

ТЕНДЕНЦИЯ(известные_значения_у;

известные_значения_х;

но-вые_значения_х; конст)

ТТЕСТ

Возвращает

вероятность,

соответствующую критерию

152

Стьюдента ТТЕСТ(массив1; массив2; хвосты; тип)

ФИШЕР

Возвращает преобразование Фишера для аргумента x

ФИШЕР(х)

ФИШЕРОБР

Возвращает

обратное

преобразование

Фишера

ФИШЕРОБР(у)

ХИ2ОБР

Возвращает значение обратное к односторонней вероятности

распределения χ2 (хи-квадрат) ХИ2ОБР(вероятность;

степени_свободы)

ХИ2РАСП

Возвращает одностороннюю вероятность (Р) распределения

χ2 (хи-квадрат, распределения Пирсона) ХИ2РАСП(х;

степени_свободы)

ЧАСТОТА

Вычисляет частоту появления значений в интервале

значений и возвращает массив цифр

ЧАСТОТА(массив_данных; массив_карманов)

ЭКСЦЕСС

Возвращает эксцесс множества данных ЭКСЦЕСС(число1;

число2; …)

FРАСП

Возвращает F-распределение вероятности (распределение

Фишера)

FРАСП(х;степени_свободы1;степени_свободы2)

FРАСПОБР

Возвращает обратное значение для F-распределения

вероятностей

(критерий

Фишера)

FРАСПОБР

(вероятность;степени_свободы1;степени_свободы2)

153

Список использованных источников:

1.Подобие и моделирование

1.1Седов Л.И. Методы подобия и размерности в механике.- М.:Наука, 1981.-448 с.

1.2Веников В.А., Веников Г.В. Теория подобия и моделирование/применительно к задачам электроэнергетики/.- М.:Наука,1984.-439 с.

2.Планирование эксперимента

2.1.Планированиеэксперимента в технике / В.И.Барабащук, Б.П.Креденцер, В.И.Мирошниченко; под. ред.. Б.П.Креденцера.- К.:Техніка ,1984.-200с.

2.2.Адлер Ю.П., Маркова Е.В., Грановский Ю.В. Планирование эксперимента при поиске оптимальных условий.-М.:Наука,1971.- 283с.

2.3.Ахназарова С.Л., Кафаров В.В. Методы оптимизации в химической технологии .-М.Высшая школа, 1985.-325 с.

3.Статистическая обработка результатов эксперимента

3.1.Вентцель Е.С. Теория вероятностей,-М.Наука,1969.-576 с.

3.2.Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения.-М.:Наука.-1988.- 480 с.

3.3.Коваленко И.Н., Филиппова А.А. Теория вероятностей и математическая статистика.-М., Высшая школа, 1973.-368 с.

3.4.Базара М.,Шетти К. Нелинейное программирование. Теория и алгоритмы.-М.,Мир.-1982.-583 с.

3.5.Колкер Я.Д. Математический анализ точности механической обработки деталей.-Киев, Техника.-1976.-200с.

3.6.Румшинский Л.З. Математическая обработка результатов эксперимента.-М.,Наука.-1971.-192 с.

3.7.Протасов К.С. Статистический анализ экспериментальных данных. -М., Мир, 2005.-142 с.

154

3.8.Письменный Д.Т. конспект лекций по теории вероятностей, математической статистике и случайным процессам.-М.,Айрис пресс, 2006.-288 с.

3.9.Минько А.А. Статистический анализ в MS Exel.-М.: Издательский дом «Вильямс»,2004.-448 с.

3.10.Свешников А.А. Прикладные методы теории случайных функций.:Глав.ред.физ.-матем. лит. Изд-ва «Наука», 1968.-663с.

155

Название: Статобработка экспериментальных данных в MS Excel
Автор: Бондарчук С.С., Бондарчук И.С.
Издательство: Томск: Томский государственный педагогический университет (ТГПУ)
Год: 2018
Формат: PDF
Страниц: 433
Для сайта:

vtome.ru

Размер: 17 mb
Язык: русский

Издание охватывает базовые направления математической статистики, используемые при анализе экспериментальных данных в областях биологии, медицины, химии, при анализе физических и педагогических измерений.
Каждый раздел издания посвящен конкретному аспекту анализа и обработки данных эксперимента. Теоретические положения сопровождается и дополняется методическими указаниями и примерами, реализованными исключительно в среде MS Ехсеl. Критические значения статистик, не поддерживаемых функциями электронных таблиц, представлены соответствующими аппроксимациями.
Для студентов (бакалавров, магистрантов и аспирантов), преподавателей и научных работников, занимающихся анализом и статистической обработкой экспериментальных данных.

Статобработка экспериментальных данных в MS Excel

Статобработка экспериментальных данных в MS Excel — Издание охватывает базовые направления математической статистики, используемые при анализе экспериментальных данных в областях биологии, медицины, химии, при анализе физических и педагогических измерений.
Каждый раздел издания посвящен конкретному аспекту анализа и обработки данных эксперимента. Теоретические положения сопровождается и дополняется методическими указаниями и примерами, реализованными исключительно в среде MS Ехсеl. Критические значения статистик, не поддерживаемых функциями электронных таблиц, представлены соответствующими аппроксимациями.
Для студентов (бакалавров, магистрантов и аспирантов), преподавателей и научных работников, занимающихся анализом и статистической обработкой экспериментальных данных.

Название: Статобработка экспериментальных данных в MS Excel
Автор: Бондарчук С. С., Бондарчук И. С.
Издательство: Томск: Томский государственный педагогический университет (ТГПУ)
Год: 2018
Страниц: 433
Формат: PDF
Размер: 16,8 МБ
Качество: отличное
Язык: русский

Скачать Статобработка экспериментальных данных в MS Excel

Poproshajka

Назад

  • 0
  • 1
  • 2
  • 3
  • 4
  • 5

1. Статистический анализ. основные понятия и определения

1.1 Математическая статистика

Математическая статистика – наука,
изучающая методы исследования закономерностей в массовых случайных явлениях и
процессах по данным, полученным из конечного числа наблюдений за ними, с целью
получения вероятностно-статистических моделей случайных явлений. Построенные на
основании этих методов закономерности относятся не к отдельным испытаниям, из
повторения которых складывается данное массовое явление, а представляют
утверждения об общих вероятностных характеристиках данного процесса. Такими
характеристиками могут быть вероятности, плотности распределения вероятностей,
математические ожидания, дисперсии и т. п. Найденные характеристики позволяют
построить вероятностно-статистическую модель изучаемого явления. Применяя к
этой модели методы теории вероятностей, исследователь может решать
технико-экономические задачи, например, определять вероятность безотказной
работы агрегата в течение заданного отрезка времени. Таким образом, теория
вероятностей по вероятностной модели процесса предсказывает его поведение, а
математическая статистика по результатам наблюдений за процессом строит его
вероятностностатистическую модель. В этом состоит тесная взаимосвязь между
данными науками. Очевидно, что для обнаружения закономерностей случайного
массового явления необходимо провести сбор статистических сведений, т. е.
сведений, характеризующих отдельные единицы каких-либо массовых явлений.

В математической статистике
рассматриваются две основные категории задач: оценивание и статистическая
проверка гипотез. Первая задача разделяется на точечное оценивание и
интервальное оценивание параметров распределения. Например, может возникнуть
необходимость по наблюдениям получить точечные оценки параметров М(Х) и D(Х) .
Если мы хотим получить некоторый интервал, с той или иной степенью достоверности
содержащий истинное значение параметра, то это задача интервального оценивания.
Вторая задача – проверка гипотез – заключается в том, что мы делаем
предположение о распределении вероятностей случайной величины (например, о
значении одного или нескольких параметров функции распределения) и решаем,
согласуются ли в некотором смысле эти значения параметров с полученными
результатами наблюдений.

Если интересующая нас совокупность слишком многочисленна,
либо ее элементы малодоступны, а также, если имеются другие причины
(организационные, финансовые, физические и т. п.), не позволяющие изучать сразу
все ее элементы, прибегают к изучению какой-то части этой совокупности. Эта
выбранная для полного исследования группа элементов называется выборкой или выборочной
совокупностью.

Выборка – это группа элементов, выбранная для исследования из
всей совокупности элементов. Задача выборочного метода в том, чтобы сделать
правильные выводы относительно всего собрания объектов, их совокупности.

Конечной целью изучения выборочной совокупности всегда
является получение информации о генеральной совокупности. Поэтому естественно
стремиться сделать выборку так, чтобы она наилучшим образом представляла всю
генеральную совокупность, то есть была бы репрезентативной или представительной.
Для получения репрезентативной выборки необходимо четко определять, что
понимается под генеральной совокупностью. Ее состав и численность зависят от
объектов и целей проводимого исследования.

В тех случаях, когда генеральная совокупность недостаточно
известна, обычно не удается предложить лучшего способа получения
представительной выборки, чем случайный выбор. При этом случайная выборка
формируется случайным отбором: из генеральной совокупности наудачу извлекается
по одному объекту.

В практических задачах закон распределения случайных величин
обычно неизвестен или известен с точностью до некоторых неизвестных параметров.
В частности, невозможно рассчитать точное значение соответствующих
вероятностей, так как нельзя определить количество общих и благоприятных
исходов. Поэтому вводится статистическое определение вероятности. По этому
определению вероятность равна отношению числа испытаний
, в которых событие
появилось, к общему количеству произведенных испытаний
. Такая вероятность называется
статистической частотой.

В результате на практике сведения о законе распределения
случайной величины получают независимыми многократными повторениями опыта, в
котором измеряются значения интересующей исследователей случайной величины
(варианты). На основе информации из полученной выборки можно построить
приблизительные значения для функции распределения и других характеристик
случайной величины.

Числа, составляющие генеральную совокупность, называются ее
элементами. Закон F(x) распределения случайной величины X называется
генеральным законом распределения, а числовые характеристики X – генеральными
числовыми характеристиками. Так как генеральная совокупность – большая, то
перебрать все ее элементы невозможно, поэтому для изучения генеральной совокупности
из нее делают выборку и по ее свойствам судят о свойствах генеральной
совокупности.

Выборкой называется множество измеренных значений n x ,x
,…,x 1 2 случайной величины X. Выборки разделяются на повторные (с
возвращением) и бесповторные (без возвращения). Требования к выборке. Для того
чтобы сделать правильный вывод о генеральной совокупности по выборке, выборка
должна быть репрезентативной, т. е. правильно представлять генеральную
совокупность. Выборка будет обладать таким свойством, если каждый объект
генеральной совокупности будет иметь один и тот же шанс быть выбранным, в этом
случае выборка является случайной. Число N объектов генеральной совокупности и
число n объектов выборки называют объемами генеральной и выборочной
совокупностей соответственно.

Кумулятивная кривая будет получена, если по оси абсцисс
откладывать интервалы, а по оси ординат – число или долю элементов
совокупности, имеющих значение, меньшее или равное заданному.

При увеличении до бесконечности размера выборки выборочные
функции распределения превращаются в теоретические: гистограмма превращается в
график плотности распределения, а кумулятивная кривая – в график функции
распределения.

В Microsoft Excel для построения выборочных функций распределения используются специальная
функция ЧАСТОТА и процедура Пакета анализа Гистограмма. Функция ЧАСТОТА
вычисляет частоты появления случайной величины в интервалах значений и выводит
их как массив чисел. Функция задается в качестве формулы массива.

Синтаксис: ЧАСТОТА (массив данных; массив карманов), где массив
данных – это массив или ссылка на множество данных, для которых вычисляются
частоты; массив карманов – это массив или ссылка на множество интервалов, в
которые группируются значения аргумента массив данных .

Количество элементов в возвращаемом массиве на единицу больше
числа элементов в массив карманов. Дополнительный элемент в возвращаемом
массиве содержит количество значений, больших, чем максимальное значение в
интервалах.

Процедура Гистограмма используется для вычисления выборочных
и интегральных частот попадания данных в указанные интервалы значений.
Процедура выводит результаты в виде таблицы и гистограммы.

Замена теоретической функции распределения  на ее выборочный аналог  в определении
математического ожидания, дисперсии, стандартного отклонения и т.п. приводят к
выборочному среднему, выборочной дисперсии, выборочному стандартному отклонению
и т.д. Выборочные характеристики являются оценками соответствующих
характеристик генеральной совокупности. Эти оценки должны удовлетворять
определенным требованиям. В соответствии с важнейшими требованиями оценки
должны быть: несмещенными, то есть стремиться к истинному значению
характеристики генеральной совокупности при

неограниченном увеличении количества испытаний; состоятельными,
то есть с ростом размера выборки оценка должна стремиться к значению
соответствующего параметра генеральной совокупности с вероятностью,
приближающейся к 1; эффективными, то есть для выборок равного объема
используемая оценка должна иметь минимальную дисперсию.

Среди выборочных характеристик выделяют показатели,
относящиеся к центру распределения (меры положения), показатели рассеяния
вариант (меры рассеяния) и меры формы распределения. К показателям,
характеризующим центр распределения, относят различные виды средних
(арифметическое, геометрическое и т. п.), а также моду и медиану.

Простейшим показателем, характеризующим центр выборки,
является мода.

Мода – это элемент выборки с наиболее часто встречающимся значением.

Средним значением выборки, или выборочным аналогом
математического ожидания, называется величина

где  – количество элементов в
выборке.

Иначе говоря, среднее значение – это центр выборки, вокруг
которого группируются элементы выборки. При увеличении числа наблюдений среднее
приближается к математическому ожиданию.

Выборочная медиана – это число, которое является серединой
выборки, то есть половина чисел имеет значения большие, чем медиана, а половина
чисел имеет значения меньшие, чем медиана. Для нахождения медианы обычно
выборку ранжируют – располагают элементы в порядке возрастания. Если количество
членов ранжированного ряда нечетное, медианой является значение ряда, которое
расположено посередине, то есть элемент с номером
. Если число членов ряда
четное, то медиана равна среднему значению членов ряда с номерами
 и .

Основными показателями рассеяния вариант являются интервал,
дисперсия выборки, стандартное отклонение и стандартная ошибка.

Интервал (амплитуда, вариационный размах) – это разница между
максимальным и минимальным значениями элементов выборки. Интервал является
простейшей и наименее надежной мерой вариации или рассеяния элементов в
выборке.

Более точно отражают рассеяние показатели, учитывающие не
только крайние, но и все значения элементов выборки.

Дисперсией выборки, или выборочным аналогом дисперсии,
называется величина

Дисперсия выборки – это параметр, характеризующий степень
разброса элементов выборки относительно среднего значения. Чем больше
дисперсия, тем дальше отклоняются значения элементов выборки от среднего
значения.

Выборочным стандартным отклонением (среднее квадратичное
отклонение) называется величина

Этот параметр также характеризует степень разброса элементов
выборки относительно среднего значения. Чем больше среднее квадратичное
отклонение, тем дальше отклоняются значения элементов выборки от среднего
значения. Параметр аналогичен дисперсии и используется в тех случаях, когда
необходимо, чтобы показатель разброса случайной величины выражался в тех же
единицах, что и среднее значение этой случайной величины.

Стандартная ошибка или ошибка среднего находится из выражения

Стандартная ошибка – это параметр, характеризующий степень
возможного отклонения среднего значения, полученного на исследуемой
ограниченной выборке, от истинного среднего значения, полученного на всей
совокупности элементов. С помощью стандартной ошибки задается так называемый
доверительный интервал. 95-процентный доверительный интервал, равный
, обозначает диапазон, в
который с вероятностью
 (при достаточно большом
числе наблюдений
n > 30) попадает среднее
генеральной совокупности
MX[1].

Выборочной квантилью называется решение уравнения

1.2 Использование инструментов
Мастера функций и Пакета анализа Excel при статистической обработке данных

В результате наблюдений или эксперимента получаются наборы
данных, называемые выборками. Для проведения их анализа данные подвергаются статистической
обработке. Первое, что всегда делается при обработке данных, это вычисление
элементарных статистических характеристик выборок по каждому параметру и по
каждой группе. Полезно также вычислить эти характеристики для объединения
родственных групп и суммарно по всем данным.

В Мастере функций Excel имеется ряд специальных функций, предназначенных для вычисления
выборочных характеристик. Прежде всего, это функции, характеризующие центр
распределения .

Функция СРЗНАЧ вычисляет среднее арифметическое из нескольких
массивов (аргументов) чисел. Функция МЕДИАНА позволяет получать медиану
заданной выборки. Функция МОДА вычисляет наиболее часто встречающееся значение.
Функция ДИСП позволяет оценить дисперсию по выборочным данным. Функция
СТАНДОТКЛОН вычисляет стандартное отклонение.

В пакете Excel
помимо Мастера функций имеется набор более мощных инструментов для работы с
несколькими выборками и углубленного анализа данных, называемый Пакет анализа, который
может быть использован для решения задач статистической обработки выборочных
данных .

Для определения характеристик выборки используется процедура
Описательная статистика. Процедура позволяет получить статистический отчет,
содержащий информацию о центральной тенденции и изменчивости входных данных.[2]

1.3 Принятие статистических решений

Статистическая гипотеза – это предположение о виде или
отдельных параметрах распределения вероятностей, которое подлежит проверке на
имеющихся данных.

Проверка статистических гипотез – это процесс формирования решения
о возможности принять или отвергнуть утверждение (гипотезу), основанный на
информации, полученной из анализа выборки. Методы проверки гипотез называются
критериями.

В большинстве случаев рассматривают так называемую нулевую
гипотезу (нуль-гипотезу
), состоящую в том, что все
события произошли случайно, естественным образом. Альтернативная гипотеза (
) состоит в том, что события
случайным образом произойти не могли, и имело место воздействие некого фактора .

Обычно нулевая гипотеза формулируется таким образом, чтобы на
основании эксперимента или наблюдений ее можно было отвергнуть с заранее
заданной вероятностью ошибки
. Эта заранее заданная
вероятность ошибки называется уровнем значимости.

Уровень значимости – максимальное значение вероятности появления
события, при котором событие считается практически невозможным. В статистике
наибольшее распространение получил уровень значимости, равный
. Поэтому, если вероятность,
с которой интересующее событие может произойти случайным образом
, то принято считать это
событие маловероятным, и если оно все же произошло, то это не было случайным. В
наиболее ответственных случаях, когда требуется особая уверенность в
достоверности полученных результатов, надежности выводов, уровень значимости принимают
равным
 или даже .

Величину , равную , называют доверительной
вероятностью (уровнем надежности), то есть вероятностью, признанной достаточной
для того, чтобы уверенно судить о принятом статистическом решении. Соответственно,
в качестве доверительных вероятностей выбирают значения 0,95, 0,99 или 0,999.

Интервал, в котором с заданной доверительной вероятностью  находится оцениваемый
параметр, называется доверительным интервалом. В соответствии с доверительными
вероятностями на практике используются 95-, 99-99,9-процентные доверительные
интервалы. Граничные точки доверительного интервала называют доверительными
пределами.

Выбор того или иного уровня значимости, выше которого результаты
отвергаются как статистически не подтвержденные, в общем случае является
произвольным. Окончательное решение зависит от исследователя, традиций и
накопленного практического опыта в данной области исследований.

Для определения относиться та или иная варианта к данной
статистической совокупности достаточно использовать правило трех сигм. Согласно
этому правилу в пределах
 находится 99,7 % всех
вариант. Поэтому если варианта попадает в этот интервал, то она считается
принадлежащей к данной совокупности. Если не попадает, то она может быть
отброшена. Хотя этот метод и предполагает нормальность исходного распределения,
на практике он успешно работает и может быть использован в большинстве других
случаев.

Определения границ доверительного интервала находится по
формуле

где  – среднее значение;

 – табличное значение
распределения Стьюдента с числом степеней свободы
 и доверительной вероятностью
.

Наиболее часто проверяется предположение о нормальном
распределении генеральной совокупности, поскольку большинство статистических
процедур ориентировано на выборки, полученные из нормально распределенной
генеральной совокупности.

Для оценки соответствия имеющихся экспериментальных данных
нормальному закону распределения обычно используют графический метод,
выборочные параметры формы распределения и критерии согласия.

Графический метод позволяет давать ориентировочную оценку
расхождения или совпадений распределений.

Наиболее убедительные результаты дает использование критериев
согласия. Критериями согласия называют статистические критерии, предназначенные
для проверки согласия опытных данных и теоретической модели. Здесь нулевая
гипотеза
 представляет собой утверждение
о том, что распределение генеральной совокупности, из которой получена выборка,
не отличается от нормального. Среди критериев согласия большое распространение
получил непараметрический критерий
 (хи-квадрат). Он основан на
сравнении эмпирических частот интервалов группировки с теоретическими
(ожидаемыми) частотами, рассчитанными по формулам нормального распределения.

Уверенно о нормальности закона распределения можно судить,
если имеется не менее 50 результатов наблюдений. В случаях меньшего числа данных
можно говорить только о том, что данные не противоречат нормальному закону, и в
этом случае обычно используют графические методы оценки соответствия. При
большем числе наблюдений целесообразно совместное использование графических и
статистических (например, тест хи-квадрат или аналогичные) методов оценки,
естественно дополняющих друг друга.

Для применения критерия желательно, чтобы объем выборки  был > 40, выборочные
данные были сгруппированы в интервальный ряд с числом интервалов не менее 7, а
в каждом интервале находилось не менее 5 наблюдений (частот).

При этом сравниваться должны именно абсолютные частоты, а не
относительные. Как и любой другой статистический критерий, критерий хи-квадрат
не доказывает справедливость нулевой гипотезы (соответствие эмпирического
распределения нормальному), а лишь может позволить ее отвергнуть с определенной
вероятностью (уровнем значимости).

В Microsoft Excel критерий хи-квадрат реализован в функции ХИ2ТЕСТ. Функция ХИ2ТЕСТ
вычисляет вероятность совпадения наблюдаемых (фактических) значений и
теоретических (гипотетических) значений. Если вычисленная вероятность ниже
уровня значимости (0,05), то нулевая гипотеза отвергается и утверждается, что
наблюдаемые значения не соответствуют нормальному закону распределения. Если
вычисленная вероятность близка к 1, то можно говорить о высокой степени
соответствия экспериментальных данных нормальному закону распределения.

Функция имеет следующий синтаксис: ХИ2ТЕСТ (фактический
интервал; ожидаемый интервал), где фактический интервал – это интервал данных,
которые содержат наблюдения, подлежащие сравнению с ожидаемыми значениями; ожидаемый
интервал – это интервал данных, который содержит теоретические (ожидаемые)
значения для соответствующих наблюдаемых [].

Параметрические критерии служат для проверки гипотез о
положении и рассеивании. Из параметрических критериев наибольшей популярностью
при проверке гипотез о равенстве генеральных средних (математических ожиданий)
пользуется t-критерий Стьюдента (t-критерий различия). Он наиболее часто
используется для проверки следующей гипотезы: «Средние двух выборок относятся к
одной и той же совокупности». Критерий позволяет найти вероятность того, что
оба средних относятся к одной и той же совокупности. Если эта вероятность
 ниже уровня значимости ( < 0,05), то принято
считать, что выборки относятся к двум разным совокупностям.

При использовании t-критерия можно выделить два случая. В
первом случае его применяют для проверки гипотезы о равенстве генеральных
средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий).
В этом случае есть контрольная группа и опытная группа.

Во втором случае, когда одна и та же группа объектов
порождает числовой материал для проверки гипотез о средних, используется так
называемый парный
t-критерий. Выборки при этом
называют зависимыми, связанными.

Для оценки достоверности отличий по критерию Стьюдента принимается
нулевая гипотеза, что средние выборок равны между собой. Затем вычисляется
значение вероятности того, что изучаемые события произошли случайным образом.

В Microsoft Excel для оценки достоверности отличий по критерию Стьюдента используются
специальная функция ТТЕСТ и процедуры Пакета анализа. Эти перечисленные
инструменты вычисляют вероятность, соответствующую критерию Стьюдента, и
используются, чтобы определить, насколько вероятно, что две выборки взяты из
генеральных совокупностей, которые имеют одно и то же среднее.

Функция ТТЕСТ имеет следующий синтаксис: ТТЕСТ (массив1;
массив2; хвосты; тип), где массив1 – это первое множество данных; массив2 – это
второе множество данных; хвосты – число хвостов распределения. Обычно число
хвостов равно 2; тип – это вид исполняемого
t-теста. Возможны три варианта выбора: парный тест; двухвыборочный тест с
равными дисперсиями; двухвыборочный тест с неравными дисперсиями [1].

Критерий Фишера используют для проверки гипотезы о
принадлежности двух дисперсий одной генеральной совокупности и, следовательно,
их равенстве. При этом предполагается, что данные независимы и распределены по
нормальному закону. Гипотеза о равенстве дисперсий принимается, если отношение
большей дисперсии к меньшей меньше критического значения распределения Фишера:

Критическое значение Фишера зависит от уровня значимости и
числа степеней свободы для дисперсий в числителе и знаменателе.

В Microsoft Excel для расчета уровня вероятности выполнения гипотезы о равенстве дисперсий
могут быть использованы функция ФТЕСТ (массив1; массив2) и процедура Пакета
анализа Двухвыборочный F-тест для дисперсий.

Важным разделом статистического анализа является
корреляционный анализ, служащий для выявления взаимосвязей между выборками.

Корреляционный анализ состоит в определении степени связи
между двумя случайными величинами
 и . В качестве меры такой связи
используется коэффициент корреляции. Он оценивается по выборке объема
 связанных пар наблюдений () из совместной генеральной совокупности
 и . Существует несколько типов
коэффициентов корреляции, применение которых зависит от предположений о
совместном распределении величин
 и .

Для оценки степени взаимосвязи наибольшее распространение
получил коэффициент линейной корреляции (Пирсона), предполагающий нормальный
закон распределения наблюдений.

Коэффициент корреляции  – параметр, характеризующий
степень линейной взаимосвязи между двумя выборками. Коэффициент корреляции
изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая
пропорциональная зависимость). При значении коэффициента равном 0 линейной
зависимости между двумя выборками нет. Здесь под прямой зависимостью понимают
зависимость, при которой увеличение или уменьшение значения одного признака ведет,
соответственно, к увеличению или уменьшению второго. При обратной зависимости
увеличение одного признака приводит к уменьшению второго и наоборот.

Выборочный коэффициент линейной корреляции между двумя
случайными величинами
 и  рассчитывается по формуле

Коэффициент корреляции является безразмерной величиной, и его
значение не зависит от единиц измерения случайных величин
 и .

На практике коэффициент корреляции принимает некоторые
промежуточные значения между
 и . Для оценки степени
взаимосвязи можно руководствоваться следующими эмпирическими правилами. Если
коэффициент корреляции
 по абсолютной величине (без
учета знака) больше, чем
, то принято считать, что
между параметрами существует практически линейная зависимость (прямая – при
положительном
 и обратная – при
отрицательном
). Если коэффициент
корреляции
 лежит в диапазоне от  до , говорят о сильной степени
линейной связи между параметрами. Если
, говорят о наличии линейной
связи между параметрами. При
обычно считают, что линейную
взаимосвязь между параметрами выявить не удалось.

В Microsoft Excel для вычисления парных коэффициентов линейной корреляции используется
специальная функция К
OРРЕЛ. Функция имеет следующий
синтаксис: КОРРЕЛ (массив1; массив2), где массив1 – это диапазон ячеек первой
случайной величины; массив2 – это второй интервал ячеек со значениями второй
случайной величины [3].

1.4 Регрессионный анализ

При исследовании взаимосвязей между выборками помимо
корреляции различают также и регрессию. Регрессия используется для анализа
воздействия на отдельную зависимую переменную значений одной или более
независимых переменных. Соответственно, наряду с корреляционным анализом еще
одним инструментом изучения стохастических зависимостей является регрессионный
анализ. Регрессионный анализ устанавливает формы зависимости между случайной
величиной
 (зависимой) и значениями
одной или нескольких переменных величин (независимых), причем значения
последних считаются точно заданными. Такая зависимость обычно определяется
некоторой математической моделью (уравнением регрессии), содержащей несколько
неизвестных параметров. В ходе регрессионного анализа на основании выборочных
данных находятся оценки этих параметров, определяются статистические ошибки
оценок или границы доверительных интервалов и проверяется соответствие
(адекватность) принятой математической модели экспериментальным данным.

В линейном регрессионном анализе связь между случайными
величинами предполагается линейной. В самом простом случае в линейной
регрессионной модели имеются две переменные
 и . И требуется по  парам наблюдений (), (),…, () построить (подобрать) прямую
линию, называемую линией регрессии, которая наилучшим образом приближает
наблюдаемые значения. Уравнение этой линии
 является регрессионным
уравнением. С помощью регрессионного уравнения можно предсказать ожидаемое
значение зависимой величины
, соответствующее заданному
значению независимой переменной
.

Таким образом, можно сказать, что линейный регрессионный анализ
заключается в подборе графика и его уравнения для набора наблюдений. В
регрессионном анализе все признаки (переменные), входящие в уравнение, должны
иметь непрерывную, а не дискретную природу.

В случае, когда рассматривается зависимость между одной зависимой
переменной
 и несколькими независимыми
переменными
, ,…, , говорят о множественной
линейной регрессии. В этом случае регрессионное уравнение имеет вид

где , ,…,  – коэффициенты;

, ,…  – независимые переменные;

 – константа.

Мерой эффективности регрессионной модели является коэффициент
детерминации
 (R-квадрат). Он определяет,
с какой точностью полученное регрессионное уравнение описывает (аппроксимирует)
исходные данные.

Значимость регрессионной модели исследуется с помощью F-критерия (Фишера). Если величина F-критерия значима (), то регрессионная модель
является значимой.

Достоверность отличия коэффициентов , , ,…,  от нуля проверяется с
помощью критерия Стьюдента. В случаях, когда
, коэффициент может считаться
нулевым, а это означает, что влияние соответствующей независимой переменной на
зависимую переменную недостоверно, и эта независимая переменная может быть
исключена из уравнения.

В Microsoft Excel экспериментальные данные аппроксимируются линейным уравнением до 16
порядка:

где  – зависимая переменная;

,…,  – независимые переменные;

, …,  – искомые коэффициенты
регрессии.

Для получения коэффициентов регрессии используется процедура
Регрессия из Пакета анализа. Кроме того, могут быть использованы функция ЛИНЕЙН
для получения параметров регрессионного уравнения и функция ТЕНДЕНЦИЯ для
получения предсказанных значений
 в требуемых точках [4].

2. Анализ и обработка экспериментальных данных

2.1 Предварительная статистическая
обработка экспериментальных данных
.

В таблице 1 приведены результаты исследования механических
свойств нержавеющей стали 08Х18Н10Т (твёрдости у,) от факторов – параметров
химического состава:

Таблица
1 – Результаты исследования

Номер опыта

Вариант 11

С,% (х1)

Mn,% (х2)

Твер-дость(y)

1

3,74

0,59

70

2

3,54

0,60

66

3

3,63

0,50

63

4

3,49

0,52

64

5

3,48

0,35

77

6

3,54

0,45

76

7

3,63

0,66

83

8

3,63

0,51

78

9

3,93

0,64

73

10

3,64

0,67

67

11

3,69

0,61

79

12

3,54

0,78

72

13

3,67

0,84

76

14

3,48

0,50

66

15

3,31

0,47

81

16

3,67

0,62

80

17

3,63

0,21

70

18

3,73

0,78

72

19

3,75

0,78

79

20

3,62

0,72

68

21

3,68

0,79

72

22

3,59

0,73

82

23

3,60

0,43

75

24

3,43

0,35

74

25

2,95

0,47

75

26

3,28

0,40

67

27

3,19

0,41

79

28

3,28

0,34

77

29

3,71

0,53

73

30

3,60

0,47

77

31

3,63

0,43

68

32

3,56

0,42

72

33

3,69

0,54

79

34

3,55

0,34

75

35

3,57

0,83

78

Для статистической обработки выборочных данных воспользуемся
инструментом
Microsoft Excel Пакет анализа. Чтобы определить характеристики выборки используется
процедура Описательная статистика.

Проанализировав данные, получим следующие результаты (рисунок
1)

Рисунок
1 – Результаты анализа

Представим результаты измерений в виде вариационного ряда
(таблица 2)

Таблица 2 – Вариационный ряд

Номер
плавки

С, ()

Mn, ()

Твердость(y)

1

2,95

0,21

63

2

3,19

0,34

64

3

3,28

0,35

66

4

3,28

0,35

66

5

3,31

0,4

67

6

3,43

0,41

67

7

3,48

0,42

68

8

3,48

0,43

68

9

3,49

0,43

70

10

3,54

0,45

70

11

3,54

0,47

72

12

3,54

0,47

72

13

3,56

0,47

72

14

3,59

0,5

72

15

3,6

0,5

73

16

3,6

0,51

73

17

3,62

0,52

74

18

3,63

0,53

75

19

3,63

0,54

75

20

3,63

0,59

76

21

3,63

0,6

76

22

3,63

0,61

77

23

3,64

0,62

77

24

3,67

0,64

77

25

3,67

0,66

78

26

3,68

0,67

79

27

3,69

0,72

79

28

3,69

0,73

79

29

3,71

0,78

79

30

3,73

0,78

80

31

3,74

0,78

81

32

3,75

0,79

82

33

3,93

0,84

83

Вычислим доверительные интервалы для среднего арифметического
при
-ной доверительной
вероятности (таблица 3), используя процедуру Описательная статистика.[5]

Таблица 3 – Доверительные интервалы

Уровень
надежности

ДИ
(Углерод)

ДИ
(Кремний)

ДИ
(Предел текучести)

95
%

3,5610,063

0,5510,056

73,81,833

99
%

3,5610,084

0,5510,075

73,82,46

99,9
%

3,5610,111

0,5510,099

73,83,247

2.2 Проверка гипотезы о нормальном распределении случайной
величины
.

Для оценки соответствия имеющихся экспериментальных данных
нормальному закону распределения, воспользуемся графическим методом и критерием
согласия хи-квадрат.

Сформулируем нулевую гипотезу  и альтернативную гипотезу  [1, 3]:

  «Отличие экспериментальных данных от
нормального закона распределения не существенно»,

  «Экспериментальные данные не
подчиняются закону нормального распределения».

Если , где  — экспериментальное значение
критерия Пирсона, а
 — теоретическое значение
критерия Пирсона, то нуль-гипотеза о нормальном законе распределения
экспериментальных данных принимается с доверительной вероятностью
. В противном случае
нуль-гипотеза отвергается и принимается альтернативная гипотеза.

1. Для Углерода

Таблица 4 – Данные для вычисления критерия Пирсона

Интервал

Хi-1 — Xi

ni

F (xi)

Pi = F (xi) —

F (xi-1)

nPi

ni — nPi

χ2 = (ni — nPi)2/
nPi

(2,9;3]

1

0,001

0,001

0,03

0,97

29,725

(3,1;3,2]

1

0,024

0,018

0,63

-0,63

0,633

(3,2;3,3]

2

0,076

0,052

1,83

-0,83

0,373

(3,3;3,4]

1

0,188

0,112

3,93

-1,93

0,945

(3,4;3,5]

4

0,368

0,180

6,30

-5,30

4,460

(3,5;3,6]

9

0,584

0,216

7,54

-3,54

1,664

(3,6;3,7]

12

0,776

0,192

6,74

2,26

0,760

(3,7;3,8]

4

0,968

0,192

6,72

5,28

4,146

(3,9;4]

1

0,001

0,024

0,83

3,17

12,162

Экспериментальное значение критерия Пирсона определяется
суммированием данных последнего столбца таблицы 4.
Теоретическое значение критерия
Пирсона определяется при заданном уровне значимости
 и числе степеней свободы  c использованием функции Microsoft Excel ХИ2ОБР(;). Тогда

Т.к. , т.е. , то принимается альтернативная
 гипотеза, т.к. данные не подчиняются
нормальному закону распределения. Для построения гистограммы
необходимо предварительно сгруппировать данные и вычислить относительные
частоты (таблица 5).

Таблица
5 – Данные для построения гистограммы

Номер интервала

Интервал

ni

Wi=ni/n

Значения относительной

частоты Wi/h

1

(2,9;3]

1

0,029

0,02

2

(3,1;3,2]

1

0,029

0,02

3

(3,2;3,3]

2

0,057

0,04

4

(3,3;3,4]

1

0,029

0,02

5

(3,4;3,5]

4

0,114

0,07

6

(3,5;3,6]

9

0,257

0,16

7

(3,6;3,7]

12

0,343

0,22

8

(3,7;3,8]

4

0,114

0,07

9

(3,9;4]

1

0,029

0,02

Построим гистограмму относительных частот (рисунок 2)

Рисунок
2 – Гистограмма частот

По гистограмме видно, что отличие экспериментальных данных от
нормального закона распределения существенно.

2. Для Марганца

Таблица 6 Данные для вычисления критерия Пирсона

Интервал

Хi-1 — Xi

ni

F (xi)

Pi = F (xi) —

F (xi-1)

nPi

ni — nPi

χ2 = (ni — nPi)2/
nPi

(0,2;0,25]

1

0,032

0,017

0,58

0,42

0,303

(0,3;0,35]

4

0,108

0,047

1,64

-1,64

1,640

(0,4;0,45]

5

0,267

0,091

3,18

0,82

0,212

(0,45;0,5]

4

0,377

0,110

3,84

-3,84

3,844

(0,5;0,55]

6

0,498

0,121

4,23

0,77

0,140

(0,55;0,6]

2

0,619

0,121

4,24

-0,24

0,013

(0,6;0,65]

3

0,729

0,110

3,86

2,14

1,183

(0,65;0,7]

2

0,821

0,092

3,20

-1,20

0,453

(0,7;0,75]

2

0,890

0,069

2,42

0,58

0,139

Т.к. , т.е. , то принимается нулевая
гипотеза, следовательно, отличие экспериментальных данных от нормального закона
распределения не существенно.

Построим гистограмму относительных частот (рисунок 3)

Таблица 7 – Данные для построения гистограммы

Номер интервала

Интервал

ni

Wi=ni/n

Значения относительной

частоты Wi/h

1

(0,2;0,25]

1

0,029

0,02

2

(0,3;0,35]

4

0,114

0,07

3

(0,4;0,45]

5

0,143

0,09

4

(0,45;0,5]

4

0,114

0,07

Номер интервала

Интервал

ni

Wi=ni/n

Значения относительной

частоты Wi/h

5

(0,5;0,55]

6

0,171

0,11

6

(0,55;0,6]

2

0,057

0,04

7

(0,6;0,65]

3

0,086

0,05

8

(0,65;0,7]

2

0,057

0,04

9

(0,7;0,75]

2

0,057

0,04

10

(0,75;0,8]

4

0,114

0,07

11

(0,8;0,85]

2

0,0363

0,02

Рисунок
3 – Гистограмма частот

По гистограмме видно, что отличие экспериментальных данных от
нормального закона распределения не существенно.

3. Для твердости

Таблица 8 – Данные для вычисления критерия Пирсона

Интервал

Хi-1 — Xi

ni

F (xi)

Pi = F (xi) —

F (xi-1)

nPi

ni — nPi

χ2 = (ni — nPi)2/
nPi

(62;64]

2

0,013

0,020

0,69

1,31

2,512

(64;66]

2

0,033

0,039

1,36

0,64

0,306

(66;68]

4

0,072

0,067

2,33

1,67

1,194

(68;70]

2

0,138

0,100

3,49

-1,49

0,635

(70;72]

4

0,238

0,130

4,54

-0,54

0,065

(72;74]

3

0,368

0,147

5,15

-2,15

0,895

(74;76]

5

0,515

0,145

5,08

-0,08

0,001

(76;78]

5

0,660

0,124

4,36

0,64

0,095

(78;80]

5

0,784

0,093

3,25

1,75

0,937

(80;82]

2

0,877

0,060

2,12

-0,12

0,006

(82;84]

1

0,938

0,034

1,20

-0,20

0,032

Т.к. , т.е. , то принимается нулевая
гипотеза, следовательно, отличие экспериментальных данных от нормального закона
распределения не существенно.

Построим гистограмму относительных частот (рисунок 4)

Таблица 9 – Данные для построения гистограммы

Номер интервала

Интервал

ni

Wi=ni/n

Значения относительной

частоты Wi/h

1

(62;64]

2

0,057

0,04

2

(64;66]

2

0,057

0,04

3

(66;68]

4

0,114

0,07

Номер интервала

Интервал

ni

Wi=ni/n

Значения относительной

частоты Wi/h

4

(68;70]

2

0,057

0,04

5

(70;72]

4

0,114

0,07

6

(72;74]

3

0,086

0,05

7

(74;76]

5

0,143

0,09

8

(76;78]

5

0,143

0,09

9

(78;80]

5

0,143

0,09

10

(80;82]

2

0,057

0,04

11

(82;84]

1

0,029

0,02

Рисунок
4 – Гистограмма частот

По гистограмме видно, что отличие экспериментальных данных от
нормального закона распределения не существенно.[6]

2.3 Проверка экспериментальных данных на наличие грубой
погрешности
.

Для проверки данных применим статистические критерии трех
сигм.

Сформулируем нулевую гипотезу и альтернативную гипотезу :

 – грубой погрешности
(промаха) нет,

 – грубая погрешность
(промах) есть.

При использовании критерия трех сигм, если , то нулевую гипотезу
отвергают и принимают альтернативную.

Таблица
10 – Проверка на промахи

Углерод

Марганец

Твердость

2,95

0,611

0,21

0,341

63

3,80

3,19

0,371

0,34

0,211

64

7,80

3,28

0,281

0,34

0,211

66

10,80

3,28

0,281

0,35

0,201

66

9,80

3,31

0,251

0,35

0,201

67

3,20

3,43

0,131

0,4

0,151

67

2,20

3,48

0,081

0,41

0,141

68

9,20

3,48

0,081

0,42

0,131

68

4,20

3,49

0,071

0,43

0,121

70

0,80

3,54

0,021

0,43

0,121

70

6,80

3,54

0,021

0,45

0,101

72

5,20

3,54

0,021

0,47

0,081

72

1,80

3,55

0,011

0,47

0,081

72

2,20

3,56

0,001

0,47

0,081

72

7,80

3,57

0,009

0,5

0,051

73

7,20

3,59

0,029

0,5

0,051

73

6,20

3,6

0,039

0,51

0,041

74

3,80

3,6

0,039

0,52

0,031

75

1,80

3,62

0,059

0,53

0,021

75

5,20

3,63

0,069

0,54

0,011

75

5,80

3,63

0,069

0,59

0,039

76

1,80

3,63

0,069

0,6

0,049

76

8,20

3,63

0,069

0,61

0,059

77

1,20

3,63

0,069

0,62

0,069

77

0,20

3,64

0,079

0,64

0,089

77

1,20

3,67

0,109

0,66

0,109

78

6,80

3,67

0,109

0,67

0,119

78

5,20

3,68

0,119

0,72

0,169

79

3,20

3,69

0,129

0,73

0,179

79

0,80

3,69

0,129

0,78

0,229

79

3,20

3,71

0,149

0,78

0,229

79

5,80

3,73

0,169

0,78

0,229

80

1,80

3,74

0,179

0,79

0,239

81

5,20

3,75

0,189

0,83

0,279

82

1,20

3,93

0,369

0,84

0,289

83

4,20

σ =0,182

σ =0,162

σ =5,335

Проанализировав
данные таблицы 10, убедимся, что грубых погрешностей нет.

2.4 Корреляционный и регрессионный
анализ экспериментальных данных
.

Для нахождения коэффициентов корреляции воспользуемся
процедурой Корреляция из Пакета анализа [1].

Получим следующие результаты

Рисунок 5 – Коэффициент
корреляции

Из полученных результатов видно, что между твердостью  и
содержанием углерода в стали существует очень слабая обратная зависимость, а
между твердостью и содержанием марганца  в стали существует очень слабая прямая
зависимость.

Проверим значимость коэффициента корреляции.

Сформулируем нулевую гипотезу и альтернативную гипотезу :

 – коэффициент корреляции
равен нулю,

 – коэффициент корреляции не
равен нулю.

Если , где , то нулевая гипотеза на
уровне значимости
 отвергается, т.е. связь
между переменными значима.

статистика находится по формуле

 – табличное значение, при , , .

Для взаимосвязи Твердость-углерод:

Поскольку , нулевую гипотезу принимаем,
т.е. связь между твердостью  и содержанием углерода  в стали незначима.

Для взаимосвязи Твердость  -Марганец:

Поскольку , нулевую гипотезу принимаем,
т.е. связь между твердостью  и содержанием марганца  в стали незначима.

Проведем регрессионный анализ с помощью процедуры Регрессия
из Пакета анализа
Microsoft Excel [2].

Для взаимосвязи Твердость – Марганец, получим следующие
результаты

1-
й способ. Функция ЛИНЕЙН.

воспользуемся статистической функцией ЛИНЕЙН.

Рисунок- 6- Функция
ЛИНЕЙН

2    
й
способ (графический). Построение линии тренда

Рисунок-7
Графический способ

3й способ. Инструмент анализа
Регрессия.

Рисунок-8
Регрессия

Анализ результатов. Построена
линейная регрессионная модель

Ан=31,91+56,22

Коэффициент корреляции между наблюдаемыми и предсказанными
моделью значениями R= 0,108

Оценка адекватности построенной модели проведена с помощью
параметра «Значимость F» Значимость F меньше  0,05 поэтому модель может
считаться адекватной с вероятностью 0,95.

Оценка значимости коэффициентов модели проведена по параметру
«Р- значение» Поскольку это значение меньше 0,05, то с вероятностью 0,95 можно
считать, что соответствующие коэффициентов модели значимы.

Для взаимосвязи твердость -углерод, получим следующие
результаты

Рисунок
9 – Полиноминальная модель

По расчётам для полиноминальной модели  наибольшее значение
корреляции имеет полиноминальная модель 6 степени.

2.5 Множественный регрессионный анализ

Проведем множественный регрессионный анализ с помощью
процедуры Регрессия из Пакета анализа
Microsoft Excel.

Получим следующий результат

Рисунок
10 – Множественный регрессионный анализ

Рисунок 11 Остаток

 Так как значимость F больше значимости а=0,05 то построенная
регрессия не является значимой. (рисунок 9). Поскольку
R-квадрат равен , то точность слабая.

Значения коэффициентов модели указаны в столбце Коэффициенты,
следовательно:
 

Выражение для определения предела текучести  в зависимости от
содержания углерода  и кремния в стали будет иметь вид:


Заключение

корреляционный

В технических науках часто приходится сталкиваться с
необходимостью обработки и анализа экспериментальных данных, полученных в
результате наблюдения. В ходе курсовой работы было показано, что необходимым
инструментарием для анализа данных обладает программа
Microsoft Excel. С ее помощью были проанализированы результаты исследования зависимости
механических свойств стали 08Х18Н10Т от химического состава. Была выявлена слабая
прямая взаимосвязь между твердостью  и содержанием марганца  в стали. Также
было установлено, что изменение процентного содержания углерода в стали не
влияет на твердость.

Библиографический список

1. Математическая статистика : учеб.-метод. пособие /
авт.-сост. : С. Е. Демин, Е. Л. Демина ; М-во образования и науки РФ ; ФГАОУ ВО
«УрФУ им. первого Президента России Б.Н.Ельцина», Нижнетагил. технол. ин-т
(фил.). – Нижний Тагил : НТИ (филиал) УрФУ, 2016. – 284 с.

2.Т.В. Борздова, Основы статистического анализа и
обработки данных с применением
Microsoft Excel: учебное пособие /Борздова Т.В. –
Минск: ГИУСТ БГУ, 2011. – 75 с.

3. В.Р. Бараз, Использование MS Excel для анализа статистических
данных: учебное пособие/Бараз В.Р., Пегашин В.Ф. – 2-е изд. – Нижний Тагил: НТИ
(филиал) УрФУ, 2014. – 181 с.

4. В.Е. Гмурман, Теория вероятностей и математическая
статистика: учебное пособие для вузов/Гмурман В.Е. – 9-е изд. – М.: Высшая
школа, 2003. – 479 с.

5. Веременюк В. В., Крушевский Е.А., Мороз О. А./ Статистическая
обработка экспериментальных данных/ Минск БНТУ, 2015-77с.

6. Е .А. Лукерьянова/ Математическая
статистика часть 2/ Курган/ 2018-48с.

Учебное пособие. — Томск: Издательство Томского государственного педагогического университета, 2018. – 433 с.

Издание охватывает базовые направления математической статистики, используемые при анализе экспериментальных данных в областях биологии, медицины, химии, при анализе физических и педагогических измерений.
Каждый раздел издания посвящен конкретному аспекту анализа и обработки данных эксперимента. Теоретические положения сопровождается и дополняется методическими указаниями и примерами, реализованными исключительно в среде MS Excel. Критические значения статистик, не поддерживаемых функциями электронных таблиц, представлены соответствующими аппроксимациями.
Для студентов (бакалавров, магистрантов и аспирантов), преподавателей и научных работников, занимающихся анализом и статистической обработкой экспериментальных данных.

Содержание
Предисловие
Базовые термины
Измерения, шкалы и величины
Генеральная совокупность. Выборка
Функции распределения
Статистические гипотезы и критерии
Описательная статистика
Дисперсионный анализ. Однородность
Критерий Фишера
Критерий Кохрена
Критерий Бартлетта
Критерий знаков
Тест Левина
Достоверности совпадений и различий для порядковой шкалы
Достоверности совпадений и различий для дихотомической шкалы
Критерии согласия
Критерий согласия Пирсона
Критерий Колмагорова
Критерий Колмагорова-Смирнова
Критерий Крамера-Мизеса-Смирнова
Метод моментов
Параметрические критерии
Критерий Стьюдента
Z-критерий
Однофакторный анализ ANOVA
Критерий множественных сравнений
Непараметрические критерии
Критерий Крамера-Уэлча
Тест Краскела-Уоллиса
Критерий Вилкоксона-Манна-Уитни
Критерий Вилкоксона связанных выборок
Линейные и нелинейные зависимости. Регрессия. Коэффициент корреляции
Линейная регрессия
Нелинейные зависимости. Аппроксимация и идентификация параметров
Коэффициенты корреляции Пирсона и Спирмена
Градуировка. Пределы обнаружения аналита
Таблицы сопряженности. Корреляции качественных признаков
Критерий χ2 для таблиц сопряженности. Таблицы 2 х
Критерий χ2 для таблиц сопряженности r х c
Риски и шансы
Исключение грубых погрешностей
Критерии Райта и правило «трех сигм»
Критерий Романовского
Критерий Шарлье
Правило «ящик с усами»
Правило Томпсона (критерий Рошера)
Критерий Диксона (Q-критерий)
Основы планирования эксперимента
Приложения:
Однородность, дисперсия и ошибка среднего
Однородность и коэффициент вариации
Дисперсия смещенная и несмещенная. Стандартная ошибка среднего
Степень(и) свободы. Классы и группировка. Вариационный ряд
Степень(и) свободы. Классы и группировка
Описательная статистика. Интервальный ранжированный частотный ряд
Нормальное распределение
Измерения, погрешности и запись результатов

Округление чисел
Округления чисел в MS Excel
Погрешности прямых и косвенных измерений
Массивы, имена и функций MS Excel. Ошибки формул
Вопросы для самопроверки
Каталог примеров
Предметный указатель
Перечень использованных источников

Понравилась статья? Поделить с друзьями:

А вот еще интересные статьи:

  • Статичное значение в формуле excel
  • Статичная ячейка в формуле excel
  • Стилем называется в word это
  • Статичная формула в excel
  • Стилевое форматирование текста в word

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии