Аппроксимация линейной функции. Результаты коэффициентов линейной аппроксимации. Нужна помощь по изучению какой-либы темы

Пусть зависимоcть y от x задана в дискретной форме: { x 1 , y 1 ; x 2 , y 2 ; … x n , y n }. По этим данным можно построить такую аппроксимирующую функцию, график которой будет располагаться между узлами интерполяции близко к ним, но не обязательно точно проходить через все узлы. Такая зависимость носит сглаживающий характер и строится, например, для того, чтобы описать экспериментальные данные с помощью функции заданного вида. Необходимо определить лишь параметры этой функции. Для решения такой задачи используется метод наименьших квадратов - МНК . Его суть заключается в минимизации полной квадратичной невязки между построенной функцией и значениями y i в узловых точках:

где F (x ) – искомая аппроксимирующая функция.

Часто в качестве приближения, строящегося по МНК, берутся полиномы степени l ,
, гдеl < n -1 . В простейшем случае строится полином первой степени, т.е. линейная функция: F (x ) = ax + b . Коэффициенты a и b находятся с помощью метода наименьших квадратов по следующим формулам:

,
.

Для нахождения коэффициентов, можно использовать стандартные функции системы MathCAD и Excel.

В MathCAD имеется функция line(vx, vy) , которая возвращает линейные коэффициенты по значениям векторных аргументов vx и v y .

В Excel имеется функция ЛИНЕЙН, у которой также имеются два аргумента, состоящих из диапазонов ячеек. На первом месте диапазон ячеек соответствующий ординате. После ввода этой функции (например, «=ЛИНЕЙН(F10:F12;E1:E3)») выводится только один линейный коэффициент. Для вывода обоих коэффициентов необходимо выделить две ячейки (включая первую слева) потом нажать «F2», а затем комбинацию клавиш «crtl», «shift», «enter».

Лабораторная работа №8

Используя исходные данные из предыдущей работы, построить линейную функцию по методу наименьших квадратов. Вычислить полную квадратичную невязку полученной функции. Вычислить значение функции при заданном значении аргумента.

Физическая задача №3

Полагаем, что измерение интенсивности радиоактивного распада было выполнено для (К+1) моментов времени с заданным интервалом времени
. Эти измерения дали таблицу, состоящую из К+1 (К=3-5) значений количества распадов
для моментов времени
.

Используя метод наименьших квадратов, определить константу распада, период полураспада и значение суммы квадратов невязок.

Знание закона радиоактивного распада

подсказывает вычислить значения
и использовать метод наименьших квадратов для величин
, отыскивая параметры линейной зависимости. Тангенс угла наклона линейной зависимости определяет константу радиоактивного распада.

В отчете должен быть представлен график прямой
вместе с экспериментальными точками. Заметим, что закон радиоактивного распада является вероятностным и выполняется сравнительно точно для больших значений. Периоды полураспада радиоактивных изотопов изменяются в очень широких пределах. Например, период полураспада изотопа азота равен 10 минутам, а период полураспада изотопа хлора 300 000 лет . В заданиях период полураспада равен часам (и ответ следует выдавать в часах).

Из определения периода полураспада
следует его связь с постоянной распада:

. (2)

Параметры задачи преподаватель выдает студенту по аналитическим формулам

, .

В этих формулах - номер студента в группе, а- номер измерения (, время в этой формуле измеряется в часах. Между номером студента и периодом полураспада имеется линейная зависимость.

В отчете показать вывод уравнений, позволяющих решить задачу, график с прямой в логарифмическом масштабе для
и экспериментальными точками, выписать значения постоянной распада и времени полураспада в часах.

линейный алгебраический численный метод

Часто при анализе экспериментальных данных возникает необходимость найти функциональную зависимость между величинами x и y, которые получены в результате измерений. При аналитическом исследовании взаимосвязи между двумя величинами x и y получается таблица значений, которую также можно представить в графическом виде.

Если же заведомо известен вид аппроксимирующей функции, то задача аппроксимации сводится только к отысканию коэффициентов (a, b, c,...), входящих в функцию. Для нахождения этих коэффициентов используется метод наименьших квадратов, заключающийся в том, что сумма квадратов расстояний по вертикали от точек до графика функции y=f(x, a, b, c,...) наименьшая: S = i 2 = min, где S i = y i - f(x i , a, b, c,...). Для этого используем необходимое условие экстремума функции нескольких переменных i - f(x i , a, b, c,...)) 2: равенство нулю частных производных. В результате получим систему. Таким образом, нахождение коэффициентов сводится только к решению системы:

Линейная регрессия

Линейная функция имеет вид y = ax + b, следовательно, требуется найти два параметра: a и b, с условием, что даны координаты n точек, найденных экспериментально со случайными ошибками («шумом»). Для этого составим функцию i - (ax i +b)) 2 , раскроем скобки i - ax i - b) 2 и составим систему:

Пусть А = i , В = i , С = i x i , D = i 2 , тогда система примет вид:

Решим эту систему линейных алгебраических уравнений методом Крамера и, таким образом, найдем искомые значения параметров a и b:

Таблица. Имеются точки:

Используя способ вычисления параметров линейной функции, получаем:

a = 0,1215455 , b = - 0,2140002

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

НАЦИОНАЛЬНЫЙ МИНЕРАЛЬНО-СЫРЬЕВОЙ УНИВЕРСИТЕТ

«ГОРНЫЙ»

Кафедра АТПП

Математические методы обработки данных

Лабораторная работа № 2

ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ ПО МЕТОДУ ГАИМЕНЬШИХ КВАДРАТОВ

Выполнил: студент гр.АПМ-13 ____ __________ / Озеров Б.А. /

(подпись) (Ф.И.О.)

Проверил: доцент ­­­­­___________ / Иванов П.В. /

(подпись) (Ф.И.О.)

Санкт-Петербург

Цель работы: изучение практических приемов нахождения коэффициентов линейных и нелинейных регрессионных зависимостей и оценки точности аппроксимации с использованием программной среды MathCad.

Линейная аппроксимация.

Дано:

Способы аппроксимации:

line ;

2) решение системы линейных уравнений с помощью конструкции Given – Find .

Выполнение задания:

1) решение системы линейных уравнений, используя функцию line.

Делаем матрицу данных нам величин, а именно x и y. Функция line просто вычисляет быстрым способом, находит не известные коэффициенты. Получаем искомые коэффициенты. Запись в программе MathCad представлена на рис.1

рис.1 решение системы линейных уравнений, используя функцию line

в программе MathCad

2) Конструкция Given – Find использует расчетную методичку, основанную на поиске корня вблизи точки начального приближения.

В блоке Given записывается система уравнений (неравенств), подлежащих решению. Система уравнений должна быть записана после или правее Given. Перед словом Given необходимо указывать начальные приближения для всех переменных. Признаком окончания системы служит Find.

Сначала задаем матрицу данных нам величин, а именно x и y. И задаем начальное приближение А и В, от которых будем начинать искать значения линейного уравнения Ах+В=y. Затем вводим служебное слово Given и после него записываем уравнение, используя знак жирное равно. И в конце написать функцию Find с неизвестными переменными в качестве параметра. Получаем искомые коэффициенты. Запись в программе MathCad представлена на рис.2

Используя метод наименьших квадратов, мы составляем уравнения, которые записываем после слова Given:

рис.2 решение системы линейных уравнений с помощью конструкции Given – Find

в программе MathCad

Вычислили коэффициенты аппроксимирующего полинома линейного уравнения двумя разными способами. Они совпали: (а=А, b=B)

Аппроксимация опытных данных – это метод, основанный на замене экспериментально полученных данных аналитической функцией наиболее близко проходящей или совпадающей в узловых точках с исходными значениями (данными полученными в ходе опыта или эксперимента). В настоящее время существует два способа определения аналитической функции:

С помощью построения интерполяционного многочлена n-степени, который проходит непосредственно через все точки заданного массива данных. В данном случае аппроксимирующая функция представляется в виде: интерполяционного многочлена в форме Лагранжа или интерполяционного многочлена в форме Ньютона.

С помощью построения аппроксимирующего многочлена n-степени, который проходит в ближайшей близости от точек из заданного массива данных. Таким образом, аппроксимирующая функция сглаживает все случайные помехи (или погрешности), которые могут возникать при выполнении эксперимента: измеряемые значения в ходе опыта зависят от случайных факторов, которые колеблются по своим собственным случайным законам (погрешности измерений или приборов, неточность или ошибки опыта). В данном случае аппроксимирующая функция определяется по методу наименьших квадратов.

Метод наименьших квадратов (в англоязычной литературе Ordinary Least Squares, OLS) - математический метод, основанный на определении аппроксимирующей функции, которая строится в ближайшей близости от точек из заданного массива экспериментальных данных. Близость исходной и аппроксимирующей функции F(x) определяется числовой мерой, а именно: сумма квадратов отклонений экспериментальных данных от аппроксимирующей кривой F(x) должна быть наименьшей.

Аппроксимирующая кривая, построенная по методу наименьших квадратов

Метод наименьших квадратов используется:

Для решения переопределенных систем уравнений, когда количество уравнений превышает количество неизвестных;

Для поиска решения в случае обычных (не переопределенных) нелинейных систем уравнений;

Для аппроксимации точечных значений некоторой аппроксимирующей функцией.

Аппроксимирующая функция по методу наименьших квадратов определяется из условия минимума суммы квадратов отклонений расчетной аппроксимирующей функции от заданного массива экспериментальных данных. Данный критерий метода наименьших квадратов записывается в виде следующего выражения:

Значения расчетной аппроксимирующей функции в узловых точках ,

Заданный массив экспериментальных данных в узловых точках .

Квадратичный критерий обладает рядом "хороших" свойств, таких, как дифференцируемость, обеспечение единственного решения задачи аппроксимации при полиномиальных аппроксимирующих функциях.

В зависимости от условий задачи аппроксимирующая функция представляет собой многочлен степени m

Степень аппроксимирующей функции не зависит от числа узловых точек, но ее размерность должна быть всегда меньше размерности (количества точек) заданного массива экспериментальных данных.

∙ В случае если степень аппроксимирующей функции m=1, то мы аппроксимируем табличную функцию прямой линией (линейная регрессия).

∙ В случае если степень аппроксимирующей функции m=2, то мы аппроксимируем табличную функцию квадратичной параболой (квадратичная аппроксимация).

∙ В случае если степень аппроксимирующей функции m=3, то мы аппроксимируем табличную функцию кубической параболой (кубическая аппроксимация).

В общем случае, когда требуется построить аппроксимирующий многочлен степени m для заданных табличных значений, условие минимума суммы квадратов отклонений по всем узловым точкам переписывается в следующем виде:

- неизвестные коэффициенты аппроксимирующего многочлена степени m;

Количество заданных табличных значений.

Необходимым условием существования минимума функции является равенству нулю ее частных производных по неизвестным переменным . В результате получим следующую систему уравнений:

Преобразуем полученную линейную систему уравнений: раскроем скобки и перенесем свободные слагаемые в правую часть выражения. В результате полученная система линейных алгебраических выражений будет записываться в следующем виде:

Данная система линейных алгебраических выражений может быть переписана в матричном виде:

В результате была получена система линейных уравнений размерностью m+1, которая состоит из m+1 неизвестных. Данная система может быть решена с помощью любого метода решения линейных алгебраических уравнений (например, методом Гаусса). В результате решения будут найдены неизвестные параметры аппроксимирующей функции, обеспечивающие минимальную сумму квадратов отклонений аппроксимирующей функции от исходных данных, т.е. наилучшее возможное квадратичное приближение. Следует помнить, что при изменении даже одного значения исходных данных все коэффициенты изменят свои значения, так как они полностью определяются исходными данными.

Аппроксимация исходных данных линейной зависимостью

(линейная регрессия)

В качестве примера, рассмотрим методику определения аппроксимирующей функции, которая задана в виде линейной зависимости. В соответствии с методом наименьших квадратов условие минимума суммы квадратов отклонений записывается в следующем виде:

Координаты узловых точек таблицы;

Неизвестные коэффициенты аппроксимирующей функции, которая задана в виде линейной зависимости.

Необходимым условием существования минимума функции является равенству нулю ее частных производных по неизвестным переменным. В результате получаем следующую систему уравнений:

Преобразуем полученную линейную систему уравнений.

Решаем полученную систему линейных уравнений. Коэффициенты аппроксимирующей функции в аналитическом виде определяются следующим образом (метод Крамера):

Данные коэффициенты обеспечивают построение линейной аппроксимирующей функции в соответствии с критерием минимизации суммы квадратов аппроксимирующей функции от заданных табличных значений (экспериментальные данные).

Алгоритм реализации метода наименьших квадратов

1. Начальные данные:

Задан массив экспериментальных данных с количеством измерений N

Задана степень аппроксимирующего многочлена (m)

2. Алгоритм вычисления:

2.1. Определяются коэффициенты для построения системы уравнений размерностью

Коэффициенты системы уравнений (левая часть уравнения)

- индекс номера столбца квадратной матрицы системы уравнений

Свободные члены системы линейных уравнений (правая часть уравнения)

- индекс номера строки квадратной матрицы системы уравнений

2.2. Формирование системы линейных уравнений размерностью .

2.3. Решение системы линейных уравнений с целью определения неизвестных коэффициентов аппроксимирующего многочлена степени m.

2.4.Определение суммы квадратов отклонений аппроксимирующего многочлена от исходных значений по всем узловым точкам

Найденное значение суммы квадратов отклонений является минимально-возможным.

Аппроксимация с помощью других функций

Следует отметить, что при аппроксимации исходных данных в соответствии с методом наименьших квадратов в качестве аппроксимирующей функции иногда используют логарифмическую функцию, экспоненциальную функцию и степенную функцию.

Логарифмическая аппроксимация

Рассмотрим случай, когда аппроксимирующая функция задана логарифмической функцией вида:

Кафедра: ________Информатики и компьютерных технологий _______________

КУРСОВАЯ РАБОТА

по дисциплине _______________ИНФОРМАТИКА __________________________

(наименование учебной дисциплины согласно учебному плану)

ЗАДАНИЕ

студенту группы МГП-12 Румянцева Н.А.

(шифр группы) (Ф.И.О.)

1. Тема работы: _Реализация численного метода средствами Microsoft Excel и с помощью средств пакета MathCAD

2. Исходные данные к работе: _Вариант № 17__________________________________

4. Перечень графического материала: _Представление результатов в виде экранных форм________________________________ ____________________________________

5. Срок сдачи законченной работы: ___01.05.2013г. ____________________________

Руководитель работы: ________ ______________ /_________/

(должность) (подпись) (Ф.И.О.)

Дата выдачи задания: __15.02.2013 г. ______________


Аннотация

Пояснительная записка представляет собой отчет о выполнении курсовой работы. В ней рассматриваются вопросы по нахождению эмпирических формул методом наименьших квадратов (МНК) посредством возможностей пакета Microsoft Excel, а также рассматривается решение данной задачи в пакете MathCAD. В работе получены уравнения различных видов с помощью аппроксимации линейной, квадратичной и экспоненциальной зависимостей. По окончании работы сделан вывод, каким методом задача решена лучше всего.

Страниц 24, таблиц 3, рисунков 14, приложений 0.

Abstract

The explanatory note represents the report on term paper performance. In it questions on a finding of empirical formulas by a method of the least squares (МНК) by means of possibilities of package Microsoft Excel are considered, and also the decision of the given problem in Turbo Pascal 7.0 is considered. In work the equations of various kinds by means of approximation linear, square-law and экспоненциальной dependences are received. Upon termination of work the conclusion is drawn, the problem is solved by what method is better.

Pages 24, tables 3, figures 14, appendixes 0.

Аннотация. 2

Введение. 4

Постановка задачи. 5

Общие сведения. 6

Линейная зависимость. 7

Нелинейная зависимость. 7

Исходные данные. 10

Расчет аппроксимаций в табличном процессоре Excel 11

Построение графиков. 17

Функция ЛИНЕЙН.. 18

Выполнение аппроксимации в программе MathCAD.. 19

Введение. 19

Линейная аппроксимация в программе MathCAD.. 21

Экспоненциальная аппроксимация в программе MathCAD.. 22

Полиномальная (квадратичная аппроксимация в программе MathCAD.. 23

Список литературы.. 24

Введение

Аппроксимация (от латинского "approximare" -"приближаться") – научный метод, суть которого состоит в замене одних, известных значений, другими, приближёнными и более простыми. Эти простые значения должны удовлетворять некой зависимости, нахождение которой, в целом, и есть конечная цель этого метода.

Известно, что функциональная зависимость между величинами может быть либо точной (этот случай характерен для теоретических измышлений), либо приближённой (что более характерно для экспериментально полученных данных). Эта неточность, отклонение полученного значения от искомой зависимости, на графике выражающаяся в разбросе точек на некотором расстоянии от кривой (здесь я немного забегаю вперёд) может иметь несколько причин:

1. Погрешности прямых измерений (приборные), ошибки, допускаемые человеком (здесь я, конечно, не говорю о грубых ошибках, дающих значительные отклонения).

2. Несовершенством человеческих знаний о природе – отнюдь не все современные научные концепции позволяют точно рассчитать какие-либо значения для реальных случаев – многие из них направлены на случаи идеальные.

3. Сложностью и изменчивостью самой природы (особенно – живой). Например, в случае проведения социологических исследований, точное совпадение экспериментальных данных с теоретическими вовсе и не требуется – даже незначительная корелляция результатов эксперимента с ожидаемыми закономерностями уже может сказать специалистам о многом.

При выборе аппроксимации следует исходить из конкретной задачи исследования. Обычно, чем более простое уравнение используется для аппроксимации, тем более приблизительно получаемое описание зависимости. Поэтому важно считывать, насколько существенны и чем обусловлены отклонения конкретных значений от получаемого тренда. При описании зависимости эмпирически определенных значений можно добиться и гораздо большей точности, используя какое-либо более сложное, многопараметрическое уравнение. Однако нет никакого смысла стремиться с максимальной точностью передать случайные отклонения величин в конкретных рядах эмпирических данных. Гораздо важнее уловить общую закономерность, которая в данном случае наиболее логично и с приемлемой точностью выражается именно двухпараметрическим уравнением степенной функции. Таким образом, выбирая метод аппроксимации, исследователь всегда идет на компромисс: решает, в какой степени в данном случае целесообразно и уместно «пожертвовать» деталями и, соответственно, насколько обобщенно следует выразить зависимость сопоставляемых переменных. Наряду с выявлением закономерностей, замаскированных случайными отклонениями эмпирических данных от общей закономерности, аппроксимация позволяет также решать много других важных задач: формализовать найденную зависимость; найти неизвестные значения зависимой переменной путем интерполяции или, если это допустимо, экстраполяции.


Постановка задачи

1. Используя метод наименьших квадратов функцию , заданную таблично, аппроксимировать

а) многочленом первой степени ;

б) многочленом второй степени ;

в) экспоненциальной зависимостью .

2. Для каждой зависимости вычислить коэффициент детерминированности.

3. Вычислить коэффициент корреляции (только в случае а).

4. Для каждой зависимости построить линию тренда.

5. Используя функцию ЛИНЕЙН вычислить числовые характеристики зависимости y от x .

6. Сравнить свои вычисления с результатами, полученными при помощи функции ЛИНЕЙН.

7. Сделать вывод, какая из полученных формул наилучшим образом аппроксимирует функцию .

8. Выполнить обработку заданных экспериментальных данных с использованием встроенных функций интерполяции (аппроксимации) и регрессии пакета MathCAD и сравнить результаты с результатами, полученными в Microsoft Excel.


Общие сведения

При экспериментальном изучении функциональной зависимости y = f(x) производят измерения величины y при различных значениях величины x. Результаты представляют в виде таблицы 1 или графически.

X x 1 x 2 ××× x n
Y x 1 Y 2 ××× y n

Таблица 1

Задача заключается в аналитическом представлении искомой функциональной зависимости, т.е. в подборе формулы, описывающей результаты эксперимента. Эмпирическую формулу обычно выбирают из достаточно узкого класса функций, рассматривая, например, множество функций линейных, степенных, показательных и т.п. При этом руководствуются какими либо теоретическими соображениями или соображениями простоты представления эмпирического материала. Найденная эмпирическая формула должна быть такой, чтобы вычисленные по ней значения функций при X=x i возможно мало отличалось бы от опытных данных y i (i = 1, 2, …,n).

Обозначим выбранную функциональную зависимость

будет минимальной. Таким образом, параметры а 1 , а 2 , …, а m определяются из условия, чтобы сумма квадратов отклонений измеренных значений y i от принимала наименьшее значение.

Используя необходимые условия экстремума функции нескольких переменных, получим нормальную систему для определения коэффициентов а 1 , а 2 , …, а m

где а1, а2 –неизвестные параметры, а система (1.3) примет вид

где a, b –постоянные причем x > 0 и y > 0.

Логарифмируя равенство (1.2.1), получим

и применив формулы (1.1.2), найдем значения параметров b и u, а затем значение параметра а.

Показательную зависимость

Полагая v = lny, c = lna, Y = x, получим линейную зависимость

Таблица №3.6

Чем меньше значение Q, тем лучше соответствует эмпирическая формула экспериментальным данным.


В каждом задании требуется методом наименьших квадратов найти теоретическую функциональную зависимость для функции, заданной таблично. В качестве теоретической функциональной зависимости использовать:

– Многочлен первой степени ,

Показательную функцию ,

– Степенную функцию ,

– Многочлен второй степени .

Для каждой зависимости найти теоретическое значение функции, сумму квадратов отклонений эмпирических значений функции от теоретических значений, указать наименьшее значение этой величины и аппроксимирующую функцию, которой оно соответствует. Построить линию тренда для каждой зависимости и показать уравнение этой линии на диаграмме. Показать на диаграмме величину коэффициента детерминированности R 2 . Этот коэффициент вычисляется по формуле

, (2.1)

где -заданные значения функции,

Теоретические значения функции,

Среднее арифметическое значение, i = 1, 2, …,n.

Если коэффициент детерминированности равен 1, то теоретические и эмпирические значения функции полностью совпадают. Если коэффициент

детерминированности равен 0, то теоретическая зависимость выбрана неудачно.

Исходные данные

Был проведён некоторый эксперимент. Его результаты записаны в виде таблицы, где x i – величина, задаваемая исследователем (например – концентрация реагентов в химическом растворе), y i – измеренная величина (в нашем примере это может быть скорость протекания реакции).

x i y i x i y i x i y i x i y i x i y i
0.21 1.62 4.98 40.09 7.96 63.31 12.33 97.77 17.32 126.45
1.19 8.65 5.49 43.56 8.32 67.45 13.21 105.34 18.43 144.34
2.43 16.76 6.07 48.45 9.43 72.87 14.72 112.56 19.38 160.45
3.12 24.45 6.81 52.21 10.21 81.34 15.53 121.89 20.45 161.34
4.54 32.87 7.21 57.34 11.54 89.45 16.23 108.54 21.22 170.59

Таблица 2

Расчет аппроксимаций в табличном процессоре Excel