Рефераты - Афоризмы - Словари
Русские, белорусские и английские сочинения
Русские и белорусские изложения
 

Исследование статистической зависимости давления в идеальном газе Ферми-Дирака от его температуры

Работа из раздела: «Математика»

/

/

Содержание

Введение

Постановка задачи

Обработка исходных данных

Корреляционный анализ

Регрессионный анализ

Проверка гипотез

Доверительные интервалы

Заключение

Список литературы

Введение

Математическая статистика -- наука о математических методах сбора и обработки статистических данных для научных и практических выводов. Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных -- результатов наблюдений.

Во время статистических наблюдений для каждого объекта в ряде случаев можно измерить значение нескольких признаков. Таким образом, получается многомерная выборка. Если многомерную выборку обработать по значениям отдельного признака, то получится обычная обработка одномерной выборки.

Смысл обработки многомерных выборок состоит в том, чтобы установить связь между признаками. Связи между ними могут быть функциональными, то есть каждому значению одной величины соответствует определенное значение другой величины.

Связь между случайными величинами часто носит случайный характер. Она называется статистической, если изменение одной величины вызывает изменение распределения другой величины. Если среднее значение одной случайной величины функционально зависит от значения другой случайной величины, то такая статистическая зависимость называется корреляционной.

Постановка задачи

Дана выборка, состоящая из 100 пар чисел ( Xi , Yi ), i =1, 2, …, 100.

Подобрать пример объекта, для которого Xi , Yi могли бы быть значениями двух признаков, связанных статистической зависимостью. Дать теоретическое обоснование.

Построить диаграмму рассеивания. Вычислить выборочные параметры: выборочные средние, выборочные и исправленные дисперсии, средние квадратичные отклонения, моды и медианы выборки по X и по Y , корреляционный момент и коэффициент корреляции.

Построить корреляционную таблицу (7 на 7). Построить полигоны, гистограммы нормированных относительных частот, эмпирические функции распределения по X и по Y, вычислить выборочные параметры (см. п.2) по корреляционной таблице.

Вычислить параметры для уравнения линейной регрессии Y на X , построить линию регрессии на диаграмме рассеивания.

Вычислить параметры для уравнения параболической регрессии, построить найденную параболу на диаграмме рассеивания.

Проверить гипотезу о нормальном распределении признака Х.

Построить доверительный интервал для математического ожидания по Х.

статистический зависимость давление регрессия

Теоретическая часть

В данной работе исследуется зависимость давления в Ферми-газе от его температуры с помощью методов математической статистики.

Ферми-газ (или идеальный газ Ферми-Дирака) - газ, состоящий из частиц, удовлетворяющих статистике Ферми-Дирака, имеющих малую массу и высокую концентрацию. В первом приближении можно считать, что потенциал, действующий на электроны в металле, является постоянной величиной и благодаря сильному экранированию положительно заряженными ионами можно пренебречь электростатическим отталкиванием между электронами. Тогда электроны металла можно рассматривать как идеальный газ Ферми -- Дирака. Примерами Ферми-газов являются электронный газ в металлах, сильнолегированных и вырожденных полупроводниках, вырожденный газ электронов в белых карликах и вырожденный газ нейтронов в нейтронных звёздах.

Давление газа на стенку сосуда -- суммарный импульс, переданный за единицу времени отдельными частицами при столкновениях со стенкой.

Температура -- физическая величина, характеризующая тепловое состояние системы и связанная со средней кинетической энергией молекул.

Давление газа и температура зависят от нескольких факторов, обе величины связаны с движением частиц (молекул газа), следовательно, зависимость статистическая. Количество молекул очень велико, скорости и направления движения молекул совершенно хаотичны. Целесообразно рассматривать связь со средними значениями скоростей, что значит принять между величинами X и Y корреляционную зависимость.

Обычно в любой области науки при изучении двух величин проводятся эксперименты, и задача состоит в том, чтобы на основании экспериментальных точек выявить функциональную зависимость.

Так как зависимость корреляционная, задача состоит в том, чтобы приближённо свести корреляционную связь к функциональной с помощью подбора такой функции, которая максимально возможно была бы близка к экспериментальным точкам. Такая функция называется функцией регрессии.

Обычно вид самой функции угадывается, но она зависит от некоторых параметров. Задача статистического и корреляционного анализа состоит в нахождении этих параметров. Для этого и используется метод наименьших квадратов.

Приведем основные определения и понятия из курса теории вероятностей и математической статистики, которые будут задействованы и использованы в данной работе.

Статистика - это наука, которая занимается получением, обработкой, а также анализом данных и публикацией информации, характеризующей количественные закономерности жизни общества в неразрывной связи с их качественным содержанием. В более узком смысле статистика - это совокупность данных о каком-либо процессе или явлении. Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов. Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных - результатов наблюдений.

Выборочной совокупностью (выборкой) называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Для того чтобы по данным выборки можно было судить об изучаемом признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли; т.е. выборка должна быть репрезентативной (представительной). В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществлять случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.

Репрезентативность - главное свойство выборки, состоящее в близости ее характеристик (состава, средних величин и т.д.) к соответствующим характеристикам генеральной совокупности, из которой отобрана выборка.

Таким образом, статистическими методами пользуются для выявления закономерностей наблюдений и для проверки соответствия построенных теорий реальных явлений с их фактическим протеканием.

Как уже было сказано выше, существует тесная связь между математической статистикой и теорией вероятностей.

Объемом совокупности называют число объектов этой совокупности.

Теория вероятностей - раздел математики, в котором по данным вероятностям одних случайных событий находят вероятности других событий, связанных каким-либо образом с первыми. Теория вероятностей изучает также случайные величины и случайные процессы. Одна из основных задач теории вероятностей состоит в выяснении закономерностей, возникающих при взаимодействии случайных факторов.

У нас имеется выборка случайных значений, объем которой равен

Случайной называют величину, которая в результате испытания примет одно и только одно возможное значение, наперед не известное и зависящее от случайных причин, которые заранее не могут быть учтены. Случайные величины бывают двух видов: дискретные и непрерывные.

Дискретной называют случайную величину, возможные значения которой есть отдельные изолированные числа, которые эта величина принимает с определенными вероятностями.

Наблюдаемые значения случайной величины называются вариантами. Частотой называется число, которое показывает, сколько раз встречается данный вариант. Относительной частотой называется отношение частоты к объему выборки n.

Математическим ожиданием M(X) дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности. Если дискретная случайная величина принимает счетное множество возможных значений, то:

Дисперсией дискретной случайной величины называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:

Средним квадратичным отклонением случайной величины X называют квадратный корень из дисперсии:

Модой называют варианту, которая имеет наибольшую частоту.

Медианой называют варианту, которая делит вариационный ряд на две части, равные по числу вариант.

Начальным моментом порядка k случайной величины X называют математическое ожидание величины Xk:

В частности, начальный момент первого порядка равен математическому ожиданию:

Центральным моментом порядка k случайной величины X называют математическое ожидание величины :

В частности, центральный момент первого порядка равен нулю:

центральный момент второго порядка равен дисперсии:

центральный момент третьего порядка равен:

Исправленной выборочной дисперсией называют произведение выборочной дисперсии на исправитель:

Выборочным исправленным средним квадратичным отклонением называют квадратный корень от исправленной выборочной дисперсии:

Корреляционное поле и корреляционная таблица являются вспомогательными средствами при анализе выборочных данных. При нанесении на координатную плоскость двумерных выборочных точек получают корреляционное поле. Для численной обработки результатов обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке корреляционной таблицы приводятся численности тех пар (X, Y), компоненты которых попадают в соответствующие интервалы группировки по каждой переменной.

Корреляция - вероятностная (статистическая) зависимость между величинами, не имеющая, вообще говоря, строго функционального характера.

Корреляционным моментом случайных величин X и Y называют математическое ожидание произведения отклонений этих величин

.

Для вычисления корреляционного момента используют формулу:

Две случайные величины Y и X называются коррелированными, если их корреляционный момент отличен от 0; Y и X называются некоррелированными величинами, если их корреляционный момент равен 0.

Коэффициентом корреляции случайных величин X и Y называют отношение корреляционного момента к произведению средних квадратических отклонений этих величин

.

Гистограммой частот называется столбчатая диаграмма, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны отношению (плотность частоты).

Гистограммой нормированных относительных частот называется диаграмма, на которой изображены столбцы, при этом ось Х - это интервалы, а ось Y - это относительная частота встречаемости:

Полигоном частот называется ломаная, отрезки которой соединяют точки . Для построения полигона на оси абсцисс откладывают варианты , а на оси ординат - соответствующие им частоты .

Полигоном относительных частот называют ломаную, отрезки которой соединяют точки . Для построения полигона на оси абсцисс откладывают варианты , а на оси ординат - соответствующие им относительные частоты .

Функцией распределения называют функцию, определяющую вероятность того, что случайная величина Х в результате испытания примет значение, меньшее х:

Функцией распределения выборки является эмпирическая функция распределения.

Эмпирической функцией распределения называют функцию , определяющую для каждого значения х относительную частоту события Х < х:

где - число вариант, меньших х; n - объем выборки.

Регрессионный анализ

Регрессия - зависимость среднего значения какой-либо величины Y от другой величины X. Понятие регрессии в некотором смысле обобщает понятие функциональной зависимости y = f(x). Только в случае регрессии одному и тому же значению x в различных случаях соответствуют различные значения у.

Регрессионный анализ заключается в определении аналитического выражения связи, в которой изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов).

По форме зависимости различают:

линейную регрессию, которая выражается уравнением прямой:

нелинейную (параболическую):

Исследование линейной регрессии:

Определим коэффициенты линейной функции методом наименьших квадратов. Для этого составим сумму

Для того чтобы эта сумма была минимальной, необходимо, чтобы ее частные производные по параметрам A и B были равны нулю

Раскрыв скобки, мы получим

Выразим a и b

Одним из важнейших методов определения зависимости между X и Y является метод наименьших квадратов. Видя общее расположение точек, можно предположить, что эта зависимость линейная. Количество прямых, проходящих через заданную совокупность точек, бесконечно. Выберем оптимальную из них. Для этого суммарное отклонение между теоретическими и экспериментальными точками должно быть минимальным. Это отклонение мы найдем с помощью функции

Метод нахождения минимального отклонения и есть метод наименьших квадратов. Это суммарное отклонение зависит от коэффициентов а и b функции Y, поэтому эти коэффициенты должны быть минимальными, то есть производная функции в этих точках равны нулю:

Найдя частные производные и приравняв их нулю, получим следующую систему уравнений

Решив эту систему, мы найдем наилучший набор этих параметров. Эта теоретическая кривая с параметрами, которые определяются методом наименьших квадратов, и будет искомой линией - линией линейной регрессии.

Исследование параболической регрессии:

В этом случае уравнение регрессии Y на X имеет вид:

,

где a, b и c - неизвестные параметры.

Найдем такие p, q, r, при которых парабола наименее уклоняется от точек (Xi,Yi). Сделаем это методом наименьших квадратов. Для того чтобы сумма квадратов отклонений

была наименьшей, необходимо, чтобы выполнялись три условия (по числу неизвестных коэффициентов)

После преобразований уравнения примут следующий вид:

Подставив соответствующие значения в полученные формулы, и решив систему уравнений, мы получим искомую функцию параболической регрессии

Эти формулы используются для линейной и параболической регрессий, затем сравнивают полученные результаты и находят наименьшие среди полученных результатов. Та регрессия, у которой будут наименьшие оценки, более точно отражает распределение точек на диаграмме рассеивания.

Обработка исходных данных

Дана выборка (объема n=100) зависимости числа (Y) от числа (X).

Табл. 1. Исходные данные

X

Y

X

Y

X

Y

X

Y

X

Y

8,45

4,27

1,31

9,51

9,01

1,36

9,48

6,05

4,8

6,82

7,88

3,21

8,42

1,46

1,28

9,92

5,41

5,53

4,64

7,1

7,41

3,44

0,902

1,56

2,36

4,53

0,824

8,92

5,41

2,31

5,15

4,74

9,72

4,29

4,93

7,43

4,15

6,2

9,53

6,94

0,107

5,58

5,78

5,25

8,01

5,03

2,88

9,13

9,1

1,88

3,92

7,47

4,47

2,73

0,146

1,99

3,1

5,26

8,31

1,08

8,77

3,21

1,64

2,2

4,38

8,25

3,06

4,47

2

5,43

4,52

7,23

3,03

6,76

4,53

9,92

8,09

9,81

9,99

5,42

3,53

6,04

8,95

8,45

3,76

1,17

1,57

4,13

6,29

1,06

2,4

7,46

1,26

6,76

0,876

3,41

3,36

9,93

4,23

6,87

3,97

2,6

6,32

2,81

9,19

7,95

3,23

1,58

2,53

2,58

8,2

3,1

4,8

7,92

3,94

6,29

6,5

8,82

5,65

1,21

4,38

7,97

9,36

7,51

1,46

7,36

9,09

3,39

6,51

6,65

6,34

3,92

2,84

6,28

0,426

4,02

2,97

6,59

2,91

9,74

5,51

8,84

9,51

3,14

4,44

1,78

9,44

1,2

6,78

7,8

7,39

9,6

4,85

0,59

0,635

9,15

9,56

5,74

1,6

9,88

6,57

8,13

5,57

7,48

2,48

2,81

6,51

1,51

2,25

6,74

9,32

4,54

8,81

6,44

1,58

4,54

7,69

5,53

6,67

1,34

0,913

6,44

1,49

1,32

7,85

7,69

3,32

8,28

4,67

7,55

3,86

9,21

2,73

6,72

0,549

8,07

7,58

3,6

1,62

1,41

Основные характеристики выборки

Числовые характеристики X:

M*(x) =4,95488;

D*(x) = 8,3006;

S2(x) = 8,2176;

у*(x) =2,8811;

s*(x) =2,8666 ;

начальные и центральные моменты первого, второго и третьего порядков:

Числовые характеристики Y:

M*(y) = 5,4433;

D*(y) = 7,4836;

S2(y) =7,4088;

у*(y) = 2,7356;

s*(y) = 2,7219;

начальные и центральные моменты первого, второго и третьего порядков:

Корреляционный момент и коэффициент корреляции :

Из Полученного значения коэффициента корреляции следует обратная связь между исследуемыми величинами, т. к. оно отрицательно. Так как принимает значение близкое к (0), то X и Y слабо зависимы.

Построим диаграмму рассеивания для данных значений X и Y:

Рис. 1. Диаграмма рассеивания

Корреляционный анализ

Для корреляционного анализа данные удобнее представить в виде корреляционной таблицы. Область попадания точек разбиваем на 7 интервалов по X и 7 по Y. В первой строке таблицы укажем средние значения интервалов для Y, а в первом столбце - средние значения интервалов по X. На пересечении строк и столбцов находятся частоты наблюдаемых пар значений признаков.

Табл. 2. Корреляционная таблица

X Y

1,2571

2,5914

3,9257

5,2600

6,5943

7,9286

9,2629

nx/n

0,8129

2

1

2

1

2

2

4

0,14

2,2248

1

3

3

1

3

1

3

0,15

3,6367

2

1

1

1

6

2

2

0,15

5,0485

3

2

0

2

3

6

2

0,18

6,4604

3

1

1

1

1

2

1

0,1

7,8722

2

2

3

2

0

1

2

0,12

9,2841

3

2

3

2

3

3

0

0,16

ny/n

0,16

0,12

0,13

0,1

0,18

0,17

0,14

1

С помощью корреляционной таблицы мы сможем найти оценки для X:

, где , = 4,69556;

, =7,39031;

, =7,46496;

, =2,71851;

, =2,73221.

С помощью корреляционной таблицы найдем числовые характеристики Y:

, где , =5,3801;

, =7,40956;

, =7,48439;

, =2,72205;

, =2,73576.

Вычислим начальные моменты первого, второго и третьего порядков для X и Y:

Вычислим центральные моменты второго и третьего порядков для X и Y:

Используя данные корреляционной таблицы, построим гистограммы, полигоны и графики эмпирических функций распределения для X и Y (см. рис. 2 -- рис. 7):

Рис. 2. Гистограмма относительных частот по X

Рис. 3. Гистограмма относительных частот по Y

Рис. 4. Полигон относительных частот по X

Рис. 5. Полигон относительных частот по Y

Рис. 6. Эмпирическая функция распределения по X

Рис. 7. Эмпирическая функция распределения по Y

Регрессионный анализ

Линейная регрессия

Для нахождения коэффициентов a и b методом наименьших квадратов были посчитаны следующие необходимые параметры:

= 3276,8479;

= 495,4880;

= 2580,2386;

= 544,33;

В нашем случае коэффициенты а и b соответственно равны:

.

Следовательно, первое уравнение линейной регрессии для нашей выборки имеет вид:

y = x .

Для нахождения коэффициентов с и d методом наименьших квадратов были посчитаны следующие необходимые параметры:

= 3703,8283;

= 495,4880;

= 2580,2386;

= 544,33;

В нашем случае коэффициенты c и d соответственно равны:

Следовательно, второе уравнение линейной регрессии для нашей выборки (см. рис. 8) имеет вид:

x = y -.

Рис. 8. Линейная регрессия

Параболическая регрессия

Для нахождения коэффициентов p, q и r методом наименьших квадратов были посчитаны следующие необходимые параметры:

;

;

= 3276,8479;

=495,4880;

=2580,2386;

=544,33.

В нашем случае коэффициенты p, q и r соответственно равны:

; ;

;

Следовательно, уравнение параболической регрессии для нашей выборки (см. рис. 9) имеет вид:

Рис. 9. Параболическая регрессия

Проверка гипотез

Рассмотрим статистику , которая показывает отклонение значений от

Проверим гипотезы и Значения, вычисленные с использованием соответствующих статистик и должны быть меньше значения . Статистика используется для проверки гипотезы о линейной зависимости, и показывает, насколько величины отклоняются от линии регрессии . Вычисляем

.

Аналогично для гипотезы используем статистику , которая, соответственно, показывает отклонение от квадратной регрессии. Видим

Из того, что и меньше следует, что гипотезы верны.

При сравнении статистик и , оказалось, что , следовательно, гипотеза о том, что зависимость между и близка к линейной, подтвердилась.

При сравнении статистик E1 и Е3, оказалось, что, следовательно, гипотеза о том, что зависимость между и близка к квадратичной, подтвердилась.

При сравнении статистик Е2 и Е3, оказалось, что, следовательно, парабола меньше отклоняется от точек выборки (), чем прямая.

Проверим гипотезу о нормальном распределении признака Х. Для этого будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты. При уровне значимости б=0,05 требуется проверить нулевую гипотезу : генеральная совокупность распределена нормально.

В качестве критерия проверки нулевой гипотезы примем случайную величину

По таблице критических точек распределения ч2 по заданному уровню значимости б и числу степеней свободы k = s -- 3 ищем критическую точку (б;k)

Если < -- нет оснований отвергнуть нулевую гипотезу.

Если > -- нулевую гипотезу отвергают.

Для нахождения теоретических частот разделим выборку на s=7 частичных интервалов, как это было сделано для корреляционной таблицы, нормируем случайную величину Х, вычисляем теоретические вероятности Рi попадания Х в интервал ( xi ; xi+1 ) по функции Лапласа и, наконец, найдем теоретические частоты nтеор .

Табл. 3. Вычисление теоретических частот нормального распределения X

nэксп

Xi

Xi+1

Zi

Zi+1

Фi

Фi+1

Pi

nтеор

ч2

14

0,107

1,51886

-1,6879

-1,16855

-0,5

-0,379

0,121

12,1

0,29835

15

1,51886

2,93071

-1,16854

-0,6492

-0,379

-0,2422

0,1368

13,68

0,12737

15

2,930714

4,34257

-0,6492

-0,12985

-0,2422

-0,0517

0,1905

19,05

0,86102

18

4,342571

5,75443

-0,12985

0,389503

-0,0517

0,1517

0,2034

20,34

0,2692

10

5,754428

7,16629

0,389503

0,908853

0,1517

0,3186

0,1669

16,69

2,68161

12

7,166286

8,57814

0,908853

1,428203

0,3186

0,4236

0,105

10,5

0,21429

16

8,578143

9,99

1,428203

1,947552

0,4236

0,5

0,0764

7,64

9,14785

100

У 

1

100

13,5997

Наблюдаемое значение =13,59969. Критическое значение (0,05;4) = 9,5. Выполняется > , следовательно, необходимо отвергнуть нулевую гипотезу.

Доверительные интервалы

Рассмотренные ранее , , , , , , , являются точечными оценками, но наряду с ними при изучении выборки используются интервальные оценки, так как полезно не только построить оценку, но и охарактеризовать величину возможной при её использовании ошибки.

Интервальной называют оценку, которая определяется двумя числами -- концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.

Величина характеризует точность оценки, если выполняется неравенство , где -- оценка некоторого параметра генеральной совокупности. Надежностью (доверительной вероятностью) оценки по называют вероятность , c которой осуществляется неравенство . Наиболее часто задают надежность, равную 0,95; 0,9; 0,999.

Доверительным называют интервал , , который покрывает известный параметр с заданной надежностью .

Рассмотрим доверительный интервал для математического ожидания генеральной совокупности. Известен объем выборки n = 100; =4,95506, =5,4433, исправленное выборочное среднеквадратичное отклонение , .

Найдем доверительный интервал для оценки неизвестного математического ожидания по X и Y с надежностями = 0,95; 0,99; 0,999.

Если наблюдаемая случайная величина имеет нормальное распределение, но ее среднеквадратичное отклонение нам неизвестно, то мы можем построить доверительный интервал по распределению Стьюдента с степенями свободы, то есть должно быть справедливо неравенство:

;

где определим по заданным и . Это соотношение выражает доверительный интервал для , определяемый с помощью распределения Стьюдента.

Найдем доверительные интервалы для математического ожидания X.

При ; : 4,380632 < <5,529488.

При ; 4,194465< <5,715655.

При ; 3,972974< <5,937146.

Заключение

В курсовой работе был проведен статистический анализ зависимости в 100 экспериментах от . Производя этот анализ, мы использовали не только аналитические функции, но и графические данные.

Зависимость давления от температуры далека от линейной и квадратичной. Однако видно, что разница между значениями статистик небольшая.

В результате работы было научно доказано, что особенностью Ферми-газов является крайне слабая зависимость давления от температуры.

Список литературы

Гмурман, В. Е. Теория вероятностей и математическая статистика. Учебное пособие для вузов. -- М. : Высшая школа, 2001.

Гмурман, В. Е. Руководство по решению задач по теории вероятностей и математической статистике. Учебное пособие для вузов. -- М. : Высшая школа, 1979.

Кремер, Н. Ш. Теория вероятностей и математическая статистика -- Учебник для втузов. -- 2-е изд. -- М. : ЮНИТИ - ДАНА, 2004.

Сивухин, Д. В. Общий курс физики. Том II. Термодинамика и молекулярная физика. 5-е изд., испр.-- М.: Физматлит, 2005.

Чавлейшвили М.П. Задачи по теории вероятностей: Учебное пособие. - Дубна: Международный университет природы, общества и человека «Дубна», 2000.

Кабанова Е.И. Теория вероятностей и математическая статистика. Курс лекций. - Дубна: Международный университет природы, общества и человека «Дубна», 1996.

Гриценко С. А., Маркова И. А. «ТВМС. Часть 1. Теория вероятностей. Учебное пособие». -- Дубна: МУПОЧ «Дубна», 2003

1. www.

ref.by 2006—2019
contextus@mail.ru