Расчетно графическая работа по статистике готовая. Статистические оценки параметров распределения

САРАТОВСКИЙ ГОСУДАРСТВЕННЫЙ

АГРАРНЫЙ УНИВЕРСИТЕТ

ИМ. Н.И. В АВИЛОВА

КАФЕДРА ЭКОНОМИЧЕСКОЙ КИБЕРНЕТИКИ

РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА

ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ

Выполнила студент III курса группы Б-303

Хуртов Денис

Саратов 2009 г.

Таблица исходных данных.

Вариант № 46

№ хозяйства

Расход кормов, и.к.ед. (Х)

Себестоимость 1 ц. молока, руб. (У)

Х - независимый признак;

У - зависимый признак.

Введение…………………………………………………………………………...4

Глава 1. Построение и графическое изображение вариационных рядов.

1.1 Порядок построения вариационных рядов………………………………….5

1.2. Графическое изображение дискретных вариационных рядов……………6

1.3. Графическое изображение интервальных вариационных рядов………….6

Глава 2. Статистические характеристики рядов распределения.

2.1. Показатели центра распределения……………………………………….….7

2.2. Показатели колеблемости признака……………………………………….8

2.3. Показатели формы распределения……………………………..…………..9

2.4. Построение нормальной кривой по эмпирическим и теоретическим данным……………………………………………………………………………10

2.5. Проверка гипотезы о законе нормального распределения……………….11

2.6. Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel………………………...…11

2.7. Статистические оценки параметров распределения…………………...…13

2.8. Статистические оценки параметров распределения……………………...14

Глава 3. Корреляционно - регрессионный анализ.

3.1. Выбор типа аппроксимирующей функции…………………………….….16

3.2. Исследование корреляционной связи и оценка степени пригодности полученного корреляционного уравнения……………………………………..18

3.3. Вычисление показателей тесноты корреляционной связи……………….19

3.4. Проведение регрессионного анализа с помощью инструмента

Регрессия ………………………………………………………………………...19

Глава 4. Дисперсионный анализ.

4.1. Понятие дисперсионного анализа……………………………………….…20

4.2. Однофакторный дисперсионный анализ…………………………………..20

Список литературы……………………………………………………………....21

Приложения……………………………………………………………………...22

Введение

Расчетно-графическая работа (РГР) предполагает применение основных приемов статистики для обработки массовой социально - экономической информации.

Программное обеспечение современных персональных компьютеров позволяет автоматизировать процесс расчетов. Наиболее эффективно использовать для этой цели табличный процессор Excel.

Excel предлагает широкий диапазон средств для анализа статистических данных. Такие встроенные функции, как СРЗНАЧ, МЕДИАНА, МОДА, могут быть полезны для проведения несложного анализа. Если встроенных статистических функций недостаточно, то можно обратиться к Пакету анализа.

Пакет анализа, являющийся надстройкой, содержит коллекцию функций и инструментов, расширяющих встроенные аналитические возможности Excel. В частности, пакет анализа можно использовать для создания гистограмм, ранжирования данных, извлечения случайных или периодических выборок из выбора данных, проведения регрессионного анализа, получения основных статистических характеристик выборки, генерации случайных чисел с различным распределением и для многих других расчетов.

Глава 1. Построение и графическое изображение

вариационных рядов.

1.1 Порядок построения вариационных рядов

Данная работа выполнена на демонстрационном примере в пакете Excel.

Составление вариационных рядов рассмотрим на примере данных о бонитете почв и урожайности овощей (Таблица исходных данных). Они являются исходными данными для демонстрационного примера.

Дискретный вариационный ряд строится по зависимому признаку (обозначим его У), интервальный - по независимому (Х).

Для того чтобы составить дискретный вариационный ряд урожайности овощей, необходимо расположить наблюдавшиеся значения признака в порядке возрастания, т.е. ранжирование статистических данных, а затем подсчитать частоты (сколько раз встречается то или иное значение признака).

Для графического изображения дискретного ряда служит многоугольник (полигон). При его построении на оси абсцисс откладываются варианты, на оси ординат - частоты.

Построение интервального вариационного ряда рассматривается на примере бонитета почв различных хозяйств.

Для этого:

1 . Определим число групп (число интервалов) по формуле Стерджесса:

K=1+3.32*lg (n),

К-число групп (интервалов);

n- число единиц наблюдения.

В данном примере K=1+3.32*lg (30) = 6.

2. Рассчитываем величину интервала, т.е. разность между верхним и нижним значением признака в группе:

Величина интервала (шаг):

3. Формируем группы, т.е. устанавливаем верхние и нижние границы для каждого интервала. Нижней границей для первой группы будет x min (или эта величина, уменьшенная не более чем на половину величины интервала). Чтобы найти верхнюю границу, нужно к нижней границе прибавить величину интервала h.

Верхняя граница первой группы будет нижней границей для второго интервала. Чтобы найти верхнюю границу, к полученному значению опять прибавляют величину интервала и т.д.

4. Подсчитываем число вариант, попавших в каждый интервал, Варианты, совпадающие с границами частичных интервалов, включаются в правый интервал. Графически интервальный ряд изображают с помощью гистограммы.

Глава 2. Статистические характеристики рядов распределения.

2.1. Показатели центра распределения .

Средней в статистике называется показатель, характеризующий типичный размер признака в совокупности.

Средняя арифметическая вычисляется по формулам:

простая ; взвешенная ,

где - среднее значение признака; - варианты; - частоты; - численность совокупности.

Характеристиками вариационных рядов наряду со степенными средними являются мода и медиана.

Мода - величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. В дискретных рядах распределения модой будет варианта с наибольшей частотой.

В интервальном ряду мода определя6ется по формуле:

где -нижняя граница интервала, содержащего моду; - величина модального интервала; - частота модального интервала; - частота интервала, предшествующего модальному; - частота послемодального интервала.

Медианой в статистике называется варианта, расположенная в середине вариационного ряда. Если ряд дискретный имеет нечётное число, то медианой будет варианта, расположенная в середине упорядоченного ряда и её порядковый номер. Если ряд состоит из чётного числа членов, то медианой будет средняя арифметическая из двух вариант в середине ряда с порядковыми номерами: и .

В интервальном ряду медиана рассчитывается по формуле:

где - нижняя граница медианного интервала; - величина медианного интервала; - сумма накопленных частот, предшествующих медианному интервалу; -частота медианного интервала.

2.2. Показатели колеблемости признака.

Для измерения колеблемости признака применяются абсолютные и относительные показатели вариации.

Размах вариации - это разность между максимальным и минимальным значениями изучаемого признака.

R = x max -x min

Среднее линейное отклонение - средняя арифметическая из модулей абсолютных отклонений вариантов от их среднего значения.

Дисперсия - это средний квадрат отклонений вариантов от их средней арифметической.

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии.

Коэффициент осцилляции - отношение размаха вариации к средней арифметической:

Относительное линейное отклонение - отношение среднего линейного отклонения к средней:

Коэффициент вариации - отношение среднего квадратического отклонения к средней:

2.3. Показатели формы распределения.

В статистике широко известны различные виды распределений - нормальное распределение, биноминальное, распределение Пуассона и др. Наиболее употребительным является нормальное распределение , выражающее закономерности взаимодействия случайных величин. Оно служит удачной моделью, с которой сравнивают анализируемое эмпирическое распределение. Если расхождения не велики, то их объясняют действием случайных факторов и считают данное распределение близким к нормальному. В противном случае делают вывод о несоответствии рассматриваемого распределения нормальному.

Чтобы определить, насколько близко эмпирическое распределение к нормальному, необходимо произвести выравнивание фактического распределения по кривой нормального распределения. С этой целью рассчитываются теоретические частоты по формуле:

где - теоретические частоты; - фактические частоты; - шаг (величина интервала); - нормированные отклонения; - дифференциальная функция Лапласа (значения даны в приложении 1).

2.5. Проверка гипотезы о законе нормального распределения.

Для объективной оценки степени соответствия эмпирического распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе нормального распределения. Это критерии Пирсона, Колмогорова, Смирнова и др. Мы рассмотрим критерий Пирсона.

Критерий Пирсона определяется по формуле:

Рассчитанное значение сравнивается с табличным при соответствующем числе степени свободы и заданном уровне значимости. Если расчетное значение χ 2 меньше табличного, то делается вывод о несущественности расхождений между эмпирическим и теоретическим распределении (т.е. нулевая гипотеза о том, что распределение подчиняется закону нормального распределения, принимается).

Рассматриваемые критерии согласия дают общую оценку степени близости эмпирического распределения к нормальному, но не дают информации о характере расхождения между ними. Для определения характера расхождения между эмпирическими и теоретическими частотами определим показатели формы распределения. Это коэффициент асимметрии и эксцесса.

Коэффициент асимметрии рассчитывается по формуле:

При симметрическом распределении К А = 0. При К А > 0 - наблюдается положительная или правосторонняя асимметрия (правая часть кривой длиннее).

Примечание. Коэффициент асимметрии находится в интервале:

Островершинность распределения характеризуется при помощи коэффициента эксцесса:

где m 4 - центральный момент четвёртого порядка;

При E x > 0 кривая распределения - плосковершинна, при E x

2.7. Статистические оценки параметров распределения.

Статистической оценкой называется специальная функция, вычисляемая на основании выборочных данных для приближенной замены неизвестного параметра распределения или самого распределения. Различают оценки смещённые и несмещённые, точечные и интервальные.

Возможное расхождение между выборочными и генеральными характеристиками составляет ошибку выборки.

Стандартная ошибка выборочной средней определяется по формуле:

Ошибка среднего квадратического отклонения

Ошибка коэффициента вариации

Точечной, несмещённой и состоятельной оценкой генеральной средней является выборочная средняя

Для определения интервальной оценки необходимо найти доверительный интервал , ,

где - предельная ошибка выборочной средней;

Коэффициент доверия, который определяют по таблице распределения Стьюдента по заданным и при малой выборке при n

Достоверность любого параметра оценивается по критерию достоверности t, определяемого как отношение оцениваемого параметра к ошибке. Если t факт > t кр, определяемого по таблице распределения Стьюдента, то данный параметр достоверен.

Достоверность выборочной средней :

Достоверность среднего квадратического отклонения и коэффициент вариации:

Определяется по формуле:

Если данная величина меньше 5%, то полученные средние можно использовать в последующих расчётах характеристик изучаемой совокупности.

Вывод:

Характер расхождения между эмпирическими и теоретическими частотами:

  • Коэффициент асимметрии К А > 0 для параметра У, следовательно у него наблюдается положительная или правосторонняя асимметрия (правая часть кривой длиннее), для параметра Х К А >0, следовательно у него наблюдается отрицательная или левосторонняя ассиметрия.
  • Коэффициент эксцесса E x > 0 для Х и У, значит кривая распределения - плосковершинная.

Стандартная ошибка выборки максимально возможные расхождения между генеральными и выборочными характеристиками. 0,0343 для параметра Х и 3,2168 - для У.

Относительная ошибка выборки для параметров Х и У меньше 5 %, значит полученные средние можно использовать для характеристики каждого из этих признаков.

Глава 3. Корреляционно - регрессионный анализ.

3.1. Выбор типа аппроксимирующей функции

В экономических исследования редко приходится иметь дело с точными и определенными функциональными связями, когда каждому значению одной величины соответствует строго определённое значение другой величины. Чаще встречаются стохастические (вероятностные) или корреляционные связи. В следующем разделе работы с помощью программы Excel проводится исследование корреляционной связи.

При изучении корреляционных связей возникает необходимость решить две основные задачи - о тесноте и о форме связи. Первая решается методом корреляции, вторая - методом регрессии и дисперсии. По форме корреляционная связь может быть линейной и нелинейной, по направлению - прямой и обратной.

Для анализа линейной корреляции между признаками Х и Y проводят n независимых парных наблюдений, исходом каждого из которых является пара чисел (X 1 ,Y 1), (X 2 ,Y 2),… (X n ,Y n). По этим значениям определяют выборочные эмпирические коэффициенты корреляции и регрессии, рассчитывают уравнение регрессии, строят теоретическую линию регрессии и оценивают значимость полученных результатов.

В MS Excel линия уравнения регрессии называется линией тренда , которая показывает тенденцию изменения данных и служит для составления прогнозов. Для создания линии тренда на основе диаграммы используется один из пяти типов аппроксимаций или линейная фильтрация.

Тип Описание

Линейная y = m*x+ b

где m - тангенс угла наклона,

b - точка пересечения с осью ординат

Логарифмическая y = c*ln(х) + b

где c и b - константы

Полиномиальная y = c 6 x 6 +…+ c 1 x+b

где c 6 ,… c 1 и b - константы

Степенная y = c*x b

где c и b - константы

Экспоненциальная y = c*e bx

где c и b - константы

На диаграмме можно выделить любой ряд данных и добавить к нему линию тренда. Когда линия тренда добавляется к ряду данных, она связывается с ним, и поэтому при изменении значений любых точек ряда данных линия тренда автоматически пересчитывается и обновляется на диаграмме.

Кроме того, имеется возможность выбирать точку, в которой линия тренда пересекает ось ординат, добавлять к диаграмме уравнение регрессии и величину достоверности аппроксимации. Покажем построение линии тренда на нашем демонстрационном примере на основе исходных данных: время уборки и урожайность. Данный анализ проводится на основе диаграммы для пяти типов аппроксимаций, и выбираем ту линию тренда, для которой величина достоверности аппроксимации наибольшая, т.е. у которой самый наибольший коэффициент корреляции.

Квадрат коэффициента корреляции равен 0,8572. Уравнение данной зависимости имеет вид:

У х = 58,964х 2 -88,707х+112,8

Для оценки степени пригодности полученного корреляционного уравнения в практических целях необходимо проверить его достоверность.

Рассчитываем ошибку уравнения по формуле:

где Y i - фактическое значение результативного признака, в демонстрационном примере - это Уфакт.; Y х - значения результативного признака, рассчитанные по уравнению регрессии, в демонстрационном примере - это Урасчетн.; n -число наблюдений, m- число параметров уравнения регрессии.

Значения Y х рассчитываются по уравнению регрессии путем подставления в него значений фактического признака (х). В РГР необходимо подсчитать ошибку уравнения для всех видов зависимостей, найти относительную ошибку уравнения, а также выявить минимальную ошибку уравнения регрессии, и убедиться, что она соответствует той зависимости, у которой самый высокий коэффициент аппроксимации (R 2).

Минимальная ошибка уравнения равна 5,308431. Она соответствует линейной зависимости, у которой самый высокий коэффициент аппроксимации (R 2), равный 0,8572.

Глава 4. Дисперсионный анализ.

4.1. Понятие дисперсионного анализа

В основе дисперсионного анализа лежит правило сложения дисперсий. В соответствии с ним общая дисперсия результативного признака при сгруппированных данных равна сумме межгрупповой и внутригрупповой дисперсий.

Межгрупповая вариация результативного признака вызвана влиянием на него одного или нескольких изучаемых факторных признаков. Дисперсию, измеряющую межгрупповую вариацию, называют межгрупповой или факторной. Внутригрупповая вариация является результатом влияния на результативный признак неучтенных факторов. Показатель, характеризующий внутригрупповую вариацию, называется внутригрупповой или остаточной дисперсией. Весь объём вариации результативного признака характеризуется общей дисперсией.

Идея дисперсионного анализа заключается в сравнении факторной дисперсии с остаточной. Отношение факторной дисперсии к остаточной носит название F- критерия или критерия Фишера и используется для оценки достоверности связи между результативным и факторными признаками. Если различие между факторной и остаточной дисперсиями значимо, то делается вывод о том, что фактор оказывает существенное влияние на результативный признак

Список литературы

1.Венецкий И.Г., Кильдишев В.С. Теория вероятностей и математическая статистика. М.: Статистика, 1975.

  1. Ефимова М.Р., Рябцев В.М. Общая теория статистики. М.: Финансы и статистика, 1991.
  2. Марк Джон, Крейг Стинсон. Эффективная работа с Microsoft Excel 2000. СПб.: Питер 2001.
  3. Блаттнер Патрик. Использование Microsoft Excel 2002. М.: Издательский дом «Вильямс», 2002.

Приложение 1.

Значение дифференциальной функции Лапласа

Приложение 2.

Критические точки распределения x 2

Значимости, α

Число степеней свободы, к

Приложение 3.

Критические точки распределения Стьюдента

степеней

свободы, к

Уровень значимости, α

степеней

свободы к

Уровень значимости, α

(двусторонняя критическая область)

Уровень значимости α (односторонняя критическая область)

Кроме показателей, рассмотренных выше, обобщающей характеристикой вариации в однородной совокупности служит определенный порядок в изменении частот распределения в соответствии с изменениями величины изучаемого признака, называемый закономерностью распределения .

Характер (тип) закономерности распределения может быть выявлен путем построения вариационного ряда на основании большого объема наблюдений, а также такого выбора числа групп и величины интегралов, при котором наиболее отчетливо могла бы проявиться закономерность.

Анализ вариационных рядов предполагает выявление характера распределения (как результата действия механизма вариации), установление функции распределения, проверку соответствия эмпирического распределения теоретическому.

Эмпирическое распределение , полученное на основе данных наблюдения, графически изображается эмпирической кривой распределения с помощью полигона.

На практике встречаются различные типы распределений, среди которых можно выделить симметричные и асимметричные, одновершинные и многовершинные.

Установить тип распределения, означает выразить механизм формирования закономерности в аналитической форме. Многим явлениям и их признакам свойственны характерные формы распределения, которые аппроксимируются соответствующими кривыми. При всем многообразии форм распределения наибольшее распространение в качестве теоретических получили нормальное распределение, распределение Пауссона, биноминальное распределение и др.

Особое место в изучении вариации принадлежит нормальному закону, благодаря его математическим свойствам. Для нормального закона выполняется правило трех сигм, по которому вариация индивидуальных значений признака находится в пределах от величины средней. При этом в границах находится около 70% всех единиц, а в пределах - 95%.

Оценка соответствия эмпирического и теоретического распределений производится с помощью критерие

36.Выборочное наблюдение в статистики.Выборочное наблюдение относится к разновидности несплошного наблюдения. Оно охватывает отобранную часть единиц генеральной совокупности. Цель выборочного наблюдения - по отобранной части единиц дать характеристику всей совокупности единиц. Чтобы отобранная часть была репрезентативна (т.е. представляла всю совокупность единиц), выборочное наблюдение должно быть специально организовано. Следовательно, в отличие от генеральной совокупности, представляющей всю совокупность исследуемых единиц, выборочная совокупность представляет ту часть единиц генеральной совокупности, которая является объектом непосредственного наблюдения.

По понятным причинам выборочный метод может широко использоваться органами государственной статистики. Он позволяет при значительной экономии средств и затрат получать необходимую достоверную информацию. Гарантия репрезентативности обеспечивается применением научно обоснованных способов отбора единиц, которые подлежат обследованию.

Следует сразу же иметь в виду, что при сопоставлении показателей по результатам выборочного исследования с характеристиками для всей генеральной совокупности могут иметь место отклонения. Величина этих отклонений называется ошибкой наблюдения, которая может быть или ошибкой регистрации (несовершенство технических условий), или ошибкой репрезентативности (случайное или систематическое нарушение правил при отборе единиц).

В статистике приняты следующие условные обозначения:

N - объем генеральной совокупности;

п - объем выборочной совокупности;

Средняя в генеральной совокупности;

Средняя в выборочной совокупности;

р - доля единиц в генеральной совокупности;

w - доля единиц в выборочной совокупности;

Генеральная дисперсия;

S 2 - выборочная дисперсия;

Среднее квадратическое отклонение признака в генеральной совокупности;

S - среднее квадратическое отклонение признака в выборочной совокупности.

37.Статистическое наблюдение связи между явлениями

Виды и формы связей
Существуют два вида связи: функциональная и корреляционная, которые обусловлены двумя типами закономерности: динамической и статистической.

При функциональной зависимости величине факторного признака строго соответствует одно или несколько значений другой величины (функции). Взаимосвязанные признаки подразделяются на факторные (под их воздействием изменяются другие, зависящие от них признаки) и результативные.

При функциональной связи изменение результативного признака всецело зависит от изменения факторного признака :

Функциональные связи характеризуются полным соответствием между изменением факторного признака и изменением результативной величины, и каждому значению признака-фактора соответствуют вполне определенные значения результативного признака.

В различных процессах, характеризующихся статистическим закономерностями, нет строгой зависимости между причиной и результатом, и обычно не предоставляется возможным выявить строгую зависимость явлений от факторов, потому что закономерности складываются под влиянием множества причин и условий.

При корреляционной связи изменение результативного признака не всецело зависит от факторного признака , а лишь частично, так как возможно влияние прочих факторов : .

Корреляционная связь является свободной, неполной и неточной связью. Например, себестоимость величины продукции зависит от уровня производительности труда: чем выше производительность труда, тем ниже себестоимость. Но себестоимость зависит также и от ряда других факторов: стоимости сырья и материалов, топлива, электроэнергии, их расхода на единицу продукции, цеховых и общезаводских расходов и т.д. Поэтому нельзя утверждать, что при повышении производительности труда, допустим, на 10% себестоимость снизится также на 10%. Может случиться, что, несмотря на рост производительности труда, себестоимость не только не снизится, но даже несколько повысится, если на нее окажут более сильное влияние действующие в обратном

Корреляционная зависимость проявляется только в средних величинах и выражает соотношение между ними в виде тенденции к возрастанию или убыванию одной переменной величины при возрастании или убывании другой.

Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной.

Для того, чтобы установить, есть ли зависимость между величинами, используются многообразные статистические методы, позволяющие определить, во-первых - какие связи; во-вторых - тесноту связи (в одном случае она сильная, устойчивая, в другом - слабая); в-третьих -форму связи (т.е. формулу, связывающую величину и ).

По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых, наоборот, рост факторного признака сопровождается уменьшением результативного. Такие связи также можно назвать соответственно положительными и отрицательными.

По аналитическому выражению корреляционная связь может быть примолинейной и криволинейной. Прямолинейной называется связь, когда величина явления изменяется приблизительно равномерно в соответствии с изменением величины влияющего фактора. Математически прямолинейная связь может быть выражена уравнением прямой: .

Если происходит неравномерное изменение явления в связи с изменением величины влияющего фактора, то такая связь называется криволинейной. Математически криволинейная зависимость может быть выражена уравнением криволинейной связи (уравнение параболы, показательная, степенная, логарифмическая функции и другие).

Указанные выше классификационные признаки наиболее часто встречаются в статистическом анализе. Но кроме перечисленных различают также непосредственные, косвенные и ложные связи. Собственно, суть каждой из них очевидна из названия. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная формально и, как правило, подтвержденная только количественными оценками. Она не имеет под собой качественной основы или же бессмысленна.

Расчётно-графическая работа по статистике

На тему: «Статистический анализ производственно-хозяйственной деятельности предприятия »

Выполнила : студентка ΙΙ курса

Проверила : Шевченко Т.В.

Одесса 2014

План

Введение

Раздел 1 . Анализ результатов производственной деятельности

предприятия

1.1. Общая характеристика предприятия строительной отрасли

1.2. Расчёт показателей динамики изучаемых экономических явлений

1.3. Определение тенденции динамики изучаемых показателей

Раздел 2 . Определение взаимосвязей и взаимозависимостей между

экономическими показателями предприятия

2.1. Характеристика и экономический анализ изучаемых показателей

2.2.Установление наличия и характера взаимосвязи между

изучаемыми признаками

2.3. Построение корреляционных уравнений

2.4. Оценка силы корреляционной связи

Выводы

Графическое приложение

Список используемой литературы


1 | | | | | | |

Исходные данные

В результате обследования в четырех цехах предприятия станков четырех разных типов, выполняющих одну и ту же операцию, были получены статистические данные о возрасте оборудования и об эксплуатационных расходах, связанных с работой этих станков. Возраст оборудования - целое число, для станка проработавшего менее одного года, - 1; от 1 года до 2 лет -2 и т.д. Эксплуатационные расходы фиксировались для каждого станка нарастающим итогом с начала года до момента проведения обследования. В результате выполняемой работы предполагалось определить, у какого типа станков наиболее низкие эксплуатационные расходы, как с возрастом станка меняется величина эксплуатационных расходов, с тем чтобы в последующем, при планируемой реорганизации и расширении станочного парка предприятия, произвести замену оборудования наиболее экономичным с точки зрения величины эксплуатационных расходов. Исходные данные для анализа представлены в табл. 2 - 5. Необходимо отметить, что статистические данные таблиц являются условными, значительно более удобными для выполнения учебных расчетов, чем данные реальных наблюдений, однако эти условные данные полностью отражают те процессы и статистические закономерности, которые наблюдаются на реальном промышленном предприятии.

В результате обследования в четырех цехах предприятия станков четырех разных типов, выполняющих одну и ту же операцию, были получены статические данные о возрасте оборудования и об эксплуатационных расходах, связанных с работой этих станков:

Таблица 1. Цех 1

Возраст, лет, X

Возраст, лет, X

Эксплуатационные расходы, тыс. руб., Y

Таблица 2. Цех 2

Возраст, лет, X

Эксплуатационные расходы, тыс. руб., Y

Возраст, лет, X

Эксплуатационные расходы, тыс. руб., Y

Таблица 3. Цех 3

Возраст, лет, X

Эксплуатационные расходы, тыс. руб., Y

Возраст, лет, X

Эксплуатационные расходы, тыс. руб., Y

Таблица 4. Цех 4

Возраст, лет, X

Эксплуатационные расходы, тыс. руб., Y

Возраст, лет, X

Эксплуатационные расходы, тыс. руб., Y

Необходимо:

1. По каждому цеху определить средний возраст оборудования, средние эксплуатационные расходы, среднее квадратическое отклонение для каждого статистического признака. Определить медиану возраста оборудования для каждого цеха. Сравнить между собой средние значения для всех цехов, построив таблицу сравнения. Сделать вывод о том, в каком цехе старше оборудование и где наиболее высокие эксплуатационные расходы.

2. Произвести аналитическую группировку статистических данных, выбрав в качестве факторного признака возраст оборудования, результативного признака - эксплуатационные расходы. Для проведения группировки создать четыре группы станков по возрасту: 1-5, 6-10, 11-15, 16-20 лет. В каждой образованной группе найти средние эксплуатационные расходы. Результаты группировки представить в табличном виде. Эти же данные представить в виде гистограмм, показывающих распределение оборудования по возрасту. По результатам построения таблиц и гистограмм сделать выводы. Определить моду возраста оборудования расчетным путем и графически.

3. Для каждого цеха определить коэффициент Фехнера, построить поле корреляции, рассчитать коэффициент корреляции и определить, для какого цеха наблюдается более тесная связь между возрастом и эксплуатационными расходами. Для каждого объекта получить уравнение линии регрессии, показывающей характер связей между возрастом и эксплуатационными расходами (связь считать прямолинейной). По полученным уравнениям сделать выводы о том, на каком объекте наблюдения быстрее возрастают с возрастом эксплуатационные расходы.

Введение

Заключение

Заказать работу

Введение: цель и содержание работы…………………………………………..3
I. Подготовка выборочных данных ………………..………………………...4
II. Первичная обработка данных…………………………………………......4
2.1. Расчет числовых характеристик (описательная статистика)…………......4
2.2. Построение интервально-вариационного ряда распределения абсолютных и относительных частот…………………………………………6
III. Проверка гипотезы о виде генерального распределения ……………….10
3.1. Проверка гипотезы о нормальном распределении…………….................10
IV. Построение доверительных интервалов для генеральных числовых характеристик параметров……………………………………………………11
4.1. Доверительный интервал для генерального среднего……………….11
4.2. Доверительный интервал для генеральной дисперсии…………….…12
V. Проверка статистических гипотез относительно значений параметров генеральных распределений …………………………………….…….…...13
5.1. Проверка гипотезы о равенстве среднего значения генеральной совокупности заданному значению…………………………………………....13
5.2. Проверка гипотезы о равенстве дисперсии генеральной совокупности заданному значению………………………………………………………...13
5.3. Проверка гипотезы об однородности двух малых выборок……….…...14
Заключение………………………………………………………..………….16

ВВЕДЕНИЕ
Целью расчетно-графической работы является оценка генеральных законов распределения и их параметров для двух показателей – компонент двумерной генеральной совокупности «рост-вес», а также установление наличия взаимозависимости между данными показателями.
Для достижения данной цели применяем выборочный метод. С помощью датчика случайных чисел, используя пакет анализа данных в программе Excel, из двумерной генеральной совокупности извлечена двумерная выборка.
В данной расчетно-графической работе проводится первичная обработка выборочных данных:
– строятся частотные распределения: полигон, гистограмма, эмпирическая функция распределения;
– определяются выборочные числовые характеристики.
Проверяется гипотеза о виде генерального распределения, использую критерий Пирсона χ².
Находятся доверительные интервала для числовых характеристик (параметров) генеральных распределений:
− доверительный интервал для генерального среднего при известном математическом ожидании;
− доверительный интервал для генерального среднего при неизвестном математическом ожидании;
− доверительный интервал для генеральной дисперсии при известной генеральной средней;
− доверительный интервал для генеральной дисперсии при не известной генеральной средней;
Проверяются статистические гипотезы о значениях данных параметров:
– рассматриваются гипотезы и их подвиды о дисперсиях;
– проводится проверка подвидов гипотез о дисперсиях;
– рассматриваются гипотезы и их подвиды о средних;
– проводится проверка подвидов гипотез о средних;
− проверка гипотезы об однородности двух малых выборок.
В заключение приводится сводная аналитическая записка, отражающая все основные этапы работы, полученные результаты, и сделанные на их основе выводы.

Заключение
В данной расчетно-графической работе проведена оценка генеральных законов распределения и их параметров для двух показателей – компонент двумерной генеральной совокупности «рост-вес», а также установлены наличия взаимозависимости между данными показателями.
Выборочные данные из двумерной генеральной совокупности (X-рост; Y-вес) генерировались с помощью датчика случайных чисел на основе данных параметров. Предполагалось, что показатели в своей генеральной совокупности имеют нормальное распределение.
Проведена первичная обработка выборочных данных, то есть был построен полигон частотного распределения, гистограмма, эмпирическая функция распределения, а также определили выборочные числовые характеристики.
Были выдвинуты и проверены гипотезы о виде законов генерального распределения, использую критерий Пирсона χ²: А также построены доверительные интервалов для генеральных числовых характеристик параметров.
Необходимо было проверить гипотезы по значениям параметров показателей генеральной совокупности, на основе предварительной статистической проверки.

Задание №1
  1. По каждому набору данных, содержащему значения двух взаимосвязанных статистических признаков (возраст оборудования и эксплуатационные расходы), определить средний возраст оборудования, средние эксплуатационные расходы, среднее квадратическое отклонение для каждого статистического признака. Определить медиану возраста оборудования для каждого набора данных. Сравнить между собой средние значения для всех четырех наборов исходных данных, построив таблицу, позволяющую произвести такое сравнение. Сделать выводы о том, на каком объекте наблюдения старше оборудование и где наиболее высоки эксплуатационные расходы.
  2. Произвести аналитическую группировку статистических данных, выбрав в качестве факторного признака возраст оборудования, результативного признака – эксплуатационные расходы. Для проведения такой группировки рекомендуется создать четыре группы станков по возрасту: от 1 года до 5, от 6 до 10, от 2 до 15, от 15 до 20 (станков старше 20 лет нет ни в одном цехе). В каждой образованной по возрасту группе найти средние по группе эксплуатационные расходы. Результаты группировки представить в табличном виде. Макеты необходимых таблиц приведены в приложении. Эти же данные представить в виде набора из четырех гистограмм, показывающих распределение оборудования по возрасту на каждом из объектов наблюдения. По результатам построения таблиц и гистограмм сделать выводы. Определить моду возраста оборудования для каждого набора данных расчетным путем и графически.
  3. Для каждого набора данных определить коэффициент Фехнера , построить поле корреляции, рассчитать коэффициент корреляции и определить, для какого цеха наблюдается более тесная связь между возрастом оборудования и величиной эксплуатационных издержек. Для каждого объекта получить уравнение линии регрессии, показывающей характер связи между возрастом оборудования и эксплуатационными расходами (связь считать прямолинейной). По полученным уравнениям сделать выводы о том, на каком объекте наблюдения быстрее возрастают с возрастом эксплуатационные расходы.

Задание №2

  1. Размах вариации, среднее линейное отклонение.
  2. Определение среднего уровня рядов динамики.

Задание . Цех завода производит батарейки. Для проверки качества отобрали 30 батареек и подвергли их испытанию на продолжительность работы. Показания снимали с интервалом в 1 час. Оцените качество батареек методом выборочного статистического контроля, сделав необходимые расчеты и построения (ряд распределения, средняя продолжительность работы батареек, мода, медиана, размах, полигон и т.д.).
Рекомендации к решению . см. предыдущий сервис.



Поделиться