ПРОГРАММЫ УЧЕБНЫХ ДИСЦИПЛИН
ПРОГРАММА КУРСА
МЕТОДЫ АНАЛИЗА ГЕОГРАФИЧЕСКИХ ДАННЫХ
2 курс, осенний семестр

Цель курса.

Освоение базовых представлений, понятий и методов анализа данных при непосредственном использовании стандартных пакетов программ, реализованных на компьютере. Базовый пакет программ для обучения: STATISTICA 6.0.


Лекция 1.

Понятия о географических данных. Формы сбора информации. Понятие элементарного объекта, как случайное событие. Понятие переменных. Способы измерения переменных: количественные, квалиметрические, групповые. Понятие состояния и процесса. Организация совокупности наблюдений в базы данных. Простейшая база данных DBASE (Ребус).

    Основная цель анализа данных:
  1. выявление порядка в отношениях между состояниями перемен-ных как между собой, так и в пространстве и во времени. Отображение процесса на основе совокупности измерений. Формулировка гипотез о возможных механизмах, ответственных за существующий порядок.
  2. проверка истинности (выявление области существования) априорных гипотез о порядке отношений в объекте исследования.
  3. построение статистических моделей отношений для решения прикладных задач географии.

Лекция 2.

Представления о случайном событии и случайном процессе. Общее правило выявления порядка: сравнение реальных отношений с гипотетическим хаосом. Основные понятия теории вероятностей. Событие, случайное событие, пространство случайных событий, вероятность аксиома произведения, объединения, дополнения независи-мых событий, условная вероятность. Представления о распределении. Модель биномиального распределения. Закон больших чисел. Эксперименты с биномиальным распределе-нием на компьютере.


Лекция 3.

Основные дискретные распределения и порождающие их модели. Эксперименты на компьютере с дискретными распределениями. Области применения дискретных распределений. Сравнение распреде-лений построенных с помощью рандомизатора с моделями. Демонстрация факта неполного соответствия реальной случайной рандомизированной выборки с заданными параметрами, теоретически ожидаемому распределению. Понятие генеральной совокупности, выборки и ожидаемого значения параметров в противопоставлении к реально существующим в природе. Трактовка имитации выборки на компьютере как аналога выборки из природы. Демонстрация действия закона больших чисел, экспериментальная проверка сходимости значений выборочных параметров к заданным как функции объема выборки.


Лекция 4.

Представления о непрерывных распределениях и порождающих моделях процессов. Представления о параметрах распределения: среднее, медиана, мода, среднее геометрическое, дисперсия, среднеквадра-тическое отклонение, коэффициент вариации, коэффициент асимметрии и эксцесса. Уточнение представления о выборочных оценках. Исследо-вание природы ошибок. Различия между случайной ошибкой и искажением. Эксперименты с распределениями, генерируемыми на компьютере и по реальным данным (климатические ряды).


Лекция 5.

Представления о риске (вероятности) ошибки при проверке гипотезы. Принципы конструирования теоретических распределений описывающих вероятность ошибок при проверке гипотез. Демонстрация распределения Стьюдента и хи-квадрат распределения. Исследование на компьютере типа распределений реальных данных. Содержательная трактовка распределений реальных данных и прогноз вероятности событий с заданной величиной и наоборот, значений событий по заданной вероятности.


Лекция 6.

Оценка параметров распределения на компьютере. Физическая трактовка полученных оценок. Сравнение достоверности различий выборочных средний и дисперсией. Эксперименты с реальными данными, анализ графических изображений. Визуальные методы оценки принадлежности распределения к нормальному. Трансформация данных.


Лекция 7.

Сумма дисперсии случайных величин. Представления об одновариантном дисперсионном анализе (ANOVA). Осуществление дисперсионного анализа на компьютере. Трактовка графических изображений и таблиц.


Лекция 8.

Представления о многомерном распределении. Двухмерное распределение и его параметры. Понятие ковариации как параметров распределения. Моделирование на компьютере формы нормальных распределений при изменении их параметров. Оценки корреляции для реальных данных. Корреляция как мера связи. Трактовка корреляций при сравнении месячных рядов наблюдений для осадков и температур за сто лет наблюдений. Визуальное выделение периодов со стационарными режимами циркуляции.


Лекция 9.

Основы регрессионного анализа. Связь регрессии с корреляцией. Сущность метода наименьших квадратов. Линейные модели одномерной регрессии. Связь формы распределения и оценки параметров регрессии. Демонстрация необходимости нормализации выборки. Построение реальных уравнений регрессии для четырех основных моделей. Физическая трактовка уравнений регрессии.


Лекция 10.

Модели множественной регрессии. Сущность метода. Исследование реальных данных. Сравнение методов “назад” и “вперед”. Влияние на результаты пороговых значений F-критерия. Анализ качества результатов.


Лекция 11.

Основы анализа временных рядов. Понятие о стационарном процессе. Тестирование временного ряда. Понятие об автокорреляции. Понятие о периодограмме и спектре. Выделение трендов и сезонных составляющих. Способы фильтрации составляющих ряда. Трактовка методов анализа временных рядов при исследовании пространственных структур.


Лекция 12.

Оценка параметров временного ряда. Авторегрессионный анализ временного ряда. Исследование реальных климатических и пространственных рядов.


Лекция 13.

Общие представления о непараметрических методах статистического анализа. Основная нулевая гипотеза непараметрических методов. Непараметрические методы при сравнении выборок. Ранговые коэффициенты корреляции и другие непараметрические методы оценки связи. Непараметрический дисперсионный анализ.


ЛИТЕРАТУРА
  • Боровиков В. П., Боровиков И. П.. STATISTICA Статистический анализ и обработка данных в среде Windows. М.:Информационно-издательский дом ФИЛИНЪ, 1997, 592 с.
  • Корн Г., Корн Т.. Справочник по математике. М.: Изд-во НАУКА, 1970, 720 с.
  • Сошников Л. А., Тамашевич В. Н., Уебе Г., Шеффер М. Многомерный статистический анализ в экономике. ЮНИТИ. М. 1999, 598 с.
  • Тюрин Ю. Н., Макаров А. А. Анализ данных на компьютере. Изд-во Финансы и статистика, ИНФРА*М, М. 1995, 384 с.

Программу составил:
профессор Ю. Г. Пузаченко