Календарный план (весна 2020) |
|
Задание № 1. «Основные приемы работы в R» |
| |
Цель: освоить приемы работы в R (типы переменных, вычисления и визуализация данных).
- Установить R и RStudio на свой персональный компьютер
- Прочитать разделы пособия Наглядная статистика. Используем R! (Шипунов и др, 2014)
Глава 2. Как обрабатывать данные
2.3. Из истории S и R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4. Применение, преимущества и недостатки R . . . . . . . . . 25
2.5. Как скачать и установить R. . . . . . . . . . . . . . . . . . . . . 27
2.6. Как начать работать в R . . . . . . . . . . . . . . . . . . . . . . . 28
Приложение А. Пример работы в R . . . . . . . . . . . . . . . . 196-206
- Открыть в RStudio скрипт R_intro_2016.R. Сохранить файл данных MET_points_2014.txt на диск персонального компьютера
- Последовательно выполнить команды, критически читая комментарии.
Задание № 2. «Анализ данных в R. Землетрясения» |
| |
Цель: провести средствами R статистическую проверку Н0: среднемноголетнее число землетрясений с магнитудой больше 7 по месяцам не различается. Источник данных: The Significant Earthquake Database.
- инструкция к выполнению задания
- zip-архив с комплектом материалов
Задание № 3. «Анализ данных в R. Почвы Стрелецкой лесостепи.» |
| |
Цель: средствами R подготовить полевые и лабораторные данные к анализу закономерности изменчивость почв северной лесостепи Среднерусской возвышенности.
- инструкция к выполнению задания
- zip-архив с комплектом материалов
Задание № 4. «AQP - визуализация и анализ почвенных профилей» |
| |
Цель: визуализировать профили почв, провести их сравнение и анализ.
- посетить тематическую страницу Algorithms for Quantitative Pedology project (AQP), познакомиться в возможностям пакета
- построить профили таксонов двух близких типов почв (например, черноземов и лугово-черноземных почв) по Классификации почв СССР (1977) согласно их характеристикам в Едином Государственном Реестре Почвенных Ресурсов России (ЕГРПР) средствами AQP (скрипт R_AQP_SoilProfiles.R)
- визуализировать вертикальный профиль гумуса и плотности черноземов Центрально-Черноземного заповедника
- инструкция к выполнению задания
- zip-архив с комплектом материалов
- набор данных "Осиновый куст"
- набор данных "Центрально-Лесной заповедник"
Задание № 5. «Моделирование почвенно-ландшафтных связей» |
| |
Упражнение демонстрирует порядок построения модели почвенно-ландшафтных связей (ПЛС) для номинальных категорий почвенной классификации с использованием инструментов статистического анализа и машинного обучения в среде R: линейного дискриминантного анализа (linear discriminant analysis), ансамбля деревьев решений (Random Forest) и метода опорных векторов (supported vector machine).
Последовательно решаются задачи:
- загрузить и визуализировать исходные данные почвенно-топографической съемки;
- провести предварительный экспертный и количественный анализ положения почв в пространстве факторов (оценить информативность индикационных переменных);
- построить модели почвенно-ландшафтных связей по обучающей выборке с использованием трех методов;
- на основе модели построить прогнозную карту;
- оценить неопределенности разных моделей и сравнить их друг с другом.
- инструкция к выполнению задания
- zip-архив с комплектом материалов
ЛИТЕРАТУРА и СПРАВОЧНЫЕ МАТЕРИАЛЫ |
| |
http://ashipunov.info/shipunov/school/books/rbook.pdf - "Наглядная статистика. Используем R!" - основное учебное пособие к освоению дисциплины. В практических заданиях указываются тематические разделы, обязательные для прочтения.
http://r-analytics.blogspot.ru - примеры анализа и визуализации данных при помощи R, а также переводы документации по этой программе
http://www.statmethods.net/ - сжатое справочное пособие для работы в R.
http://www.r-graph-gallery.com - лучшие примеры визуализации данных средствами R. Выбираем нужный график-карту-схему и смотрим его код.
Тематические сообщеста в Google+ (присоединяйтесь и следите за новостями):
https://plus.google.com/u/0/communities/115516770321395255377 - R Programming for Data Analysis
https://plus.google.com/u/0/communities/117681470673972651781 - Statistics and R
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ |
| |
В качестве инструментов пространственного анализа используются компьютерные программы, бесплатные для некоммерческого использования и обладающие необходимой функциональностью при относительной простоте использования.
|
R - свободная программная среда вычислений для статистической обработки данных, работы с графикой, цифровой картографии и моделирования
|
|
RStudio - is an integrated development environment (IDE) for R. It includes a console, syntax-highlighting editor that supports direct code execution, as well as tools for plotting, history, debugging and workspace management.
|
|
Quntum GIS (QGIS) - дружественная к пользователю cвободная географическая информационная система с открытым кодом, распространяющаяся под GNU General Public License. QGIS является проектом Open Source Geospatial Foundation (OSGeo). Она работает на Linux, Unix, Mac OSX, Windows и Android, поддерживает множество векторных, растровых форматов, баз данных и обладает широкими возможностями. |
|
System for Automated Geoscientific Analyses (SAGA) - одно из лучших некоммерческих средств анализа пространственно распределенных данных (ГИС-операции, геостатистика, морфометрический анализ ЦМР, тематический анализ аэрокосмической снимков и др.). Программа разрабатывается под руководством Джергена Бохнера (Juergen Böhner) и Олафа Конрада (Olaf Conrad) в Университете Гамбурга (отдел физической географии Института географии и Klimacampus, Германия). Распространяется по GNU Lesser General Public License (LGPL). |
|
Программа Gimp 2 - полнофункциональный графический редактор с русским интерфейсом и возможностями, не уступающими Adobe Photoshop. |
|
Программа ImageJ - графический редактор c возможностями количественного анализа изображений. |
[09.12.16]
доцент Д.Н. Козлов
|