1 февр. 2009 г.

01. Просто R – Использование R для ознакомительной статистики

Этим постом я открываю серию моих переводов из учебного пособия "Просто R – Использование R для ознакомительной статистики" американского автора John'a Verzani.
http://www.math.csi.cuny.edu/Statistics/R/simpleR

Предисловие автора

Эти заметки являются введением в использование статистического програмного пакета R в ознакомительном курсе статистики. Они должны сопровождать учебник, например такой как Kitchens «Exploring Statistics». Их целью было не столько показать все особенности R или заменить стандартное руководство к нему, но скорее быть полезным вместе с руководством, для того чтобы проиллюстрировать те особенности R, которые можно изучить за один семестр вводного курса статистики.

Эти заметки были написаны с учётом преимуществ версии R 1.5.0 или более поздней. Из учебных соображений знак равенства, =, используется как оператор присвоения (an assignment operator) вместо традиционной стрелки <-. Это было добавлено в R в версии 1.4.0. Если же читателю доступна лишь более старая версия, то он должен будет вводить небольшие поправки.
В этом тексте я буду несколько раз ссылаться на данные и функции, которые надо установить, прежде чем ими пользоваться. Сделать это несложно, но инструкции будут отличаться в зависимости от вашей операционной системы. Пользователям Windows нужно загрузить «zip»-файл, после чего установить его из меню «Программы». В UNIX следует использовать комманду

R cmd install имя-пакета.tar.gz

Некоторые из наборов данных я позаимствовал у других авторов, особенно у Kitchens. Более подробно это описано в help-файлах каждого набора данных. Все эти материалы доступны как R-пакеты по адресам:

http://www.math.csi.cuny.edu/Statistics/R/simpleR/Simple 0.4.zip для пользователей Windows
http://www.math.csi.cuny.edu/Statistics/R/simpleR/Simple 0.4.tar.gz для пользователей UNIX

Кроме этого, отдельные наборы данных можно скачать по адресу:
http://www.math.csi.cuny.edu/Statistics/R/simpleR/Simple

Это версия 0.4 заметок, от 22 августа 2002 года.
Copyright c John Verzani (verzani@math.csi.cuny.edu), 2001-2. All rights reserved.


Раздел 1: Введение
Что такое R

Эти заметки описывают, как пользоваться R при изучении вводного курса статистики. Моей целью было упростить освоение этой превосходной программой на «низкоуровневых» курсах, где часто пользуются такими пакетами как MINITAB, SPSS, Excel и др. Я предполагаю, что читатель к этому моменту уже усвоил курс «начальных вычислений» (pre-calculus course). Надеюсь, что студенты, увидев на этом начальном этапе, как пользоваться R, будут лучше разбираться в статистических вопросах и извлекут значительно большую пользу из более сложных программ.

Преимуществами R для начинающих являются:
• R — свободен и бесплатен. R относится к категории «open-source» и его можно запускать под UNIX, Windows и Macintosh.
• у R есть отличная встроенная система помощи.
• у R превосходные визуализационные возможности.
• студенты могут легко перейти от R к коммерческой программе S-Plus, если возникнет потребность.
• язык R обладает мощным, лёгким в изучении синтаксисом с огромным количеством встроенных статистических функций.
• этот язык легко расширить функциями, написанными самим пользователем.
• R — это язык компьютерного программирования. Для программистов он покажется более знакомым, чем для других, особенно для начинающих пользователей; однако после него перейти к программированию будет намного легче.

В чём же R проигрывает по сравнению с другими программными продуктами?
• у него очень ограниченный графический интерфейс (даже у S‑Plus он значительно лучше). Это значит, что R сложнее учить на первых порах.
• у него нет коммерческой поддержки (хотя некоторые говорят, что международная рассылка, в которой обсуждаются проблемы R, даже лучше).
• командный язык R — это язык программирования, поэтому студенты должны чётко владеть, к примеру, вопросами его синтаксиса.

R является «open-source» (по лицензии GPL) статистическим окружением, сделанным по образцу языков S и S‑Plus (http://www.insightful.com). Язык S был разработан в конце 1980х в лабораториях компании AT&T. Проект R был начат Робертом Джентельменом (Rober Gentleman) и Россом Игакой (Ross Ihaka) с факультета статистики Оклендского университета (Statistics Department of the University of Auckland) в 1995м. Проект сразу получил широкое признание. Он по сию пору поддерживается Командой развития R (R core-development team), состоящей из интенсивно работающего, международного коллектива добровольных разработчиков. Интернет-страница проекта R (http://www.r-project.org) является основным информационным ресурсом по R. На этом сайте можно получить как саму программу R, так и дополнительные пакеты, а также познакомиться с соответствующей документацией.

Комментариев нет: