R (програмски језик)
R је програмски језик и програмско окружење за статистичке израчуне и графике. Он је изведен из програмског језика S са лексичком семантиком инспирисаном Scheme-ом. R су створили Рос Ихака и Роберт Џентлмен[2] на Аукланд универзитету (University of Auckland), Нови Зеланд, а сад га развија R Development Core Team. Назван је делимично према именима аутора, а делом као игра речи на име S.[3]
R | |
---|---|
Модел | 3.3.2 |
Појавио се | 1993.[1] |
Аутор(и) | R Development Core Team |
Дизајнер(и) | Ross Ihaka и Robert Gentleman |
Датум актуелне верзије | 31. октобар 2016. године |
Утицаји | S |
Оперативни системи | Cross-Platform |
Лиценца | GNU General Public License |
Веб-сајт | http://www.r-project.org/ |
Језик R је постао стандард међу статистичарима који развијају статистички софтвер,[4][5] и широко је коришћен за развој статистичког софтвера и анализу података.[5]
R је део ГНУ пројекта.[6] Његов изворни код је слободан и под условима које даје ГНУ-ова општа јавна лиценца, а прекомпилиране бинарне верзије су обезбеђене за различите оперативне системе. R користи интерфејс командне линије, кроз више графичких корисничких окружења.
Историја
R је имплементација програмског језика S помешаног са програмским језиком Scheme.[7] Језик S je направио Џон Чемберс док је радио за Белове лабораторије. Има великих промена у R, али ипак велики део S кода ради и у R.[8]
Пројекат је настао 1992. године, прва верзија је изашла 1995. године док је стабилна бета верзија изашла 2000. године.[9][10][11]
Особине
R обезбеђује широк избор статистичких (линеарних и нелинеарних модела, класичних статистичких тестова, анализа временских серија, класификација, кластери, и остало) и графичких техника. R, је слично као S, пројектован као прави програмски језик, и омогућава корисницима додатну функционалност дефинисањем нових функција. Постоји више важних разлика, али доста кода може бити искориштен као S, непромењен. Много R-овог система је такође писана у овом језику, што га чини лакшим за кориснике при формирању алгоритама. Код захтевних задатака, C, C++ и Фортран код може бити повезан и покренут. Напредни корисници могу писати C код за манипулисање R-ових објеката директно.
R може бити проширен, кроз пакете обезбеђене од корисника, за специфичне функције или специфичне области проучавања. Због свог S наслеђа, R има бољу подршку за Објектно-оријентисано програмирање него остали статистички програмски језици. Проширивост R-а је олакшана и његовим попустљивим језичким опсегом.[12]
Следећа предност R-а су његове графичке могућности, које обезбеђују графике квалитета довољно доброг за публиковање који укључују математичке симболе. R има сопствени LaTeX-олики формат докумената, који се користи за представљање свеобухватне документације, преко интернета у бројним форматима или као штампана копија.
Иако је R претежно кориштен од статистичара и практичара који захтевају окружење за статистичке прорачуне и развој софтвера, такође може бити кориштен као општи алат за израчунавање матрица учинка упоредивог са оним од ГНУ Октава и његовог власничког конкурента, MATLAB.[13]RWeka[14] сучеље је додато популарном софтверу за излучивање података Weka које дозвољава могућност уписа и читања у arff формату који даље омогућава кориштење могућности програма.
Примери
Следећи примери илуструју основе синтаксе језика и кориштење командне линије.
> x <- c(1,2,3,4,5,6) # Create ordered collection> y <- x^2 # Square the elements of x> mean(y) # Calculate arithmetic mean of y[1] 15.16667> var(y) # Calculate sample variance[1] 178.9667> summary(lm(y ~ x)) # Fit a linear regression modelCall:lm(formula = y ~ x)Residuals:1 2 3 4 5 63.3333 -0.6667 -2.6667 -2.6667 -0.6667 3.3333Coefficients:Estimate Std. Error t value Pr(>|t|)(Intercept) -9.3333 2.8441 -3.282 0.030453 *x 7.0000 0.7303 9.585 0.000662 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 3.055 on 4 degrees of freedomMultiple R-squared: 0.9583,Adjusted R-squared: 0.9478F-statistic: 91.88 on 1 and 4 DF, p-value: 0.000662> par(mfrow=c(2, 2)) # Request 2x2 plot layout> plot(lm(y ~ x)) # Diagnostic plot of regression model
useR! конференције
Званично окупљање корисника R-а зове се "useR!".[15]
Прва конференција, useR! 2004 Архивирано на сајту Wayback Machine (14. септембар 2013), одржана је у мају 2004. године у Бечу у Аустрији.[16] Конференција се од 2006. године одржава годишње, углавном наизменично у земљама Европе и Северне Америке.[17]
Од тада су одржане следеће конференције: [15]
- useR! 2006, Беч, Аустрија
- useR! 2007, Амес, Ајова, САД Архивирано на сајту Wayback Machine (31. октобар 2016)
- useR! 2008, Дортмунд, Немачка
- useR! 2009, Рен, Француска Архивирано на сајту Wayback Machine (6. децембар 2016)
- useR! 2010, Гејтерсбург, Мериленд, САД
- useR! 2011, Ковентри, Уједињено Краљевство
- useR! 2012, Нешвил, Тенеси, САД Архивирано на сајту Wayback Machine (3. новембар 2016)
- useR! 2013, Албасете, Шпанија Архивирано на сајту Wayback Machine (3. новембар 2016)
- useR! 2014, Лос Анђелес, САД
- useR! 2015, Олборг, Данска
- useR! 2016, Станфорд, Калифорнија, САД
Види још
- Листа статистичких пакета
- Поређење статистичких пакета
Референце
Литература
- Kurt Hornik. The R FAQ: Why is R named R?. ISBN 978-3-900051-08-2. Приступљено 29. 1. 2008.