R의 탄생
R은 소스가 오픈된 프로그램으로 통계 및 데이터마이닝과 그래프를 위한 언어입니다. 여러 가지 최신 통계분석과 마이닝 기능을 제공하며, 다양한 기능을 지원하는 패키지가 많고, 수시로 업데이트 되고 있습니다. 또한, 세계적으로 많은 사용자들이 다양한 예제를 공유하여 활용도 측면에서도 매우 높다고 할 수 있습니다.
R의 특징
R은 오픈소스 프로그램으로 커뮤니티에 도움 요청이 쉬우며, 많은 패키지가 수시로 업데이트 됩니다. SAS, SPSS와 같이 대용량 설치공간이 필요하지 않고, 오픈소스 프로그램답게 다양한 모듈을 오픈소스로 이용하실 수 있습니다.
또한, 프로그래밍이나 그래픽 측면 등 대부분의 중요한 특징들에서 상용 프로그램들과 대등하거나 월등하다는 큰 장점이 있습니다. 각 세션 사이마다 시스템에 데이터셋을 저장하므로 할 때 마다 데이터를 로딩할 필요가 없고, 명령어 스토리도 저장이 가능합니다.
모든 운영체제에서 사용이 가능하며, S 통계 언어를 기반으로 구현됩니다. 그리고, 통계 가능 뿐만 아니라 일반 프로그래밍 언어처럼 자동화하거나 새로운 함수를 생성하여 사용이 가능하고, 분석 결과를 활용하기 위해서는 별도의 작업이 필요한 다른 프로그램과는 달리 추정계수, 잔차, 표준오차 등 결과값을 객체에 저장하여 원하는 부분을 호출해 쉽게 활용이 가능합니다.
이는 더욱 깔끔하고 단축된 코드이며, 매우 빠른 코드 진행 속도, 단순한 코드로 디버깅 노력 감소, 병렬 프로그래이밍으로의 전화나이 더욱 용이하다는 많은 장점을 보유하고 있습니다.
R스튜디오
R스튜디오 또한 오픈소스이며 다양한 운영체계를 지원합니다. 메모리에 변수가 어떻게 되어 있는지, 타입이 무엇인지 등을 볼 수 있고, 스크립트 관리 및 도큐먼테이션이 편리합니다.
코딩을 해야하는 부담이 있지만, 스크립트용 프로그래밍으로 쉽게 자동화가 가능합니다. 래틀은 GUI가 패키지와 긴밀하게 결합되어 있어 정해진 기능만 사용 가능하여 업그레이드가 제대로 되지 않으면 통합성에 문제가 발생할 수 있습니다.
R 기반의 작업 환경
작업환경은 업무 규모와 본인에게 익숙한 환경을 파악하여 선택하도록 해야 합니다. 기업환경에는 64bit 환경의 듀얼코어, 32GB RAM, 2TB 디스크, 리눅스 운영체제를 추천합니다.
R의 메모리
64bit 유닉스 환경 : 메모리 무제한
x86 64bit 환경 : 128TB 까지 지원
64bit 윈도우 환경 : 8TB 까지 지원
R 및 R스튜디오 다운로드
R은 https://www.r-project.org/ 에서 다운받을 수 있으며, 본인의 컴퓨터 운영체제에 맞게 다운로드 해야 합니다. 언어 또한 여러가지 언어가 지원되니 원하는 언어로 선택하시고 설치 해 주시면 됩니다.
R 스튜디오는 https://rstudio.com/ 에서 다운 받을 수 있습니다. R 스튜디오의 경우 무료로 사용 할 수 있는 제품과, 유료로 사용하는 제품으로 나누어져 있습니다. 유료 프로그램의 경우는 개발에 따른 직접 문의가 가능하여 보다 상업적으로 이용할 수 있습니다. R스튜디오 역시 자신의 운영체제에 맞게 선택하여 다운받아 주시고, 자신의 기호에 맞게 설정을 변경하여 사용해 주시면 됩니다.
'빅데이터' 카테고리의 다른 글
ADsP(데이터 분석 준전문가) - 앙상블 분석 (0) | 2020.04.27 |
---|---|
ADsP(데이터 분석 준전문가) - 분류분석 및 예측분석 (0) | 2020.04.27 |
ADsP(데이터 분석 준전문가) - 암기노트2 (0) | 2020.04.10 |
ADsP(데이터 분석 준전문가) - 암기노트 1 (0) | 2020.04.09 |
ADsP(데이터 분석 준전문가) - 데이터 분석 기법 (0) | 2020.04.09 |
댓글