본문 바로가기

빅데이터29

ADsP(데이터 분석 준전문가) - 분류분석 및 예측분석 분류분석과 에측분석의 정의 분류분석이란 데이터가 어떤 그룹에 속하는지 예측하는데 사용하는 기법입니다. 클러스터링과 유사하지만, 분류분석은 각 그룹이 정의되어 있습니다. 예측분석은 시계열분석처럼 시간에 따른 값 두 개만을 사용해 앞으로의 매출 또는 온도 등을 예측하는 기법입니다. 모델링을 하는 입력 데이터가 어떤 것인지에 따라 특성이 다르며, 여러 개의 다양한 설명변수가 아니라, 한 개의 설명변수로 이해하는게 옳습니다. 분류분석과 예측분석의 공통점으로는 레코드의 특정 속성값을 미리 알아맞힌다는 점입니다. 반대로 두 분석의 차이점은 분류분석은 레코드의 범주형 속성값을 알아 맞히는 것이고, 예측분석은 레코드의 연속형 속성값을 알아맞힌느 것입니다. 분류분석의 예로는, 학생들의 국어, 수학, 영어 점수를 통해 내.. 2020. 4. 27.
통계 프로그램 - R 프로그래밍 R의 탄생 R은 소스가 오픈된 프로그램으로 통계 및 데이터마이닝과 그래프를 위한 언어입니다. 여러 가지 최신 통계분석과 마이닝 기능을 제공하며, 다양한 기능을 지원하는 패키지가 많고, 수시로 업데이트 되고 있습니다. 또한, 세계적으로 많은 사용자들이 다양한 예제를 공유하여 활용도 측면에서도 매우 높다고 할 수 있습니다. R의 특징 R은 오픈소스 프로그램으로 커뮤니티에 도움 요청이 쉬우며, 많은 패키지가 수시로 업데이트 됩니다. SAS, SPSS와 같이 대용량 설치공간이 필요하지 않고, 오픈소스 프로그램답게 다양한 모듈을 오픈소스로 이용하실 수 있습니다. 또한, 프로그래밍이나 그래픽 측면 등 대부분의 중요한 특징들에서 상용 프로그램들과 대등하거나 월등하다는 큰 장점이 있습니다. 각 세션 사이마다 시스템에 .. 2020. 4. 13.
ADsP(데이터 분석 준전문가) - 암기노트2 데이터 분석 기획 편분석 대상이 정확하게 무엇인지 모르는 경우에는 기존의 분석 방법을 활용하여 통찰을 도출 해냄으로써 문제 도출과 해결에 기여하거나 발견 접근법으로 분석 대상 자체를 새롭게 도출할 수 있습니다.분석 기획의 고려사항 중 복잡하거나 정교한 모형은 장애요소에 해당하지 않습니다.데이터 분석 방법은 충분하게 이해하였으나, 분석 대상이 무엇인지 인지하지 못 하는 유형을 통찰이라고 합니다.ERP, CRM, SCM등은 정형 데이터 휴형의 정보시스템이며, 록 데이터, 모바일 데이터, 센싱 데이터 등은 반정형 데이터 입니다. 영상, 음성, 문자 등은 비정형 데이터 입니다.단계를 순차적으로 진행하는 방법을 폭포수 모델이라고 하며, 이전 단계가 완려 된 후 진행하여야 합니다. 문제가 발견되면 피드백 과정을 수.. 2020. 4. 10.
ADsP(데이터 분석 준전문가) - 암기노트 1 데이터의 이해 편정량적 데이터는 기호, 도형, 수치 등으로 표현되며, 정성적 데이터는 언어, 문자의 형태로 기술됩니다.데이터 내부에 메타 데이터를 가지고 있고, 일반적으로 파일형태로 저장되는 것은 반정형 데이터라고 할 수 있다.데이터 마스킹이란 데이터의 유형, 형식, 길이 등과 같은 속성을 유지하고, 새로운 데이터를 익명으로 생성하는 기술입니다.암묵지와 상호작용은 내면화, 공통화이고 형식지와 상호작용은 연결화, 표출화 입니다.지식은 상호로 연결된 정보 패턴을 습득하여 이를 토대로 예측한 결과물입니다.데이터를 가공하고 처리하여 얻을 수 있는 것을 DIKW(데이터 정보, 지식, 지혜) 라고 하며, 계층적 구조로 피라미드를 형성합니다.산업별 분석 애플리케이션에서 분석 사례 중 에너지는 트레이딩, 긍급/수요 예.. 2020. 4. 9.