adsp (3) 썸네일형 리스트형 ADSP PART 3. 데이터 분석 배깅 여러개의 붓스트랩 자료를 생성하고 각 붓스트랩 자료에 예측 모형을 만든 후 결합하여 최종 예측 모형을 만드는 방법 붓스트랩은 주어진 자료에서 동일한 크기의 표본을 랜덤 복원추출로 뽑은 자료 보팅은 여러개의 모형으로 부터 산출된 결과를 다수결에 의해서 최종결과를 선정 배깅에서는 가지치기를 하지 않고 최대로 성장한 의사결정 나무들을 활용 훈련 자료를 모집단으로 생각하고 평균예측모형을 구하여 분산을 줄이고 예측력을 향상시킬수 있다. 부스팅 예측력이 약한 모형들을 결합하여 강한 예측 모형을 만드는 방법 Adaboost는 이진 분류 문제에서 랜덤 분류기보다 조금 더 좋은 분류기 n개에 각각 가중치를 설정하고 n개의 분류기를 결합하여 최종분류기를 만드는 방법 제안 랜덤포레스트 배깅과 부스팅보다 더 많은 무작위.. ADSP PART 2. 데이터 분석 기획 요약 정리 분석 대상과 방법 분석의 대상 (what) known unknown optimization insight known 분석의 방법 solution discovery unknown 방법론의 적용업무의 특성에 따른 모델 1. 폭포수 모델 : 단계를 순차적으로 진행하는 방법, 이전 단계가 완료되어야 다음 단계로 진행가능 2. 프로토타입 모델 : 폭포수 모델의 단점을 보완하기 위해 점진적으로 시스템을 개발해 나가는 접근 방식, 일부분을 우선 개발하여 사용자에게 제공 3. 나선형 모델 : 반복을 통해 점증적으로 개발하는 방식 관리 체계를 효과적으로 갖추지 못한 경우 복잡도가 상승하여 프로젝트 진행이 어려울 수 있다. KDD 분석 방법론 프로파일링 기술을 기반으로 데이터로부터 통계적 패턴이나 지식을 찾기 위해 활용할.. ADSP PART 1. 데이터의 이해 요약 정리 데이터의 유형 정성적 데이터 언어, 문자 저장, 검색, 분석에 많은 비용 소모 정량적 데이터 수치, 도형, 기호 비용소모 적음 지식경영의 핵심 이슈 암묵지 겉으로 드러나지 않는 지식 김장김치 담그기, 자전거 타기 다른 사람에게 공유되기 어려움 공통화, 내면화 형식지 형상화 된 지식 교과서, 비디오, DB 전달과 공유가 용이함 표출화, 연결화 ex) 암묵지 : 개인에게 축적된 내면화 된 지식 -> 조직의 지식으로 공통화 형식지 : 언어, 기호, 숫자로 표출화 된 지식 -> 개인의 지식으로 연결화 DIKW 피라미드 데이터 : A 마트는 100원에 B 마트는 200원에 연필을 판매 정보 : A 마트의 연필이 더 싸다 지식 : 상대적으로 저렴한 A 마트에서 연필을 사야겠다 지혜 : A 마트의 다른 상품들도 B .. 이전 1 다음