회사

검색
  • IMGURU

Random Forest



Random Forest

랜덤포레스트는 많은 결정 트리(Decision tree)로 이루어져 있습니다. 그것들은 결정 트리의 앙상블이며,       각 결정 트리는 주어진 모집단을 분류하는 데 사용 된 속성의 하위 집합을 사용 하여      만들어 집니다. 이러한 결정 트리는 입력 데이터의 인스턴스를 분류하는 방법에 대해 투표하고, 랜덤포레스트가 최상의 예측을 선택하기 위해 해당 투표를 ‘bootstrap’ 합니다. 이는 결정 트리의     단점인 ‘overfit(과적합)’ 상태를 방지하기 위해 수행됩니다.

랜덤 포레스트는 지도 학습 분류 알고리즘입니다. 그것은 Forest(결정 트리들)를 만들고 노드를   내려서          무작위로 나눕니다. Forest에 결정 트리가 많을수록 더 좋은 결과를 만들어 낼 수 있습니다.

대상 및 기능이 포함된 훈련 데이터 세트를 결정 트리에 입력하면 예측을 수행하는 데 사용 할 수 있는 규칙      집합이 공식화 됩니다.

예 : 당신의 e-commerce 웹 사이트 방문자가 미스터리 소설을 즐기는 지에 대한 예측을 하고 싶을 때 먼저     읽고 좋아했던 과거 책에 대한 정보를 수집하세요. 페이지수, 작가, 출판일, 해당   시리즈의 부분 등 결정 트리에는 해당 기능에 적용되는 규칙들이 있습니다. 예를 들면 아주 긴 책을 좋아하는 독자도 있고 그렇지 않은      독자도 있습니다. 새로운 소설에 대한 메타 데이터를 입력하면 해당 웹 사이트 방문자가 해당 소설을 원할      것인지 아닌지에 대한 예측이 가능합니다. 노드를 정렬하고 규칙을 정의하는 것은 Gini-Index 계산에              의존합니다. 랜덤 포레스트는 루트 노드를 찾고 해당 노드를 임의로 분할합니다.

조회 27회

최근 게시물

전체 보기

기술적 특이점

특이점이란 개념은 수학, 물리학에서 존재하는 개념이다. 1. 특이점(singularity) - 수학: 분수의 분모가 제로에 근접함에 따라 무한대로 발산되는 지점 - 물리학: 광속도로 이동하는 빛조차도 탈출할 수 없는 블랙홀의 경계에 존재하는 사건의 지평선(event horizon) 2. 기술적 특이점 - 영국 옥스포드 사전에 정의된 특이점이란 “인공지능을

© 2020 by IMGURU, Inc. All rights reserved.