회사

검색
  • IMGURU

Unsupervised Learning



A Beginner’s Guide to Unsupervised Learning

지도학습과는 다르게 비지도 학습은 레이블 데이터 셋이 없습니다.

레이블이 없는 경우, 입력된 데이터를 재구성 하거나 임베딩(embedding) 하는 방법을 사용합니다.

컨텐츠

  • - Visualization(시각화)

  • - K-Means Clustering

  • - Transfer Learning

  • - K-Nearest Neighbors

1. Visualization

T-distributed stochastic neighbor embedding(T-SNE) 는 고차원의 데이터를 2차원 또는 3차원으로 축소하는 알고리즘으로 산점도(Scatterplot)로 표현 할 수 있습니다. T-SNE는 데이터의 잠재적   경향을 찾는데              사용됩니다. Deeplearning4j(딥러닝 오픈소스) 는 일부 시각화를 위해 T-SNE에   의존합니다.

랜더링 – Deeplearning4j는 시각적 랜더링을 휴리스특으로 사용하여 신경망이 얼마나 잘 학습되고 있는지     모니터링 합니다. 즉, 랜더링은 디버깅하는 데 사용됩니다. 시간이 지남에 따라 시각화가 얼마나 학습하고     있는지 나타내는 지표 입니다.

2. K-Means Clustering

K-Means는 벡터 공간에서 다른 입력으로부터 원시 거리를 기반으로 활성화 레이블을 자동으로 지정하는 데 사용되는 알고리즘 입니다. 목표 또는 loss function은 없습니다. K-means는 무게중심을 활용합니다.                K-Means 는 모든 데이터 포인트의 반복 된 평균화를 통해 중심을 만듭니다.

K-Means는 주어진 중심에 근접하여 새로운 데이터를 분류합니다. 각 중심은 레이블과 연관되어 있습니다.

3. Transfer Learning

Transfer Learning은 하나의 신경망의 활성화를 가져 와서 다른 알고리즘이나 분류 자의 기능으로 사용 하도록 합니다. 얘를 들어, ImgeNet에서 훈련한 ConvNet의 모델을 가져와서 K-Nearest Neighbor 와 같은 다른    알고리즘으로 새로운 이미지를 전달 할 수 있습니다. Transfer Learning의 엄격한 정의는 단지 하나의            데이터 집합에 대해 훈련된 모델을 가져 와서 다른 문제에 꽂는 것입니다.

4. K-Nearest Neighbors

Mike Depies는 Deeplearning4j와 K-Nearest Neighbor 를 결합하는 방법의 튜토리얼을 만들 었습니다.

이 알고리즘은 분류 및 회귀의 목적으로 사용되며 kd 트리를 사용합니다. Kd 트리는 k 번째 차원 공간에서      점의 유한한 세트를 저장하는 데이터 구조입니다. 그것은 임의의 차원의 공간을 나무로 나누며 이를 유리한      지점 트리라고 합니다. Kd-tree는 트리 구조로 공간을 세분하고 트리를 탐색하여 가장 가까운 점을 찾습니다. 가장 가까운 점과 연관된 레이블이 입력에 적용됩니다.

조회 2회

최근 게시물

전체 보기

기술적 특이점

특이점이란 개념은 수학, 물리학에서 존재하는 개념이다. 1. 특이점(singularity) - 수학: 분수의 분모가 제로에 근접함에 따라 무한대로 발산되는 지점 - 물리학: 광속도로 이동하는 빛조차도 탈출할 수 없는 블랙홀의 경계에 존재하는 사건의 지평선(event horizon) 2. 기술적 특이점 - 영국 옥스포드 사전에 정의된 특이점이란 “인공지능을

© 2020 by IMGURU, Inc. All rights reserved.