Unsupervised Learning

A Beginner’s Guide to Unsupervised Learning
지도학습과는 다르게 비지도 학습은 레이블 데이터 셋이 없습니다.
레이블이 없는 경우, 입력된 데이터를 재구성 하거나 임베딩(embedding) 하는 방법을 사용합니다.
컨텐츠
- Visualization(시각화)
- K-Means Clustering
- Transfer Learning
- K-Nearest Neighbors
1. Visualization
T-distributed stochastic neighbor embedding(T-SNE) 는 고차원의 데이터를 2차원 또는 3차원으로 축소하는 알고리즘으로 산점도(Scatterplot)로 표현 할 수 있습니다. T-SNE는 데이터의 잠재적 경향을 찾는데 사용됩니다. Deeplearning4j(딥러닝 오픈소스) 는 일부 시각화를 위해 T-SNE에 의존합니다.
랜더링 – Deeplearning4j는 시각적 랜더링을 휴리스특으로 사용하여 신경망이 얼마나 잘 학습되고 있는지 모니터링 합니다. 즉, 랜더링은 디버깅하는 데 사용됩니다. 시간이 지남에 따라 시각화가 얼마나 학습하고 있는지 나타내는 지표 입니다.
2. K-Means Clustering
K-Means는 벡터 공간에서 다른 입력으로부터 원시 거리를 기반으로 활성화 레이블을 자동으로 지정하는 데 사용되는 알고리즘 입니다. 목표 또는 loss function은 없습니다. K-means는 무게중심을 활용합니다. K-Means 는 모든 데이터 포인트의 반복 된 평균화를 통해 중심을 만듭니다.
K-Means는 주어진 중심에 근접하여 새로운 데이터를 분류합니다. 각 중심은 레이블과 연관되어 있습니다.
3. Transfer Learning
Transfer Learning은 하나의 신경망의 활성화를 가져 와서 다른 알고리즘이나 분류 자의 기능으로 사용 하도록 합니다. 얘를 들어, ImgeNet에서 훈련한 ConvNet의 모델을 가져와서 K-Nearest Neighbor 와 같은 다른 알고리즘으로 새로운 이미지를 전달 할 수 있습니다. Transfer Learning의 엄격한 정의는 단지 하나의 데이터 집합에 대해 훈련된 모델을 가져 와서 다른 문제에 꽂는 것입니다.
4. K-Nearest Neighbors
Mike Depies는 Deeplearning4j와 K-Nearest Neighbor 를 결합하는 방법의 튜토리얼을 만들 었습니다.
이 알고리즘은 분류 및 회귀의 목적으로 사용되며 kd 트리를 사용합니다. Kd 트리는 k 번째 차원 공간에서 점의 유한한 세트를 저장하는 데이터 구조입니다. 그것은 임의의 차원의 공간을 나무로 나누며 이를 유리한 지점 트리라고 합니다. Kd-tree는 트리 구조로 공간을 세분하고 트리를 탐색하여 가장 가까운 점을 찾습니다. 가장 가까운 점과 연관된 레이블이 입력에 적용됩니다.