[Microsoft Azure] Azure Machine Learning

 

Azure에서는 데이터를 가지고 ML 모델을 실습해볼 수 있는 Azure Machine Learning을 제공한다.

 

etc-image-0

 

 

컨테이너 레지스트리는 자동으로 만들어지지 않아서 직접 생성

(이름 중복되면 안 된다)

SKU는 "기본"이 가장 작은 것

 

etc-image-1

 

 

배포가 완료되면 스튜디오로 가서 컴퓨팅 인스턴스를 만들어준다

가상 머신 이름은 고유해야 함

 

etc-image-2

 

파이프라인을 만들어서 해보자

 

etc-image-3

 

 

데이터를 추가해준다

넷상의 web파일을 사용할 거면 csv raw 파일 링크를 정확히 입력해주자

 

etc-image-4

 

 

 

왼쪽 메뉴의 구성 요소에서 필요한 작업을 골라서

드래그앤드랍 하는 형태로 데이터 전처리 등의 작업이 가능하다

 

etc-image-5

 

더블클릭해서 선택할 열 등의 세부 정보를 넣어줄 수 있다.

 

 

etc-image-6

 

런타임 설정에서 오류가 나는 경우 위에서 만든 컴퓨팅 인스턴스를 직접 설정해 준다.

 

etc-image-7

 

 

값 누락 전처리: Clean Missing Data

대체 모드 등 선택 가능하다

 

etc-image-8

 

 

Edit Metadata: 일부 속성의 데이터형을 변경할 수 있다. (e.g., 0, 1값을 numeric에서 boolean으로 변환)

Split Data: 훈련 데이터와 평가 데이터로 분류. 분류 비율 지정도 가능하다.

 

교차검증: 학습 데이터셋을 더 작은 크기의 여러개의 서브셋으로 나누어 학습하고 검증

Cross Validate Model: 유추하고자 하는 열 속성을 선택한다.

 - 왼쪽 입력: ML 알고리즘, 오른쪽 입력: 사용할 데이터셋

 

 

Train Model: 데이터 훈련

 - 왼쪽에 ML 알고리즘 입력, 오른쪽에 훈련된 데이터셋 연결

 - 분석 결과로 정해진 열을 지정한다.

 

Score Model: 훈련 모델 성능 평가 

 - 훈련된 모델과 성능 평가할 데이터셋 연결

 - 결과에 평가 결과가 출력된다.

 

Evaluate Model: 훈련 모델 평가

 - 여러 개의 훈련 모델을 비교 분석할 수 있다.

 

훈련 모델 기반 예측

Enter Data Manually: 가상의 신규 데이터를 입력하여 예측해본다. (전처리 이후의 데이터와 동일한 형식) 

 - 신규 입력한 데이터에서도 Edit Metadata 등을 통해 속성을 바꿔줘야 한다.