[Microsoft Azure] Azure Machine Learning

 

Azure에서는 데이터를 가지고 ML 모델을 실습해볼 수 있는 Azure Machine Learning을 제공한다.

 

 

 

컨테이너 레지스트리는 자동으로 만들어지지 않아서 직접 생성

(이름 중복되면 안 된다)

SKU는 "기본"이 가장 작은 것

 

 

 

배포가 완료되면 스튜디오로 가서 컴퓨팅 인스턴스를 만들어준다

가상 머신 이름은 고유해야 함

 

 

파이프라인을 만들어서 해보자

 

 

 

데이터를 추가해준다

넷상의 web파일을 사용할 거면 csv raw 파일 링크를 정확히 입력해주자

 

 

 

 

왼쪽 메뉴의 구성 요소에서 필요한 작업을 골라서

드래그앤드랍 하는 형태로 데이터 전처리 등의 작업이 가능하다

 

 

더블클릭해서 선택할 열 등의 세부 정보를 넣어줄 수 있다.

 

 

 

런타임 설정에서 오류가 나는 경우 위에서 만든 컴퓨팅 인스턴스를 직접 설정해 준다.

 

 

 

값 누락 전처리: Clean Missing Data

대체 모드 등 선택 가능하다

 

 

 

Edit Metadata: 일부 속성의 데이터형을 변경할 수 있다. (e.g., 0, 1값을 numeric에서 boolean으로 변환)

Split Data: 훈련 데이터와 평가 데이터로 분류. 분류 비율 지정도 가능하다.

 

교차검증: 학습 데이터셋을 더 작은 크기의 여러개의 서브셋으로 나누어 학습하고 검증

Cross Validate Model: 유추하고자 하는 열 속성을 선택한다.

 - 왼쪽 입력: ML 알고리즘, 오른쪽 입력: 사용할 데이터셋

 

 

Train Model: 데이터 훈련

 - 왼쪽에 ML 알고리즘 입력, 오른쪽에 훈련된 데이터셋 연결

 - 분석 결과로 정해진 열을 지정한다.

 

Score Model: 훈련 모델 성능 평가 

 - 훈련된 모델과 성능 평가할 데이터셋 연결

 - 결과에 평가 결과가 출력된다.

 

Evaluate Model: 훈련 모델 평가

 - 여러 개의 훈련 모델을 비교 분석할 수 있다.

 

훈련 모델 기반 예측

Enter Data Manually: 가상의 신규 데이터를 입력하여 예측해본다. (전처리 이후의 데이터와 동일한 형식) 

 - 신규 입력한 데이터에서도 Edit Metadata 등을 통해 속성을 바꿔줘야 한다.