본문 바로가기

Server Infra/AWS

AWS Machine Learning - Specialty 취득 후기

728x90

2월부터 ADsP를 공부하다 AWS Cert부터 모두 취득해야 겠다라는 마음으로 방향을 전환하여 MLS-C01을 공부하기 시작했다.

https://explore.skillbuilder.aws/lms/

 

https://explore.skillbuilder.aws/lms/

 

explore.skillbuilder.aws

보통 Cert는 skilbuilder에 미리 공부할 자료가 올라와 있는데 skilbuilder에 Exam Readiness: AWS Certified Machine Learning - Specialty(Korean) 무려!! 한국어가 있었다!!

 

일단 정독을 하고 해당 과정 내에 있는 문제들을 열심히 공부했다.(이거 꼭 숙지해라 실제 시험에도 출제된다. 말 그대로 예상 문제 같은 놈들이다)

그리고 이제는 공짜가된 모의고사를 풀어보았다.

생각보다 저조하진 않았다. 실제 ML에 있는 알고리즘을 딥하게 물어보는 문제가 없었다. 그래서 시험 소개 문서를 읽어보고 항목을 파악해 보았다

지식 권장 사항

  • AWS 클라우드에서 기계 학습/딥러닝 워크로드를 개발, 설계 및 실행한 2년 이상의 실습 경험
  • 기본 기계 학습 알고리즘을 직관적으로 표현할 수 있는 능력
  • 기본 하이퍼파라미터 최적화를 수행한 경험
  • 기계 학습 및 딥 러닝 프레임워크를 사용한 경험
  • 모델 훈련, 배포 및 운영 모범 사례를 따르는 능력

안해도 되는 사항

  • 대규모 또는 복잡한 알고리즘 개발
  • 대규모의 하이퍼파라미터 최적화
  • 복잡한 수학적 증명 및 계산
  • 고급 네트워킹 및 네트워크 설계
  • 고급 데이터베이스, 보안 및 DevOps 개념
  • Amazon EMR 을 위한 DevOps 관련 태스크

우선 위처럼 절대 응시자에게 계산을 시키거나 추론 결과를 예측하라는 식의 질문은 없다. 시험 보니 어떤 상황에서 어떤 알고리즘을 적용해야 하는지(예를 들어 너무 복잡하고 큰 집단이 있을때 이걸 효율적으로 분석하기 위한 알고리즘은? PCA와 같은 녀석으로 차원을 축소시키는 방법을 선택한다) 정규화는 어떻게 하는지, 결측값은 어떻게 대치하는지 정도가 주였다.

근데 특별히 어려운 것이라면 하이퍼파라미터 튜닝부분인데 이건 진짜 시험에서 대부분 찍은것 같다. 이거 외우는 사람은 정말 사람이 아니다…

일단 Sagemaker에 대하여 간단한 핸즈온 해본 경험이 다 였기 때문에 강의를 들으며 자세하게 공부하기 시작했다.

https://www.udemy.com/course/aws-machine-learning/

 

AWS Certified Machine Learning Specialty 2022 - Hands On!

AWS machine learning certification preparation - learn SageMaker, feature engineering, data engineering, modeling & more

www.udemy.com

정규화부터 알고리즘까지 자세하게 설명해 주었기에 대략적인 정리가 가능했다. 특히, 정규화 관련해서 중요한게 데이터가 잘못되었다고 절대 지우면 안된다. 그러면 전체 학습에 문제가 생기니 k-mean같은 알고리즘으로 대치하여 학습시키자!

그리고 각종 정규화 기법을 자세하게 알아두자. L1, L2정규화와 dropout등…과적합 관련 문제가 많이 나왔었다.

Docs의 알고리즘표는 무조건 숙지하자!!

https://docs.aws.amazon.com/ko_kr/sagemaker/latest/dg/algos.html

 

Amazon SageMaker 기본 제공 알고리즘 사용 - Amazon SageMaker

이 페이지에 작업이 필요하다는 점을 알려 주셔서 감사합니다. 실망시켜 드려 죄송합니다. 잠깐 시간을 내어 설명서를 향상시킬 수 있는 방법에 대해 말씀해 주십시오.

docs.aws.amazon.com

이제 자주 애용하는 Tutorials Dojo의 모의고사를 찾아보자. 아쉽게도 유데미에 ML Specialty 모의고사는 없어서 dojo사이트에서 구매했다

https://portal.tutorialsdojo.com/courses/aws-certified-machine-learning-specialty-practice-exams/

 

AWS Certified Machine Learning Specialty Practice Exams 2022 - Tutorials Dojo

AWS Certified Machine Learning - Specialty Questions in TIMED mode, REVIEW mode, SECTION-BASED, and FINAL TEST mode with Explanations, Reference Links, Score Tracking, Plus BONUS Flashcards

portal.tutorialsdojo.com

유데미랑 다르게 한 문제당 바로 정답과 해설을 알려주는 모드가 있다. 근데 몇개는 해설을 봐도 이해가 안되서 FaQ부터 해당 알고리즘까지 다 찾아 보았다.

대망의 NTM vs LDA 이건 나만 이해가 안 되는게 아닌지 stackoverflow에도 글이 있었다.

https://stackoverflow.com/questions/59109982/what-is-the-difference-between-lda-and-ntm-in-amazon-sagemaker-for-topic-modelin

 

What is the difference between LDA and NTM in Amazon Sagemaker for Topic Modeling?

I am looking for difference between LDA and NTM . What are some use case where you will use LDA over NTM? As per AWS doc: LDA : The Amazon SageMaker Latent Dirichlet Allocation (LDA) algorithm is...

stackoverflow.com

위의 설명으로는 LDA와 NTM은 기본적으로 주제를 찾는 목적은 같지만 LDA와 비교하여 NTM이 문서 전체를 파악하여 주제를 파악하고 하드웨어 옵션을 더 많이 제공하기 때문에 좀더 빠르고 대규모의 주제 추출에 적합하다고 이해했다.

 

🔥 참고로 BlazingText 이놈도 텍스트 분류 작업이 가능하다. 또한 서비스 중에 comprehend도 주제와 텍스트 분류가 가능하다. 딱 보면 시험에 나올만한 녀석 아닐까?? translate과 seq2seq의 차이도 잘 파악해놓자. 둘다 번역하는데 사용한다. 다만 seq2seq는 문장 예측과 함께 RNN과 CNN을 함께 사용하며 예측및 번역을 진행한다(말 그대로 공수가 많이 든다는 의미)

 

RCF는 그냥 이상 탐지라는 문구 보이면 아무생각없이 RCF를 찾으면 된다. 이건 KDA에서 실시간 분석시 자주 사용되며 현업에서도 정말 많이 사용하는 서비스이다.

그리고 어려웠던게 XGBoost였는데 그냥 약한 분류기를 세트로 묶어서 예측하는 기법이다 정도만 숙지했다.(말 그대로 앙상블)

 

그리고 보고 공부했던 자료들

https://www.notion.so/mate-academy/AWS-Machine-Learning-Specialty-30c644619c7246e8a2cc5fa3960b3691#3e87b905889f4c9f8f93248727162e82

 

AWS Machine Learning - Specialty 취득 후기

2월부터 ADsP를 공부하다 AWS Cert부터 모두 취득해야 겠다라는 마음으로 방향을 전환하여 MLS-C01을 공부하기 시작했다.

www.notion.so

https://jayendrapatil.com/aws-certified-machine-learning-specialty-mls-c01-exam-learning-path/

 

AWS Certified Machine Learning -Specialty (MLS-C01) Exam Learning Path

AWS Certified Machine Learning -Specialty (MLS-C01) Exam Learning Path Finally, cleared the AWS Certified Machine Learning – Specialty (MLS-C01). It took me around four months to prepare for …

jayendrapatil.com


생각보다 고득점이다.

 

ANS이후로 정말 골때리는 시험이 아닐수 없다. ML과는 거리가 멀었고 그나마 Kinesis나 Athena, Glue등의 서비스등은 자주 사용했으며 Lex나 Translate같은 서비스들은 어떠한 기능들이 있는지 알고 있었기에 쉽게쉽게 풀었는데 Sagemaker 요놈은 진짜 골때리는 놈이었다.

너무 담고있는게 많고 배포 방식도 다양하다.

 

엔드포인트를 활용해 A/B테스트 형식으로 배포도 가능한데 이런 것과 보안적으로 격리를 어떻게 시켜냐 하는지도 문제가 출제되었다.(참고로 이 내용은 Readiness 진짜 자세하게 나온다. 이거 꼭꼭꼭 읽어라. 두번읽어라 이거 읽은것 때문에 그냥 얻어걸린 문제가 진짜 1/3은 되는것 같다.)

 

 

참고로 DAS에서 나온 문제가 일부 재탕되어 나오기도 했다. Glue가 특히 많이 나왔는데 개인적으로 DAS-C01를 합격했다면 몇가지는 무난하게 먹고 들어가는 시험인것 같다.

이제 SAP on AWS 하나 남았다.

728x90