Amazon SageMaker là một dịch vụ thuộc nhóm Machine Learning hỗ trợ các nhà phát triển và DS (Data Scientist) trong việc prepare, build, train, deploy ML Model một cách nhanh chóng.
SageMaker bao gồm các step trong việc phát triển ML chẳng hạn như Labeling, data preparation, feature engineering, statistical bias detection, auto-ML, training, tuning, hosting, explainability, monitoring và workflows.
Amazon SageMaker Studio đây là IDE về ML đầu tiên được thiết kế một giao diện toàn diện và trực quan để thực hiện ML Dev.

Amazon SageMaker được xây dựng dựa trên kinh nghiệm hơn 20 năm của Amazon.com trong việc phát triển các ứng dụng ML như product recommendations, personalize, intelligent shopping, robotics, voice-assisted devices.

Amazon SageMaker AutoPilot giúp lựa chọn algorithm tốt nhất cho việc prediction và tự động build, train, tune ML Models. Điều này rất là kỳ diệu giúp bạn tiết kiệm trí não lẫn cả thời gian tiền bạc trong việc triển khai ML. Mặc dù Autopilot giúp bạn tự động tìm kiếm algorithm, build, train, tune nhưng bạn vẫn có quyền kiểm soát và thấy được (visibility) các công việc này.
Amazon SageMaker Ground Truth giúp bạn đánh nhãn training datasets một cách dễ dàng nhanh chóng cho nhiều use cases như là 3D point cloud, video, images, và văn bản. Amazon SageMaker Ground Truth giúp tiết kiệm chi phí Labeling tới 70%.
Amazon SageMaker Data Wrangler giúp giảm thời gian trong việc prepare data cho ML từ hàng tuần, giờ chỉ còn tính theo phút. Chỉ với một vài click bạn có thể hoàn thành các bước liên quan data preparation workflows bao gồm data selection, cleansing, exploration, và visualization.
Amazon SageMaker Feature Store là nơi lưu trữ, chia sẻ ML features. Bao gồm tất cả các tính năng cho ML Model có thể sử dụng, giúp ta sinh ra các ML Model có độ chính xác cao.
Amazon SageMaker Clarify cho phép phát hiện các sai lệch bias detection trong suốt ML workflow, cho phép bạn build ML model tốt hơn (fairness & transparency).
Sử dụng Amazon SageMaker miễn phí 02 tháng
Với Amazon SageMaker bạn chỉ phải chi trả cho những gì mình sử dụng Pay As You Go. Việc chạy các tác vụ liên quan ML thường rất tốn kém do cần một hạ tầng phần cứng mạnh mẽ. Nếu trong quá trình học tập tìm hiểu bạn đầu bạn có thể sử dụng Amazon SageMaker với 02 tháng miễn phí với một số lượng lớn các offer miễn phí như sau:
- Amazon SageMaker Studio Notebooks: 250 hours of ml.t3.medium instance
- Amazon SageMaker On-demand notebook instance: 250 hours of ml.t2.medium or ml.t3.medium
- Amazon SageMaker Data Wrangler: 25 hours of ml.m5.4xlarge instance
- Amazon SageMaker Feature Store: 10M write units, 10M read units, 25GB storage
- Training: 50 hours of m4.xlarge or m5.xlarge instances.
- Inference: 125 hours of m4.xlarge or m5.xlarge instances.
Việc sử dụng Amazon SageMaker Studio là miễn phí. SageMaker Studio cho phép chúng ta build, train, tune, và deploy ML Models. Bạn chỉ phải trả phí cho những tài nguyên mà chạy trong Studio ví dụ như các instances chạy Data Wrangler, Notebooks, Training hay Inference…
Amazon SageMaker Studio Services
Có rất nhiều dịch vụ tích hợp sẵn trong Amazon SageMaker Studio miễn phí như sau:
- SageMaker Pipeline – https://aws.amazon.com/sagemaker/pipelines/
- SageMaker Autopilot – https://aws.amazon.com/sagemaker/autopilot/
- SageMaker Experiments – Organize, track your training jobs, và versions.
- SageMaker Debugger – https://aws.amazon.com/sagemaker/debugger/
- SageMaker Model Monitor – https://aws.amazon.com/sagemaker/model-monitor/
- SageMaker Clarify – https://aws.amazon.com/sagemaker/clarify/
- SageMaker JumpStart – https://aws.amazon.com/sagemaker/getting-started/ easily deploy ML Models.
Giá tham khảo một số instance phổ biến nếu hết free tier. Giả sử một tháng chạy với công suất 50% (tương đương 360 hours). Giả định giá ở Singapore, gía này chỉ có tính tạm thời, có thể bạn truy xuất vào thời điểm khác giá có thể khác, thường là rẻ hơn hoặc bằng. Bạn nên check thường xuyên để có update mới nhất. Phần này Kevin chia sẻ để các bạn hình dung sơ về giá rổ thế nào.
Giá full: https://aws.amazon.com/sagemaker/pricing/
- ml.t3.medium (2 vCPU, 4 GB RAM) = $0.074 * 360 = $26.64
- ml.m5.xlarge (4 vCPU, 16 GB RAM) = $0.336 * 360 = $120.96
- ml.m5.4xlarge (16 vCPU, 64 GB RAM) = $1.344 * 360 = $483.84
Tóm lại chúng ta có thể dùng miễn phí nếu biết dùng, nhưng chỉ cần sai lệch thôi là tháng bạn có thể trả thêm vài trăm đến cả nghìn $.
Have fun!