So sánh AWS Kinesis Data Stream và Kinesis Data Fire Horse

AWS Kinesis là một dịch vụ rất phổ biến sử dụng trong các kiến trúc về data trên cloud làm nhiệm vụ đưa dữ liệu từ nhiều nguồn đến với AWS Cloud và từ đó có nhiều câu chuyện tiếp theo như Data Platform, Data Lake, Datawarehouse, big data, Data Analytics…

AWS Kinesis cũng là một chủ đề được hỏi rất nhiều trong kỳ thi lấy chứng chỉ AWS không chỉ Solution Architect mà còn ở cả Developer Associate. Do đó bạn cần nắm chắc dịch vụ này không sẽ bị đề thi xoay cho không biết hỏi gì và câu trả lời nào cũng thấy hợp lý.

AWS Kinesis được ví như máng truyền dẫn dữ liệu từ Data Producer và Data Consumer.

  • Data Producer là những nguồn dữ liệu bất kỳ từ website, từ mạng xã hội, từ mobile app, từ các IoT devices…
  • Data Consumer là nơi tiêu thụ hay chứa dữ liệu này ví dụ như Apache Hadoop, Apache Storm, Redshift, S3, ElasticSearch…

AWS Kinesis Data Streams – cho phép lập trình viên có thể tùy chỉnh luồng dữ liệu cho những mục đích đặc thù. Kinesis Data Stream là dịch vụ thuộc nhóm unmanaged có nghĩa bạn phải chịu trách nhiệm về việc provision, scaling. Data có thể hiện hữu mặc định 24 giờ, bạn có thể trả thêm phí để kéo dài tới 7 ngày.

AWS Kinesis Data Fire Horse – cho phép load dữ liệu thẳng vào các AWS Services để thực hiện xử lý. Fire horse là dịch vụ thuộc nhóm managed service, có nghĩa là bạn không cần lo lắng về scaling, hay provisioning giải pháp. Fire horse cho phép bạn batching, encrypting, compressing. Firehorse cho phép streaming dữ liệu vào thẳng S3, Redshift, ElasticSearch.

%d bloggers like this: