Bộ Ba dịch vụ lưu trữ phổ biến nhất của AWS: Amazon S3 – Amazon EBS – Amazon EFS

Amazon Web Services (AWS) có trên 200 dịch vụ với đầy đủ tính năng cho nhiều loại công nghệ, ngành công nghiệp và mục đích sử dụng; với số lượng dịch vụ khá nhiều như này AWS thường khiến những người mới bắt đầu thậm chí là các chuyên gia nhầm lẫn. Điều này đặc biệt đúng khi nói đến các dịch vụ lưu trữ mà AWS cung cấp cho người dùng. Nắm được lợi ích và các trường hợp sử dụng của các dịch vụ lưu trữ sẽ giúp đưa ra mô hình giải pháp tốt nhất. Trong bài viết này, chúng ta sẽ xem xét bộ ba dịch vụ lưu trữ: Amazon S3, Amazon EBS và Amazon EFS.

Vì vậy, những dịch vụ này là gì và được sử dụng để lưu trữ gì? Hãy bắt đầu với Amazon S3 – Amazon Simple Storage Service.

Amazon S3 – Dịch vụ lưu trữ object storage nổi tiếng nhất

Dịch vụ lưu trữ của Amazon S3 là giải pháp lưu trữ đối tượng (object storage) của AWS. Nếu bạn đã từng sử dụng một trong các dịch vụ như Google Drive hoặc Dropbox, bạn sẽ nắm được cách hoạt động cơ bản của S3. Thoạt nhìn, Amazon S3 chỉ đơn giản là nơi lưu trữ tệp, ảnh, video và các tài liệu khác. Tuy nhiên, sau khi tìm hiểu kỹ càng hơn, bạn sẽ khám phá ra nhiều chức năng thú vị khác của dịch vụ này.

Amazon S3 là minh chứng rõ nhất của dùng đến đâu trả tiền đến đó (pay as you go) và khả năng mở rộng (scalability). Dịch vụ này sẽ đáp ứng việc tăng giảm dung lượng lưu trữ của dự án và chỉ tính đúng số tài nguyên mà bạn sử dụng.

Bạn cũng dễ dàng quản lý dữ liệu, kiểm soát những ai truy cập vào nội dung của bạn. Đồng thời, bạn có thể bảo vệ dữ liệu khỏi tất cả các loại mối đe dọa. Amazon S3 sẽ sao chép dữ liệu để đảm bảo độ bền dữ liệu và cho phép bạn lựa chọn giữa các lớp lưu trữ khác nhau để tiết kiệm chi phí.

Trên thực tế, Amazon S3 được xem là một công cụ lưu trữ dữ liệu cực mạnh mẽ, ngay cả gã khổng lồ công nghệ Netflix cũng đang sử dụng dịch vụ này để lưu trữ. Bên cạnh Netflix, nhiều trang web bạn truy cập hàng ngày cũng đang trực tiếp host trên S3 hoặc sử dụng nội dung được lưu trữ trong các S3 bucket. Hãy xem xét một số tình huống sau để hiểu rõ hơn về cách sử dụng của S3.

Các trường hợp sử dụng Amazon S3

Tính huống 1: Chống mất mát dữ liệu

Chắc rằng trong chúng ta có nhiều bạn đã vô tình xóa một dữ liệu đó quan trọng và gặp khó khăn trong việc khôi phục dữ liệu đó?

Với Amazon S3, khả năng sao lưu và khôi phục sẽ đảm bảo người dùng không bị mất dữ liệu thông qua bảo vệ các dữ liệu bị xóa và tạo phiên bản. Tạo phiên bản (version) có nghĩa là AWS sẽ lưu phiên bản mới của tệp mỗi khi tệp được cập nhật và tính năng bảo vệ xóa đảm bảo người dùng có quyền phù hợp trước khi xóa tệp.

Tình huống 2: Tính khả dụng cao

Một công ty sẽ làm gì khi bị cúp điện đột xuất hoặc nếu trung tâm dữ liệu tại chỗ đột ngột bị sập?

Dữ liệu lưu trữ trong Amazon S3 được bảo vệ trong một trung tâm dữ liệu do Amazon quản lý, tương tự như các trung tâm dữ liệu Amazon sử dụng để lưu trữ trang web mua sắm nổi tiếng của họ. Bằng cách sử dụng dịch vụ này, người dùng có được lựa chọn lưu trữ thay thế mà không cần phải trả trực tiếp tiền thuê và tận hưởng các tiện ích của một trang web vật lý.

Đó là lý do Amazon S3 có cam kết SLA 11 số 9 (99.999999999%). Ngoài ra, người dùng có thể sao chép dữ liệu sang một Region khác để phòng tránh việc mất mát dữ liệu. Tham khảo qua bài viết của VTI Cloud: Triển khai Multi-Region S3 Replication chỉ với 01 câu lệnh | VTI CLOUD

Tình huống 3: Lưu trữ lâu dài với chi phí tiết kiệm và an toàn

Một số doanh nghiệp cần lưu trữ dữ liệu tài chính, y tế hoặc dữ liệu khác trong thời gian dài theo quy định của tiêu chuẩn ngành đó, ví dụ y tế là 10 năm. AWS cho phép người dùng lưu trữ loại dữ liệu này với S3 Glacier. S3 Glacier là một giải pháp lưu trữ hiệu quả về chi phí và là một trong những giải pháp tốt nhất trên thị trường hiện nay.

S3 glacier

Amazon EBS – Dịch vụ lưu trữ dạng block nổi tiếng nhất

Amazon Elastic Block Store (Amazon EBS) là tên gọi chung cho tất cả các dịch vụ lưu trữ khối (block storage) của AWS. Khác với Amazon S3, EBS chỉ cung cấp một khối lượng lưu trữ được kết nối trực tiếp với Amazon EC2 (Elastic Cloud Compute). Dịch vụ này cho phép người dùng lưu trữ các tệp trực tiếp trên một EC2 instance, đồng thời cho phép instance đó truy cập vào các tệp một cách nhanh chóng với mức giá khá rẻ.

Người dùng có thể tùy chỉnh dung lượng EBS với cấu hình phù hợp nhất cho khối lượng công việc. Ví dụ: nếu bạn có khối lượng công việc (workload) yêu cầu thông lượng (throughput) lớn hơn, thì bạn có thể chọn ổ cứng Throughput Optimized HDD EBS. Nếu bạn không có bất kỳ nhu cầu cụ thể nào cho khối lượng công việc (workload) thì bạn có thể chọn ổ EBS General Purpose SSD. Nếu bạn cần một khối lượng có hiệu suất cao thì một ổ EBS Provisioned IOPS SSD sẽ là sự lựa chọn phù hợp nhất cho bạn. 

Nói một cách dễ hiểu nhất, thì Amazon EBS hoạt động với Amazon EC2 tương tự như cách ổ cứng hoạt động trong máy tính. Amazon EBS cho phép lưu các tệp trực tiếp vào một EC2 instance. Với dung lượng lưu trữ này, EC2 có thể thực hiện một số công việc khá mạnh mẽ mà nếu không có EBS thì gần như không thể thực hiện. Hãy xem một vài ví dụ sau.

ebs storage

Các trường hợp sử dụng Amazon EBS

Tình huống 1: Đáp ứng workload cơ sở dữ liệu

Nhiều công ty tìm kiếm những lựa chọn tối ưu chi phí để chạy cơ sở dữ liệu. Amazon EBS cung cấp cả Cơ sở dữ liệu quan hệ (sử dụng cho Amazon RDS) và NoSQL (sử dụng cho Amazon DynamoDB) với các giải pháp có tính linh hoạt và đảm bảo độ trễ thấp. Ứng dụng tin nhắn – Slack, đang sử dụng Amazon EBS để tăng hiệu suất cơ sở dữ liệu nhằm phục vụ khách hàng trên khắp thế giới tốt hơn.

Tình huống 2: Sao lưu và khôi phục

Một trường hợp sử dụng khác liên quan đến việc sao lưu các instance của bạn. Các bản sao lưu người dùng tạo trong EBS có thể dễ dàng được tải lên S3 để lưu trữ thuận tiện và tiết kiệm chi phí. Bằng cách này, người dùng có thể khôi phục dữ liệu tại một thời điểm nhất định nếu cần.

Amazon EFS

Với Amazon Elastic File System (EFS), các doanh nghiệp có thể chia sẻ đồng thôi dữ liệu tệp từ nhiều EC2 instance hay từ các on-premises instance. Amazon EFS là một dịch vụ serverless có quy mô linh hoạt. EFS tự động tăng và thu nhỏ quy mô tùy thuộc vào nhu cầu lưu trữ tệp của người dùng mà không cần phải cung cấp hoặc quản lý.

Một số ưu điểm nổi bật của EFS: khả năng phân chia dữ liệu giữa các lớp lưu trữ được truy cập thường xuyên hoặc không thường xuyên, giúp người dùng tối ưu hóa chi phí sử dụng. Amazon EFS được coi là một giải pháp cơ bản nhất AWS, có khả năng hỗ trợ các dịch vụ khác như Amazon Elastic Container Service (ECS) và AWS Lambda.

Hãy tưởng tượng một công ty quốc tế có hàng trăm EC2 instance với mỗi instance lưu trữ một ứng dụng web. Hàng trăm nghìn người đang truy cập các máy chủ này một cách thường xuyên – do đó tạo ra lượng dữ liệu RẤT LỚN. Amazon EFS là công cụ AWS cho phép người dùng kết nối dữ liệu được thu thập từ hàng trăm, thậm chí hàng nghìn instance để người dùng có thể thực hiện phân tích dữ liệu và thu thập thông tin chi tiết về doanh nghiệp.

Các trường hợp sử dụng Amazon EFS

Tình huống 1: Máy học và Dữ liệu lớn

Amazon Elastic File System (EFS) cung cấp một hệ thống tệp dễ sử dụng, hiệu suất cao và nhất quán cho các khối lượng công việc máy học (machine learning) và dữ liệu lớn (big data). Hàng triệu các nhà khoa học dữ liệu sử dụng EFS để tạo ra môi trường xử lý cho khối lượng công việc lớn của họ.

Tình huống 2: Quản lý thông tin và ứng dụng web

EFS cung cấp một phương tiện hiệu quả để quản lý nội dung và các ứng dụng web. EFS triển khai nhiều cấu trúc tệp mà các đội phát triển web thường sử dụng, giúp dễ dàng học và triển khai trong các ứng dụng web như trang web hoặc nội dung trực tuyến khác.

Các công ty như Discover và Ancestry khi chuyển từ các hệ thống lưu trữ cũ sang Amazon EFS, họ đã tiết kiệm được số tiền lớn do giảm chi phí quản lý và thời gian.

efs

So sánh 03 giải pháp Amazon S3, EBS và EFS

aws storage services

Cùng điểm lại sự khác nhau của 3 dịch vụ lưu trữ trong bảng dưới đây:

 

Amazon S3

Amazon EBS

Amazon EFS

Loại lưu trữ

Object storage (đối tượng như: ảnh, video, tài liệu, …)

Lưu trữ khối (block) cho một EC2 instance

Hệ thống lưu trữ file cho các EC2 instance

Tính năng

Có thể truy cập vào bất kỳ dịch vụ hoặc người nào

 

Hiệu suất cao cho khối lượng công việc của một EC2 instance đơn lẻ

 

Tính nhất quán cao, khả năng truy cập đồng thời và có các tính năng khóa tệp

Trường hợp sử dụng

Ứng dụng web, quản lý nội dung, ảnh, video, sao lưu, và big data

 

Đẩy khối lượng, các giao dịch, cơ sở dữ liệu NoSQL, kho dữ liệu & ETL

Thư mục chính, sao lưu cơ sở dữ liệu, công cụ dành cho nhà phát triển, lưu trữ container, phân tích dữ liệu lớn

Dung lượng lưu trữ tối đa

Không giới hạn

2 lựa chọn: 16 TB hoặc 64 TB

Không giới hạn

Kích thước file tối đa

Một đối tượng: 5 TB

Kích thước file tối đa = kích thước volume tối đa

Một file đơn lẻ: 47.9 TB

Độ trễ

Độ trễ thấp cho các loại yêu cầu khác nhau;

Có thể tích hợp với CloudFront để có độ trễ thấp hơn

Độ trễ thấp hơn EFS và S3

SSD là loại độ trễ thấp nhất

Độ trễ thấp, sử dụng chế độ I/O tối đa để có hiệu suất cao hơn

Thông lượng

Multiple GBs mỗi giây;

Hỗ trợ tải multi-part

Lên đến 2 GB mỗi giây,

HDD là loại có thông lượng cao

10+ GB mỗi giây;

Chế độ thông lượng Bursting sẽ thay đổi theo kích thước của hệ thống tệp

Độ bền

Multiple AZs, có độ bền 99,999999999% (11 9’s)

Chỉ lưu trữ ở một AZ

Được lưu trữ trên Multi AZs

Khả năng khả dụng

S3 Standard – 99.99%

S3 Standard-IA – 99.9%

S3 One Zone-IA – 99.5%

S3 Intelligent Tiering – 99.9%

Volume – 99.999%

File System – 99.9% (Multi – AZ)

Khả năng mở rộng

Khả năng mở rộng không giới hạn

Khả năng mở rộng theo chiều dọc bằng cách tái cấu hình lại loại thể tích;

Khả năng mở rộng theo chiều ngang bằng cách gắn và tách các khối lượng bổ sung đến và đi từ EC2 

Hệ thống tệp EFS phát triển và thu nhỏ khi người dùng tải lên/xóa tệp

Truy cập dữ liệu

Có thể được truy cập qua internet bởi hàng triệu người; 

Có giao diện REST web

Thường được truy cập bởi một EC2 instance trong một AZ duy nhất;

Ngoại lệ là Amazon EBS (một ổ đĩa được cung cấp IOPS duy nhất có thể được đính kèm vào 16 Nitro Instance)

Có thể được truy cập bởi hàng nghìn EC2 instance từ các AZ, khu vực hoặc tài khoản khác nhau

Điểm cuối dịch vụ

Trong VPC;

Không có VPC (URL S3)

Trong phạm vi một VPC

Trong phạm vi một VPC

Tổng kết

Amazon S3 là dịch vụ lưu trữ đối tượng, như là ảnh, video, file, và các trang web cơ bản.

Amazon EBS là dịch vụ lưu trữ khối cho các EC2 instance, đơn giản như là ổ cứng của máy tính.

Amazon EFS là hệ thống lưu trữ file cho nhiều các EC2 instance.

Thông qua những giải thích trên, VTI Cloud hi vọng các bạn đã nắm được những sự khác biệt cơ bản nhất giữa bộ ba dịch vụ lưu trữ phổ biến nhất của AWS, từ đó hỗ trợ cho việc xây dựng kiến trúc hệ thống AWS được chính xác và tối ưu hơn.

Về VTI Cloud

VTI Cloud là Đối tác cấp cao (Advanced Consulting Partner) của AWS, với đội ngũ hơn 50+ kỹ sư về giải pháp được chứng nhận bởi AWS. Với mong muốn hỗ trợ khách hàng trong hành trình chuyển đổi số và dịch chuyển lên đám mây AWS, VTI Cloud tự hào là đơn vị tiên phong trong việc tư vấn giải pháp, phát triển phần mềm và triển khai hạ tầng AWS cho khách hàng tại Việt Nam và Nhật Bản.

Xây dựng các kiến trúc an toàn, hiệu suất cao, linh hoạt, và tối ưu chi phí cho khách hàng là nhiệm vụ hàng đầu của VTI Cloud trong sứ mệnh công nghệ hóa doanh nghiệp.