Dự báo là gì? Hướng dẫn về dự báo dữ liệu dành cho người mới bắt đầu – Amazon Web Services

Dữ liệu chéo quan sát các cá nhân và công ty trong cùng một khoảng thời gian. Mặt khác, dữ liệu chuỗi thời gian là bất kỳ tập dữ liệu nào thu thập thông tin trong các khoảng thời gian khác nhau. Dữ liệu này khác biệt vì nó sắp xếp các điểm dữ liệu theo thời gian. Vì vậy, giữa những dữ liệu quan sát trong các khoảng thời gian liền kề có khả năng tồn tại sự tương quan.

Dữ liệu chuỗi thời gian có thể được biểu thị trên biểu đồ bằng các khoảng thời gian tăng dần đều (hoặc mốc thời gian) trên trục x và các giá trị dữ liệu mẫu quan sát được trên trục y. Các biểu đồ chuỗi thời gian như vậy là công cụ rất hữu ích để trực quan hóa dữ liệu. Các nhà khoa học dữ liệu sử dụng chúng để xác định đặc điểm của dữ liệu dự báo. Sau đây là một số ví dụ về các đặc điểm của dữ liệu chuỗi thời gian:

Dữ liệu xu hướng theo thời gian

Trong dữ liệu xu hướng, giá trị trục y tăng hoặc giảm theo thời gian, khiến cho biểu đồ có dạng tuyến tính. Ví dụ: dữ liệu dân số có thể tăng hoặc giảm theo dạng tuyến tính theo thời gian.

Tính thời vụ

Mẫu thời vụ xuất hiện khi dữ liệu chuỗi thời gian biểu thị các mẫu chính quy và dự đoán được trong khoảng thời gian dưới một năm. Mẫu dữ liệu này có thể xuất hiện dưới dạng mức tăng đột biến hoặc các điểm bất thường khác trên một biểu đồ tuyến tính khác. Ví dụ: doanh số của một cửa hàng bán lẻ có thể tăng trong giai đoạn nghỉ lễ vào khoảng tháng 12 và tháng 4.

Điểm gãy cấu trúc

Đôi khi dữ liệu chuỗi thời gian đột nhiên thay đổi hành vi vào một thời điểm nhất định. Biểu đồ chuỗi thời gian có thể đột nhiên dịch lên hoặc xuống, tạo ra một điểm gãy cấu trúc hoặc phi tuyến tính. Ví dụ: nhiều chỉ báo kinh tế thay đã đổi mạnh trong năm 2008 sau khi cuộc khủng hoảng tài chính toàn cầu bắt đầu.