Sự khác biệt giữa Data Warehousing và Data Marts

Dữ liệu kho bãi so với các tòa dữ liệu

Bạn nên xây dựng những gì trước tiên: kho dữ liệu hoặc siêu dữ liệu? Đây là câu hỏi làm phiền những người quản lý CNTT gần đây. Hầu hết các nhà cung cấp sẽ nói rằng kho dữ liệu rất khó và tốn kém để làm, và rằng chúng không được khuyến khích. Họ nói rằng các kho dữ liệu mất nhiều thời gian để xây dựng. Ngoài ra, họ nói rằng nó phải đối mặt với rất nhiều vấn đề liên quan đến những gì công ty đang phải đối mặt trong thời gian chờ đợi. Một số vấn đề là tích hợp dữ liệu kế thừa và sự khó khăn trong việc quản lý số lượng lớn dữ liệu. Data mart đã chắc chắn tạo ra một hình ảnh u ám khỏi kho dữ liệu, nhưng tất cả đều không đúng. Cần phải có một định nghĩa kỹ lưỡng và trích dẫn khác biệt cho quan niệm sai lầm này. Nhưng các kho dữ liệu và kho dữ liệu là gì?

Trước hết bạn phải biết rằng data mart là một công ty cụ thể. Nó đại diện cho các chương trình, dữ liệu của nó, phần mềm và phần cứng. Nó có nghĩa là có dữ liệu riêng biệt cho mỗi bộ phận. Ví dụ: có một quầy dữ liệu để sản xuất, về tài chính, một phòng bán hàng và một bộ phận tiếp thị khác. Mỗi bản ghi dữ liệu có các chức năng và tính năng cụ thể của riêng nó. Nó không giống với các dữ liệu khác của các phòng ban khác, nhưng chúng có thể phối hợp với nhau. Data mart tập trung vào từng cá nhân và bộ phận cụ thể, đó là lý do tại sao nó không thể xử lý dữ liệu lớn. Cơ sở dữ liệu cấu trúc nối sao được sử dụng để thu thập tất cả cơ sở dữ liệu data mart cho thiết kế. Có hai loại dữ liệu mart, data mart độc lập (đây là dữ liệu mạnh mẽ hơn) và data data phụ thuộc (đây là dạng dữ liệu không mạnh). Một phải tạo ra nhiều marts dữ liệu độc lập để nó có thể được sử dụng cho tổ chức.

Kho dữ liệu rộng và không giới hạn chỉ tập trung vào các phòng ban cụ thể. Nó có thể đại diện cho toàn bộ công ty; nó bao gồm tất cả các đối tượng và mô hình dữ liệu của công ty. Kho dữ liệu không giới hạn ở các lĩnh vực chuyên môn của các phòng ban và tổng công ty. Dữ liệu được lưu trữ trong kho dữ liệu chi tiết hơn so với dữ liệu mart. Cách lưu trữ dữ liệu chỉ mục là nhẹ vì nó phải xử lý khối lượng lớn dữ liệu. Kho dữ liệu bao gồm một diện tích lớn của công ty hoặc công ty đó là lý do tại sao phải mất một thời gian dài để xử lý nó. Đó cũng là lý do tại sao các quầy dữ liệu nhanh và dễ sử dụng, thiết kế và thực hiện vì nó chỉ xử lý một lượng nhỏ dữ liệu. Đây cũng là lý do vì sao việc lưu trữ dữ liệu đắt hơn so với data mart.

TÓM TARYT:

1.

Data Mart tập trung vào các phòng ban riêng lẻ của công ty hoặc công ty, trong khi kho dữ liệu có thể đại diện cho toàn bộ công ty hoặc công ty nói chung.
2.

Dữ liệu mart chỉ có thể xử lý số lượng nhỏ dữ liệu, không giống như kho dữ liệu có thể xử lý số lượng lớn dữ liệu.
3.

Kho dữ liệu có thể tốn kém và khó sử dụng bởi vì nó bao phủ một phần rộng của công ty hoặc công ty, không giống như mart dữ liệu có giá cả phải chăng và thuận tiện vì nó liên quan đến các phòng ban nhỏ của công ty hoặc công ty.