Sự khác biệt giữa dữ liệu phân loại và số liệu: phân loại so với số

Anonim

Dữ liệu phân loại so với số liệu

Dữ liệu là các dữ kiện hoặc thông tin thu thập được cho mục đích tham khảo hoặc phân tích. Thông thường các dữ liệu này được thu thập như là một thuộc tính của đối tượng liên quan. Thuộc tính này có thể khác nhau từ một đến khác do đó thuộc tính thay đổi này có thể được coi là một biến. Các biến có thể giả định các dạng thức khác nhau của các giá trị và đây là nội tại của dữ liệu được thu thập.

Các biến số có thể là định tính hoặc định lượng; tôi. e. nếu biến là số lượng, các câu trả lời là số và độ lớn của các thuộc tính đo được có thể được nêu với một mức độ chính xác nhất định. Các loại khác, các biến chất lượng đo các thuộc tính định tính và các giá trị giả định bởi các biến không thể được đưa ra về kích thước hoặc cường độ. Các biến chính nó được gọi là các biến phân loại và dữ liệu thu thập được bằng phương tiện của một biến phân loại là dữ liệu phân loại.

Dữ liệu số về cơ bản là dữ liệu định lượng thu được từ một biến, và giá trị có ý nghĩa về kích thước / cường độ. Các số liệu thu được được chia thành ba loại khác nữa dựa trên lý thuyết được phát triển bởi Stanley Smith Stevens. Dữ liệu số có thể là thứ tự, khoảng hoặc tỷ lệ. Kiểu dữ liệu được xác định bằng phương pháp đo các giá trị, và các loại được gọi là các mức đo lường.

Trọng lượng của một người, khoảng cách giữa hai điểm, nhiệt độ, và giá của cổ phiếu là những ví dụ về số liệu.

Trong số liệu thống kê, phần lớn các phương pháp này có nguồn gốc từ việc phân tích dữ liệu số. Các thống kê mô tả cơ bản và hồi qui và các phương pháp inferential khác được sử dụng chủ yếu để phân tích số liệu số.

Thông tin thêm về dữ liệu phân loại

Dữ liệu phân loại là các giá trị cho biến định tính, thường là số, một từ hoặc ký hiệu. Họ đưa ra thực tế là biến trong trường hợp được xem xét thuộc một trong những lựa chọn có sẵn. Do đó, chúng thuộc về một trong các loại; do đó tên phân loại.

Sự liên kết chính trị của một người, quốc tịch của một người, màu sắc yêu thích của một người, và nhóm máu của bệnh nhân là những thuộc tính định tính. Đôi khi, một số có thể thu được như một giá trị phân loại, nhưng số chính nó không đại diện cho độ lớn của thuộc tính được đo.Mã bưu điện là một ví dụ.

Ngoài ra, bất kỳ giá trị phân loại nào thuộc kiểu dữ liệu danh định, là loại khác dựa trên các mức đo. Các phương pháp được sử dụng để phân tích dữ liệu phân loại khác với dữ liệu số, nhưng nguyên tắc cơ bản có thể giống nhau.

Sự khác nhau giữa Dữ liệu phân loại và Số liệu là gì?

• Dữ liệu số là các giá trị lấy được cho biến định lượng, và có độ lớn liên quan đến ngữ cảnh của biến (do đó chúng luôn là các số hoặc ký hiệu mang một giá trị số). Dữ liệu phân loại là các giá trị thu được cho một biến chất; các số liệu phân loại không có ý nghĩa về cường độ.

• Dữ liệu số luôn thuộc về thứ tự, tỷ lệ, hay khoảng thời gian, trong khi dữ liệu phân loại thuộc loại danh nghĩa.

• Các phương pháp được sử dụng để phân tích dữ liệu định lượng khác với các phương pháp được sử dụng cho dữ liệu phân loại, thậm chí nếu các nguyên tắc giống nhau thì ít nhất ứng dụng có sự khác biệt đáng kể.

• Dữ liệu số được phân tích bằng các phương pháp thống kê trong thống kê mô tả, hồi qui, chuỗi thời gian và nhiều hơn nữa.

• Đối với dữ liệu phân loại, các phương pháp mô tả thông thường và các phương pháp đồ hoạ được sử dụng. Một số bài kiểm tra phi tham số cũng được sử dụng.