Độ chính xác và thu hồi trong khai thác dữ liệu là gì?
Độ chính xác và thu hồi trong khai thác dữ liệu là gì?

Video: Độ chính xác và thu hồi trong khai thác dữ liệu là gì?

Video: Độ chính xác và thu hồi trong khai thác dữ liệu là gì?
Video: Thu Hồi Đất Có Được Đền Bù Theo Giá Thị Trường? | TVPL 2024, Tháng mười một
Anonim

Trong khi độ chính xác đề cập đến phần trăm kết quả của bạn có liên quan, Gợi lại đề cập đến phần trăm tổng số kết quả có liên quan được thuật toán của bạn phân loại chính xác. Đối với các vấn đề khác, cần phải đánh đổi và phải đưa ra quyết định có tối đa hóa độ chính xác , hoặc Gợi lại.

Hơn nữa, độ chính xác và nhớ lại với ví dụ là gì?

Thí dụ của Độ chính xác - Hồi tưởng thước đo để đánh giá chất lượng đầu ra của bộ phân loại. Độ chính xác - Hồi tưởng là một thước đo hữu ích cho sự thành công của dự đoán khi các lớp rất mất cân đối. Khi truy xuất thông tin, độ chính xác là thước đo mức độ liên quan của kết quả, trong khi Gợi lại là thước đo có bao nhiêu kết quả thực sự có liên quan được trả về.

Ngoài phần trên, bạn làm cách nào để tính toán độ chính xác và thu hồi trong khai thác dữ liệu? Ví dụ: độ chính xác hoàn hảo và điểm thu hồi sẽ dẫn đến điểm F-Measure hoàn hảo:

  1. F-Measure = (2 * Độ chính xác * Nhớ lại) / (Độ chính xác + Nhớ lại)
  2. F-Measure = (2 * 1,0 * 1,0) / (1,0 + 1,0)
  3. F-Measure = (2 * 1.0) / 2.0.
  4. F-Measure = 1,0.

Cũng cần biết là, độ chính xác trong khai thác dữ liệu là gì?

Trong nhận dạng mẫu, truy xuất thông tin và sự phân loại (máy học), độ chính xác (còn được gọi là giá trị dự đoán dương) là phần nhỏ của các trường hợp có liên quan trong số các trường hợp được truy xuất, trong khi thu hồi (còn được gọi là độ nhạy) là phần của tổng số các trường hợp có liên quan đã

Tại sao chúng ta sử dụng độ chính xác và thu hồi?

Độ chính xác là được định nghĩa bằng số lượng dương tính thực chia cho số lượng dương tính thực cộng với số lượng dương tính giả. Trong khi Gợi lại thể hiện khả năng tìm thấy tất cả các phiên bản có liên quan trong một tập dữ liệu, độ chính xác thể hiện tỷ lệ của các điểm dữ liệu mà mô hình của chúng tôi nói là có liên quan thực sự có liên quan.

Đề xuất: