Thu thập và phân loại dữ liệu

I. Thu thập dữ liệu

1. Khái niệm

- Những thông tin thu thập được như: số, chữ, hình ảnh,… được gọi là dữ liệu. Dữ liệu dưới dạng số được gọi là số liệu.

- Số liệu là một loại dữ liệu nhưng dữ liệu chưa chắc là số liệu.

- Các cách thu thập dữ liệu: Quan sát, lập phiếu điều tra (phiếu hỏi), thu thập từ những nguồn có sẵn (sách, báo, trang web,…)

2. Ví dụ

VD1: Cho bảng điều tra về các môn thể thao được ưa thích của lớp 6A được trình bày dưới đây

- Dữ liệu bao gồm danh sách các môn thể thao: bóng đá, cầu lông, bóng bàn, đá cầu, bóng rổ, 15, 9, 2, …

 

- Các số liệu: 15, 9, 2, 3, 6. 

II. Phân loại dữ liệu

1. Khái niệm

- Phân loại dữ liệu là ta đi sắp xếp các thông tin theo những tiêu chí nhất định.

2. Ví dụ

Hình dưới đây là các bình ga của một cửa hàng đang bán.

a) Cửa hàng đang bán tất cả bao nhiêu bình ga?

b) Cửa hàng bán mấu loại bình ga?

Hãy cho biết số lượng bình ga mỗi loại.

Giải:

a) Cửa hàng bán tất cả 8 bình ga

b) Quan sát hình ta thấy các bình ga có hai màu vàng và hồng.

Có hai kích thước: lớn và nhỏ

Nếu lấy tiêu chí là kích thước thì có hai loại ga là:

- Bình cỡ nhỏ: 6 bình

- Bình vỡ lớn: 2 bình

Nếu lấy tiêu chí là màu sắc để phân loại thì có 2 loại bình là:

- Màu hồng: 6 bình

- Màu vàng: 2 bình.

III. Tính hợp lí của dữ liệu

1. Các kiến thức cần nhớ

- Để đánh giá tính hợp lí của dữ liệu, ta cần đưa ra các tiêu chí đánh giá, chẳng hạn như dữ liệu phải:

+ Đúng định dạng: Họ và tên phải là chữ, số tuổi phải là số, email thì phải có kí hiệu @,…

+ Nằm trong phạm vi dự kiến: Số người thì phải là số tự nhiên, cân nặng của người Việt Nam thì phải dưới 200kg, số tuổi của người nguyên dương,…

2. Ví dụ:

a) Danh sách đội học sinh dự thi văn nghệ của lớp 6A được ghi lại trong bảng sau:

STT

Họ và tên

1

Hoàng Thu Trang

2

Đỗ Ngọc Hà

3

Phạm Văn Vũ

4

0384888586

5

Trần Nhật Minh

6

Nguyễn Minh Trí

Dữ liệu không hợp lí ở đây là 0384888586 trong cột Họ và tên vì đây không phải là tên người.

b) Điều tra điểm Toán của 20 bạn trong kì khảo sát đầu năm của lớp 6B:

5

2

8

9

4

6

7

5,5

6

-1

5

10

6

7

-3

8

9

6

3

8

Dữ liệu không hợp lí là -1 và -3 vì số điểm kiểm tra không thể là số âm được.

Luyện bài tập vận dụng tại đây!