PHẦN 2: PIVOT TABLE NÂNG CAO
Tác giả bài viết: Phạm Thành Mỹ
I. YÊU CẦU CƠ BẢN KHI THỰC HIỆN PIVOT TABLE
Đã nói về Pivot Table là nói về tổng hợp và phân tích.
Đã nói về phân tích là phải có tiêu chí phân tích.
- Tiêu chí phân tích là bất kỳ tiêu chí nào có thể dùng để phân loại dữ liệu. Thí dụ tiêu chí loại chi phí, tiêu chí kỳ báo cáo, tiêu chí nhóm sản phẩm, tiêu chí vùng thị trường, tiêu chí loại khách hàng, thậm chí phân loại khách hàng cũng có nhiều cách phân loại: phân loại theo khách mua sỉ, lẻ; phân loại theo doanh số lớn nhỏ
- Phân loại dữ liệu cần chính xác, không trùng lắp, không mơ hồ. 1 dòng dữ liệu chỉ có thể nằm trong 1 loại, không được hơn. Thí dụ nếu đã có loại chi phí Văn Phòng thì không được có chi phí Điện thoại. Muốn có chi phí Điện thoại thì phải tách chi phí Văn Phòng ra: chi phí Điện thoại, mực in, văn phòng phẩm, lương nhân viên Văn Phòng, cái gì không cần quá chi tiết thì gộp vào chi phí linh tinh.
Đó là nói về phân tích, còn nói về Pivot Table: Pivot Table cũng yêu cầu chính xác y như vậy thậm chí nếu bạn gõ sai chính tả, dư dấu space, thiếu dấu sắc, dấu huyền; Pivot cũng coi như 1 loại mới và tách riêng ra.
Thí dụ trong bảng Pivot Table trên nếu tất cả dữ liệu cột Thành phố Hồ Chí Minh trong cột tỉnh là “HCM”, lọt vào 1 ô “HCM ” (dư 1 khoảng trắng) thì sẽ bị tách riêng ra 1 dòng như sau: ô tô màu cam là ô gõ dư khoảng trắng, thể hiện dòng HCM thứ 2 trên Pivot Table.
|
Như vậy để cho Pivot Table làm tốt bạn phải làm theo đúng cách. Tôi gợi ý 1 quy trình như sau:
1. Lấy dữ liệu thô
2. Chọn tiêu chí phân tích
3. Lập 1 danh sách các loại dữ liệu theo tiêu chí trên, phân bao nhiêu loại tùy bạn, nhưng tên từng loại phải chính xác và ngắn gọn. Nếu tiêu chí này có sẵn trong dữ liệu thô: kiểm tra tính chính xác của các loại dữ liệu trong tiêu chí đó. Nếu việc kiểm tra khó khăn do dữ liệu nhiều, tốt nhất là làm 1 Danh sách mới.
4. Thêm 1 cột vào dữ liệu thô. Trong cột này mỗi dòng dữ liệu phải chọn 1 loại trong Danh sách đã làm ở bước 3, chính xác từng ký tự. Tốt nhất là dùng validation để chọn.
5. Nếu bạn cần phân tích nhiều tiêu chí, làm lại bước 3 và 4 cho mỗi tiêu chí.
6. Tiến hành tạo Pivot Table.
II. CÁC PHƯƠNG PHÁP THỐNG KÊ ĐỐI VỚI TRƯỜNG DỮ LIỆU
A. Các phép thống kê thông dụng:
Pivot table không chỉ có thống kê tổng, nó có thể thống kê số lượng, số lớn nhất, nhỏ nhất, số trung bình, ...
Thí dụ ta có bảng điểm thi 5 môn của học sinh 3 lớp như sau:
|
Bây giờ ta muốn thống kê:
- Số học sinh mỗi lớp dự thi
- Điểm cao nhất của mỗi lớp
- Điểm thấp nhất của mỗi lớp
- Điểm trung bình mỗi lớp
Hãy tạo 1 Pivot table với cấu trúc như sau: Kéo thả Lớp vào Rows, Tên HS và điểm vào Data:
|
Tác giả bài viết: Phạm Thành Mỹ
I. YÊU CẦU CƠ BẢN KHI THỰC HIỆN PIVOT TABLE
Đã nói về Pivot Table là nói về tổng hợp và phân tích.
Đã nói về phân tích là phải có tiêu chí phân tích.
- Tiêu chí phân tích là bất kỳ tiêu chí nào có thể dùng để phân loại dữ liệu. Thí dụ tiêu chí loại chi phí, tiêu chí kỳ báo cáo, tiêu chí nhóm sản phẩm, tiêu chí vùng thị trường, tiêu chí loại khách hàng, thậm chí phân loại khách hàng cũng có nhiều cách phân loại: phân loại theo khách mua sỉ, lẻ; phân loại theo doanh số lớn nhỏ
- Phân loại dữ liệu cần chính xác, không trùng lắp, không mơ hồ. 1 dòng dữ liệu chỉ có thể nằm trong 1 loại, không được hơn. Thí dụ nếu đã có loại chi phí Văn Phòng thì không được có chi phí Điện thoại. Muốn có chi phí Điện thoại thì phải tách chi phí Văn Phòng ra: chi phí Điện thoại, mực in, văn phòng phẩm, lương nhân viên Văn Phòng, cái gì không cần quá chi tiết thì gộp vào chi phí linh tinh.
Đó là nói về phân tích, còn nói về Pivot Table: Pivot Table cũng yêu cầu chính xác y như vậy thậm chí nếu bạn gõ sai chính tả, dư dấu space, thiếu dấu sắc, dấu huyền; Pivot cũng coi như 1 loại mới và tách riêng ra.
Thí dụ trong bảng Pivot Table trên nếu tất cả dữ liệu cột Thành phố Hồ Chí Minh trong cột tỉnh là “HCM”, lọt vào 1 ô “HCM ” (dư 1 khoảng trắng) thì sẽ bị tách riêng ra 1 dòng như sau: ô tô màu cam là ô gõ dư khoảng trắng, thể hiện dòng HCM thứ 2 trên Pivot Table.
A
| B
| C
|1
| Tỉnh
| Đại lý
| Total
|2
|An Giang|C| 108799000
|3
| |D| 325820000
|4
|Hà nội|E| 166348000
|5
| |F| 107271000
|6
|HCM|A| 39071000
|7
| |B| 60188000
|8
| |H| 89886000
|9
| |I| 49433000
|10
|HCM |A| 82091000
|11
|Huế|G| 174133000
|12
| |J| 118448000
|13
|Grand Total| | 1321488000
|Như vậy để cho Pivot Table làm tốt bạn phải làm theo đúng cách. Tôi gợi ý 1 quy trình như sau:
1. Lấy dữ liệu thô
2. Chọn tiêu chí phân tích
3. Lập 1 danh sách các loại dữ liệu theo tiêu chí trên, phân bao nhiêu loại tùy bạn, nhưng tên từng loại phải chính xác và ngắn gọn. Nếu tiêu chí này có sẵn trong dữ liệu thô: kiểm tra tính chính xác của các loại dữ liệu trong tiêu chí đó. Nếu việc kiểm tra khó khăn do dữ liệu nhiều, tốt nhất là làm 1 Danh sách mới.
4. Thêm 1 cột vào dữ liệu thô. Trong cột này mỗi dòng dữ liệu phải chọn 1 loại trong Danh sách đã làm ở bước 3, chính xác từng ký tự. Tốt nhất là dùng validation để chọn.
5. Nếu bạn cần phân tích nhiều tiêu chí, làm lại bước 3 và 4 cho mỗi tiêu chí.
6. Tiến hành tạo Pivot Table.
II. CÁC PHƯƠNG PHÁP THỐNG KÊ ĐỐI VỚI TRƯỜNG DỮ LIỆU
A. Các phép thống kê thông dụng:
Pivot table không chỉ có thống kê tổng, nó có thể thống kê số lượng, số lớn nhất, nhỏ nhất, số trung bình, ...
Thí dụ ta có bảng điểm thi 5 môn của học sinh 3 lớp như sau:
A
| B
| C
| D
| E
|17
| STT
| Tên HS
| Lớp
| Môn
| Điểm
|18
| 1
|Nguyễn văn 01| 6A1
|Toán| 8,3
|19
| 2
|Nguyễn văn 02| 6A1
|Văn| 6,9
|20
| 3
|Nguyễn văn 03| 6A1
|Lý| 9,7
|21
| 4
|Nguyễn văn 04| 6A1
|Hóa| 6,9
|22
| 5
|Nguyễn văn 05| 6A1
|Sinh| 6,5
|23
| 6
|Nguyễn văn 06| 6A1
|Toán| 9,2
|24
| 7
|Nguyễn văn 07| 6A2
|Văn| 8,1
|25
| 8
|Nguyễn văn 08| 6A2
|Lý| 10
|26
| 9
|Nguyễn văn 09| 6A2
|Hóa| 8,9
|27
| 10
|Nguyễn văn 10| 6A2
|Sinh| 7,4
|28
| 11
|Nguyễn văn 11| 6A2
|Toán| 8
|29
| 12
|Nguyễn văn 12| 6A2
|Văn| 7,8
|30
| 13
|Nguyễn văn 13| 6A3
|Lý| 8,7
|31
| 14
|Nguyễn văn 14| 6A3
|Hóa| 7,2
|32
| 15
|Nguyễn văn 15| 6A3
|Sinh| 8,1
|33
| 16
|Nguyễn văn 16| 6A3
|Toán| 7,7
|34
| 17
|Nguyễn văn 17| 6A3
|Văn| 6,9
|Bây giờ ta muốn thống kê:
- Số học sinh mỗi lớp dự thi
- Điểm cao nhất của mỗi lớp
- Điểm thấp nhất của mỗi lớp
- Điểm trung bình mỗi lớp
Hãy tạo 1 Pivot table với cấu trúc như sau: Kéo thả Lớp vào Rows, Tên HS và điểm vào Data:
A
| B
| C
|37
|| Data
||38
| Lớp
| Count of Tên HS
| Sum of Điểm
|39
| 6A1
| 6
| 47,5
|40
| 6A2
| 6
| 50,2
|41
| 6A3
| 5
| 38,6
|42
| Grand Total
| 17
| 136,3
| Sửa lần cuối: