1. Giới thiệu
Có nhiều lý do để thực hiện khảo sát: đánh giá mức độ hài lòng của khách hàng, tiến hành nghiên cứu thị trường, cải thiện sản phẩm hoặc dịch vụ hoặc đánh giá mức độ tương tác của nhân viên. Tuy nhiên, nếu đã thử làm việc với dữ liệu khảo sát trước khi bạn có thể biết rằng định dạng chuẩn rất khó làm việc. Trong hướng dẫn này, chúng tôi sẽ xây dựng một quy trình tự động để thu thập kết quả trên Google Biểu mẫu, chuẩn bị dữ liệu để phân tích bằng Cloud Dataprep, tải dữ liệu đó vào BigQuery, đồng thời cho phép nhóm của bạn thực hiện phân tích hình ảnh bằng các công cụ như Looker hoặc Data Studio.
Sản phẩm bạn sẽ tạo ra
Trong lớp học lập trình này, bạn sẽ sử dụng Dataprep để chuyển đổi các câu trả lời trong bản khảo sát mẫu trên Google Biểu mẫu thành một định dạng hữu ích cho việc phân tích dữ liệu. Bạn sẽ đẩy dữ liệu đã chuyển đổi vào BigQuery, nơi bạn có thể đặt các câu hỏi sâu hơn bằng SQL và kết hợp dữ liệu đó vào các tập dữ liệu khác để phân tích hiệu quả hơn. Sau cùng, bạn có thể khám phá các trang tổng quan được tạo sẵn hoặc kết nối công cụ thông tin kinh doanh của riêng bạn với BigQuery để tạo báo cáo mới.
Kiến thức bạn sẽ học được
- Cách biến đổi dữ liệu khảo sát bằng Dataprep
- Cách đẩy dữ liệu khảo sát vào BigQuery
- Cách nhận thêm thông tin chi tiết từ dữ liệu khảo sát
Bạn cần có
- Một dự án Google Cloud đã bật tính năng thanh toán, BigQuery và Dataprep
- Kiến thức cơ bản về Dataprep rất hữu ích, nhưng không bắt buộc
- Kiến thức cơ bản về BigQuery và SQL rất hữu ích, nhưng không bắt buộc
2. Quản lý câu trả lời trên Google Biểu mẫu
Chúng ta sẽ bắt đầu bằng cách xem xét kỹ hơn các câu trả lời trên Google Biểu mẫu cho bài khảo sát mẫu.
Bạn có thể xuất kết quả khảo sát từ phần "câu trả lời" bằng cách nhấp vào biểu tượng Google Trang tính rồi tạo bảng tính mới hoặc tải kết quả vào một bảng tính hiện có. Google Biểu mẫu sẽ tiếp tục thêm câu trả lời vào bảng tính khi người trả lời gửi câu trả lời cho đến khi bạn bỏ chọn mục "Chấp nhận câu trả lời" .
Bây giờ, hãy xem từng loại phản hồi và cách loại phản hồi đó được dịch trong tệp Google Trang tính.
3. Biến đổi các ý kiến phản hồi trong bản khảo sát
Các câu hỏi khảo sát có thể được nhóm thành 4 nhóm sẽ có định dạng xuất cụ thể. Tuỳ thuộc vào loại câu hỏi, bạn sẽ cần sắp xếp lại dữ liệu theo cách nhất định. Tại đây, chúng ta sẽ xem xét từng nhóm và các loại quy tắc chuyển đổi cần áp dụng.
Câu hỏi một lựa chọn: câu trả lời ngắn, đoạn văn, trình đơn thả xuống, thang điểm tuyến tính, v.v.
- Tên câu hỏi: tên cột
- Phản hồi: giá trị của ô
- Các yêu cầu về việc chuyển đổi: không cần chuyển đổi; phản hồi sẽ được tải nguyên trạng.
Câu hỏi trắc nghiệm: nhiều lựa chọn, hộp đánh dấu
- Tên câu hỏi: tên cột
- Phản hồi: danh sách giá trị có dấu phân cách dấu chấm phẩy (ví dụ: "Resp 1; Resp 4; Resp 6")
- Yêu cầu về việc chuyển đổi: cần trích xuất và tổng hợp danh sách giá trị, vì vậy, mỗi phản hồi sẽ trở thành một hàng mới.
Câu hỏi theo lưới nhiều lựa chọn
Dưới đây là ví dụ về câu hỏi trắc nghiệm. Bạn phải chọn một giá trị duy nhất trong mỗi hàng.
- Tên câu hỏi: mỗi câu hỏi riêng lẻ trở thành một tên cột có định dạng "Câu hỏi [Lựa chọn]" này.
- Phản hồi: mỗi câu trả lời riêng lẻ trong lưới sẽ trở thành một cột có một giá trị duy nhất.
- Yêu cầu về việc chuyển đổi: mỗi câu hỏi/câu trả lời phải trở thành một hàng mới trong bảng và được chia thành 2 cột. Một cột đề cập đến lựa chọn cho câu hỏi và cột còn lại có câu trả lời.
Câu hỏi về lưới hộp đánh dấu nhiều lựa chọn
Dưới đây là ví dụ về lưới hộp đánh dấu. Bạn có thể chọn không có giá trị nào trong mỗi hàng.
- Tên câu hỏi: mỗi câu hỏi riêng lẻ trở thành một tên cột có định dạng này "Câu hỏi [Lựa chọn]".
- Phản hồi: mỗi phản hồi riêng lẻ trong lưới sẽ trở thành một cột có danh sách các giá trị được phân tách bằng dấu chấm phẩy.
- Yêu cầu về việc chuyển đổi: các loại câu hỏi này kết hợp "hộp đánh dấu" và "lưới nhiều lựa chọn" và phải được giải quyết theo thứ tự này.
Trước tiên, cần trích xuất và tổng hợp danh sách giá trị của mỗi câu trả lời. Vì vậy, mỗi câu trả lời sẽ trở thành một hàng mới cho câu hỏi cụ thể.
Thứ hai: mỗi câu trả lời phải trở thành một hàng mới trong bảng và được chia thành hai cột. Một cột đề cập đến lựa chọn cho câu hỏi và cột còn lại chứa câu trả lời.
Tiếp theo, chúng ta sẽ tìm hiểu cách dùng Cloud Dataprep để xử lý những quy tắc chuyển đổi này.
4. Xây dựng Luồng dữ liệu trên đám mây
Nhập "Mẫu thiết kế cho Google Biểu mẫu Analytics" trong Cloud Dataprep
Tải gói quy trình Mẫu thiết kế Analytics cho Google Biểu mẫu xuống (mà không cần giải nén). Trong ứng dụng Cloud Dataprep, hãy nhấp vào biểu tượng Flows trên thanh điều hướng bên trái. Sau đó, trên trang Quy trình, hãy chọn Nhập trên trình đơn theo bối cảnh.
Sau khi nhập luồng, hãy chọn luồng đã nhập để chỉnh sửa, màn hình sẽ có dạng như sau:
Bảng tính kết quả khảo sát trên Google Trang tính
Ở bên trái của quy trình, bạn phải kết nối lại nguồn dữ liệu với Google Trang tính có chứa kết quả trên Google Biểu mẫu. Nhấp chuột phải vào đối tượng tập dữ liệu Google Trang tính rồi chọn "Replace" (Thay thế).
Sau đó nhấp vào "Nhập tập dữ liệu" ở cuối cửa sổ phụ. Nhấp vào "Chỉnh sửa đường dẫn" bút chì.
Từ đó, hãy thay thế giá trị hiện tại bằng đường liên kết trỏ đến Google Trang tính với một số kết quả liên quan đến Google Biểu mẫu, bạn có thể sử dụng ví dụ hoặc bản sao của riêng bạn: https://docs.google.com/spreadsheets/d/1DgIlvlLceFDqWEJs91F8rt1B-X0PJGLY6shkKGBPWpk/edit?usp=sharing
Nhấp vào "Bắt đầu" rồi chọn "Nhập & Thêm vào Flow" ở dưới cùng bên phải. Khi bạn quay lại cửa sổ phụ, hãy nhấp vào nút "Thay thế" ở góc dưới cùng bên phải.
Kết nối bảng BigQuery
Ở bên phải của quy trình, bạn cần kết nối dữ liệu đầu ra với phiên bản BigQuery của riêng mình. Đối với mỗi kết quả, hãy nhấp vào biểu tượng rồi chỉnh sửa các thuộc tính của kết quả đó như sau.
Trước tiên, hãy bắt đầu bằng cách chỉnh sửa "Đích đến thủ công"
Trong phần "Cài đặt xuất bản" sau đây trên màn hình, nhấp vào nút chỉnh sửa
Khi bạn xem phần "Tác vụ xuất bản" , bạn cần thay đổi chế độ cài đặt kết nối bằng cách nhấp vào kết nối BigQuery và chỉnh sửa các thuộc tính của kết nối đó.
Chọn tập dữ liệu BigQuery nơi bạn muốn tải kết quả trên Google Biểu mẫu. Bạn có thể chọn "mặc định" nếu bạn chưa tạo bất kỳ tập dữ liệu BigQuery nào.
Sau khi bạn đã chỉnh sửa "Đích đến thủ công", hãy tiến hành tương tự như vậy cho "Đích đến đã lên lịch" đầu ra.
Lặp lại trên mỗi đầu ra theo các bước tương tự. Tổng cộng bạn phải chỉnh sửa 8 đích đến.
5. Giải thích về luồng Dataprep trên đám mây
Ý tưởng cơ bản về "Mẫu thiết kế cho Analytics trên Google Biểu mẫu" là để thực hiện chuyển đổi đối với các câu trả lời khảo sát như đã mô tả trước đó – bằng cách chia nhỏ từng danh mục câu hỏi thành một công thức chuyển đổi dữ liệu Cloud Dataprep cụ thể.
Quy trình này chia các câu hỏi thành 4 bảng (tương ứng với 4 hạng mục câu hỏi nhằm mục đích đơn giản)
Bạn nên khám phá từng công thức nấu ăn, bắt đầu bằng tiêu đề "Xoá tiêu đề" rồi chọn "SingleChoiceSELECT-Question" tiếp theo là các công thức khác ở bên dưới.
Tất cả công thức đều được nhận xét để giải thích các bước biến đổi. Khi ở trong một công thức, bạn có thể chỉnh sửa một bước và xem trước trạng thái trước/sau của một cột cụ thể.
6. Chạy Luồng dữ liệu trên đám mây
Hiện tại, nguồn và đích đến của bạn đã được định cấu hình đúng cách, bạn có thể chạy quy trình để chuyển đổi và tải phản hồi vào BigQuery. Chọn từng kết quả rồi nhấp vào "Run" (Chạy) . Nếu bảng BigQuery được chỉ định tồn tại, Dataprep sẽ thêm các hàng mới, nếu không sẽ tạo bảng mới.
Nhấp vào "lịch sử công việc" biểu tượng ở trên xoay bên trái để theo dõi công việc. Có thể mất vài phút để tiếp tục và tải bảng BigQuery.
Khi tất cả công việc được hoàn tất, kết quả khảo sát sẽ được tải trong BigQuery theo định dạng rõ ràng, có cấu trúc và chuẩn hoá để sẵn sàng cho việc phân tích.
7. Phân tích dữ liệu khảo sát trong BigQuery
Trong Google Console cho BigQuery, bạn sẽ có thể xem thông tin chi tiết về từng bảng mới
Nhờ dữ liệu khảo sát trong BigQuery, bạn có thể dễ dàng đặt các câu hỏi toàn diện hơn để hiểu rõ các câu trả lời khảo sát ở mức độ sâu hơn. Ví dụ: giả sử bạn đang cố gắng hiểu ngôn ngữ lập trình nào thường được những người có chức danh nghề nghiệp khác nhau sử dụng nhiều nhất – bạn có thể viết một truy vấn như sau:
SELECT
programming_answers.Language AS programming_answers_language,
project_answers.Title AS project_answers_title,
AVG((case when programming_answers.Level='None' then 0
when programming_answers.Level='beginner' then 1
when programming_answers.Level='competent' then 2
when programming_answers.Level='proficient' then 3
when programming_answers.Level='expert' then 4
else null end) ) AS programming_answers_average_level_value
FROM `my-project.DesignPattern.A000111_ProjectAnswers` AS project_answers
INNER JOIN `my-project.A000111_ProgrammingAnswers` AS programming_answers
ON programming_answers.RESPONSE_ID = project_answers.RESPONSE_ID
GROUP BY 1,2
ORDER BY 3 DESC
Để phân tích hiệu quả hơn nữa, bạn có thể kết hợp các câu trả lời khảo sát vào dữ liệu CRM để xem liệu người tham gia có ánh xạ đến bất kỳ tài khoản nào đã có trong kho dữ liệu của bạn hay không. Nhờ đó, doanh nghiệp của bạn có thể đưa ra quyết định sáng suốt hơn về dịch vụ hỗ trợ khách hàng hoặc nhắm đến người dùng cho các đợt phát hành mới.
Trong bài viết này, chúng tôi sẽ hướng dẫn bạn cách kết hợp dữ liệu khảo sát vào một bảng tài khoản dựa trên miền của người trả lời và trang web tài khoản. Giờ đây, bạn có thể xem mức độ phân bổ câu trả lời theo loại tài khoản. Điều này giúp bạn biết số lượng người trả lời thuộc các tài khoản khách hàng hiện tại.
SELECT
account.TYPE AS account_type,
COUNT(DISTINCT project_answers.Domainname) AS project_answers_count_domains
FROM `my-project.A000111_ProjectAnswers` AS project_answers
LEFT JOIN `my-project.testing.account` AS account
ON project_answers.Domainname=account.website
GROUP BY 1
8. Phân tích bằng hình ảnh
Giờ đây, dữ liệu khảo sát của bạn được tập trung trong kho dữ liệu, bạn có thể dễ dàng phân tích dữ liệu trong công cụ thông tin kinh doanh. Chúng tôi đã tạo một số báo cáo mẫu trong Data Studio và trong Looker.
Looker
Nếu đã có một thực thể Looker, bạn có thể dùng LookML trong thư mục này để bắt đầu phân tích bản khảo sát mẫu và dữ liệu CRM cho mẫu này. Bạn chỉ cần tạo một dự án Looker mới, thêm LookML rồi thay thế kết nối và tên bảng trong tệp cho phù hợp với cấu hình BigQuery của mình. Nếu chưa có thực thể Looker nhưng muốn tìm hiểu thêm, bạn có thể lên lịch để xem bản minh hoạ tại đây.
Data Studio
Ngoài ra, để tạo báo cáo trong Data Studio, hãy nhấp vào khung có "Báo cáo trống" của Google và kết nối với BigQuery. Làm theo tất cả các hướng dẫn của Data Studio. Nếu muốn biết thêm, bạn có thể xem hướng dẫn bắt đầu nhanh và giới thiệu về các tính năng chính của Data Studio tại đây. Bạn cũng có thể tìm thấy trang tổng quan được tạo sẵn của chúng tôi về Data Studio tại đây.
9. Dọn dẹp
Cách dễ nhất để loại bỏ việc thanh toán là xoá dự án Google Cloud bạn đã tạo trong phần hướng dẫn. Ngoài ra, bạn có thể xoá từng tài nguyên đó.
- Trong Cloud Console, hãy chuyển đến phần quản lý tài nguyên
- Trong danh sách dự án, hãy chọn dự án mà bạn muốn xoá, sau đó nhấp vào Delete (Xoá).
- Trong hộp thoại, hãy nhập mã dự án rồi nhấp vào Tắt để xoá dự án.