Phân tích dữ liệu (data analysis) trong nghiên cứu là gì? – NordicCoder
Nội Dung Chính
Phân tích dữ liệu – Data analysis – trong nghiên cứu là gì?
Định nghĩa nghiên cứu trong phân tích dữ liệu: Theo LeCompte và Schensul, phân tích dữ liệu nghiên cứu là một quá trình được các nhà nghiên cứu sử dụng để gia giảm dữ liệu thành một câu chuyện và diễn giải nó để rút ra những hiểu biết. Quá trình phân tích dữ liệu giúp giảm một lượng lớn dữ liệu thành các mảnh nhỏ hơn, điều này làm nó có ý nghĩa hơn.
Ba điều thiết yếu diễn ra trong quá trình phân tích dữ liệu – tổ chức dữ liệu đầu tiên. Tóm tắt và phân loại cùng nhau góp phần trở thành phương pháp được biết đến thứ hai được sử dụng để giảm dữ liệu. Nó giúp tìm kiếm các mẫu và chủ đề trong dữ liệu để dễ dàng xác định và liên kết. Thứ ba và cách cuối cùng là phân tích dữ liệu – các nhà nghiên cứu thực hiện nó theo cả cách từ trên xuống hoặc từ dưới lên.
Marshall và Rossman, mặt khác, mô tả phân tích dữ liệu là một quá trình lộn xộn, mơ hồ và tốn thời gian, nhưng là một quá trình sáng tạo và hấp dẫn, qua đó một khối dữ liệu được thu thập và sắp xếp theo thứ tự, cấu trúc và ý nghĩa.
Chúng ta có thể nói rằng, phân tích và giải thích dữ liệu là một quá trình thể hiện ứng dụng logic suy diễn và quy nạp vào nghiên cứu và phân tích dữ liệu.
Tại sao phải phân tích dữ liệu trong nghiên cứu?
Các nhà nghiên cứu phụ thuộc rất nhiều vào dữ liệu khi họ có một câu chuyện để kể hoặc vấn đề cần giải quyết. Nó bắt đầu bằng một câu hỏi và dữ liệu không là gì ngoài câu trả lời cho câu hỏi đó. Nhưng, nếu không có câu hỏi để hỏi thì sao? Tốt! Có thể khám phá dữ liệu ngay cả khi không gặp sự cố – chúng tôi gọi đó là ‘Khai thác dữ liệu’ thường tiết lộ một số mẫu thú vị trong dữ liệu đáng để khám phá.
Không liên quan đến loại dữ liệu, các nhà nghiên cứu khám phá, sứ mệnh và tầm nhìn của khán giả hướng dẫn họ tìm ra các mô hình để họ có thể định hình câu chuyện họ muốn kể. Một trong những điều thiết yếu được mong đợi từ các nhà nghiên cứu trong khi phân tích dữ liệu là để mở và không thiên vị đối với các mẫu, biểu thức và kết quả bất ngờ. Đôi khi, hãy nhớ rằng phân tích dữ liệu kể những câu chuyện thú vị nhất nhưng không lường trước được mà không mong đợi ở thời điểm bắt đầu phân tích dữ liệu. Do đó, hãy dựa vào dữ liệu bạn có trong tay và tận hưởng hành trình phân tích dữ liệu khám phá trong nghiên cứu.
Các loại dữ liệu trong nghiên cứu
Mỗi loại dữ liệu có một chất lượng hiếm có để mô tả mọi thứ sau khi gán một giá trị cụ thể cho nó. Để phân tích, bạn cần tổ chức các giá trị này, được xử lý và trình bày trong một bối cảnh nhất định, để làm cho nó hữu ích. Dữ liệu có thể ở các dạng khác nhau, đây là các loại dữ liệu chính
- Dữ liệu định tính: Khi dữ liệu được trình bày có từ ngữ và mô tả, chúng tôi gọi đó là dữ liệu định tính. Mặc dù bạn có thể quan sát dữ liệu này, nhưng nó chủ quan và do đó, khó phân tích dữ liệu trong nghiên cứu, đặc biệt là để so sánh. Ví dụ: Dữ liệu chất lượng đại diện cho mọi thứ mô tả hương vị, kinh nghiệm, kết cấu hoặc ý kiến được coi là dữ liệu chất lượng. Loại dữ liệu này thường được thu thập thông qua các nhóm tập trung, phỏng vấn cá nhân hoặc sử dụng các câu hỏi mở trong các cuộc khảo sát.
- Dữ liệu định lượng: Bất kỳ dữ liệu nào được biểu thị bằng số lượng các số liệu được gọi là dữ liệu định lượng. Loại dữ liệu này có thể được phân biệt thành các loại, được nhóm, đo lường, tính toán hoặc xếp hạng. Ví dụ: các câu hỏi như tuổi, thứ hạng, chi phí, chiều dài, cân nặng, điểm số, v.v … mọi thứ đều thuộc loại dữ liệu này. Bạn có thể trình bày dữ liệu đó ở định dạng đồ họa, biểu đồ hoặc bạn có thể áp dụng các phương pháp phân tích thống kê cho dữ liệu này. Bảng câu hỏi OMS (Hệ thống đo lường kết quả) trong các cuộc khảo sát là một nguồn thu thập dữ liệu số đáng kể.
- Dữ liệu phân loại:Đó là dữ liệu được trình bày theo nhóm. Tuy nhiên, một mục được bao gồm trong dữ liệu phân loại không thể thuộc về nhiều nhóm cùng một lúc. Ví dụ: một người trả lời khảo sát bằng cách nói về phong cách sống, tình trạng hôn nhân, thói quen hút thuốc hoặc thói quen uống rượu của họ theo dữ liệu phân loại. Một bài kiểm tra chi bình phương là một phương pháp tiêu chuẩn được sử dụng để phân tích dữ liệu này.
Phân tích dữ liệu trong nghiên cứu định tính
Phân tích và nghiên cứu dữ liệu trong dữ liệu định tính hoạt động khác một chút so với dữ liệu số vì dữ liệu chất lượng được tạo thành từ các từ, mô tả, hình ảnh, đối tượng và đôi khi là ký hiệu. Để có thể nhận được cái nhìn sâu sắc từ thông tin phức tạp như vậy là một quá trình phức tạp, do đó thường được sử dụng cho nghiên cứu khám phá và phân tích dữ liệu.
Tìm mẫu trong dữ liệu định tính
Mặc dù có một số cách để tìm các mẫu trong thông tin văn bản, một phương pháp dựa trên từ là kỹ thuật toàn cầu được sử dụng rộng rãi để nghiên cứu và phân tích dữ liệu. Đáng chú ý, quá trình phân tích dữ liệu trong nghiên cứu định tính là thủ công. Ở đây các nhà nghiên cứu thường đọc dữ liệu có sẵn và tìm các từ lặp đi lặp lại hoặc thường được sử dụng.
Ví dụ: trong khi nghiên cứu dữ liệu được thu thập từ các quốc gia châu Phi để hiểu những vấn đề cấp bách nhất mà mọi người phải đối mặt, các nhà nghiên cứu có thể tìm thấy thức ăn và cơn đói là những từ được sử dụng phổ biến nhất và sẽ làm nổi bật chúng để phân tích thêm
Bối cảnh từ khóa là một kỹ thuật dựa trên từ được sử dụng rộng rãi. Trong phương pháp này, nhà nghiên cứu cố gắng hiểu khái niệm bằng cách phân tích bối cảnh trong đó những người tham gia sử dụng một từ khóa cụ thể.
Ví dụ, các nhà nghiên cứu tiến hành nghiên cứu và phân tích dữ liệu để nghiên cứu khái niệm ‘bệnh tiểu đường’ trong số những người được hỏi có thể phân tích bối cảnh thời gian và cách người được hỏi đã sử dụng hoặc gọi từ ‘bệnh tiểu đường’.
Kỹ thuật dựa trên sự xem xét kỹ lưỡng cũng là một trong những phương pháp phân tích văn bản được khuyến nghị sử dụng để xác định một mẫu trong dữ liệu chất lượng. So sánh và tương phản là phương pháp được sử dụng rộng rãi theo kỹ thuật này để phân biệt cách một văn bản cụ thể tương tự hoặc khác biệt với nhau.
Ví dụ: để tìm hiểu tầm quan trọng của người bác sĩ nội trú trong một công ty, dữ liệu thu thập được chia thành những người cho rằng cần phải thuê bác sĩ nội trú và những người cho rằng không cần thiết. So sánh và tương phản là phương pháp tốt nhất có thể được sử dụng để phân tích các cuộc thăm dò có các loại câu hỏi trả lời duy nhất.
Các phép ẩn dụ có thể được sử dụng để giảm dữ liệu và tìm các mẫu trong đó để việc kết nối dữ liệu với lý thuyết trở nên dễ dàng hơn.
Phân vùng biến là một kỹ thuật khác được sử dụng để phân tách các biến để các nhà nghiên cứu có thể tìm thấy các mô tả và giải thích mạch lạc hơn từ dữ liệu khổng lồ.
Phương pháp được sử dụng để phân tích dữ liệu trong nghiên cứu định tính
Có một số kỹ thuật để phân tích dữ liệu trong nghiên cứu định tính, nhưng đây là một số phương pháp thường được sử dụng,
Phân tích nội dung: Nó được chấp nhận rộng rãi và là kỹ thuật được sử dụng thường xuyên nhất để phân tích dữ liệu trong phương pháp nghiên cứu. Nó có thể được sử dụng để phân tích thông tin tài liệu từ văn bản, hình ảnh. Nó phụ thuộc vào các câu hỏi nghiên cứu để dự đoán thời điểm và nơi sử dụng phương pháp này.
Phân tích tường thuật: Đây là một phương pháp được sử dụng để phân tích nội dung được thu thập từ nhiều nguồn khác nhau. Ở đây, nguồn có thể là các cuộc phỏng vấn cá nhân, quan sát thực địa và khảo sát. Phần lớn thời gian, câu chuyện hoặc ý kiến được chia sẻ bởi mọi người đều tập trung vào việc tìm câu trả lời cho các câu hỏi nghiên cứu.
Phân tích diễn ngôn: Tương tự như phân tích tường thuật, phân tích diễn ngôn được sử dụng để phân tích các tương tác với mọi người. Tuy nhiên, phương pháp đặc biệt này sẽ xem xét bối cảnh xã hội theo đó hoặc trong đó diễn ra giao tiếp giữa nhà nghiên cứu và người trả lời. Ngoài ra, phân tích diễn ngôn cũng tập trung vào lối sống và môi trường hàng ngày trong khi đưa ra bất kỳ kết luận nào.
Lý thuyết có căn cứ: Khi bạn muốn giải thích tại sao một hiện tượng cụ thể xảy ra, thì sử dụng lý thuyết có căn cứ để phân tích dữ liệu chất lượng là biện pháp tốt nhất. Lý thuyết có căn cứ được áp dụng để nghiên cứu dữ liệu về các trường hợp tương tự xảy ra trong các bối cảnh khác nhau. Khi các nhà nghiên cứu đang sử dụng phương pháp này, họ có thể thay đổi các giải thích hoặc đưa ra những giải thích mới cho đến khi họ đi đến một kết luận nào đó.
Phân tích dữ liệu trong nghiên cứu định lượng
Chuẩn bị dữ liệu để phân tích
Giai đoạn đầu tiên trong nghiên cứu và phân tích dữ liệu là làm cho nó trở thành dữ liệu danh nghĩa có thể được chuyển đổi thành một cái gì đó có ý nghĩa. Chuẩn bị dữ liệu bao gồm bốn giai đoạn
Giai đoạn I: Xác thực dữ liệu
Xác thực dữ liệu được thực hiện để hiểu nếu mẫu dữ liệu được thu thập theo các tiêu chuẩn được đặt trước hoặc đó là một mẫu dữ liệu sai lệch được chia thành bốn giai đoạn khác nhau
- Gian lận: Để đảm bảo con người thực tế ghi lại từng câu trả lời cho khảo sát hoặc bảng câu hỏi
- Sàng lọc: Để đảm bảo mỗi người tham gia hoặc người trả lời được lựa chọn hoặc lựa chọn tuân thủ các tiêu chí nghiên cứu
- Quy trình: Để đảm bảo các tiêu chuẩn đạo đức được duy trì trong khi thu thập mẫu dữ liệu
- Tính đầy đủ: Để đảm bảo rằng người trả lời đã trả lời tất cả các câu hỏi trong một cuộc khảo sát trực tuyến và người phỏng vấn đã hỏi tất cả các câu hỏi được đặt ra trong bảng câu hỏi.
Giai đoạn II: Chỉnh sửa dữ liệu
Thường xuyên hơn, một mẫu dữ liệu nghiên cứu rộng rãi thường đi kèm với các lỗi. Người trả lời đôi khi điền vào một số lĩnh vực không chính xác hoặc đôi khi bỏ qua chúng một cách vô tình. Chỉnh sửa dữ liệu là một quá trình trong đó các nhà nghiên cứu phải xác nhận rằng dữ liệu được cung cấp không có lỗi như vậy. Vì vậy, họ cần tiến hành kiểm tra cần thiết và kiểm tra ngoại lệ để chỉnh sửa thô và làm cho nó sẵn sàng để phân tích.
Giai đoạn III: Mã hóa dữ liệu
Trong cả ba, đây là giai đoạn chuẩn bị dữ liệu quan trọng nhất, liên quan đến việc nhóm và gán giá trị cho các phản hồi khảo sát. Giả sử một cuộc khảo sát được hoàn thành với cỡ mẫu 1000, sau đó nhà nghiên cứu sẽ tạo một khung tuổi để phân biệt người trả lời dựa trên tuổi của họ. Do đó, việc phân tích các mẫu dữ liệu nhỏ trở nên dễ dàng hơn thay vì xử lý đống dữ liệu khổng lồ.
Phương pháp được sử dụng để phân tích dữ liệu trong nghiên cứu định lượng
Sau khi dữ liệu được chuẩn bị để phân tích, các nhà nghiên cứu sẵn sàng sử dụng các phương pháp nghiên cứu và phân tích dữ liệu khác nhau để rút ra những hiểu biết có ý nghĩa. Chắc chắn, các kỹ thuật thống kê được ưa chuộng nhất để phân tích dữ liệu số. Phương pháp này một lần nữa được phân loại thành hai nhóm. Đầu tiên, ‘Thống kê mô tả‘ được sử dụng để mô tả dữ liệu. Sau đó, ‘Thống kê suy luận’ giúp so sánh dữ liệu.
Thống kê mô tả
Phương pháp này được sử dụng để mô tả các tính năng cơ bản của các loại dữ liệu linh hoạt trong nghiên cứu. Nó trình bày dữ liệu theo cách có ý nghĩa như vậy mà mô hình trong dữ liệu bắt đầu có ý nghĩa. Tuy nhiên, phân tích mô tả không đi xa hơn việc đưa ra kết luận. Các kết luận một lần nữa dựa trên các nhà nghiên cứu giả thuyết đã đưa ra cho đến nay. Dưới đây là một vài loại phương pháp phân tích mô tả chính
Các biện pháp tần số
- Đếm, Phần trăm, Tần suất
- Nó được sử dụng để biểu thị mức độ thường xuyên xảy ra một sự kiện cụ thể
- Các nhà nghiên cứu sử dụng nó khi họ muốn giới thiệu tần suất trả lời
Biện pháp của xu hướng trung ương
- Phương pháp, trung bình, chế độ
- Phương pháp này được sử dụng rộng rãi để chứng minh sự phân phối bởi các điểm khác nhau
- Các nhà nghiên cứu sử dụng phương pháp này khi họ muốn thể hiện phản ứng phổ biến nhất hoặc mức độ trung bình được chỉ định
Các biện pháp phân tán hoặc biến đổi
- Phạm vi, phương sai, độ lệch chuẩn
- Ở đây trường tương ứng với điểm cao / thấp
- Độ lệch chuẩn phương sai = chênh lệch giữa điểm số quan sát và giá trị trung bình
- Nó được sử dụng để xác định sự lây lan của điểm số bằng cách nêu các khoảng
- Các nhà nghiên cứu sử dụng phương pháp này để giới thiệu dữ liệu dàn trải. Nó giúp họ xác định độ sâu cho đến khi dữ liệu được trải ra mà nó ảnh hưởng trực tiếp đến giá trị trung bình.
Các biện pháp của vị trí
- Cấp bậc phần trăm, hàng ngũ
- Nó dựa vào điểm số được tiêu chuẩn hóa giúp các nhà nghiên cứu xác định mối quan hệ giữa các điểm số khác nhau.
- Nó thường được sử dụng khi các nhà nghiên cứu muốn so sánh điểm số với số lượng trung bình.
Đối với nghiên cứu thị trường định lượng, sử dụng phân tích mô tả thường đưa ra những con số tuyệt đối, nhưng phân tích không bao giờ đủ để chứng minh sự hợp lý đằng sau những con số đó. Tuy nhiên, cần phải nghĩ ra phương pháp tốt nhất được sử dụng cho nghiên cứu và phân tích dữ liệu phù hợp với bảng câu hỏi khảo sát của bạn và những gì các nhà nghiên cứu muốn kể. Ví dụ, giá trị trung bình là cách tốt nhất để chứng minh điểm trung bình của học sinh trong trường. Tốt hơn là dựa vào số liệu thống kê mô tả khi các nhà nghiên cứu có ý định giữ cho nghiên cứu hoặc kết quả giới hạn trong mẫu được cung cấp mà không khái quát nó cho dân số. Ví dụ: khi bạn muốn so sánh biểu quyết trung bình được thực hiện ở hai thành phố khác nhau, thì thống kê chênh lệch là đủ.
Phân tích mô tả cũng được gọi là “phân tích đơn biến” vì nó thường được sử dụng để phân tích một biến duy nhất.
Thống kê suy luận
Số liệu thống kê suy luận được sử dụng để đưa ra dự đoán về dân số lớn hơn sau khi nghiên cứu và phân tích dữ liệu về mẫu thu thập của dân số đại diện. Ví dụ: tại một rạp chiếu phim, bạn có thể hỏi 100 khán giả bất kỳ nếu họ thích bộ phim họ đang xem. Sau đó, các nhà nghiên cứu sử dụng số liệu thống kê suy luận về mẫu được thu thập để lý giải rằng khoảng 80-90% số người thích bộ phim họ đang xem.
Đây là hai lĩnh vực quan trọng của thống kê suy luận
- Ước tính các tham số:nó lấy số liệu thống kê từ dữ liệu nghiên cứu mẫu và sử dụng nó để chứng minh điều gì đó về tham số dân số.
- Kiểm tra giả thuyết:đó là về lấy mẫu dữ liệu nghiên cứu để trả lời các câu hỏi nghiên cứu khảo sát . Ví dụ, các nhà nghiên cứu có thể quan tâm để hiểu liệu màu son mới ra mắt gần đây có tốt hay không, hoặc nếu viên nang vitamin tổng hợp giúp trẻ em hoạt động tốt hơn trong các trò chơi.
Đây là các phương pháp phân tích tinh vi được sử dụng để thể hiện mối quan hệ giữa các biến khác nhau thay vì mô tả một biến duy nhất. Nó thường được sử dụng khi các nhà nghiên cứu muốn một cái gì đó vượt quá con số tuyệt đối để hiểu mối quan hệ giữa các biến.
Dưới đây là một số phương pháp thường được sử dụng để phân tích dữ liệu trong nghiên cứu
- Tương quan:Khi các nhà nghiên cứu không tiến hành nghiên cứu thực nghiệm trong đó các nhà nghiên cứu quan tâm tìm hiểu mối quan hệ giữa hai hoặc nhiều biến số, họ chọn phương pháp nghiên cứu tương quan .
- Lập bảng chéo:Còn được gọi là bảng dự phòng, lập bảng chéo là phương pháp được sử dụng để phân tích mối quan hệ giữa nhiều biến. Giả sử dữ liệu được cung cấp có các loại tuổi và giới tính được trình bày theo hàng và cột, sau đó lập bảng chéo hai chiều giúp phân tích và nghiên cứu dữ liệu liền mạch bằng cách hiển thị số lượng nam và số nữ trong mỗi loại tuổi.
- Phân tích hồi quy: Đểhiểu mối quan hệ mạnh mẽ giữa hai biến, các nhà nghiên cứu thường dùng phương pháp phân tích hồi quy chính, đây cũng là một loại phân tích dự đoán được sử dụng. Trong phương pháp này, bạn có một yếu tố thiết yếu được gọi là biến phụ thuộc và bạn cũng có nhiều biến độc lập trong phân tích hồi quy, bạn thực hiện các nỗ lực để tìm ra tác động của các biến độc lập đối với biến phụ thuộc. Các giá trị của cả hai biến độc lập và phụ thuộc được coi là được xác định theo cách ngẫu nhiên không có lỗi.
- Bảng tần suất:Quy trình thống kê được sử dụng để kiểm tra mức độ mà hai hoặc nhiều biến khác nhau trong một thử nghiệm. Một mức độ khác nhau đáng kể có nghĩa là kết quả nghiên cứu có ý nghĩa. Trong nhiều bối cảnh, thử nghiệm ANOVA và phân tích phương sai là tương tự nhau.
- Phân tích phương sai:Quy trình thống kê được sử dụng để kiểm tra mức độ mà hai hoặc nhiều thay đổi khác nhau trong một thử nghiệm. Một mức độ khác nhau đáng kể có nghĩa là kết quả nghiên cứu có ý nghĩa. Trong nhiều bối cảnh, thử nghiệm ANOVA và phân tích phương sai là tương tự nhau.
Lưu ý trong phân tích dữ liệu nghiên cứu
- Các nhà nghiên cứu phải có các kỹ năng cần thiết để phân tích dữ liệu, Được đào tạo để chứng minh một tiêu chuẩn thực hành nghiên cứu cao. Lý tưởng nhất, các nhà nghiên cứu phải sở hữu nhiều hơn sự hiểu biết cơ bản về cơ sở lý luận của việc lựa chọn một phương pháp thống kê so với phương pháp khác để có được những hiểu biết dữ liệu tốt hơn.
- Thông thường, phương pháp nghiên cứu và phân tích dữ liệu khác nhau theo kỷ luật khoa học; do đó, có được lời khuyên thống kê khi bắt đầu phân tích giúp thiết kế bảng câu hỏi khảo sát, chọn phương pháp thu thập dữ liệu, chọn mẫu.
- Mục đích chính của nghiên cứu và phân tích dữ liệu là để có được những hiểu biết cuối cùng không thiên vị. Bất kỳ sai lầm trong hoặc giữ một tâm trí thiên vị để thu thập dữ liệu, chọn phương pháp phân tích hoặc trong việc chọn mẫu đối tượng đều dẫn đến một suy luận thiên vị.
- Không liên quan đến sự chính xác được sử dụng trong dữ liệu nghiên cứu và phân tích là đủ để điều chỉnh các phép đo kết quả khách quan được xác định kém. Không có vấn đề gì nếu thiết kế có lỗi hoặc ý định không rõ ràng, nhưng thiếu rõ ràng có thể gây hiểu lầm cho độc giả, do đó tránh thực hành.
- Động lực của phân tích dữ liệu trong nghiên cứu là trình bày dữ liệu chính xác và đáng tin cậy. Càng xa càng tốt, tránh các lỗi thống kê và tìm cách đối phó với các thách thức hàng ngày như ngoại lệ, thiếu dữ liệu, thay đổi dữ liệu, khai thác dữ liệu hoặc phát triển biểu diễn đồ họa.
Lượng dữ liệu được tạo ra hàng ngày thật đáng sợ. Đặc biệt là khi phân tích dữ liệu đã thực hiện giai đoạn trung tâm. vào năm 2018. Trong năm ngoái, tổng nguồn cung dữ liệu lên tới 2,8 nghìn tỷ gigabyte. Do đó, rõ ràng là các doanh nghiệp sẵn sàng tồn tại trong thế giới siêu cạnh tranh phải có khả năng tuyệt vời để phân tích dữ liệu nghiên cứu phức tạp, rút ra những hiểu biết có thể hành động và thích ứng với nhu cầu thị trường mới.
Theo Questionpro – Dịch bới đội ngũ của Nordic Coder