Tiểu luận phương pháp phân tích định lượng trong nghiên cứu khoa học – Tài liệu text

Tiểu luận phương pháp phân tích định lượng trong nghiên cứu khoa học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (300.73 KB, 39 trang )

Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
LỜI MỞ ĐẦU
Trong nghiên cứu khoa học cũng như trong giải quyết công việc nói chung,
phương pháp là yếu tố vô cùng quan trọng. Xác định đúng phương pháp là con đường
dẫn tới thành công và cũng là cơ sở, là chuẩn mực để đánh giá một công trình nghiên
cứu. Phương pháp, trong đó bao gồm phương pháp luận, hệ phương pháp nghiên cứu,
phương pháp tiếp cận, lý thuyết nghiên cứu và kỹ thuật nghiên cứu, có thể nói là chìa
khóa để mở lối cho công trình khoa học, đồng thời cũng là cơ sở đảm bảo tính chất
khoa học của kết quả nghiên cứu. Chính vì vai trò quan trọng của phương pháp như
vậy nên trong quá trình học môn: Phương pháp nghiên cứu khoa học, nhóm chúng tôi
đã được tiếp cận chuyên đề “Phương pháp phân tích định lượng trong nghiên cứu
khoa học”. Thiết nghĩ chuyên đề này sẽ đem lại cho chúng ta những gợi mở bổ ích
cho quá trình nghiên cứu khoa học sau này, mà trước mắt là luận văn cao học.
Trong thời đại ngày nay, khi mà chúng ta có thể tiếp cận thông tin, số liệu từ
nhiều nguồn khác nhau: Từ sách vở, báo chí, từ mạng Internet, thì việc thu thập và xử
lí số liệu như thế nào sẽ có vai trò rất quan trọng. Vì vậy, khi chúng ta tiếp cận và hiểu
được phương pháp phân tích định lượng rồi thì sẽ không còn lúng túng, căng thẳng
khi đứng trước một “mớ hỗn độn” những tài liệu từ nhiều nguồn thông tin khác nhau
và tập hợp tài liệu đó làm nổi bật lên bản chất của vấn đề cần nghiên cứu.
Một công trình nghiên cứu khoa học sẽ có sức thuyết phục hơn khi được dẫn
chứng bằng những con số, số lượng cụ thể. Sự vật, hiện tượng bao giờ cũng biểu hiện
bản chất của nó qua tính chất và số lượng. Trong đó, số lượng giúp cho nhận thức của
chúng ta được chính xác, cụ thể, đồng thời hạn chế đặc tính chủ quan của người
nghiên cứu. Tuy nhiên, vấn đề là người nghiên cứu phải biết xử lí những số liệu,
những con số thu thập được như thế nào cho chính xác và khoa học. Với vấn đề này,
phương pháp phân tích định lượng có nhiều ưu điểm hơn hẳn so với các phương pháp
nghiên cứu khác. Với phương pháp phân tích định lượng, chúng ta có thể xử lí các số
liệu đám đông; có thể khắc phục tình trạng thiếu hụt số liệu, kiểm chứng các nhận
định và có khả năng ứng dụng các công cụ, thiết bị tin học hiện đại và nhu cầu nhận
thức của thời đại thông tin.
Do tập thể các thành viên trong nhóm là những học viên đang trong quá trình

học tập, nên khả năng tìm hiểu, nghiên cứu và thu thập thông tin bị hạn chế. Vì vậy,
sự sai sót không thể tránh khỏi. Tập thể nhóm rất mong nhận được sự đóng góp ý kiến
của các anh chị trong lớp và đặc biệt là sự hướng dẫn của Thầy để nhóm hoàn thiện
chuyên đề này tốt hơn.
Tập thể thành viên nhóm
1
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
CHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁP
NGHIÊN CỨU ĐỊNH LƯỢNG
1.1 Định nghĩa:
Nghiên cứu định lượng là phương pháp thu thập dữ liệu bằng số và giải quyết
quan hệ trong lý thuyết và nghiên cứu theo quan điểm diễn dịch. Hay nói cách khác
nghiên cứu định lượng là những nghiên cứu thu được các kết quả bằng việc sử dụng
những công cụ đo lường, tính toán với những con số cụ thể.
Nghiên cứu định lượng là đi tìm câu trả lời cho câu hỏi bao nhiêu, mức nào.
1.2 Lý thuyết:
Nghiên cứu định lượng chủ yếu là kiểm định lý thuyết, sử dụng mô hình
Khoa học tự nhiên thực chứng luận, phương pháp nghiên cứu định lượng có thể chứng
minh được trong thực tế và theo chủ nghĩa khách quan.
1.3 Phương pháp thực hiện
– Nghiên cứu thực nghiệm thông qua các biến.
– Nghiên cứu đồng đại chéo có nghĩa là thiết kế nghiên cứu trong đó các dữ
liệu được thu thập trong cùng một thời điểm.
Ví dụ: nghiên cứu việc học của con gái ở thành thị và nông thôn.
Nghiên cứu lịch đại thì dữ liệu thu thập theo thời gian trong đó các dữ liệu
được so sánh theo thời gian.
Nghiên cứu trường hợp là thiết kế nghiên cứu tập trung vào một trường hợp cụ
thể.
Nghiên cứu so sánh là thiết kế nghiên cứu trong cùng một thời điểm hay qua
nhiều thời điểm.

1. 4 Cách chọn mẫu:
– Mẫu ngẫu nhiên đơn giản.
– Chọn mẫu hệ thống.
– Chọn mẫu phân tầng.
– Chọn mẫu cụm.
1.5 Cách lập bảng câu hỏi:
2
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
– Theo thứ tự.
– Câu hỏi đóng: Là dạng câu hỏi có số liệu thu thập có thể tương đối dễ dàng
phân tích, mã hóa nhưng nó giới hạn sự trả lời. Thí dụ, sinh viên các khóa học được
đưa ra các câu hỏi nhận xét về giáo trình, bài giảng, sách, … và được chỉ định trả lời
theo thang đánh giá 5 mức độ (rất hài lòng: +2; hài lòng: +1; trung bình: 0; không hài
lòng: -1; rất không hài lòng: -2) để biết sinh viên thỏa mãn hay không thỏa mãn. Đây
là các câu hỏi đóng thể hiện sự mã hóa số liệu.
– Câu hỏi mở: Là dạng câu hỏi có số liệu thu thập không có cấu trúc hay số liệu
khó được mã hóa. Câu hỏi cho phép câu trả lời mở và có các diễn tả, suy nghĩ khác
nhau hơn là ép hoặc định hướng cho người trả lời.
– Câu hỏi được soạn sẵn.
– Câu hỏi ngắn gọn, xúc tích.
– Câu hỏi không gây tranh luận.
1.6 Sử dụng các phương pháp toán học để để ứng dụng trong phân tích
định lượng.
– Thống kê kế toán: Là một bộ phận của toán học ứng dụng dành cho các
phương pháp xử lý và phân tích số liệu thống kê, mà các ứng dụng chủ yếu của nó
trong quản lý là các phương pháp xử lý kiểm tra và dự đoán (dự đoán, điều tra chọn
mẫu,…)
– Mô hình toán: Là sự phản ánh những thuộc tính cơ bản nhất định của các
đối tượng nghiên cứu kinh tế, là công cụ quan trọng cho việc trừu tượng hoá một cách
khoa học các quá trình và hiện tượng kinh tế. Khoa học kinh tế từ lâu đã biết sử dụng

các mô hình kinh tế lượng như mô hình hàm sản suất Cobb – Douglas, mô hình cung
cầu, giá cả v.v
– Vận trù học: Là khoa học có mục đích nghiên cứu các phương pháp phân
tích nhằm chuẩn bị căn cứ chính xác cho các quyết định, đối tượng của nó là hệ thống,
tức là tập hợp các phần tử và hệ thống có tác động qua lại với nhau nhằm đạt tới một
mục tiêu nhất định.
3
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
CHƯƠNG 2: PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNG
Chương này trình bày một số phương pháp tiếp cận thường được áp dụng để
phân tích dữ liệu trong nghiên cứu kinh doanh cũng như các nghiên cứu khác. Đầu
tiên chúng tôi giới thiệu các thử nghiệm của những giả thuyết về sự khác nhau. Sau đó
chúng tôi kiểm tra các biến khác nhau và dự đoán các mối liên hệ. Thêm vào đó,
chúng tôi còn thảo luận các phương pháp để giảm dữ liệu và rút ra phạm vi cơ bản.
2.1 Kiểm tra sự khác nhau.
Câu hỏi bạn đang hỏi là liệu rằng kết quả nghiên cứu khoa học trong kinh
doanh có thể được hỏi bằng cách thống kê hay bằng những phương pháp nghiên cứu
khác. Ví dụ nếu 81% trong 100 khách hàng hài lòng với cửa hàng A và 71% hài lòng
với cửa hàng B thì cửa hàng A có tốt hơn không?
2.1.1 Những giả thiết về một giá trị trung bình.
Trong nghiên cứu chúng ta thường phải làm những báo cáo về giá trị trung
bình. Chúng ta phải giải thích độ lệch chuẩn và hệ số Z có nghĩa là gì. Khi mà phương
sai mẫu chưa được biết và sai số chuẩn của giá trị trung bình thì cũng chưa được biết.
Sai số chuẩn của giá trị trung bình phải được ước tính từ các số liệu mẫu.
Sự ước tính:
SD
X
= (11.1)
Trong đó:
– SD

x
: Sai số chuẩn của giá trị trung bình
– SD’ : Độ lệch chuẩn ước tính.
– N : Kích thước mẫu
1
)(

1
2


=

=
N
Xx
SD
N
i
i
(11.2)
Giả thiết kiểm tra là phân phối t với bậc tự do N-1 và tiến đến phân phối
thường khi số lần quan sát tăng lên.
Ví dụ: Tại một chuỗi siêu thị cung ứng sản phẩm mới, có ít nhất 100 đơn vị
sản phẩm được bán mỗi tuần. Sản phẩm mới được kiểm tra trong 10 sản phẩm ngẫu
nhiên được lựa chọn với một giới hạn thời gian nhất định. Kiểm định một đầu,ví dụ
4
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
khi hướng tìm giả thuyết là thích hợp khi mà doanh số ở mỗi cửa hàng ít nhất là 100,
sản phẩm sẽ được giới thiệu trên quy mô toàn quốc. Giả thuyết không (giả thuyết đơn

H
0
) và giả thuyết thay thế (H
A
)
H
0
: X < 100
H
A
: X > 100
Giả sử mức ý nghĩa α = 0.05, nghĩa là chúng ta bác bỏ giả thiết không (H
0
), khi
mà xác xuất cho giả thiết không chính xác là 5%. Vì vậy mức ý nghĩa cho chúng ta
thấy rằng xác xuất mà chúng ta chờ đợi để xem xét là một quyết định sai, điều đó
nghĩa là chấp nhận giả thuyết thay thế (H
A
) khi thực tế giả thuyết không là đúng.
Bằng việc tính toán chúng ta thấy rằng mức trung bình X = 109.4 và độ lệch
chuẩn SD =14.90
Chúng ta cũng có thể thấy rằng sai số chuẩn của giá trị trung bình:
SDx = = = 4.55
Chúng ta tìm t bằng cách tính :
07.2
55.4
1004.109
=

=


=
X
SD
X
t
µ
Giới hạn t (ví dụ giá trị t được yêu cầu để từ chối giả thiết không) như khi đọc
từ bảng t với bậc tự do là 1.833 (α=0.05).
Ở đây giá trị kiểm tra t được cho sẵn. Giá trị kiểm tra t giả sử là biến phân phối
nhưng không tìm ra được giá trị nào thiết thực hơn. Khi N trở nên lớn (ví dụ N > 30),
phân phối t tiến gần đến phân phối thường.
Hộp 11.1 Những giả thiết
Giả thiết đóng vai trò chính trong việc nghiên cứu. Chúng gợi ý một cách gián
tiếp những giả định hoặc những kỳ vọng và thường quy định bởi những câu hỏi. Nếu
sự hài lòng của khách hàng ở cửa hàng A lớn hơn ở cửa hàng B thì liệu rằng sản phẩm
mới sẽ bán mỗi tuần của cửa hàng A có nhiều hơn 100 đơn vị sản phẩm? Những giả
thiết có thể được quy định (về nguyên tắc cơ bản). Để làm như vậy chúng ta phải đối
chiếu với giả thiết.
V í dụ: Với giả thiết không (H
0
), sự hài lòng của khách hàng ở cửa hàng A tốt
hơn ở cửa hàng B thì sẽ không có sự khác biệt giữa cửa hàng A và cửa hàng B. Để
5
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
làm điều đó chúng ta cần số liệu về việc thực hiện giữa cửa hàng A và cửa hàng B.
Nếu có đủ sự khác biệt để tồn tại chúng ta bác bỏ giả thiết không (H
0
) và chấp nhận
giả thiết thay thế (H

A
). Vì vậy, thông qua việc giả định, chúng ta có được những hiểu
biết, nghĩa là chúng ta đã kiểm nghiệm giả định hoặc kỳ vọng của chúng ta.
2.1.2 Những giả thiết về hai giá trị trung bình.
Những người nghiên cứu thường đối mặt với những câu hỏi như: Thị hiếu
trong khu vực A khác với thị hiếu trong khu vực B không? Phân khúc khách hàng 1
với phân khúc khách hàng 2 không? Có 1 chiến dịch quảng cáo hiệu quả hơn cái khác
không? Công thức để kiểm tra sự khác biệt giữa các nghiệm là được phân bổ bình
thường, và do đó những sự khác biệt của chúng cũng tạo ra sự phân bổ bình thường,
cụ thể theo công thức sau :
Z =
(X
1
– X
2
) – (µ
1
– µ
2
)
 Trong đó:
X
1
= Nghiệm 1
X
2
= Nghiệm
= Sai số của hai nghiệm
µ
1

và µ
2
là nghiệm kỳ vọng chưa biết
 Sai số của hai nghiệm được tính theo công thức sau:
=
Giả định rằng 2 phương sai tổng thể bằng nhau, phương sai tổng thể chung có
thể được tạo ra bằng cách tổng hợp các mẫu. Khi phương sai không rõ và sai số chuẩn
của các mẫu phải được ước lượng, sau đó t đại diện cho một số liệu thống kê kiểm tra
phân bổ phù hợp với v = N
1
+ N
2
– 2 bậc tự do.
Ví dụ :
Một nhà phân phối đang phát triển 1 sản phẩm mới và tự hỏi liệu nhãn hiệu của
sản phẩm nên có màu đỏ hay màu xanh dương. Những sản phẩm mới với hai nhãn
hiệu khác nhau được thử nghiệm trong 10 cửa hàng được lựa chọn ngẫu nhiên. Doanh
6
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
thu trung bình đạt được với nhãn màu đỏ là 403.0 và với màu xanh dương là 390.3.
Sai số chuẩn của việc ước lượng cho sự khác biệt giữa các mẫu là 8.15
Tính t = = = 1.56
Giá trị này được chuyển đến bảng t cho v = n
1
+ n
2
-2 = 10 + 10 – 2 = 18 bậc tự
do. Kiểm nghiệm là hai phía vì giả thuyết là hai màu sắc phù hợp như nhau. Với α =
0.05, và 18 bậc tự do, tới hạn t = 2.101. Điều này có nghĩa giả thuyết không được chấp
nhận. Ở ví dụ trên chúng ta thấy rằng ( µ1 – µ2 ) = 0. Vì hai nghiệm kỳ vọng chưa biết

và được giả định là như nhau.
NB : Lưu ý rằng trong ví dụ trên hai mẫu được giả định là không liên quan, đó
là được rút ra độc lập với nhau.
2.1.3 Các mẫu liên quan
Giả sử chúng ta muốn tìm hiểu xem thu nhập đã tăng lên từ năm ngoái đến
nay trên cơ sở dữ liệu thu nhập của năm ngoái và thu nhập của năm nay trong một
mẫu sau:
7
Người
Thu nhập
năm trước
Thu nhập
năm nay
Chênh lệch
1 228 224 -4
2 213 225 12
3 257 271 14

30 260 292 32
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Điều này thường được gọi là vấn đề hai mẫu với sự quan sát theo cặp. Chúng
theo cặp bởi vì sự quan sát xảy ra trong một cặp thu nhập năm trước và năm nay của
mỗi cá nhân. Để giải quyết vấn đề này chúng ta có thể lấy giá trị thu nhập của năm
nay (cột 3) trừ đi giá trị thu nhập của năm trước (cột 2), và bây giờ, chúng ta có giá trị
khác biệt ở cột chênh lệch (cột 4).
Cần chú ý rằng sự khác biệt biệt được so sánh từ một mẫu quan sát đã thảo luận
trước đó, vì vậy các phương pháp áp dụng là tương tự.
Giả thuyết vô hiệu H
0
là trung bình của tập hợp chính khác nhau, 30 mẫu khác

nhau trong cột 4 , khi giá tri này bằng 0 . Giả thuyết thay thế H
A
là giá trị trung bình
dãy số lớn hơn 0.
Từ kết quả kiểm mẫu của sinh viên cho thấy:
Với mức ý nghĩa = 8.13
Độ lệch chuẩn ước tính (SD) = 10,91
St sai số là = 1,99
t = 4,08
p = 0,0002
Từ các tính toán thống kê thấy t = 4,08 . Tương ứng với giá trị p = 0,0002 là
nhỏ hơn đáng kể so với 0,05 và do đó H
0
bị từ chối. Trong hầu hết các mẫu kiểm tra
và các chương trình giá trị thống kê kiểm tra và giá trị p tương ứng đều hiển thị do đó
không cần tìm chúng trong bảng phân phối thống kê tương ứng.
Một số phương pháp phi tham số hữu ích cũng có sẵn như là những lựa chọn
thay thế cho các phương pháp cổ điển. Chúng có lợi thế là đòi hỏi ít về những giả
định .
Nhưng nếu giả định cần thiết cho việc sử dụng t kiểm tra là hợp lý thì nó rất
hữu ích vì thử nghiệm này thường có độ chính xác cao hơn. Ví dụ cho khoảng cách tin
cậy hẹp hơn so với phương pháp phi tham số tương ứng. Chú ý phương pháp dựa trên
phân phối t có liên quan tới phương sai, trong khi các phương pháp phi tham số
thường quan tâm tới giá trị trung bình. Nhưng nếu phân phối là đối xứng thì hai giá trị
trên bằng nhau.
8
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Một thử nghiệm phi tham số đơn giản áp dụng cho các vấn đề thu nhập cao hơn
là kiểm tra dấu hiệu. Giả sử trong trường hợp trên 30 mẫu kiểm 7 là dưới trung bình
và 23 là trên trung bình. Dấu hiệu trung bình p = 0,0026, P giá trị chỉ ra sự khác biệt

đáng kể giữa thu nhập năm trước và thu nhập năm nay. Kiểm tra dấu hiệu trong ví dụ
trên là dựa trên thực tế là 7 sự khác biệt tiêu cực và 23 khác biệt tích cực . Không có
thông tin khác được sử dụng. Kiểm tra dấu hiệu, hay nói cách khác là thông tin chứa
trong dữ liệu đó vì mốc dao động xung quanh giá trị trung bình. Một thử nghiệm tham
số, ví dụ t kiểm tra cũng có sự khác biệt rõ ràng với giá trị trung bình.
2.1.4 Sự so sánh từ hai nhóm trở lên
Trong nghiên cứu chúng ta thường gặp sự so sánh từ hai nhóm trở lên xảy ra
cùng một lúc. Để nghiên cứu các tình huống như vậy thì phân tích phương sai
(ANOVA) thường được sử dụng. Trước khi giải thích phương pháp nghiên cứu này,
chúng ta sẽ đề cập rằng tại sao cần phải tiến hành một vài kiểm nghiệm t để so sánh
tất cả sự kết hợp của các nhóm thì thật sự không thích hợp.
Giả sử chúng ta quan tâm đến sự khác nhau giữa ba nhóm. Nếu chúng ta tiến
hành kiểm nghiệm t tại mỗi nhóm, chúng ta phải so sánh giữa nhóm 1 và nhóm 2, giữa
nhóm 1 và nhóm 3, và giữa nhóm 2 và nhóm 3. Nếu mỗi kiểm nghiệm t này sử dụng
mức ý nghĩa là 0.05, sau đó xác xuất nhầm lẫn của sự bác bỏ giả thiết không (H
0
) là
5%. Do đó xác xuất không có lỗi loại I là 95% cho mỗi kiểm nghiệm. Khi giả sử rằng
các cuộc kiểm nghiệm là độc lập với nhau, thì xác xuất không có lỗi loại I là (0.95)
3
=
0.95 x 0.95 x 0.95 = 0.857. Bây giờ xác xuất chắc chắn không có lỗi loại I là 1 – 0.857
= 0.143, hay 14.3% (thí nghiệm thống kê qua tỷ lệ sai số này được tính trên dữ liệu
thực nghiệm giống nhau được biết đến như tỷ lệ sai số thực nghiệm).
Phân tích phương sai dựa trên so sánh chỉ số của phương sai hệ thống với
phương sai không có hệ thống. Giả sử một nghiên cứu thực nghiệm bao gồm khảo sát
của ba phương pháp thiết kế. Nếu các phương pháp thay đổi hiệu lực, thì một khả
năng kỳ vọng sẽ thay đổi ít hơn trong một nhóm được bộc lộ đến một loại thiết kế đặc
thù hơn qua các nhóm. Phân tích phương sai được tính theo công thức như sau:
1. Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân.

9
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
2. Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lý với tổng
bình quân;
3. Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trong nhóm với
bình quân nhóm.
Ước lượng riêng lẻ của biến tổng thể trên trung bình bình phương:
MS
T
= =
MS
B
= =
MS
W
= =
Trong đó:
1. MS
T
= Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân.
2. MS
B
= Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lý
với tổng bình quân; và
3. MS
W
= Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trong
nhóm với bình quân nhóm.
Ví dụ:
Giả sử có ba nghiên cứu về quảng cáo trong 24 thành phố được lựa chọn ngẫu

nhiên, so sánh về kích thước và nhân khẩu. Giả sử kết quả từ máy tính cho ra như sau:
Nguồn biến thiên
Tổng bình
phương
Bậc tự do
Trung bình
bình phương
Tỷ lệ F
Giữa các nhóm
Trong các nhóm
Tổng cộng
49.0
87.5
136.5
2
21
23
24.1
4.17
5.88
Bậc tự do được tính toán như sau: Tổng cộng (24-1) = 23, phương sai giữa các nhóm
(3-1)=2, phương sai trong nhóm (23-2)=21
Giả thiết không (Ho) là các trung bình nhóm ví dụ như: X
G1
= X
G2
= X
G2’
và giá
trị tới hạn là α = 0.05. Để kiểm định giả thiết, một thí nghiệm F (trên cơ sở phân phối

10
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
F) là phù hợp. Thí nghiệm F có thể được xem như là khái quát của thí nghiệm t và cho
phép so sánh của hai nhóm trở lên cùng lúc. Giá trị F được tính bằng hiệu số giữa
trung bình bình phương và bình phương phương sai trong nhóm, đó là 24,5/4,17. Khi
tra bảng phân phối F, chúng ta tìm thấy đơn vị tử số (là 2) và mẫu số (là 21) và tìm
thấy giá trị là 3.47. Bởi vì 5.88 lớn hơn 3.47 chúng ta sẽ loại bỏ giả thiết không (H
0
),
kết quả là, mức ý nghĩa của nhóm bằng nhau, và chấp nhận giả thiết thay thế, như vậy,
sự thay đổi chiến dịch quảng cáo là có hiệu quả. Nếu chúng ta đánh giá mức hiệu quả
trung bình của một trong ba chiến dịch quảng cáo trên chúng ta cũng nhận thấy rằng
có một chiến dịch là có hiệu quả nhất.
NB: Trong phân tích dung sai, biến thiên phụ thuộc, hiệu quả của quảng cáo,
được thừa nhận theo hệ mét, đó là khoảng cách hoặc chỉ số tỷ lệ. Biến độc lập (chiến
dịch quảng cáo khác nhau) là xác thực.
Ở trên là một ví dụ về phân tích dung sai đơn giản. Chỉ một hệ số, ảnh hưởng
của thay đổi chiến dịch quảng cáo được phân tích như thế nào. Phân tích dung sai có
thể được mở rộng bao gồm nhiều hơn hai biến độc lập một cách rõ ràng hơn; ví dụ,
thành tích của sinh viên (biến phụ thuộc) có thể được nghiên cứu như đầu ra của
những phương pháp khác nhau của thiết kế và người thiết kế chương trình giáo dục
(biến độc lập). Phân tích phương sai cũng có thể được mở rộng để kiểm tra sự tác
động đồng thời trên hai biến phụ thuộc, giới hạn của sự đa dạng phân tích dung sai.
2.2 Mối quan hệ (sự biến thiên đồng thời) giữa các biến
Trong nghiên cứu, chúng ta thường quan tâm, chú ý đến có 1, 2 hay nhiều mối
quan hệ giữa các biến số. Có nhiều phép đo về những mối quan hệ này, hãy xem ví dụ
của Frankfort –Nachmias và Nachmias (1996) về tổng quan một số phép đo phổ biến
của sự liên hệ.
2.2.1 Hệ số tương quan
Một phép đo quan trọng là sự tương quan hay nói cách khác là hệ số tương

quan tức thời: r đã được đề cập ở những chương trước. Hệ số tương quan tức thời giới
hạn bời khoảng cách của biến số hay qui mô của biến số. Giống như những phép đo
khác về mối quan hệ, hệ số tương quan được xem là biến số chung của 2 phép đo. Hệ
số tương quan tức thời dùng để kiểm tra mối quan hệ tuyến tính giữa 2 biến số X và
Y.
11
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Về lý thuyết, hệ số tương quan có giá trị từ [-1,1] ( -1 ≤ r ≤ 1)
 r = +1, cho biết 2 biến số là biến số có thực;
 r = -1, cho biết 2 biến số có mối quan hệ hoản toàn ngược nhau;
 r dần tới 0, chỉ ra rằng những biến số không có mối liên hệ với nhau.
Công thức tính hệ số tương quan tức thời:
r
xy
=
Trong đó X ,Y đại diện cho mẫu X, Y tương ứng.
Ta có công thức tương đương:
r
xy
=
Trong đó: là phương sai của X
là phương sai của Y
là phương sai hợp của X và Y
Hệ số tương quan diển tả mối quan hệ giữa hai biến số và hệ quả của mối liên
hệ đó.
Bình phương hệ số tương quan là:
Biến xem xét
R
2
=

Biến tổng hợp
Điều này có nghĩa là nếu bình phương hệ số tương quan giữa X và Y là 50%
thì biến X là 50% và biến Y là 50%.
Sự tương quan thường được dùng để kiểm tra 2 chiều các mệnh đề giả thuyết,
có nghĩa là kiểm tra giả thuyết về mối quan hệ giữa hai biến số. Từ vấn đề này, chúng
12
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
ta thấy rằng, hệ số tương quan là số thống kê có ý nghĩa. Nó phụ thuộc vào cả độ lớn
của hệ số tương quan và số lượng quan sát.
Độ lệch tiêu chuẩn của hệ số tương quan là:
Ví dụ: Một bản thử nghiệm nghiên cứu, trong số 2 nhóm khảo sát về sự cảm
nhận quảng cáo chịu tác động, ảnh hưởng bởi sự thu hút quảng cáo (1= tích cực; 0=
tiêu cực) , sự tin chắc vào sản phẩm quảng cáo và giới tính (1= nữ; 0= nam). Số lượng
khảo sát là 60, kết quả được ghi nhận ở bảng 11.1. Qua bảng trên, chỉ ra rằng phụ nữ
thì ít có khuynh hướng cảm nhận quảng cáo và phụ nữ cũng có thể ít tin vào sản phẩm
quảng cáo. Chúng ta cũng thấy rằng, những khảo sát này có ý nghĩa quan trọng trong
phân tích hai chiều (phân tích 2 biến số). Thêm vào đó, chúng ta chú ý rằng: sự thu
hút tích cực có thể được cảm nhận hơn là sự thu hút tiêu cực (mức ý nghĩa 0.05).
2.2.2 Tương quan một phần
Trong chương 10 ( cũng như chứng minh trong chương 5) chúng ta thảo luận
làm cách nào mà chúng ta có thể đưa ra kiểm soát việc liên quan đến mối quan hệ
giữa các biến bằng cách kiểm soát biến thứ ba ( hoặc nhiều hơn). Điều này cũng có
thể thực hiện trong tương quan.
Bảng 11.1 Sự chồng chéo giữa cảm nhận quảng cáo, giới tính, tin tưởng vào
nhà sản xuất và sự hấp dẫn.
Cảm nhận
quảng cáo
Giới tính
Sự tin
tưởng

Sự hấp dẫn
Cảm nhận quảng cáo – -0.33* 0.25** 0.24**
Giới tính – -0.36* 0.09
Sự tin chắc – 0.14
Sự thu hút quảng cáo – –
* , **
Phân tích, nghĩa là tương quan một phần. Công thức cho hệ số tương quan một
phần r
12.3
( đọc giữa tương quan một phần ( biến ) 1 và 2 chấm 3 ) là:
13
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
r
12 3
= (11.5)
Công thức được lặp đi lặp lại, và do đó sau khi kiểm soát cho biến 3 biến tiếp
theo có thể được kiểm soát.
Ví dụ:
Quan sát mối quan hệ giữa thừa nhận quảng cáo và sự hấp dẫn tác động bởi
điều khiển của giới tính. Sử dụng trong công thức 11.5 ta thấy:
r
Ad.rec.,ad.appeals.sex
= = 0.29
Điều này cho thấy rằng bằng cách kiểm soát giới tính thì liên quan mối quan hệ
giữa thừa nhận quảng cáo và quảng cáo hấp dẫn ( xác thực) là trở nên vững chắc.
2.3 Giải thích và dự báo những mỗi quan hệ giữa các biến
Mô tả, giải thích và dự báo mối quan hệ giữa các biến là công việc quan trọng
trong nghiên cứu kinh doanh. Chẳng hạn, một người quản lý có thể quan tâm đến mối
qua hệ giữa lượng tiền phải trả cho quảng cáo và bán hàng hoặc là mối quan hệ giữa
số lượng hàng bán và lượng khách đến tham quan. Như vậy thông tin rất quan trọng

trong kinh doanh bởi vì nó cho phép giải quyết một cách hoàn thiện hơn, chẳng hạn
làm thế nào biết chi trả cho quảng cáo bao nhiêu là tốt.
Một trong các phương pháp tiếp cận ứng dụng và hữu ích nhất để kiểm tra mối
quan hệ giữa các biến là phân tích hồi quy. Trong phân tích hồi quy chúng ta có một
biến phụ thuộc (nghĩa là biến được giải thích) va một hoặc nhiều hơn biến không phụ
thuộc. Cả biến phụ thuộc lẫn biến không phụ thuộc thường giả định là tham số (nghĩa
là khoảng cáchhoặc là thước đo tỷ lệ). Như thảo luận ở dưới đây, cái gọi là biến giả
còn có thể sử dụng như biến không phụ thuộc. Trong phân tích hồi quy ( như phân
tích nhiều loại khác) chúng ta muốn có một mô hình phù hợp nhất là miêu tả dữ liệu,
cái có thể làm trong phân tích hồi quy bằng cách áp dụng phương pháp bình phương
nhỏ nhất. Chính xác hơn, điều này được thực hiện bằng một đường thẳng phù hợp mà
giảm thiểu các độ lệch bình phương từ đó đường thẳng hiển thị như trong hình 11.1
14
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
2.3.1 Hồi quy tuyến tính đơn giản.
Nó được biết rằng có thể vẽ bất kỳ đường thẳng nếu bạn biết hai điều: (1) độ
dốc (hoặc độ nghiêng) của đường thẳng, và (2) điểm mà tại đó đường thẳng băng qua
trục thẳng đứng của đồ thị ( được biết như là phần mặt phẳng bị chặn của đường
thẳng).
h
l
β
1
=
β
0
Hình 11.1 Mô hình tuyến tính
Phương trình của đường thẳng là:
Y = β
0

+ β
1
x
1
+ ε
i
Y là biến kết quả chúng ta muốn dự báo, x
1
là điểm của đối tượng hoặc của
người dự báo biến; β
1
là độ đốc của đường thẳng khít với dữ liệu. β
0
là phần mặt phẳng
bị chặn của đường thẳng; ε
i
là đại diện cho sự khác biệt giữa điểm số dự báo tuyến
tính cho đối tượng và điểm số mà đối tượng chắc chắn thu được thường là số hạng còn
dư lại. Trong phân tích hồi quy ước lượng hồi quy đường thẳng mang lại giá trị dự
báo. Nếu quan sát tất cả giá trị giảm của dự báo tuyến tính. Không có những sự khác
biệt giữa dự báo và giá trị còn dư như thể hiện hình 11.1
Ví dụ:
Giả sử một thương nhân xe hơi tập hợp dữ liệu của 6 tháng với 4 biến: Quảng
cáo TV, quảng cáo chữ in, quảng cáo người cạnh tranh và bán hàng.Y là thương nhân
xe hơi mong đợi việc bán xe hơi tương quan với quảng cáo TV và quảng cáo chữ in.
Mối tương quan giữa bán xe hơi và đối thủ cạnh tranh quảng cáo hầu như chắc chắn là
không. Nhưng nếu quảng cáo của đối thủ cạnh tranh mở rộng toàn bộ trên thị trường
15
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
hơn là hay thay đổi thị trường thị phần, mối tương quan có thể là dương. Giá trị của 4

biến được thể hiện trong bảng 11.2
Bảng 11.2 Ma trận dữ liệu
Hàng QC TV QC chữ in Đối thủ cạnh tranh QC Bán xe hơi
1 0 1 2 1
2 1 0 0 1
3 2 2 4 2
4 2 3 6 3
5 3 3 3 4
6 4 3 0 4
Bảng 11.3 Trung bình hồi quy giản đơn:
Predictor Coef St. dev t-radio p
Constant 0.70000 0.4453 1.57 0.191
TV-Ads 0.90000 0.1871 4.81 0.009
S= 0.5916 R-sp=0.85.3% R-sq(adj)=81.6%
Sự cân bằng của hồi quy
CarSale = 0.7000 + 0.9000 TV-Ads
Đầu tiên, chúng ta giải thích sự hữu ích của phương trình hồi quy tuyến tính
bằng việc dự kiến chỉ có quảng cáo trên T.V và Carsales là được theo dõi. Chúng ta
xem Carsales như là biến phụ thuộc và quảng cáo T.V là biến độc lập. Tiếp theo,
chúng ta ước tính hàm số theo phương pháp quy hồi tuyến tính giản đơn của Caresales
trên quảng cáo T.V. Được thể hiện như bảng 11.3 được in ra từ máy tính.
Thời kỳ liên tục 0.7000 chỉ rằng, nếu người kinh doanh không sử dụng hình
thức quảng cáo nào trên truyền hình ( nghĩa là chi phí quảng cáo = 0) thì giá trị dự
kiến của Carsale là 0.7 đơn vị, đó chính là 7 chiếc xe. Hệ số hồi quy ước tính ước tính
của doanh số trên quảng cáo T.V là 0.9000. Hệ số này chỉ rằng nếu biến quảng cáo
T.V được tăng lên 1 đơn vị thì giá trị dự kiến của Carsales tăng lên 0.9 đơn vị, điều đó
là 9 chiếc xe. Đây là những thông tin hữu ích đối với những nhà kinh doanh xe.
Nhưng người kinh doanh miễn cưỡng với việc tăng “polate”: điều này có nghĩa là
người kinh doanh không được sử dụng những thông tin có giá trị ngoài chương trình
16

Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
quảng cáo trong khoảng từ 0 cho đến 4 mà nó đã thể hiện ở mẫu ( nhìn vào bảng
11.3).
Kết quả, hệ số tương quan ( R-sp). R
2
85,3% ( bình phương hệ số tương quan là
85,3%) hệ số này chỉ ra rằng việc xác định mẫu có hệ số tương quan R
2
ngang với giá
trị là 0.853. Nói một cách cụ thể, điều này có nghĩa mức độ biến đổi trong các biến ở
chương trình quảng cáo T.V được giải thích là 85,3 % của Carsales có thể biến đổi
trong mẫu của chúng tôi. Bình phương của mẫu là hệ số tương quan r. Giá trị P:
0.0009 là hệ số hồi quy, β là doanh số trên chương trình quảng cáo T.V nhỏ hơn an
pha 0.05, chúng tôi thừa nhận điều này theo quy ước chọn lựa của chúng tôi với mức
ý nghĩa. Có nghĩa là chúng tôi có thể loại bỏ giả thiết không có hiệu lực H
0
, tương ứng
với hệ số tương quan. β là ngang bằng với 0, là sử dụng được hai mặt. A
2
: β # 0 (sử
dụng hai mặt là sự mặc định của chương trình máy tính).
Tóm lại: Quảng cáo T. V và doanh số bán hàng có mối quan hệ ý nghĩa với
nhau. Từ đó nó có mối quan hệ là mật thiết không thể nào có chuyện gia tăng chí phí
quảng cáo mà dẫn đến kết quả là giảm doanh số bán ra, nó thật sự thích hợp cho việc
sử dụng một chiều, A
1
: β > 0. Điều đó có nghĩa là giá trị p được hệ thống sử lý của
máy tính chia làm 2 phần. Như thế giá trị có liên quan của p là (0.009/2) = 0.0045.
Đây là bằng chứng thiết thực cho kết quả là có mối quan hệ giữa quảng cáo T.V và
Carsales. Những trường hợp thiết thực này chúng ta chắc sẽ thấy sau này, một hệ số

có lẽ không tập hợp khi có sự khác biệt đáng kể từ 0 (zero) khi chúng ta sử dụng mối
liên hệ hai mặt, mặc dù nó đã được xác minh là có dấu hiệu khác biệt từ 0 ( zero) nếu
đã được trình bày là có mối liên hệ một mặt. Như vậy nó thật sự quan trọng trong việc
lực chọn một mặt trong điều kiện thích hợp ( xem phần 10.5 ). Biểu đồ ở bảng số 11.4
là mối liên hệ khác biệt cho vấn đề này.
Bảng 11.4 Những giá trị thặng dư và phù hợp
Hàng Kinh doanh
Quảng cáo
TV
Giá trị thặng
dư chuẩ
Thích hợp
Giá trị thặng

1
2
3
4
5
1
1
2
3
4
0
1
2
2
3
0.77033

-1.18431
-0.92582
0.92582
1.18431
0.7
1.6
2.5
2.5
3.4
0.3
-0.6
-0.5
0.5
0.6
17
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
6 4 4 -0.77033 4.3 -0.3
Một biến là hữu ích nếu giá trị p của nó nhỏ hơn . Sử dụng thay thế một chiều
thay vì cách thức hai mặt là giá trị p thực tế sẽ giảm một nữa.
Sự phù hợp là ước tính dự kiến bán xe hơi hoặc doanh số bán xe hơi tương ứng
với các giá trị của biến độc lập quảng cáo truyền hình được tìm thấy trong mẫu. Phần
còn dư là độ lệch tương ứng từ ước lượng hồi quy đường thẳng. Chú ý rằng phương
trình thích hợp + giá trị thặng dư = Doanh số bán xe hơi là giá trị cho mỗi tháng ( mỗi
sự quan sát). Chúng ta thích sự để được gần gũi với doanh số bán hàng và gần gũi
quen thuộc với giá trị thặng dư để được gần với 0. Sau đó R
2
sẽ gần đến 1.
Giả định trong phân tích hồi quy.
Phân tích hồi quy là dựa trên một số giả định, bao gồm:
1. Giá trị kỳ vọng của sai số là không, E( = 0).

2. Phương sai của sai số cho mỗi x
i
là hằng số. Đây là được gọi là homo-
scedasticity. Nếu phương sai thay đổi theo x
i
được gọi là heteroscedasticity.
3. Sai sót cho các quan sát là không tương quan.
4. thường phân bổ cho mỗi x
i.
5. Các sai số không tương quan với x
i,
Corr( x
i
) = 0.
6. Nó cũng là một giả định phổ biến mà các mô hình hồi quy phải là tuyến tính
trong các tham số của nó.
Đó là thực hành các logic để kiểm tra các giả định. Kết quả của bạn của bạn có
thể hữu ích ngay cả khi tất cả các giải định tiêu chuẩn không đáp ứng, nhưng sau đó
kết quả thường không chắc chắn hơn so với số liệu thống kê cho thấy. Điều quan
trọng là bạn sử dụng logic phán đoán tất cả các giai đoạn mà bạn biết những gì bạn
đang làm.
Trong một thời gian ngắn chúng ta sẽ cho thấy kiểm tra một số giả định như thế
nào trong ví dụ của chúng ta. Nó nên được nhớ tới, tuy nhiên, chúng ta có quá ít quan
sát để có được một tình huống thực tế. Giả định của một mô hình tuyến tính có thể
18
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
kiểm tra bề ngoài bằng cách nhìn vào biểu đồ được cung cấp từ máy tính. Vài giả định
có thể có liên quan đến sự xáo lộn khó nhìn thấy được ước tính bằng giá trị thặng dư .
Giá trị thặng dư có thể biểu diễn theo nhiều cách – ví dụ tùy vào các biến độc lập.
Chúng ta có thể kiểm tra bề ngoài giả định của homo- scedasticity: nghĩa là, chúng ta

kiểm tra sự khác nhau của giới hạn xáo trộn không thay đổi khi giá trị của biến độc
lập thay đổi. Chúng ta thích nhìn thấy một bức tranh nơi mà biến thiên lên và xuống
trong biểu đồ là gần như nhau, nói, bên trái, ở giữa và một phần bên phải của biểu đồ.
Để có một vài ý tưởng cho sự phù hợp của các giả định của sự xáo lộn phân bổ
bình thường, nếu bạn có nhiều quan sát hơn chúng tôi, kết quả kiểm tra biểu đồ tần số
của giá trị thặng dư có một số trùng với mật độ bình thường, bạn cũng có thể sử dụng
biểu đồ sác xuất thông thường. Nếu kết quả các điểm trong biểu đồ của điểm bình
thường rơi khoảng trong một đường thẳng, giá trị thặng dư (và hy vọng cũng như sự
xáo trộn) dường như đến từ mật độ bình thường. Hệ số tương quan nói như thế nào về
một đường thẳng. Nếu cũng như dữ liệu ở đây là dữ liệu chuỗi thời gian, có thể tự
quan tự động trong các xáo trộn. Kiểm tra một sự thích hợp cho sự tự tương quan là 1.
Nếu số liệu thống kê D-W gần đến 2, cũng như ở đây, không có nguy cơ cho sự tương
quan tự động. Nếu như nó gần tới 0, có thể có sự tự tương quan tự động. Nếu như nó
gần tới 4, có thể có tương quan tiêu cực xảy ra (hiếm khi xảy ra). Một cuộc thảo luận
xuất sắc của kiểm tra phân tích hồi quy, xem Field 2000.
Lựa chọn của các biến
Nếu chúng ta muốn sử dụng hồi quy tuyến tính đơn giản, nhìn vào ví dụ, tuyến
tính Y trên x
1
, cũng như đã thực hiện. Nhưng chúng ta cũng có thể có hồi quy Y trên
x
2
hoặc hồi quy Y trên x
3
. Trong sự lựa chọn giữa hàm hồi quy khác nhau trong tình
huống như thế này nó rất hữu ích để xem xét các hệ số tương quan. Hệ số tương quan
được biểu diễn trong bảng 11.5.
Chúng ta chú ý rằng giữa ba biến độc lập, quảng cáo T.V là một trong những
cái mà trong đó sự tương quan mẫu là cao nhất với các biến bán hàng độc lập. Trước
đây chúng ta thấy hàm hồi quy tương ứng có vẻ là thỏa đáng trong tất cả các khía

cạnh. Vì vậy, nếu chúng ta quyết định chỉ sử dụng một biến độc lập, quảng cáo T.V là
được chọn. Xem xét kỹ lưỡng trên sự tương quan, chúng ta cũng nhìn thấy rằng quảng
19
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
cáo T.V tương quan mạnh với quảng cáo chữ in và quảng cáo chữ in tương quan mạnh
với kinh doanh. Hệ số tương quan cao giữa quảng cáo T.V và quảng cáo chữ in cho
thấy mức độ cao của đa cộng, là khả năng làm mờ các ước tính, cũng như chỉ ra rằng
biến này (quảng cáo chữ in) bao gồm biến phụ thuộc.
Đánh giá tốt sự thích hợp.
Làm thế nào để ước lượng mô hình hồi quy phù hợp với dữ liệu? (Điều này
được giới hạn “giải thích các biến”). Cũng như chú ý ở trên, bị chắn và hệ số hồi
quy có thể ước lượng.
Bảng 11.5 Tương quan hồi quy
Quảng cáo T.V Quảng cáo máy in Đối thủ cạnh tranh quảng cáo
Quảng cáo in 0.783
Đối thủ quảng cáo -0.060 0.472
Doanh số 0.923 0.918 0.155
Khi tổng kết tất cả i ở trên nó cũng có thể được biểu diễn:
TSS RSS ESS
Như chúng ta có thể nhìn thấy từ bình phương trên, chúng có tổng ở đây. Đầu
tiên, TTS là tổng số của các bình phương. Thứ hai, RSS là tổng hệ quy của các bình
phương, nó là những biến số trong những biến số độc lập được giải thích bởi những
mô hình hồi quy. Sau cùng, ESS là tổng bình phương của các sai số là tổng bình của
những giá trị thặng dư. Những phân số RSS/ TSS là một phần biến số trong biến số
độc lập được giải thích bởi những mô hình hồi quy, thường được cho là những hệ số
của biến số, R
2
như được đề cập ở trên.
Những tiêu chuẩn của hệ số hồi quy
Những hệ số hồi quy β

1
, như trình bày ở ví dụ trên thật là dễ dàng để giải thích
nếu như đo lường X và Y là có ý nghĩa. Điều này thường không phải là trường hợp
khó khăn để ước tính độ mạnh trong mối quan hệ tuyến tính khi chúng có các biến số
độc lập, đây cũng có thể là trường hợp đặc biệt. Trong các trường hợp chúng ta có thể
20
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
chuẩn hóa các hệ số hồi quy bởi sự tăng thêm của các hệ số hồi quy do độ lệch chuẩn
của phân số X vượt quá mức chuẩn của phân số Y.
2.3.2 Hồi quy bội số
Trong nhiều hồi quy hai hay nhiều biến độc lập được áp dụng để giải thích dự
đoán các biến phụ thuộc. Mục đích là để làm cho các mô hình thực tế hơn, kiểm soát
biến khác, và giải thích của phương sai trong biến phụ thuộc (và do đó để giảm dư).
Mô hình hồi quy chung nhiều có thể được viết như sau:
Y
i
= B
o
+ B
1
X
1
+ B
2
X
2
+ …+ E
i
So với (11.6) chúng ta thấy rằng sự khác biệt duy nhất là sự bao gồm của các
biến độc lập hơn.

Ví dụ : Các doanh nghiệp đều thường cũng quan tâm đến khai thác thương hiệu
của họ cũng như các thiết lập bằng cách mở rộng chúng thành các loại sản phẩm mới.
Nghiên cứu trước đây đã chỉ ra rằng sự thành công của chiến lược này bị ảnh hưởng
bởi, trong số những thứ khác, các yếu tố như danh tiếng của thương hiệu được mở
rộng và tương tự nhận thức của các loại sản phẩm mới và thương hiệu hiện có. Người
ta cũng tin rằng các yếu tố như kiến thức của người tiêu dùng về các nhóm sản phẩm
mới,và khả năng hậu quả tiêu cực trình tự cũng như sẵn sàng nhận thức không chắc
chắn nhiều người tiêu dùng ảnh hưởng để chấp nhận một phần mở rộng thương hiệu
(xemví dụ Keller, 1998). Một nhà sản xuất đã tiến hành một nghiên cứu để kiểm tra sự
sẵn sàng của người tiêu dùng chấp nhận một phần mở rộng thương hiệu(ACC). Chính
xác hơn, các nhà sản xuất kiểm tra năng giải thích của kiến thức về các loại sản phẩm
mới (PKNOW), hậu quả nhận thức (Phần kết luận) và sự không chắc chắn nhận thức
(UNCERT). Các nhà sản xuất cũng tin rằng kiến thức của người tiêu dùng có thể
tương tác với sự không chắc chắn nhận thức (tức là kiến thức của người tiêu dùng có
thể làm giảm sự không chắc chắn nhận thức được), UNCERT x PKNOW. Do đó,mô
hình được thử nghiệm là:
ACC = x
1
REP + x
2
SIM + x
3
CONC + x
4
UNCERT + x
5
PKNOW + x
6
UNCERT x PKNOW
Kết quả, theo báo cáo trong sản lượng máy tính SPSS, được trình bày trong

bảng 11.6, lần đầu tiên cho thấy một bản tóm tắt mô hình. Chúng tôi ở đây thấy rằng
các giải thích phương sai R
2
.
Bảng 11.6 Hồi quy bội số – xuất ra từ SPSS
21
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Mô hình tóm tắt
Mô hình R R
2
Điều chỉnh R
2
Std. Lỗi dự
toán
1 .620
a
.384 .372 1.0053
ANOVA
b
Mô hình
Tổng
bình
phương
df
Có nghĩa là
vuông
F Sig.
1. Hồi quy

Tổng

cộng
192.691
309.275
501.966
6
306
312
32.115
1.011
31.775 .000
a

Coefficients
c
Mô hình
Hệ số không tiêu chuẩn
Hệ số tiêu
chuẩn
t Sig.
B Std.Lỗi Beta
1. (Liên tục)
REP
SIM
CONC
UNCERT
UNCERT x
PKNOW
PKNOW
6.245E-02
.359

.516
6.796E-02
.106
-3.232E-02
7.496E-02
.475
.055
.050
.075
.103
.034
.141
.300
.481
.045
.103
111
.067
.132
6.491
10.291
.905
1.025
952
.532
.895
.000
.000
.366
.306

.342
.595
Là 0,384 và được điều chỉnh thấp hơn một chút 0.372. R
2
cho chúng ta biết bao
nhiêu của biến trongYchiếm bởi các mô hình hồi quy từ mẫu của chúng tôi, giá trị
điều chỉnh cho chúng ta biết bao nhiêu biến trongY được hạch toán nếu các mô hình
đã được bắt nguồn từ dân số mà từ đó mẫu đã được lấy. Tiếp theo, phân tích phương
sai (được biết đến từ phần11.2) được báo cáo. Khi trở lại (11.8) này là không đáng
ngạc nhiên. Phân tích hồi quy và phân tích phương sai có liên quan. Bằng việc tính
22
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
toán các phần của biến giải thích bằng mô hình hồi quy trên tổng phương sai, chúng
tôi có được 267.149/777.129=0,344.
Bằng cách kiểm tra mức độ quan trọng, chúng tôi cũng thấy rằng mô hình hồi
quy là rất quan trọng, chỉ ra rằng mô hình có sức mạnh giải thích, và giả thuyết, đó là,
mô hình hồi quy không cải thiện dự đoán, có thể bị từ chối. Phần cuối cùng của bảng
11.6 cho thấy các hệ số hồi quy ước lượng, sai số chuẩn của các ước tính, t – giá trị và
mức độ quan trọng. Hệ số chuẩn và không chuẩn đã được báo cáo. 6.245E-02 là
6.245×10-2, đó là 0.06245. Lưu ý rằng các phần bị chặn(β
0
) không được báo cáo khi
hệ số hồi quy chuẩn được ước tính. Kiểm tra các hệ số hồi quy chuẩn cho thấy SIM là
biến sở hữu sức mạnh giải thích cao nhất. Giá trị báo cáo(0,481) có nghĩa là một sự
thay đổi của một đơn vị tiêu chuẩn trong REP sẽ dẫn đến một sự thay đổi của
0,481đơn vị tiêu chuẩn trong các biến phụ thuộc.
2.3.3 Biến số giả
Biến tuyệt đối thường được bao gồm như là biến độc lập. Ví dụ, nhu cầu về
một sản phẩm hoặc dịch vụ có thể thay đổi theo mùa, chúng tôi có thể, ví dụ, chia
năm vào mùa hè, mùa thu, mùa đông và mùa xuân. Đây là một biến quy mô danh

nghĩa mà không thể được xếp hạng. Được áp dụng trong một hồi quy (và định lượng
khác) phân tích, mùa giải cần phải được con số được gán (xem bảng 11.7)
Kiểm tra bảng 11.7 cho thấy ba biến mới A, B và C. Chúng ta thấy rằng nếu
doanh số bán hàng trong mùa hè, 1 được mã hoá trong biến A, và số 0 trong biến B
và C. Bảng 11.7 cũng cho thấy bốn mùa có kết hợp khác nhau của số 0 và số 1. Giả
định rằng mô hình hồi quy sau đây để bán quần áo phụ nữ, mức giá cũng được bao
gồm, đã được ước tính:
Doanh số bán hàng = 1000 – 0.5 x đơn giá + 100A – 20B – 50C
Những phương trình cho chúng ta biết doanh số bán hàng cao nhất trong mùa
hè (A = 1, B = 0, C = 0)
Bảng 11.7 Mã hóa của biến giả
Mùa A B C
Mùa hè 1 0 0
Mùa thu 0 1 0
Mùa đông 0 0 1
Mùa xuân 0 0 0
23
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Sự thay đổi các đường hồi quy tuyến tính xảy ra bởi các biến số giả:Giả sử giá
là £200. Doanh số trong mùa hè là :
1000 – 0.5 x 200 + 200 x (1) – 20 x (0)– 50 x (0) = 100
Khi mức giá được giữ nguyên thì doanh số trong mùa thu là :
1000 – 0.5 x 200 + 200 x (0) – 20 x (1) – 80 x (0) = 880
2.3.4 Phân tích các biến số
Phân tích hồi quy áp dụng theo quy ước, đó là : các biến số độc lập trong một
khoảng thời gian hay là tỷ lệ quy mô. Tuy nhiên thường những biến số phụ thuộc là
tuyệt đối. Ví dụ: điều đáng quan tâm được giải thích tại sao là những công ty thành
công thì nó khác với những công ty không thành công với những sự phân biệt đối với
việc nuôi dưỡng và không nuôi dưỡng một sản phẩm mới…để phân tích các biến số là
tuyệt đối. Phân tích các biến số trong chủ thể là bắt nguồn từ sự thay đổi, sự kết hợp

tuyến tính của hai hay nhiều các biến số độc lập sẽ kết hợp tốt giữa hai hoặc nhiều
nhóm được xác định rõ ràng. Những biến số đạt được bởi sự thành lập của sự biến đổi
trọng lượng cho mỗi sự khác biệt để đạt được mức cao nhất giữa những nhóm biến đổi
liên quan tới những nhóm biến đổi khác. Việc kết hợp những tuyến tính cho một phân
tích biến số, nó được biết tới như một hàm số biến số, nó được bắt nguồn từ một
phương trình như sau :
Z
jk
= a + W
1
X
1k
+ W
2
X
2k
+ …. (11.9)
Trong đó :
Z
jk
= biến số Z mã hóa cho biến số hàm số j cho chủ thể k
a = đường thẳng
W
i
= biến số trọng lượng cho sự biến đổi độc lập i
X
ik
= biến đổi độc lập i cho chủ thể k.
Những biến số này thì tỷ lệ trung bình cho tất cả những biến số riêng lẻ với
từng nhóm đặc biệt, chúng đứng giũa mỗi nhóm và được nhắc tới như một trọng tâm.

Trọng lượng W
i
có thể được giải thích như những hệ số hồi quy β trong các phân tích
hồi quy. Hầu hết các chương trình báo cáo của máy tính bao gồm những biến số trọng
lượng chuẩn và không chuẩn. Khả năng biến số có thể được đánh giá như là sự cải
thiện đúng trong phân loại.
24
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Ví dụ :
Giả sử rằng nhà máy có khả năng kiểm soát một tài liệu nghiên cứu nếu như nó
có thể tìm ra những biến số người mua và người không mua sản phẩm. Chính xác hơn,
nhà máy này phải biết quan tâm tới độ tuổi và có khả năngđạt mức thu nhập. Biến số
phụ thuộc là xác định tuyệt đối (mua thì bằng 1, không mua thì =0) trong khi những
biến số độc lập là theo quy ước. Phân tích các biến số của hai nhóm được xuất ra trong
chương trình máy vi tính thì xem ở bảng 11.8. Sự kiểm soát là một phần trình bày của
28 trong 30 lần quan sát được áp dụng trong các phân tích và hai hai quan sát còn lại
là không có dữ liệu. Chúng cũng nhìn thấy dữ liệu nhóm 0 bao gồm 19 chủ thể và 9
chủ thể của nhóm khác. Từ phần (b) chúng ta nhìn thấy những dữ liệu phân tích thì
phải đặt tất cả các đơn vị vào những nhóm mà ở đó chúng phụ thuộc đúng. Trường
hợp này thường không bắt buộc.
Hai hàm của phương trình biến số thì được tính toán theo phần (d). Cho nhóm
0 là : F
0
= -18.27 + 0.225 tuổi + 0.120 thu nhập. Cho nhóm F
1
= – 31.758 + 0.052 tuổi
+ 0.203 thu nhập. Hai phương trình này được sử dụng để tiên đoán nếu như một người
với độ tuổi 54 và thu nhập với mức 250 thì sẽ mua sản phẩm P. Đơn giản chúng ta có
thể gắn hai số liệu này vào hai hàm số và đạt được f
0

(54.250)= 24.023 và
f
1
(54.250)=21.800. Khi đó f
0
(54.250) > f
1
(54.250), chúng ta dự đoán rằng những
người thuộc vào nhóm 0 thì người đó sẽ không mua được sản phẩm này.
Bảng 11.8 Phân tích biến số của hai nhóm.
(a) Trường hợp
Nhóm 0 1
Đếm 19 9
28 trường hợp được sử dụng 2 trường hợp không có giá trị
(b) Tổng hợp của các phân loại
Đặt vào Đúng Nhóm…
Nhóm 0 1
0 19 0
1 0 9
Tổng số N 19 9
N số đúng 19 9
25

học tập, nên khả năng tìm hiểu, nghiên cứu và thu thập thông tin bị hạn chế. Vì vậy,sự sai sót không thể tránh khỏi. Tập thể nhóm rất mong nhận được sự đóng góp ý kiếncủa các anh chị trong lớp và đặc biệt là sự hướng dẫn của Thầy để nhóm hoàn thiệnchuyên đề này tốt hơn.Tập thể thành viên nhómTiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn TânCHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁPNGHIÊN CỨU ĐỊNH LƯỢNG1.1 Định nghĩa:Nghiên cứu định lượng là phương pháp thu thập dữ liệu bằng số và giải quyếtquan hệ trong lý thuyết và nghiên cứu theo quan điểm diễn dịch. Hay nói cách khácnghiên cứu định lượng là những nghiên cứu thu được các kết quả bằng việc sử dụngnhững công cụ đo lường, tính toán với những con số cụ thể.Nghiên cứu định lượng là đi tìm câu trả lời cho câu hỏi bao nhiêu, mức nào.1.2 Lý thuyết:Nghiên cứu định lượng chủ yếu là kiểm định lý thuyết, sử dụng mô hìnhKhoa học tự nhiên thực chứng luận, phương pháp nghiên cứu định lượng có thể chứngminh được trong thực tế và theo chủ nghĩa khách quan.1.3 Phương pháp thực hiện- Nghiên cứu thực nghiệm thông qua các biến.- Nghiên cứu đồng đại chéo có nghĩa là thiết kế nghiên cứu trong đó các dữliệu được thu thập trong cùng một thời điểm.Ví dụ: nghiên cứu việc học của con gái ở thành thị và nông thôn.Nghiên cứu lịch đại thì dữ liệu thu thập theo thời gian trong đó các dữ liệuđược so sánh theo thời gian.Nghiên cứu trường hợp là thiết kế nghiên cứu tập trung vào một trường hợp cụthể.Nghiên cứu so sánh là thiết kế nghiên cứu trong cùng một thời điểm hay quanhiều thời điểm.1. 4 Cách chọn mẫu:- Mẫu ngẫu nhiên đơn giản.- Chọn mẫu hệ thống.- Chọn mẫu phân tầng.- Chọn mẫu cụm.1.5 Cách lập bảng câu hỏi:Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân- Theo thứ tự.- Câu hỏi đóng: Là dạng câu hỏi có số liệu thu thập có thể tương đối dễ dàngphân tích, mã hóa nhưng nó giới hạn sự trả lời. Thí dụ, sinh viên các khóa học đượcđưa ra các câu hỏi nhận xét về giáo trình, bài giảng, sách, … và được chỉ định trả lờitheo thang đánh giá 5 mức độ (rất hài lòng: +2; hài lòng: +1; trung bình: 0; không hàilòng: -1; rất không hài lòng: -2) để biết sinh viên thỏa mãn hay không thỏa mãn. Đâylà các câu hỏi đóng thể hiện sự mã hóa số liệu.- Câu hỏi mở: Là dạng câu hỏi có số liệu thu thập không có cấu trúc hay số liệukhó được mã hóa. Câu hỏi cho phép câu trả lời mở và có các diễn tả, suy nghĩ khácnhau hơn là ép hoặc định hướng cho người trả lời.- Câu hỏi được soạn sẵn.- Câu hỏi ngắn gọn, xúc tích.- Câu hỏi không gây tranh luận.1.6 Sử dụng các phương pháp toán học để để ứng dụng trong phân tíchđịnh lượng.- Thống kê kế toán: Là một bộ phận của toán học ứng dụng dành cho cácphương pháp xử lý và phân tích số liệu thống kê, mà các ứng dụng chủ yếu của nótrong quản lý là các phương pháp xử lý kiểm tra và dự đoán (dự đoán, điều tra chọnmẫu,…)- Mô hình toán: Là sự phản ánh những thuộc tính cơ bản nhất định của cácđối tượng nghiên cứu kinh tế, là công cụ quan trọng cho việc trừu tượng hoá một cáchkhoa học các quá trình và hiện tượng kinh tế. Khoa học kinh tế từ lâu đã biết sử dụngcác mô hình kinh tế lượng như mô hình hàm sản suất Cobb – Douglas, mô hình cungcầu, giá cả v.v- Vận trù học: Là khoa học có mục đích nghiên cứu các phương pháp phântích nhằm chuẩn bị căn cứ chính xác cho các quyết định, đối tượng của nó là hệ thống,tức là tập hợp các phần tử và hệ thống có tác động qua lại với nhau nhằm đạt tới mộtmục tiêu nhất định.Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn TânCHƯƠNG 2: PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNGChương này trình bày một số phương pháp tiếp cận thường được áp dụng đểphân tích dữ liệu trong nghiên cứu kinh doanh cũng như các nghiên cứu khác. Đầutiên chúng tôi giới thiệu các thử nghiệm của những giả thuyết về sự khác nhau. Sau đóchúng tôi kiểm tra các biến khác nhau và dự đoán các mối liên hệ. Thêm vào đó,chúng tôi còn thảo luận các phương pháp để giảm dữ liệu và rút ra phạm vi cơ bản.2.1 Kiểm tra sự khác nhau.Câu hỏi bạn đang hỏi là liệu rằng kết quả nghiên cứu khoa học trong kinhdoanh có thể được hỏi bằng cách thống kê hay bằng những phương pháp nghiên cứukhác. Ví dụ nếu 81% trong 100 khách hàng hài lòng với cửa hàng A và 71% hài lòngvới cửa hàng B thì cửa hàng A có tốt hơn không?2.1.1 Những giả thiết về một giá trị trung bình.Trong nghiên cứu chúng ta thường phải làm những báo cáo về giá trị trungbình. Chúng ta phải giải thích độ lệch chuẩn và hệ số Z có nghĩa là gì. Khi mà phươngsai mẫu chưa được biết và sai số chuẩn của giá trị trung bình thì cũng chưa được biết.Sai số chuẩn của giá trị trung bình phải được ước tính từ các số liệu mẫu.Sự ước tính:SD= (11.1)Trong đó:- SD: Sai số chuẩn của giá trị trung bình- SD’ : Độ lệch chuẩn ước tính.- N : Kích thước mẫu)(XxSD(11.2)Giả thiết kiểm tra là phân phối t với bậc tự do N-1 và tiến đến phân phốithường khi số lần quan sát tăng lên.Ví dụ: Tại một chuỗi siêu thị cung ứng sản phẩm mới, có ít nhất 100 đơn vịsản phẩm được bán mỗi tuần. Sản phẩm mới được kiểm tra trong 10 sản phẩm ngẫunhiên được lựa chọn với một giới hạn thời gian nhất định. Kiểm định một đầu,ví dụTiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tânkhi hướng tìm giả thuyết là thích hợp khi mà doanh số ở mỗi cửa hàng ít nhất là 100,sản phẩm sẽ được giới thiệu trên quy mô toàn quốc. Giả thuyết không (giả thuyết đơn) và giả thuyết thay thế (H: X < 100: X > 100Giả sử mức ý nghĩa α = 0.05, nghĩa là chúng ta bác bỏ giả thiết không (H), khimà xác xuất cho giả thiết không chính xác là 5%. Vì vậy mức ý nghĩa cho chúng tathấy rằng xác xuất mà chúng ta chờ đợi để xem xét là một quyết định sai, điều đónghĩa là chấp nhận giả thuyết thay thế (H) khi thực tế giả thuyết không là đúng.Bằng việc tính toán chúng ta thấy rằng mức trung bình X = 109.4 và độ lệchchuẩn SD =14.90Chúng ta cũng có thể thấy rằng sai số chuẩn của giá trị trung bình:SDx = = = 4.55Chúng ta tìm t bằng cách tính :07.255.41004.109SDGiới hạn t (ví dụ giá trị t được yêu cầu để từ chối giả thiết không) như khi đọctừ bảng t với bậc tự do là 1.833 (α=0.05).Ở đây giá trị kiểm tra t được cho sẵn. Giá trị kiểm tra t giả sử là biến phân phốinhưng không tìm ra được giá trị nào thiết thực hơn. Khi N trở nên lớn (ví dụ N > 30),phân phối t tiến gần đến phân phối thường.Hộp 11.1 Những giả thiếtGiả thiết đóng vai trò chính trong việc nghiên cứu. Chúng gợi ý một cách giántiếp những giả định hoặc những kỳ vọng và thường quy định bởi những câu hỏi. Nếusự hài lòng của khách hàng ở cửa hàng A lớn hơn ở cửa hàng B thì liệu rằng sản phẩmmới sẽ bán mỗi tuần của cửa hàng A có nhiều hơn 100 đơn vị sản phẩm? Những giảthiết có thể được quy định (về nguyên tắc cơ bản). Để làm như vậy chúng ta phải đốichiếu với giả thiết.V í dụ: Với giả thiết không (H), sự hài lòng của khách hàng ở cửa hàng A tốthơn ở cửa hàng B thì sẽ không có sự khác biệt giữa cửa hàng A và cửa hàng B. ĐểTiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tânlàm điều đó chúng ta cần số liệu về việc thực hiện giữa cửa hàng A và cửa hàng B.Nếu có đủ sự khác biệt để tồn tại chúng ta bác bỏ giả thiết không (H) và chấp nhậngiả thiết thay thế (H). Vì vậy, thông qua việc giả định, chúng ta có được những hiểubiết, nghĩa là chúng ta đã kiểm nghiệm giả định hoặc kỳ vọng của chúng ta.2.1.2 Những giả thiết về hai giá trị trung bình.Những người nghiên cứu thường đối mặt với những câu hỏi như: Thị hiếutrong khu vực A khác với thị hiếu trong khu vực B không? Phân khúc khách hàng 1với phân khúc khách hàng 2 không? Có 1 chiến dịch quảng cáo hiệu quả hơn cái kháckhông? Công thức để kiểm tra sự khác biệt giữa các nghiệm là được phân bổ bìnhthường, và do đó những sự khác biệt của chúng cũng tạo ra sự phân bổ bình thường,cụ thể theo công thức sau :Z =(X– X) – (µ- µ Trong đó:= Nghiệm 1= Nghiệm= Sai số của hai nghiệmvà µlà nghiệm kỳ vọng chưa biết Sai số của hai nghiệm được tính theo công thức sau:Giả định rằng 2 phương sai tổng thể bằng nhau, phương sai tổng thể chung cóthể được tạo ra bằng cách tổng hợp các mẫu. Khi phương sai không rõ và sai số chuẩncủa các mẫu phải được ước lượng, sau đó t đại diện cho một số liệu thống kê kiểm traphân bổ phù hợp với v = N+ N– 2 bậc tự do.Ví dụ :Một nhà phân phối đang phát triển 1 sản phẩm mới và tự hỏi liệu nhãn hiệu củasản phẩm nên có màu đỏ hay màu xanh dương. Những sản phẩm mới với hai nhãnhiệu khác nhau được thử nghiệm trong 10 cửa hàng được lựa chọn ngẫu nhiên. DoanhTiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tânthu trung bình đạt được với nhãn màu đỏ là 403.0 và với màu xanh dương là 390.3.Sai số chuẩn của việc ước lượng cho sự khác biệt giữa các mẫu là 8.15Tính t = = = 1.56Giá trị này được chuyển đến bảng t cho v = n+ n-2 = 10 + 10 – 2 = 18 bậc tựdo. Kiểm nghiệm là hai phía vì giả thuyết là hai màu sắc phù hợp như nhau. Với α =0.05, và 18 bậc tự do, tới hạn t = 2.101. Điều này có nghĩa giả thuyết không được chấpnhận. Ở ví dụ trên chúng ta thấy rằng ( µ1 – µ2 ) = 0. Vì hai nghiệm kỳ vọng chưa biếtvà được giả định là như nhau.NB : Lưu ý rằng trong ví dụ trên hai mẫu được giả định là không liên quan, đólà được rút ra độc lập với nhau.2.1.3 Các mẫu liên quanGiả sử chúng ta muốn tìm hiểu xem thu nhập đã tăng lên từ năm ngoái đếnnay trên cơ sở dữ liệu thu nhập của năm ngoái và thu nhập của năm nay trong mộtmẫu sau:NgườiThu nhậpnăm trướcThu nhậpnăm nayChênh lệch1 228 224 -42 213 225 123 257 271 1430 260 292 32Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn TânĐiều này thường được gọi là vấn đề hai mẫu với sự quan sát theo cặp. Chúngtheo cặp bởi vì sự quan sát xảy ra trong một cặp thu nhập năm trước và năm nay củamỗi cá nhân. Để giải quyết vấn đề này chúng ta có thể lấy giá trị thu nhập của nămnay (cột 3) trừ đi giá trị thu nhập của năm trước (cột 2), và bây giờ, chúng ta có giá trịkhác biệt ở cột chênh lệch (cột 4).Cần chú ý rằng sự khác biệt biệt được so sánh từ một mẫu quan sát đã thảo luậntrước đó, vì vậy các phương pháp áp dụng là tương tự.Giả thuyết vô hiệu Hlà trung bình của tập hợp chính khác nhau, 30 mẫu khácnhau trong cột 4 , khi giá tri này bằng 0 . Giả thuyết thay thế Hlà giá trị trung bìnhdãy số lớn hơn 0.Từ kết quả kiểm mẫu của sinh viên cho thấy:Với mức ý nghĩa = 8.13Độ lệch chuẩn ước tính (SD) = 10,91St sai số là = 1,99t = 4,08p = 0,0002Từ các tính toán thống kê thấy t = 4,08 . Tương ứng với giá trị p = 0,0002 lànhỏ hơn đáng kể so với 0,05 và do đó Hbị từ chối. Trong hầu hết các mẫu kiểm travà các chương trình giá trị thống kê kiểm tra và giá trị p tương ứng đều hiển thị do đókhông cần tìm chúng trong bảng phân phối thống kê tương ứng.Một số phương pháp phi tham số hữu ích cũng có sẵn như là những lựa chọnthay thế cho các phương pháp cổ điển. Chúng có lợi thế là đòi hỏi ít về những giảđịnh .Nhưng nếu giả định cần thiết cho việc sử dụng t kiểm tra là hợp lý thì nó rấthữu ích vì thử nghiệm này thường có độ chính xác cao hơn. Ví dụ cho khoảng cách tincậy hẹp hơn so với phương pháp phi tham số tương ứng. Chú ý phương pháp dựa trênphân phối t có liên quan tới phương sai, trong khi các phương pháp phi tham sốthường quan tâm tới giá trị trung bình. Nhưng nếu phân phối là đối xứng thì hai giá trịtrên bằng nhau.Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn TânMột thử nghiệm phi tham số đơn giản áp dụng cho các vấn đề thu nhập cao hơnlà kiểm tra dấu hiệu. Giả sử trong trường hợp trên 30 mẫu kiểm 7 là dưới trung bìnhvà 23 là trên trung bình. Dấu hiệu trung bình p = 0,0026, P giá trị chỉ ra sự khác biệtđáng kể giữa thu nhập năm trước và thu nhập năm nay. Kiểm tra dấu hiệu trong ví dụtrên là dựa trên thực tế là 7 sự khác biệt tiêu cực và 23 khác biệt tích cực . Không cóthông tin khác được sử dụng. Kiểm tra dấu hiệu, hay nói cách khác là thông tin chứatrong dữ liệu đó vì mốc dao động xung quanh giá trị trung bình. Một thử nghiệm thamsố, ví dụ t kiểm tra cũng có sự khác biệt rõ ràng với giá trị trung bình.2.1.4 Sự so sánh từ hai nhóm trở lênTrong nghiên cứu chúng ta thường gặp sự so sánh từ hai nhóm trở lên xảy racùng một lúc. Để nghiên cứu các tình huống như vậy thì phân tích phương sai(ANOVA) thường được sử dụng. Trước khi giải thích phương pháp nghiên cứu này,chúng ta sẽ đề cập rằng tại sao cần phải tiến hành một vài kiểm nghiệm t để so sánhtất cả sự kết hợp của các nhóm thì thật sự không thích hợp.Giả sử chúng ta quan tâm đến sự khác nhau giữa ba nhóm. Nếu chúng ta tiếnhành kiểm nghiệm t tại mỗi nhóm, chúng ta phải so sánh giữa nhóm 1 và nhóm 2, giữanhóm 1 và nhóm 3, và giữa nhóm 2 và nhóm 3. Nếu mỗi kiểm nghiệm t này sử dụngmức ý nghĩa là 0.05, sau đó xác xuất nhầm lẫn của sự bác bỏ giả thiết không (H) là5%. Do đó xác xuất không có lỗi loại I là 95% cho mỗi kiểm nghiệm. Khi giả sử rằngcác cuộc kiểm nghiệm là độc lập với nhau, thì xác xuất không có lỗi loại I là (0.95)0.95 x 0.95 x 0.95 = 0.857. Bây giờ xác xuất chắc chắn không có lỗi loại I là 1 – 0.857= 0.143, hay 14.3% (thí nghiệm thống kê qua tỷ lệ sai số này được tính trên dữ liệuthực nghiệm giống nhau được biết đến như tỷ lệ sai số thực nghiệm).Phân tích phương sai dựa trên so sánh chỉ số của phương sai hệ thống vớiphương sai không có hệ thống. Giả sử một nghiên cứu thực nghiệm bao gồm khảo sátcủa ba phương pháp thiết kế. Nếu các phương pháp thay đổi hiệu lực, thì một khảnăng kỳ vọng sẽ thay đổi ít hơn trong một nhóm được bộc lộ đến một loại thiết kế đặcthù hơn qua các nhóm. Phân tích phương sai được tính theo công thức như sau:1. Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân.Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân2. Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lý với tổngbình quân;3. Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trong nhóm vớibình quân nhóm.Ước lượng riêng lẻ của biến tổng thể trên trung bình bình phương:MS= =MS= =MS= =Trong đó:1. MS= Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân.2. MS= Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lývới tổng bình quân; và3. MS= Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trongnhóm với bình quân nhóm.Ví dụ:Giả sử có ba nghiên cứu về quảng cáo trong 24 thành phố được lựa chọn ngẫunhiên, so sánh về kích thước và nhân khẩu. Giả sử kết quả từ máy tính cho ra như sau:Nguồn biến thiênTổng bìnhphươngBậc tự doTrung bìnhbình phươngTỷ lệ FGiữa các nhómTrong các nhómTổng cộng49.087.5136.5212324.14.175.88Bậc tự do được tính toán như sau: Tổng cộng (24-1) = 23, phương sai giữa các nhóm(3-1)=2, phương sai trong nhóm (23-2)=21Giả thiết không (Ho) là các trung bình nhóm ví dụ như: XG1= XG2= XG2’và giátrị tới hạn là α = 0.05. Để kiểm định giả thiết, một thí nghiệm F (trên cơ sở phân phối10Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn TânF) là phù hợp. Thí nghiệm F có thể được xem như là khái quát của thí nghiệm t và chophép so sánh của hai nhóm trở lên cùng lúc. Giá trị F được tính bằng hiệu số giữatrung bình bình phương và bình phương phương sai trong nhóm, đó là 24,5/4,17. Khitra bảng phân phối F, chúng ta tìm thấy đơn vị tử số (là 2) và mẫu số (là 21) và tìmthấy giá trị là 3.47. Bởi vì 5.88 lớn hơn 3.47 chúng ta sẽ loại bỏ giả thiết không (H),kết quả là, mức ý nghĩa của nhóm bằng nhau, và chấp nhận giả thiết thay thế, như vậy,sự thay đổi chiến dịch quảng cáo là có hiệu quả. Nếu chúng ta đánh giá mức hiệu quảtrung bình của một trong ba chiến dịch quảng cáo trên chúng ta cũng nhận thấy rằngcó một chiến dịch là có hiệu quả nhất.NB: Trong phân tích dung sai, biến thiên phụ thuộc, hiệu quả của quảng cáo,được thừa nhận theo hệ mét, đó là khoảng cách hoặc chỉ số tỷ lệ. Biến độc lập (chiếndịch quảng cáo khác nhau) là xác thực.Ở trên là một ví dụ về phân tích dung sai đơn giản. Chỉ một hệ số, ảnh hưởngcủa thay đổi chiến dịch quảng cáo được phân tích như thế nào. Phân tích dung sai cóthể được mở rộng bao gồm nhiều hơn hai biến độc lập một cách rõ ràng hơn; ví dụ,thành tích của sinh viên (biến phụ thuộc) có thể được nghiên cứu như đầu ra củanhững phương pháp khác nhau của thiết kế và người thiết kế chương trình giáo dục(biến độc lập). Phân tích phương sai cũng có thể được mở rộng để kiểm tra sự tácđộng đồng thời trên hai biến phụ thuộc, giới hạn của sự đa dạng phân tích dung sai.2.2 Mối quan hệ (sự biến thiên đồng thời) giữa các biếnTrong nghiên cứu, chúng ta thường quan tâm, chú ý đến có 1, 2 hay nhiều mốiquan hệ giữa các biến số. Có nhiều phép đo về những mối quan hệ này, hãy xem ví dụcủa Frankfort –Nachmias và Nachmias (1996) về tổng quan một số phép đo phổ biếncủa sự liên hệ.2.2.1 Hệ số tương quanMột phép đo quan trọng là sự tương quan hay nói cách khác là hệ số tươngquan tức thời: r đã được đề cập ở những chương trước. Hệ số tương quan tức thời giớihạn bời khoảng cách của biến số hay qui mô của biến số. Giống như những phép đokhác về mối quan hệ, hệ số tương quan được xem là biến số chung của 2 phép đo. Hệsố tương quan tức thời dùng để kiểm tra mối quan hệ tuyến tính giữa 2 biến số X vàY.11Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn TânVề lý thuyết, hệ số tương quan có giá trị từ [-1,1] ( -1 ≤ r ≤ 1) r = +1, cho biết 2 biến số là biến số có thực; r = -1, cho biết 2 biến số có mối quan hệ hoản toàn ngược nhau; r dần tới 0, chỉ ra rằng những biến số không có mối liên hệ với nhau.Công thức tính hệ số tương quan tức thời:xyTrong đó X ,Y đại diện cho mẫu X, Y tương ứng.Ta có công thức tương đương:xyTrong đó: là phương sai của Xlà phương sai của Ylà phương sai hợp của X và YHệ số tương quan diển tả mối quan hệ giữa hai biến số và hệ quả của mối liênhệ đó.Bình phương hệ số tương quan là:Biến xem xétBiến tổng hợpĐiều này có nghĩa là nếu bình phương hệ số tương quan giữa X và Y là 50%thì biến X là 50% và biến Y là 50%.Sự tương quan thường được dùng để kiểm tra 2 chiều các mệnh đề giả thuyết,có nghĩa là kiểm tra giả thuyết về mối quan hệ giữa hai biến số. Từ vấn đề này, chúng12Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tânta thấy rằng, hệ số tương quan là số thống kê có ý nghĩa. Nó phụ thuộc vào cả độ lớncủa hệ số tương quan và số lượng quan sát.Độ lệch tiêu chuẩn của hệ số tương quan là:Ví dụ: Một bản thử nghiệm nghiên cứu, trong số 2 nhóm khảo sát về sự cảmnhận quảng cáo chịu tác động, ảnh hưởng bởi sự thu hút quảng cáo (1= tích cực; 0=tiêu cực) , sự tin chắc vào sản phẩm quảng cáo và giới tính (1= nữ; 0= nam). Số lượngkhảo sát là 60, kết quả được ghi nhận ở bảng 11.1. Qua bảng trên, chỉ ra rằng phụ nữthì ít có khuynh hướng cảm nhận quảng cáo và phụ nữ cũng có thể ít tin vào sản phẩmquảng cáo. Chúng ta cũng thấy rằng, những khảo sát này có ý nghĩa quan trọng trongphân tích hai chiều (phân tích 2 biến số). Thêm vào đó, chúng ta chú ý rằng: sự thuhút tích cực có thể được cảm nhận hơn là sự thu hút tiêu cực (mức ý nghĩa 0.05).2.2.2 Tương quan một phầnTrong chương 10 ( cũng như chứng minh trong chương 5) chúng ta thảo luậnlàm cách nào mà chúng ta có thể đưa ra kiểm soát việc liên quan đến mối quan hệgiữa các biến bằng cách kiểm soát biến thứ ba ( hoặc nhiều hơn). Điều này cũng cóthể thực hiện trong tương quan.Bảng 11.1 Sự chồng chéo giữa cảm nhận quảng cáo, giới tính, tin tưởng vàonhà sản xuất và sự hấp dẫn.Cảm nhậnquảng cáoGiới tínhSự tintưởngSự hấp dẫnCảm nhận quảng cáo – -0.33* 0.25** 0.24**Giới tính – -0.36* 0.09Sự tin chắc – 0.14Sự thu hút quảng cáo – -* , **Phân tích, nghĩa là tương quan một phần. Công thức cho hệ số tương quan mộtphần r12.3( đọc giữa tương quan một phần ( biến ) 1 và 2 chấm 3 ) là:13Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân12 3= (11.5)Công thức được lặp đi lặp lại, và do đó sau khi kiểm soát cho biến 3 biến tiếptheo có thể được kiểm soát.Ví dụ:Quan sát mối quan hệ giữa thừa nhận quảng cáo và sự hấp dẫn tác động bởiđiều khiển của giới tính. Sử dụng trong công thức 11.5 ta thấy:Ad.rec.,ad.appeals.sex= = 0.29Điều này cho thấy rằng bằng cách kiểm soát giới tính thì liên quan mối quan hệgiữa thừa nhận quảng cáo và quảng cáo hấp dẫn ( xác thực) là trở nên vững chắc.2.3 Giải thích và dự báo những mỗi quan hệ giữa các biếnMô tả, giải thích và dự báo mối quan hệ giữa các biến là công việc quan trọngtrong nghiên cứu kinh doanh. Chẳng hạn, một người quản lý có thể quan tâm đến mốiqua hệ giữa lượng tiền phải trả cho quảng cáo và bán hàng hoặc là mối quan hệ giữasố lượng hàng bán và lượng khách đến tham quan. Như vậy thông tin rất quan trọngtrong kinh doanh bởi vì nó cho phép giải quyết một cách hoàn thiện hơn, chẳng hạnlàm thế nào biết chi trả cho quảng cáo bao nhiêu là tốt.Một trong các phương pháp tiếp cận ứng dụng và hữu ích nhất để kiểm tra mốiquan hệ giữa các biến là phân tích hồi quy. Trong phân tích hồi quy chúng ta có mộtbiến phụ thuộc (nghĩa là biến được giải thích) va một hoặc nhiều hơn biến không phụthuộc. Cả biến phụ thuộc lẫn biến không phụ thuộc thường giả định là tham số (nghĩalà khoảng cáchhoặc là thước đo tỷ lệ). Như thảo luận ở dưới đây, cái gọi là biến giảcòn có thể sử dụng như biến không phụ thuộc. Trong phân tích hồi quy ( như phântích nhiều loại khác) chúng ta muốn có một mô hình phù hợp nhất là miêu tả dữ liệu,cái có thể làm trong phân tích hồi quy bằng cách áp dụng phương pháp bình phươngnhỏ nhất. Chính xác hơn, điều này được thực hiện bằng một đường thẳng phù hợp màgiảm thiểu các độ lệch bình phương từ đó đường thẳng hiển thị như trong hình 11.114Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân2.3.1 Hồi quy tuyến tính đơn giản.Nó được biết rằng có thể vẽ bất kỳ đường thẳng nếu bạn biết hai điều: (1) độdốc (hoặc độ nghiêng) của đường thẳng, và (2) điểm mà tại đó đường thẳng băng quatrục thẳng đứng của đồ thị ( được biết như là phần mặt phẳng bị chặn của đườngthẳng).Hình 11.1 Mô hình tuyến tínhPhương trình của đường thẳng là:Y = β+ β+ εY là biến kết quả chúng ta muốn dự báo, xlà điểm của đối tượng hoặc củangười dự báo biến; βlà độ đốc của đường thẳng khít với dữ liệu. βlà phần mặt phẳngbị chặn của đường thẳng; εlà đại diện cho sự khác biệt giữa điểm số dự báo tuyếntính cho đối tượng và điểm số mà đối tượng chắc chắn thu được thường là số hạng còndư lại. Trong phân tích hồi quy ước lượng hồi quy đường thẳng mang lại giá trị dựbáo. Nếu quan sát tất cả giá trị giảm của dự báo tuyến tính. Không có những sự khácbiệt giữa dự báo và giá trị còn dư như thể hiện hình 11.1Ví dụ:Giả sử một thương nhân xe hơi tập hợp dữ liệu của 6 tháng với 4 biến: Quảngcáo TV, quảng cáo chữ in, quảng cáo người cạnh tranh và bán hàng.Y là thương nhânxe hơi mong đợi việc bán xe hơi tương quan với quảng cáo TV và quảng cáo chữ in.Mối tương quan giữa bán xe hơi và đối thủ cạnh tranh quảng cáo hầu như chắc chắn làkhông. Nhưng nếu quảng cáo của đối thủ cạnh tranh mở rộng toàn bộ trên thị trường15Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tânhơn là hay thay đổi thị trường thị phần, mối tương quan có thể là dương. Giá trị của 4biến được thể hiện trong bảng 11.2Bảng 11.2 Ma trận dữ liệuHàng QC TV QC chữ in Đối thủ cạnh tranh QC Bán xe hơi1 0 1 2 12 1 0 0 13 2 2 4 24 2 3 6 35 3 3 3 46 4 3 0 4Bảng 11.3 Trung bình hồi quy giản đơn:Predictor Coef St. dev t-radio pConstant 0.70000 0.4453 1.57 0.191TV-Ads 0.90000 0.1871 4.81 0.009S= 0.5916 R-sp=0.85.3% R-sq(adj)=81.6%Sự cân bằng của hồi quyCarSale = 0.7000 + 0.9000 TV-AdsĐầu tiên, chúng ta giải thích sự hữu ích của phương trình hồi quy tuyến tínhbằng việc dự kiến chỉ có quảng cáo trên T.V và Carsales là được theo dõi. Chúng taxem Carsales như là biến phụ thuộc và quảng cáo T.V là biến độc lập. Tiếp theo,chúng ta ước tính hàm số theo phương pháp quy hồi tuyến tính giản đơn của Caresalestrên quảng cáo T.V. Được thể hiện như bảng 11.3 được in ra từ máy tính.Thời kỳ liên tục 0.7000 chỉ rằng, nếu người kinh doanh không sử dụng hìnhthức quảng cáo nào trên truyền hình ( nghĩa là chi phí quảng cáo = 0) thì giá trị dựkiến của Carsale là 0.7 đơn vị, đó chính là 7 chiếc xe. Hệ số hồi quy ước tính ước tínhcủa doanh số trên quảng cáo T.V là 0.9000. Hệ số này chỉ rằng nếu biến quảng cáoT.V được tăng lên 1 đơn vị thì giá trị dự kiến của Carsales tăng lên 0.9 đơn vị, điều đólà 9 chiếc xe. Đây là những thông tin hữu ích đối với những nhà kinh doanh xe.Nhưng người kinh doanh miễn cưỡng với việc tăng “polate”: điều này có nghĩa làngười kinh doanh không được sử dụng những thông tin có giá trị ngoài chương trình16Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tânquảng cáo trong khoảng từ 0 cho đến 4 mà nó đã thể hiện ở mẫu ( nhìn vào bảng11.3).Kết quả, hệ số tương quan ( R-sp). R85,3% ( bình phương hệ số tương quan là85,3%) hệ số này chỉ ra rằng việc xác định mẫu có hệ số tương quan Rngang với giátrị là 0.853. Nói một cách cụ thể, điều này có nghĩa mức độ biến đổi trong các biến ởchương trình quảng cáo T.V được giải thích là 85,3 % của Carsales có thể biến đổitrong mẫu của chúng tôi. Bình phương của mẫu là hệ số tương quan r. Giá trị P:0.0009 là hệ số hồi quy, β là doanh số trên chương trình quảng cáo T.V nhỏ hơn anpha 0.05, chúng tôi thừa nhận điều này theo quy ước chọn lựa của chúng tôi với mứcý nghĩa. Có nghĩa là chúng tôi có thể loại bỏ giả thiết không có hiệu lực H, tương ứngvới hệ số tương quan. β là ngang bằng với 0, là sử dụng được hai mặt. A: β # 0 (sửdụng hai mặt là sự mặc định của chương trình máy tính).Tóm lại: Quảng cáo T. V và doanh số bán hàng có mối quan hệ ý nghĩa vớinhau. Từ đó nó có mối quan hệ là mật thiết không thể nào có chuyện gia tăng chí phíquảng cáo mà dẫn đến kết quả là giảm doanh số bán ra, nó thật sự thích hợp cho việcsử dụng một chiều, A: β > 0. Điều đó có nghĩa là giá trị p được hệ thống sử lý củamáy tính chia làm 2 phần. Như thế giá trị có liên quan của p là (0.009/2) = 0.0045.Đây là bằng chứng thiết thực cho kết quả là có mối quan hệ giữa quảng cáo T.V vàCarsales. Những trường hợp thiết thực này chúng ta chắc sẽ thấy sau này, một hệ sốcó lẽ không tập hợp khi có sự khác biệt đáng kể từ 0 (zero) khi chúng ta sử dụng mốiliên hệ hai mặt, mặc dù nó đã được xác minh là có dấu hiệu khác biệt từ 0 ( zero) nếuđã được trình bày là có mối liên hệ một mặt. Như vậy nó thật sự quan trọng trong việclực chọn một mặt trong điều kiện thích hợp ( xem phần 10.5 ). Biểu đồ ở bảng số 11.4là mối liên hệ khác biệt cho vấn đề này.Bảng 11.4 Những giá trị thặng dư và phù hợpHàng Kinh doanhQuảng cáoTVGiá trị thặngdư chuẩThích hợpGiá trị thặngdư0.77033-1.18431-0.925820.925821.184310.71.62.52.53.40.3-0.6-0.50.50.617Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân6 4 4 -0.77033 4.3 -0.3Một biến là hữu ích nếu giá trị p của nó nhỏ hơn . Sử dụng thay thế một chiềuthay vì cách thức hai mặt là giá trị p thực tế sẽ giảm một nữa.Sự phù hợp là ước tính dự kiến bán xe hơi hoặc doanh số bán xe hơi tương ứngvới các giá trị của biến độc lập quảng cáo truyền hình được tìm thấy trong mẫu. Phầncòn dư là độ lệch tương ứng từ ước lượng hồi quy đường thẳng. Chú ý rằng phươngtrình thích hợp + giá trị thặng dư = Doanh số bán xe hơi là giá trị cho mỗi tháng ( mỗisự quan sát). Chúng ta thích sự để được gần gũi với doanh số bán hàng và gần gũiquen thuộc với giá trị thặng dư để được gần với 0. Sau đó Rsẽ gần đến 1.Giả định trong phân tích hồi quy.Phân tích hồi quy là dựa trên một số giả định, bao gồm:1. Giá trị kỳ vọng của sai số là không, E( = 0).2. Phương sai của sai số cho mỗi xlà hằng số. Đây là được gọi là homo-scedasticity. Nếu phương sai thay đổi theo xđược gọi là heteroscedasticity.3. Sai sót cho các quan sát là không tương quan.4. thường phân bổ cho mỗi xi.5. Các sai số không tương quan với xi,Corr( x) = 0.6. Nó cũng là một giả định phổ biến mà các mô hình hồi quy phải là tuyến tínhtrong các tham số của nó.Đó là thực hành các logic để kiểm tra các giả định. Kết quả của bạn của bạn cóthể hữu ích ngay cả khi tất cả các giải định tiêu chuẩn không đáp ứng, nhưng sau đókết quả thường không chắc chắn hơn so với số liệu thống kê cho thấy. Điều quantrọng là bạn sử dụng logic phán đoán tất cả các giai đoạn mà bạn biết những gì bạnđang làm.Trong một thời gian ngắn chúng ta sẽ cho thấy kiểm tra một số giả định như thếnào trong ví dụ của chúng ta. Nó nên được nhớ tới, tuy nhiên, chúng ta có quá ít quansát để có được một tình huống thực tế. Giả định của một mô hình tuyến tính có thể18Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tânkiểm tra bề ngoài bằng cách nhìn vào biểu đồ được cung cấp từ máy tính. Vài giả địnhcó thể có liên quan đến sự xáo lộn khó nhìn thấy được ước tính bằng giá trị thặng dư .Giá trị thặng dư có thể biểu diễn theo nhiều cách – ví dụ tùy vào các biến độc lập.Chúng ta có thể kiểm tra bề ngoài giả định của homo- scedasticity: nghĩa là, chúng takiểm tra sự khác nhau của giới hạn xáo trộn không thay đổi khi giá trị của biến độclập thay đổi. Chúng ta thích nhìn thấy một bức tranh nơi mà biến thiên lên và xuốngtrong biểu đồ là gần như nhau, nói, bên trái, ở giữa và một phần bên phải của biểu đồ.Để có một vài ý tưởng cho sự phù hợp của các giả định của sự xáo lộn phân bổbình thường, nếu bạn có nhiều quan sát hơn chúng tôi, kết quả kiểm tra biểu đồ tần sốcủa giá trị thặng dư có một số trùng với mật độ bình thường, bạn cũng có thể sử dụngbiểu đồ sác xuất thông thường. Nếu kết quả các điểm trong biểu đồ của điểm bìnhthường rơi khoảng trong một đường thẳng, giá trị thặng dư (và hy vọng cũng như sựxáo trộn) dường như đến từ mật độ bình thường. Hệ số tương quan nói như thế nào vềmột đường thẳng. Nếu cũng như dữ liệu ở đây là dữ liệu chuỗi thời gian, có thể tựquan tự động trong các xáo trộn. Kiểm tra một sự thích hợp cho sự tự tương quan là 1.Nếu số liệu thống kê D-W gần đến 2, cũng như ở đây, không có nguy cơ cho sự tươngquan tự động. Nếu như nó gần tới 0, có thể có sự tự tương quan tự động. Nếu như nógần tới 4, có thể có tương quan tiêu cực xảy ra (hiếm khi xảy ra). Một cuộc thảo luậnxuất sắc của kiểm tra phân tích hồi quy, xem Field 2000.Lựa chọn của các biếnNếu chúng ta muốn sử dụng hồi quy tuyến tính đơn giản, nhìn vào ví dụ, tuyếntính Y trên x, cũng như đã thực hiện. Nhưng chúng ta cũng có thể có hồi quy Y trênhoặc hồi quy Y trên x. Trong sự lựa chọn giữa hàm hồi quy khác nhau trong tìnhhuống như thế này nó rất hữu ích để xem xét các hệ số tương quan. Hệ số tương quanđược biểu diễn trong bảng 11.5.Chúng ta chú ý rằng giữa ba biến độc lập, quảng cáo T.V là một trong nhữngcái mà trong đó sự tương quan mẫu là cao nhất với các biến bán hàng độc lập. Trướcđây chúng ta thấy hàm hồi quy tương ứng có vẻ là thỏa đáng trong tất cả các khíacạnh. Vì vậy, nếu chúng ta quyết định chỉ sử dụng một biến độc lập, quảng cáo T.V làđược chọn. Xem xét kỹ lưỡng trên sự tương quan, chúng ta cũng nhìn thấy rằng quảng19Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tâncáo T.V tương quan mạnh với quảng cáo chữ in và quảng cáo chữ in tương quan mạnhvới kinh doanh. Hệ số tương quan cao giữa quảng cáo T.V và quảng cáo chữ in chothấy mức độ cao của đa cộng, là khả năng làm mờ các ước tính, cũng như chỉ ra rằngbiến này (quảng cáo chữ in) bao gồm biến phụ thuộc.Đánh giá tốt sự thích hợp.Làm thế nào để ước lượng mô hình hồi quy phù hợp với dữ liệu? (Điều nàyđược giới hạn “giải thích các biến”). Cũng như chú ý ở trên, bị chắn và hệ số hồiquy có thể ước lượng.Bảng 11.5 Tương quan hồi quyQuảng cáo T.V Quảng cáo máy in Đối thủ cạnh tranh quảng cáoQuảng cáo in 0.783Đối thủ quảng cáo -0.060 0.472Doanh số 0.923 0.918 0.155Khi tổng kết tất cả i ở trên nó cũng có thể được biểu diễn:TSS RSS ESSNhư chúng ta có thể nhìn thấy từ bình phương trên, chúng có tổng ở đây. Đầutiên, TTS là tổng số của các bình phương. Thứ hai, RSS là tổng hệ quy của các bìnhphương, nó là những biến số trong những biến số độc lập được giải thích bởi nhữngmô hình hồi quy. Sau cùng, ESS là tổng bình phương của các sai số là tổng bình củanhững giá trị thặng dư. Những phân số RSS/ TSS là một phần biến số trong biến sốđộc lập được giải thích bởi những mô hình hồi quy, thường được cho là những hệ sốcủa biến số, Rnhư được đề cập ở trên.Những tiêu chuẩn của hệ số hồi quyNhững hệ số hồi quy β, như trình bày ở ví dụ trên thật là dễ dàng để giải thíchnếu như đo lường X và Y là có ý nghĩa. Điều này thường không phải là trường hợpkhó khăn để ước tính độ mạnh trong mối quan hệ tuyến tính khi chúng có các biến sốđộc lập, đây cũng có thể là trường hợp đặc biệt. Trong các trường hợp chúng ta có thể20Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tânchuẩn hóa các hệ số hồi quy bởi sự tăng thêm của các hệ số hồi quy do độ lệch chuẩncủa phân số X vượt quá mức chuẩn của phân số Y.2.3.2 Hồi quy bội sốTrong nhiều hồi quy hai hay nhiều biến độc lập được áp dụng để giải thích dựđoán các biến phụ thuộc. Mục đích là để làm cho các mô hình thực tế hơn, kiểm soátbiến khác, và giải thích của phương sai trong biến phụ thuộc (và do đó để giảm dư).Mô hình hồi quy chung nhiều có thể được viết như sau:= B+ B+ B+ …+ ESo với (11.6) chúng ta thấy rằng sự khác biệt duy nhất là sự bao gồm của cácbiến độc lập hơn.Ví dụ : Các doanh nghiệp đều thường cũng quan tâm đến khai thác thương hiệucủa họ cũng như các thiết lập bằng cách mở rộng chúng thành các loại sản phẩm mới.Nghiên cứu trước đây đã chỉ ra rằng sự thành công của chiến lược này bị ảnh hưởngbởi, trong số những thứ khác, các yếu tố như danh tiếng của thương hiệu được mởrộng và tương tự nhận thức của các loại sản phẩm mới và thương hiệu hiện có. Ngườita cũng tin rằng các yếu tố như kiến thức của người tiêu dùng về các nhóm sản phẩmmới,và khả năng hậu quả tiêu cực trình tự cũng như sẵn sàng nhận thức không chắcchắn nhiều người tiêu dùng ảnh hưởng để chấp nhận một phần mở rộng thương hiệu(xemví dụ Keller, 1998). Một nhà sản xuất đã tiến hành một nghiên cứu để kiểm tra sựsẵn sàng của người tiêu dùng chấp nhận một phần mở rộng thương hiệu(ACC). Chínhxác hơn, các nhà sản xuất kiểm tra năng giải thích của kiến thức về các loại sản phẩmmới (PKNOW), hậu quả nhận thức (Phần kết luận) và sự không chắc chắn nhận thức(UNCERT). Các nhà sản xuất cũng tin rằng kiến thức của người tiêu dùng có thểtương tác với sự không chắc chắn nhận thức (tức là kiến thức của người tiêu dùng cóthể làm giảm sự không chắc chắn nhận thức được), UNCERT x PKNOW. Do đó,môhình được thử nghiệm là:ACC = xREP + xSIM + xCONC + xUNCERT + xPKNOW + xUNCERT x PKNOWKết quả, theo báo cáo trong sản lượng máy tính SPSS, được trình bày trongbảng 11.6, lần đầu tiên cho thấy một bản tóm tắt mô hình. Chúng tôi ở đây thấy rằngcác giải thích phương sai RBảng 11.6 Hồi quy bội số – xuất ra từ SPSS21Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn TânMô hình tóm tắtMô hình R RĐiều chỉnh RStd. Lỗi dựtoán1 .620.384 .372 1.0053ANOVAMô hìnhTổngbìnhphươngdfCó nghĩa làvuôngF Sig.1. Hồi quyDưTổngcộng192.691309.275501.96630631232.1151.01131.775 .000CoefficientsMô hìnhHệ số không tiêu chuẩnHệ số tiêuchuẩnt Sig.B Std.Lỗi Beta1. (Liên tục)REPSIMCONCUNCERTUNCERT xPKNOWPKNOW6.245E-02.359.5166.796E-02.106-3.232E-027.496E-02.475.055.050.075.103.034.141.300.481.045.103111.067.1326.49110.291.9051.025952.532.895.000.000.366.306.342.595Là 0,384 và được điều chỉnh thấp hơn một chút 0.372. Rcho chúng ta biết baonhiêu của biến trongYchiếm bởi các mô hình hồi quy từ mẫu của chúng tôi, giá trịđiều chỉnh cho chúng ta biết bao nhiêu biến trongY được hạch toán nếu các mô hìnhđã được bắt nguồn từ dân số mà từ đó mẫu đã được lấy. Tiếp theo, phân tích phươngsai (được biết đến từ phần11.2) được báo cáo. Khi trở lại (11.8) này là không đángngạc nhiên. Phân tích hồi quy và phân tích phương sai có liên quan. Bằng việc tính22Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tântoán các phần của biến giải thích bằng mô hình hồi quy trên tổng phương sai, chúngtôi có được 267.149/777.129=0,344.Bằng cách kiểm tra mức độ quan trọng, chúng tôi cũng thấy rằng mô hình hồiquy là rất quan trọng, chỉ ra rằng mô hình có sức mạnh giải thích, và giả thuyết, đó là,mô hình hồi quy không cải thiện dự đoán, có thể bị từ chối. Phần cuối cùng của bảng11.6 cho thấy các hệ số hồi quy ước lượng, sai số chuẩn của các ước tính, t – giá trị vàmức độ quan trọng. Hệ số chuẩn và không chuẩn đã được báo cáo. 6.245E-02 là6.245×10-2, đó là 0.06245. Lưu ý rằng các phần bị chặn(β) không được báo cáo khihệ số hồi quy chuẩn được ước tính. Kiểm tra các hệ số hồi quy chuẩn cho thấy SIM làbiến sở hữu sức mạnh giải thích cao nhất. Giá trị báo cáo(0,481) có nghĩa là một sựthay đổi của một đơn vị tiêu chuẩn trong REP sẽ dẫn đến một sự thay đổi của0,481đơn vị tiêu chuẩn trong các biến phụ thuộc.2.3.3 Biến số giảBiến tuyệt đối thường được bao gồm như là biến độc lập. Ví dụ, nhu cầu vềmột sản phẩm hoặc dịch vụ có thể thay đổi theo mùa, chúng tôi có thể, ví dụ, chianăm vào mùa hè, mùa thu, mùa đông và mùa xuân. Đây là một biến quy mô danhnghĩa mà không thể được xếp hạng. Được áp dụng trong một hồi quy (và định lượngkhác) phân tích, mùa giải cần phải được con số được gán (xem bảng 11.7)Kiểm tra bảng 11.7 cho thấy ba biến mới A, B và C. Chúng ta thấy rằng nếudoanh số bán hàng trong mùa hè, 1 được mã hoá trong biến A, và số 0 trong biến Bvà C. Bảng 11.7 cũng cho thấy bốn mùa có kết hợp khác nhau của số 0 và số 1. Giảđịnh rằng mô hình hồi quy sau đây để bán quần áo phụ nữ, mức giá cũng được baogồm, đã được ước tính:Doanh số bán hàng = 1000 – 0.5 x đơn giá + 100A – 20B – 50CNhững phương trình cho chúng ta biết doanh số bán hàng cao nhất trong mùahè (A = 1, B = 0, C = 0)Bảng 11.7 Mã hóa của biến giảMùa A B CMùa hè 1 0 0Mùa thu 0 1 0Mùa đông 0 0 1Mùa xuân 0 0 023Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn TânSự thay đổi các đường hồi quy tuyến tính xảy ra bởi các biến số giả:Giả sử giálà £200. Doanh số trong mùa hè là :1000 – 0.5 x 200 + 200 x (1) – 20 x (0)– 50 x (0) = 100Khi mức giá được giữ nguyên thì doanh số trong mùa thu là :1000 – 0.5 x 200 + 200 x (0) – 20 x (1) – 80 x (0) = 8802.3.4 Phân tích các biến sốPhân tích hồi quy áp dụng theo quy ước, đó là : các biến số độc lập trong mộtkhoảng thời gian hay là tỷ lệ quy mô. Tuy nhiên thường những biến số phụ thuộc làtuyệt đối. Ví dụ: điều đáng quan tâm được giải thích tại sao là những công ty thànhcông thì nó khác với những công ty không thành công với những sự phân biệt đối vớiviệc nuôi dưỡng và không nuôi dưỡng một sản phẩm mới…để phân tích các biến số làtuyệt đối. Phân tích các biến số trong chủ thể là bắt nguồn từ sự thay đổi, sự kết hợptuyến tính của hai hay nhiều các biến số độc lập sẽ kết hợp tốt giữa hai hoặc nhiềunhóm được xác định rõ ràng. Những biến số đạt được bởi sự thành lập của sự biến đổitrọng lượng cho mỗi sự khác biệt để đạt được mức cao nhất giữa những nhóm biến đổiliên quan tới những nhóm biến đổi khác. Việc kết hợp những tuyến tính cho một phântích biến số, nó được biết tới như một hàm số biến số, nó được bắt nguồn từ mộtphương trình như sau :jk= a + W1k+ W2k+ …. (11.9)Trong đó :jk= biến số Z mã hóa cho biến số hàm số j cho chủ thể ka = đường thẳng= biến số trọng lượng cho sự biến đổi độc lập iik= biến đổi độc lập i cho chủ thể k.Những biến số này thì tỷ lệ trung bình cho tất cả những biến số riêng lẻ vớitừng nhóm đặc biệt, chúng đứng giũa mỗi nhóm và được nhắc tới như một trọng tâm.Trọng lượng Wcó thể được giải thích như những hệ số hồi quy β trong các phân tíchhồi quy. Hầu hết các chương trình báo cáo của máy tính bao gồm những biến số trọnglượng chuẩn và không chuẩn. Khả năng biến số có thể được đánh giá như là sự cảithiện đúng trong phân loại.24Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn TânVí dụ :Giả sử rằng nhà máy có khả năng kiểm soát một tài liệu nghiên cứu nếu như nócó thể tìm ra những biến số người mua và người không mua sản phẩm. Chính xác hơn,nhà máy này phải biết quan tâm tới độ tuổi và có khả năngđạt mức thu nhập. Biến sốphụ thuộc là xác định tuyệt đối (mua thì bằng 1, không mua thì =0) trong khi nhữngbiến số độc lập là theo quy ước. Phân tích các biến số của hai nhóm được xuất ra trongchương trình máy vi tính thì xem ở bảng 11.8. Sự kiểm soát là một phần trình bày của28 trong 30 lần quan sát được áp dụng trong các phân tích và hai hai quan sát còn lạilà không có dữ liệu. Chúng cũng nhìn thấy dữ liệu nhóm 0 bao gồm 19 chủ thể và 9chủ thể của nhóm khác. Từ phần (b) chúng ta nhìn thấy những dữ liệu phân tích thìphải đặt tất cả các đơn vị vào những nhóm mà ở đó chúng phụ thuộc đúng. Trườnghợp này thường không bắt buộc.Hai hàm của phương trình biến số thì được tính toán theo phần (d). Cho nhóm0 là : F= -18.27 + 0.225 tuổi + 0.120 thu nhập. Cho nhóm F= – 31.758 + 0.052 tuổi+ 0.203 thu nhập. Hai phương trình này được sử dụng để tiên đoán nếu như một ngườivới độ tuổi 54 và thu nhập với mức 250 thì sẽ mua sản phẩm P. Đơn giản chúng ta cóthể gắn hai số liệu này vào hai hàm số và đạt được f(54.250)= 24.023 và(54.250)=21.800. Khi đó f(54.250) > f(54.250), chúng ta dự đoán rằng nhữngngười thuộc vào nhóm 0 thì người đó sẽ không mua được sản phẩm này.Bảng 11.8 Phân tích biến số của hai nhóm.(a) Trường hợpNhóm 0 1Đếm 19 928 trường hợp được sử dụng 2 trường hợp không có giá trị(b) Tổng hợp của các phân loạiĐặt vào Đúng Nhóm…Nhóm 0 10 19 01 0 9Tổng số N 19 9N số đúng 19 925