Tiểu luận phương pháp phân tích định lượng trong nghiên cứu khoa học – Tài liệu text – Kiến Thức Cho Người lao Động Việt Nam
Tiểu luận phương pháp phân tích định lượng trong nghiên cứu khoa học
Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (300.73 KB, 39 trang )
Bạn đang đọc: Tiểu luận phương pháp phân tích định lượng trong nghiên cứu khoa học – Tài liệu text
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
LỜI MỞ ĐẦU
Trong nghiên cứu khoa học cũng như trong giải quyết công việc nói chung,
phương pháp là yếu tố vô cùng quan trọng. Xác định đúng phương pháp là con đường
dẫn tới thành công và cũng là cơ sở, là chuẩn mực để đánh giá một công trình nghiên
cứu. Phương pháp, trong đó bao gồm phương pháp luận, hệ phương pháp nghiên cứu,
phương pháp tiếp cận, lý thuyết nghiên cứu và kỹ thuật nghiên cứu, có thể nói là chìa
khóa để mở lối cho công trình khoa học, đồng thời cũng là cơ sở đảm bảo tính chất
khoa học của kết quả nghiên cứu. Chính vì vai trò quan trọng của phương pháp như
vậy nên trong quá trình học môn: Phương pháp nghiên cứu khoa học, nhóm chúng tôi
đã được tiếp cận chuyên đề “Phương pháp phân tích định lượng trong nghiên cứu
khoa học”. Thiết nghĩ chuyên đề này sẽ đem lại cho chúng ta những gợi mở bổ ích
cho quá trình nghiên cứu khoa học sau này, mà trước mắt là luận văn cao học.
Trong thời đại ngày nay, khi mà chúng ta có thể tiếp cận thông tin, số liệu từ
nhiều nguồn khác nhau: Từ sách vở, báo chí, từ mạng Internet, thì việc thu thập và xử
lí số liệu như thế nào sẽ có vai trò rất quan trọng. Vì vậy, khi chúng ta tiếp cận và hiểu
được phương pháp phân tích định lượng rồi thì sẽ không còn lúng túng, căng thẳng
khi đứng trước một “mớ hỗn độn” những tài liệu từ nhiều nguồn thông tin khác nhau
và tập hợp tài liệu đó làm nổi bật lên bản chất của vấn đề cần nghiên cứu.
Một công trình nghiên cứu khoa học sẽ có sức thuyết phục hơn khi được dẫn
chứng bằng những con số, số lượng cụ thể. Sự vật, hiện tượng bao giờ cũng biểu hiện
bản chất của nó qua tính chất và số lượng. Trong đó, số lượng giúp cho nhận thức của
chúng ta được chính xác, cụ thể, đồng thời hạn chế đặc tính chủ quan của người
nghiên cứu. Tuy nhiên, vấn đề là người nghiên cứu phải biết xử lí những số liệu,
những con số thu thập được như thế nào cho chính xác và khoa học. Với vấn đề này,
phương pháp phân tích định lượng có nhiều ưu điểm hơn hẳn so với các phương pháp
nghiên cứu khác. Với phương pháp phân tích định lượng, chúng ta có thể xử lí các số
liệu đám đông; có thể khắc phục tình trạng thiếu hụt số liệu, kiểm chứng các nhận
định và có khả năng ứng dụng các công cụ, thiết bị tin học hiện đại và nhu cầu nhận
thức của thời đại thông tin.
Do tập thể các thành viên trong nhóm là những học viên đang trong quá trình
học tập, nên khả năng tìm hiểu, nghiên cứu và thu thập thông tin bị hạn chế. Vì vậy,
sự sai sót không thể tránh khỏi. Tập thể nhóm rất mong nhận được sự đóng góp ý kiến
của các anh chị trong lớp và đặc biệt là sự hướng dẫn của Thầy để nhóm hoàn thiện
chuyên đề này tốt hơn.
Tập thể thành viên nhóm
1
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
CHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁP
NGHIÊN CỨU ĐỊNH LƯỢNG
1.1 Định nghĩa:
Nghiên cứu định lượng là phương pháp thu thập dữ liệu bằng số và giải quyết
quan hệ trong lý thuyết và nghiên cứu theo quan điểm diễn dịch. Hay nói cách khác
nghiên cứu định lượng là những nghiên cứu thu được các kết quả bằng việc sử dụng
những công cụ đo lường, tính toán với những con số cụ thể.
Nghiên cứu định lượng là đi tìm câu trả lời cho câu hỏi bao nhiêu, mức nào.
1.2 Lý thuyết:
Nghiên cứu định lượng chủ yếu là kiểm định lý thuyết, sử dụng mô hình
Khoa học tự nhiên thực chứng luận, phương pháp nghiên cứu định lượng có thể chứng
minh được trong thực tế và theo chủ nghĩa khách quan.
1.3 Phương pháp thực hiện
– Nghiên cứu thực nghiệm thông qua các biến.
– Nghiên cứu đồng đại chéo có nghĩa là thiết kế nghiên cứu trong đó các dữ
liệu được thu thập trong cùng một thời điểm.
Ví dụ: nghiên cứu việc học của con gái ở thành thị và nông thôn.
Nghiên cứu lịch đại thì dữ liệu thu thập theo thời gian trong đó các dữ liệu
được so sánh theo thời gian.
Nghiên cứu trường hợp là thiết kế nghiên cứu tập trung vào một trường hợp cụ
thể.
Nghiên cứu so sánh là thiết kế nghiên cứu trong cùng một thời điểm hay qua
nhiều thời điểm.
1. 4 Cách chọn mẫu:
– Mẫu ngẫu nhiên đơn giản.
– Chọn mẫu hệ thống.
– Chọn mẫu phân tầng.
– Chọn mẫu cụm.
1.5 Cách lập bảng câu hỏi:
2
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
– Theo thứ tự.
– Câu hỏi đóng: Là dạng câu hỏi có số liệu thu thập có thể tương đối dễ dàng
phân tích, mã hóa nhưng nó giới hạn sự trả lời. Thí dụ, sinh viên các khóa học được
đưa ra các câu hỏi nhận xét về giáo trình, bài giảng, sách, … và được chỉ định trả lời
theo thang đánh giá 5 mức độ (rất hài lòng: +2; hài lòng: +1; trung bình: 0; không hài
lòng: -1; rất không hài lòng: -2) để biết sinh viên thỏa mãn hay không thỏa mãn. Đây
là các câu hỏi đóng thể hiện sự mã hóa số liệu.
– Câu hỏi mở: Là dạng câu hỏi có số liệu thu thập không có cấu trúc hay số liệu
khó được mã hóa. Câu hỏi cho phép câu trả lời mở và có các diễn tả, suy nghĩ khác
nhau hơn là ép hoặc định hướng cho người trả lời.
– Câu hỏi được soạn sẵn.
– Câu hỏi ngắn gọn, xúc tích.
– Câu hỏi không gây tranh luận.
1.6 Sử dụng các phương pháp toán học để để ứng dụng trong phân tích
định lượng.
– Thống kê kế toán: Là một bộ phận của toán học ứng dụng dành cho các
phương pháp xử lý và phân tích số liệu thống kê, mà các ứng dụng chủ yếu của nó
trong quản lý là các phương pháp xử lý kiểm tra và dự đoán (dự đoán, điều tra chọn
mẫu,…)
– Mô hình toán: Là sự phản ánh những thuộc tính cơ bản nhất định của các
đối tượng nghiên cứu kinh tế, là công cụ quan trọng cho việc trừu tượng hoá một cách
khoa học các quá trình và hiện tượng kinh tế. Khoa học kinh tế từ lâu đã biết sử dụng
các mô hình kinh tế lượng như mô hình hàm sản suất Cobb – Douglas, mô hình cung
cầu, giá cả v.v
– Vận trù học: Là khoa học có mục đích nghiên cứu các phương pháp phân
tích nhằm chuẩn bị căn cứ chính xác cho các quyết định, đối tượng của nó là hệ thống,
tức là tập hợp các phần tử và hệ thống có tác động qua lại với nhau nhằm đạt tới một
mục tiêu nhất định.
3
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
CHƯƠNG 2: PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNG
Chương này trình bày một số phương pháp tiếp cận thường được áp dụng để
phân tích dữ liệu trong nghiên cứu kinh doanh cũng như các nghiên cứu khác. Đầu
tiên chúng tôi giới thiệu các thử nghiệm của những giả thuyết về sự khác nhau. Sau đó
chúng tôi kiểm tra các biến khác nhau và dự đoán các mối liên hệ. Thêm vào đó,
chúng tôi còn thảo luận các phương pháp để giảm dữ liệu và rút ra phạm vi cơ bản.
2.1 Kiểm tra sự khác nhau.
Câu hỏi bạn đang hỏi là liệu rằng kết quả nghiên cứu khoa học trong kinh
doanh có thể được hỏi bằng cách thống kê hay bằng những phương pháp nghiên cứu
khác. Ví dụ nếu 81% trong 100 khách hàng hài lòng với cửa hàng A và 71% hài lòng
với cửa hàng B thì cửa hàng A có tốt hơn không?
2.1.1 Những giả thiết về một giá trị trung bình.
Trong nghiên cứu chúng ta thường phải làm những báo cáo về giá trị trung
bình. Chúng ta phải giải thích độ lệch chuẩn và hệ số Z có nghĩa là gì. Khi mà phương
sai mẫu chưa được biết và sai số chuẩn của giá trị trung bình thì cũng chưa được biết.
Sai số chuẩn của giá trị trung bình phải được ước tính từ các số liệu mẫu.
Sự ước tính:
SD
X
= (11.1)
Trong đó:
– SD
x
: Sai số chuẩn của giá trị trung bình
– SD’ : Độ lệch chuẩn ước tính.
– N : Kích thước mẫu
1
)(
‘
1
2
−
−
=
∑
=
N
Xx
SD
N
i
i
(11.2)
Giả thiết kiểm tra là phân phối t với bậc tự do N-1 và tiến đến phân phối
thường khi số lần quan sát tăng lên.
Ví dụ: Tại một chuỗi siêu thị cung ứng sản phẩm mới, có ít nhất 100 đơn vị
sản phẩm được bán mỗi tuần. Sản phẩm mới được kiểm tra trong 10 sản phẩm ngẫu
nhiên được lựa chọn với một giới hạn thời gian nhất định. Kiểm định một đầu,ví dụ
4
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
khi hướng tìm giả thuyết là thích hợp khi mà doanh số ở mỗi cửa hàng ít nhất là 100,
sản phẩm sẽ được giới thiệu trên quy mô toàn quốc. Giả thuyết không (giả thuyết đơn
H
0
) và giả thuyết thay thế (H
A
)
H
0
: X < 100
H
A
: X > 100
Giả sử mức ý nghĩa α = 0.05, nghĩa là chúng ta bác bỏ giả thiết không (H
0
), khi
mà xác xuất cho giả thiết không chính xác là 5%. Vì vậy mức ý nghĩa cho chúng ta
thấy rằng xác xuất mà chúng ta chờ đợi để xem xét là một quyết định sai, điều đó
nghĩa là chấp nhận giả thuyết thay thế (H
A
) khi thực tế giả thuyết không là đúng.
Bằng việc tính toán chúng ta thấy rằng mức trung bình X = 109.4 và độ lệch
chuẩn SD =14.90
Chúng ta cũng có thể thấy rằng sai số chuẩn của giá trị trung bình:
SDx = = = 4.55
Chúng ta tìm t bằng cách tính :
07.2
55.4
1004.109
=
−
=
−
=
X
SD
X
t
µ
Giới hạn t (ví dụ giá trị t được yêu cầu để từ chối giả thiết không) như khi đọc
từ bảng t với bậc tự do là 1.833 (α=0.05).
Ở đây giá trị kiểm tra t được cho sẵn. Giá trị kiểm tra t giả sử là biến phân phối
nhưng không tìm ra được giá trị nào thiết thực hơn. Khi N trở nên lớn (ví dụ N > 30),
phân phối t tiến gần đến phân phối thường.
Hộp 11.1 Những giả thiết
Giả thiết đóng vai trò chính trong việc nghiên cứu. Chúng gợi ý một cách gián
tiếp những giả định hoặc những kỳ vọng và thường quy định bởi những câu hỏi. Nếu
sự hài lòng của khách hàng ở cửa hàng A lớn hơn ở cửa hàng B thì liệu rằng sản phẩm
mới sẽ bán mỗi tuần của cửa hàng A có nhiều hơn 100 đơn vị sản phẩm? Những giả
thiết có thể được quy định (về nguyên tắc cơ bản). Để làm như vậy chúng ta phải đối
chiếu với giả thiết.
V í dụ: Với giả thiết không (H
0
), sự hài lòng của khách hàng ở cửa hàng A tốt
hơn ở cửa hàng B thì sẽ không có sự khác biệt giữa cửa hàng A và cửa hàng B. Để
5
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
làm điều đó chúng ta cần số liệu về việc thực hiện giữa cửa hàng A và cửa hàng B.
Nếu có đủ sự khác biệt để tồn tại chúng ta bác bỏ giả thiết không (H
0
) và chấp nhận
giả thiết thay thế (H
A
). Vì vậy, thông qua việc giả định, chúng ta có được những hiểu
biết, nghĩa là chúng ta đã kiểm nghiệm giả định hoặc kỳ vọng của chúng ta.
2.1.2 Những giả thiết về hai giá trị trung bình.
Những người nghiên cứu thường đối mặt với những câu hỏi như: Thị hiếu
trong khu vực A khác với thị hiếu trong khu vực B không? Phân khúc khách hàng 1
với phân khúc khách hàng 2 không? Có 1 chiến dịch quảng cáo hiệu quả hơn cái khác
không? Công thức để kiểm tra sự khác biệt giữa các nghiệm là được phân bổ bình
thường, và do đó những sự khác biệt của chúng cũng tạo ra sự phân bổ bình thường,
cụ thể theo công thức sau :
Z =
(X
1
– X
2
) – (µ
1
– µ
2
)
Trong đó:
X
1
= Nghiệm 1
X
2
= Nghiệm
= Sai số của hai nghiệm
µ
1
và µ
2
là nghiệm kỳ vọng chưa biết
Sai số của hai nghiệm được tính theo công thức sau:
=
Giả định rằng 2 phương sai tổng thể bằng nhau, phương sai tổng thể chung có
thể được tạo ra bằng cách tổng hợp các mẫu. Khi phương sai không rõ và sai số chuẩn
của các mẫu phải được ước lượng, sau đó t đại diện cho một số liệu thống kê kiểm tra
phân bổ phù hợp với v = N
1
+ N
2
– 2 bậc tự do.
Ví dụ :
Một nhà phân phối đang phát triển 1 sản phẩm mới và tự hỏi liệu nhãn hiệu của
sản phẩm nên có màu đỏ hay màu xanh dương. Những sản phẩm mới với hai nhãn
hiệu khác nhau được thử nghiệm trong 10 cửa hàng được lựa chọn ngẫu nhiên. Doanh
6
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
thu trung bình đạt được với nhãn màu đỏ là 403.0 và với màu xanh dương là 390.3.
Sai số chuẩn của việc ước lượng cho sự khác biệt giữa các mẫu là 8.15
Tính t = = = 1.56
Giá trị này được chuyển đến bảng t cho v = n
1
+ n
2
-2 = 10 + 10 – 2 = 18 bậc tự
do. Kiểm nghiệm là hai phía vì giả thuyết là hai màu sắc phù hợp như nhau. Với α =
0.05, và 18 bậc tự do, tới hạn t = 2.101. Điều này có nghĩa giả thuyết không được chấp
nhận. Ở ví dụ trên chúng ta thấy rằng ( µ1 – µ2 ) = 0. Vì hai nghiệm kỳ vọng chưa biết
và được giả định là như nhau.
NB : Lưu ý rằng trong ví dụ trên hai mẫu được giả định là không liên quan, đó
là được rút ra độc lập với nhau.
2.1.3 Các mẫu liên quan
Giả sử chúng ta muốn tìm hiểu xem thu nhập đã tăng lên từ năm ngoái đến
nay trên cơ sở dữ liệu thu nhập của năm ngoái và thu nhập của năm nay trong một
mẫu sau:
7
Người
Thu nhập
năm trước
Thu nhập
năm nay
Chênh lệch
1 228 224 -4
2 213 225 12
3 257 271 14
30 260 292 32
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Điều này thường được gọi là vấn đề hai mẫu với sự quan sát theo cặp. Chúng
theo cặp bởi vì sự quan sát xảy ra trong một cặp thu nhập năm trước và năm nay của
mỗi cá nhân. Để giải quyết vấn đề này chúng ta có thể lấy giá trị thu nhập của năm
nay (cột 3) trừ đi giá trị thu nhập của năm trước (cột 2), và bây giờ, chúng ta có giá trị
khác biệt ở cột chênh lệch (cột 4).
Cần chú ý rằng sự khác biệt biệt được so sánh từ một mẫu quan sát đã thảo luận
trước đó, vì vậy các phương pháp áp dụng là tương tự.
Giả thuyết vô hiệu H
0
là trung bình của tập hợp chính khác nhau, 30 mẫu khác
nhau trong cột 4, khi giá tri này bằng 0. Giả thuyết thay thế H
A
là giá trị trung bình
dãy số lớn hơn 0.
Từ kết quả kiểm mẫu của sinh viên cho thấy:
Với mức ý nghĩa = 8.13
Độ lệch chuẩn ước tính (SD) = 10,91
St sai số là = 1,99
t = 4,08
p = 0,0002
Từ các tính toán thống kê thấy t = 4,08. Tương ứng với giá trị p = 0,0002 là
nhỏ hơn đáng kể so với 0,05 và do đó H
0
bị từ chối. Trong hầu hết các mẫu kiểm tra
và các chương trình giá trị thống kê kiểm tra và giá trị p tương ứng đều hiển thị do đó
không cần tìm chúng trong bảng phân phối thống kê tương ứng.
Một số phương pháp phi tham số hữu ích cũng có sẵn như là những lựa chọn
thay thế cho các phương pháp cổ điển. Chúng có lợi thế là đòi hỏi ít về những giả
định.
Nhưng nếu giả định cần thiết cho việc sử dụng t kiểm tra là hợp lý thì nó rất
hữu ích vì thử nghiệm này thường có độ chính xác cao hơn. Ví dụ cho khoảng cách tin
cậy hẹp hơn so với phương pháp phi tham số tương ứng. Chú ý phương pháp dựa trên
phân phối t có liên quan tới phương sai, trong khi các phương pháp phi tham số
thường quan tâm tới giá trị trung bình. Nhưng nếu phân phối là đối xứng thì hai giá trị
trên bằng nhau.
8
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Một thử nghiệm phi tham số đơn giản áp dụng cho các vấn đề thu nhập cao hơn
là kiểm tra dấu hiệu. Giả sử trong trường hợp trên 30 mẫu kiểm 7 là dưới trung bình
và 23 là trên trung bình. Dấu hiệu trung bình p = 0,0026, P giá trị chỉ ra sự khác biệt
đáng kể giữa thu nhập năm trước và thu nhập năm nay. Kiểm tra dấu hiệu trong ví dụ
trên là dựa trên thực tế là 7 sự khác biệt tiêu cực và 23 khác biệt tích cực. Không có
thông tin khác được sử dụng. Kiểm tra dấu hiệu, hay nói cách khác là thông tin chứa
trong dữ liệu đó vì mốc dao động xung quanh giá trị trung bình. Một thử nghiệm tham
số, ví dụ t kiểm tra cũng có sự khác biệt rõ ràng với giá trị trung bình.
2.1.4 Sự so sánh từ hai nhóm trở lên
Trong nghiên cứu chúng ta thường gặp sự so sánh từ hai nhóm trở lên xảy ra
cùng một lúc. Để nghiên cứu các tình huống như vậy thì phân tích phương sai
(ANOVA) thường được sử dụng. Trước khi giải thích phương pháp nghiên cứu này,
chúng ta sẽ đề cập rằng tại sao cần phải tiến hành một vài kiểm nghiệm t để so sánh
tất cả sự kết hợp của các nhóm thì thật sự không thích hợp.
Giả sử chúng ta quan tâm đến sự khác nhau giữa ba nhóm. Nếu chúng ta tiến
hành kiểm nghiệm t tại mỗi nhóm, chúng ta phải so sánh giữa nhóm 1 và nhóm 2, giữa
nhóm 1 và nhóm 3, và giữa nhóm 2 và nhóm 3. Nếu mỗi kiểm nghiệm t này sử dụng
mức ý nghĩa là 0.05, sau đó xác xuất nhầm lẫn của sự bác bỏ giả thiết không (H
0
) là
5%. Do đó xác xuất không có lỗi loại I là 95% cho mỗi kiểm nghiệm. Khi giả sử rằng
các cuộc kiểm nghiệm là độc lập với nhau, thì xác xuất không có lỗi loại I là (0.95)
3
=
0.95 x 0.95 x 0.95 = 0.857. Bây giờ xác xuất chắc chắn không có lỗi loại I là 1 – 0.857
= 0.143, hay 14.3% (thí nghiệm thống kê qua tỷ lệ sai số này được tính trên dữ liệu
thực nghiệm giống nhau được biết đến như tỷ lệ sai số thực nghiệm).
Phân tích phương sai dựa trên so sánh chỉ số của phương sai hệ thống với
phương sai không có hệ thống. Giả sử một nghiên cứu thực nghiệm bao gồm khảo sát
của ba phương pháp thiết kế. Nếu các phương pháp thay đổi hiệu lực, thì một khả
năng kỳ vọng sẽ thay đổi ít hơn trong một nhóm được bộc lộ đến một loại thiết kế đặc
thù hơn qua các nhóm. Phân tích phương sai được tính theo công thức như sau:
1. Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân.
9
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
2. Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lý với tổng
bình quân;
3. Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trong nhóm với
bình quân nhóm.
Ước lượng riêng lẻ của biến tổng thể trên trung bình bình phương:
MS
T
= =
MS
B
= =
MS
W
= =
Trong đó:
1. MS
T
= Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân.
2. MS
B
= Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lý
với tổng bình quân; và
3. MS
W
= Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trong
nhóm với bình quân nhóm.
Ví dụ:
Giả sử có ba nghiên cứu về quảng cáo trong 24 thành phố được lựa chọn ngẫu
nhiên, so sánh về kích thước và nhân khẩu. Giả sử kết quả từ máy tính cho ra như sau:
Nguồn biến thiên
Tổng bình
phương
Bậc tự do
Trung bình
bình phương
Tỷ lệ F
Giữa các nhóm
Trong các nhóm
Tổng cộng
49.0
87.5
136.5
2
21
23
24.1
4.17
5.88
Bậc tự do được tính toán như sau: Tổng cộng (24-1) = 23, phương sai giữa các nhóm
(3-1)=2, phương sai trong nhóm (23-2)=21
Giả thiết không (Ho) là các trung bình nhóm ví dụ như: X
G1
= X
G2
= X
G2’
và giá
trị tới hạn là α = 0.05. Để kiểm định giả thiết, một thí nghiệm F (trên cơ sở phân phối
10
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
F) là phù hợp. Thí nghiệm F có thể được xem như là khái quát của thí nghiệm t và cho
phép so sánh của hai nhóm trở lên cùng lúc. Giá trị F được tính bằng hiệu số giữa
trung bình bình phương và bình phương phương sai trong nhóm, đó là 24,5/4,17. Khi
tra bảng phân phối F, chúng ta tìm thấy đơn vị tử số (là 2) và mẫu số (là 21) và tìm
thấy giá trị là 3.47. Bởi vì 5.88 lớn hơn 3.47 chúng ta sẽ loại bỏ giả thiết không (H
0
),
kết quả là, mức ý nghĩa của nhóm bằng nhau, và chấp nhận giả thiết thay thế, như vậy,
sự thay đổi chiến dịch quảng cáo là có hiệu quả. Nếu chúng ta đánh giá mức hiệu quả
trung bình của một trong ba chiến dịch quảng cáo trên chúng ta cũng nhận thấy rằng
có một chiến dịch là có hiệu quả nhất.
NB: Trong phân tích dung sai, biến thiên phụ thuộc, hiệu quả của quảng cáo,
được thừa nhận theo hệ mét, đó là khoảng cách hoặc chỉ số tỷ lệ. Biến độc lập (chiến
dịch quảng cáo khác nhau) là xác thực.
Ở trên là một ví dụ về phân tích dung sai đơn giản. Chỉ một hệ số, ảnh hưởng
của thay đổi chiến dịch quảng cáo được phân tích như thế nào. Phân tích dung sai có
thể được mở rộng bao gồm nhiều hơn hai biến độc lập một cách rõ ràng hơn; ví dụ,
thành tích của sinh viên (biến phụ thuộc) có thể được nghiên cứu như đầu ra của
những phương pháp khác nhau của thiết kế và người thiết kế chương trình giáo dục
(biến độc lập). Phân tích phương sai cũng có thể được mở rộng để kiểm tra sự tác
động đồng thời trên hai biến phụ thuộc, giới hạn của sự đa dạng phân tích dung sai.
2.2 Mối quan hệ (sự biến thiên đồng thời) giữa các biến
Trong nghiên cứu, chúng ta thường quan tâm, chú ý đến có 1, 2 hay nhiều mối
quan hệ giữa các biến số. Có nhiều phép đo về những mối quan hệ này, hãy xem ví dụ
của Frankfort –Nachmias và Nachmias (1996) về tổng quan một số phép đo phổ biến
của sự liên hệ.
2.2.1 Hệ số tương quan
Một phép đo quan trọng là sự tương quan hay nói cách khác là hệ số tương
quan tức thời: r đã được đề cập ở những chương trước. Hệ số tương quan tức thời giới
hạn bời khoảng cách của biến số hay qui mô của biến số. Giống như những phép đo
khác về mối quan hệ, hệ số tương quan được xem là biến số chung của 2 phép đo. Hệ
số tương quan tức thời dùng để kiểm tra mối quan hệ tuyến tính giữa 2 biến số X và
Y.
11
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Về lý thuyết, hệ số tương quan có giá trị từ [-1,1] ( -1 ≤ r ≤ 1)
r = +1, cho biết 2 biến số là biến số có thực;
r = -1, cho biết 2 biến số có mối quan hệ hoản toàn ngược nhau;
r dần tới 0, chỉ ra rằng những biến số không có mối liên hệ với nhau.
Công thức tính hệ số tương quan tức thời:
r
xy
=
Trong đó X ,Y đại diện cho mẫu X, Y tương ứng.
Ta có công thức tương đương:
r
xy
=
Trong đó: là phương sai của X
là phương sai của Y
là phương sai hợp của X và Y
Hệ số tương quan diển tả mối quan hệ giữa hai biến số và hệ quả của mối liên
hệ đó.
Bình phương hệ số tương quan là:
Biến xem xét
R
2
=
Biến tổng hợp
Điều này có nghĩa là nếu bình phương hệ số tương quan giữa X và Y là 50%
thì biến X là 50% và biến Y là 50%.
Sự tương quan thường được dùng để kiểm tra 2 chiều các mệnh đề giả thuyết,
có nghĩa là kiểm tra giả thuyết về mối quan hệ giữa hai biến số. Từ vấn đề này, chúng
12
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
ta thấy rằng, hệ số tương quan là số thống kê có ý nghĩa. Nó phụ thuộc vào cả độ lớn
của hệ số tương quan và số lượng quan sát.
Độ lệch tiêu chuẩn của hệ số tương quan là:
Ví dụ: Một bản thử nghiệm nghiên cứu, trong số 2 nhóm khảo sát về sự cảm
nhận quảng cáo chịu tác động, ảnh hưởng bởi sự thu hút quảng cáo (1= tích cực; 0=
tiêu cực), sự tin chắc vào sản phẩm quảng cáo và giới tính (1= nữ; 0= nam). Số lượng
khảo sát là 60, kết quả được ghi nhận ở bảng 11.1. Qua bảng trên, chỉ ra rằng phụ nữ
thì ít có khuynh hướng cảm nhận quảng cáo và phụ nữ cũng có thể ít tin vào sản phẩm
quảng cáo. Chúng ta cũng thấy rằng, những khảo sát này có ý nghĩa quan trọng trong
phân tích hai chiều (phân tích 2 biến số). Thêm vào đó, chúng ta chú ý rằng: sự thu
hút tích cực có thể được cảm nhận hơn là sự thu hút tiêu cực (mức ý nghĩa 0.05).
2.2.2 Tương quan một phần
Trong chương 10 ( cũng như chứng minh trong chương 5) chúng ta thảo luận
làm cách nào mà chúng ta có thể đưa ra kiểm soát việc liên quan đến mối quan hệ
giữa các biến bằng cách kiểm soát biến thứ ba ( hoặc nhiều hơn). Điều này cũng có
thể thực hiện trong tương quan.
Bảng 11.1 Sự chồng chéo giữa cảm nhận quảng cáo, giới tính, tin tưởng vào
nhà sản xuất và sự hấp dẫn.
Cảm nhận
quảng cáo
Giới tính
Sự tin
tưởng
Xem thêm: Khái niệm và phân loại các phương pháp nghiên cứu khoa học
Sự hấp dẫn
Cảm nhận quảng cáo – -0.33* 0.25** 0.24**
Giới tính – -0.36* 0.09
Sự tin chắc – 0.14
Sự thu hút quảng cáo – –
*, **
Phân tích, nghĩa là tương quan một phần. Công thức cho hệ số tương quan một
phần r
12.3
( đọc giữa tương quan một phần ( biến ) 1 và 2 chấm 3 ) là:
13
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
r
12 3
= (11.5)
Công thức được lặp đi lặp lại, và do đó sau khi kiểm soát cho biến 3 biến tiếp
theo có thể được kiểm soát.
Ví dụ:
Quan sát mối quan hệ giữa thừa nhận quảng cáo và sự hấp dẫn tác động bởi
điều khiển của giới tính. Sử dụng trong công thức 11.5 ta thấy:
r
Ad.rec.,ad.appeals.sex
= = 0.29
Điều này cho thấy rằng bằng cách kiểm soát giới tính thì liên quan mối quan hệ
giữa thừa nhận quảng cáo và quảng cáo hấp dẫn ( xác thực) là trở nên vững chắc.
2.3 Giải thích và dự báo những mỗi quan hệ giữa các biến
Mô tả, giải thích và dự báo mối quan hệ giữa các biến là công việc quan trọng
trong nghiên cứu kinh doanh. Chẳng hạn, một người quản lý có thể quan tâm đến mối
qua hệ giữa lượng tiền phải trả cho quảng cáo và bán hàng hoặc là mối quan hệ giữa
số lượng hàng bán và lượng khách đến tham quan. Như vậy thông tin rất quan trọng
trong kinh doanh bởi vì nó cho phép giải quyết một cách hoàn thiện hơn, chẳng hạn
làm thế nào biết chi trả cho quảng cáo bao nhiêu là tốt.
Một trong các phương pháp tiếp cận ứng dụng và hữu ích nhất để kiểm tra mối
quan hệ giữa các biến là phân tích hồi quy. Trong phân tích hồi quy chúng ta có một
biến phụ thuộc (nghĩa là biến được giải thích) va một hoặc nhiều hơn biến không phụ
thuộc. Cả biến phụ thuộc lẫn biến không phụ thuộc thường giả định là tham số (nghĩa
là khoảng cáchhoặc là thước đo tỷ lệ). Như thảo luận ở dưới đây, cái gọi là biến giả
còn có thể sử dụng như biến không phụ thuộc. Trong phân tích hồi quy ( như phân
tích nhiều loại khác) chúng ta muốn có một mô hình phù hợp nhất là miêu tả dữ liệu,
cái có thể làm trong phân tích hồi quy bằng cách áp dụng phương pháp bình phương
nhỏ nhất. Chính xác hơn, điều này được thực hiện bằng một đường thẳng phù hợp mà
giảm thiểu các độ lệch bình phương từ đó đường thẳng hiển thị như trong hình 11.1
14
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
2.3.1 Hồi quy tuyến tính đơn giản.
Nó được biết rằng có thể vẽ bất kỳ đường thẳng nếu bạn biết hai điều: (1) độ
dốc (hoặc độ nghiêng) của đường thẳng, và (2) điểm mà tại đó đường thẳng băng qua
trục thẳng đứng của đồ thị ( được biết như là phần mặt phẳng bị chặn của đường
thẳng).
h
l
β
1
=
β
0
Hình 11.1 Mô hình tuyến tính
Phương trình của đường thẳng là:
Y = β
0
+ β
1
x
1
+ ε
i
Y là biến kết quả chúng ta muốn dự báo, x
1
là điểm của đối tượng hoặc của
người dự báo biến; β
1
là độ đốc của đường thẳng khít với dữ liệu. β
0
là phần mặt phẳng
bị chặn của đường thẳng; ε
i
là đại diện cho sự khác biệt giữa điểm số dự báo tuyến
tính cho đối tượng và điểm số mà đối tượng chắc chắn thu được thường là số hạng còn
dư lại. Trong phân tích hồi quy ước lượng hồi quy đường thẳng mang lại giá trị dự
báo. Nếu quan sát tất cả giá trị giảm của dự báo tuyến tính. Không có những sự khác
biệt giữa dự báo và giá trị còn dư như thể hiện hình 11.1
Ví dụ:
Giả sử một thương nhân xe hơi tập hợp dữ liệu của 6 tháng với 4 biến: Quảng
cáo TV, quảng cáo chữ in, quảng cáo người cạnh tranh và bán hàng.Y là thương nhân
xe hơi mong đợi việc bán xe hơi tương quan với quảng cáo TV và quảng cáo chữ in.
Mối tương quan giữa bán xe hơi và đối thủ cạnh tranh quảng cáo hầu như chắc chắn là
không. Nhưng nếu quảng cáo của đối thủ cạnh tranh mở rộng toàn bộ trên thị trường
15
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
hơn là hay thay đổi thị trường thị phần, mối tương quan có thể là dương. Giá trị của 4
biến được thể hiện trong bảng 11.2
Bảng 11.2 Ma trận dữ liệu
Hàng QC TV QC chữ in Đối thủ cạnh tranh QC Bán xe hơi
1 0 1 2 1
2 1 0 0 1
3 2 2 4 2
4 2 3 6 3
5 3 3 3 4
6 4 3 0 4
Bảng 11.3 Trung bình hồi quy giản đơn:
Predictor Coef St. dev t-radio p
Constant 0.70000 0.4453 1.57 0.191
TV-Ads 0.90000 0.1871 4.81 0.009
S= 0.5916 R-sp=0.85.3% R-sq(adj)=81.6%
Sự cân bằng của hồi quy
CarSale = 0.7000 + 0.9000 TV-Ads
Đầu tiên, chúng ta giải thích sự hữu ích của phương trình hồi quy tuyến tính
bằng việc dự kiến chỉ có quảng cáo trên T.V và Carsales là được theo dõi. Chúng ta
xem Carsales như là biến phụ thuộc và quảng cáo T.V là biến độc lập. Tiếp theo,
chúng ta ước tính hàm số theo phương pháp quy hồi tuyến tính giản đơn của Caresales
trên quảng cáo T.V. Được thể hiện như bảng 11.3 được in ra từ máy tính.
Thời kỳ liên tục 0.7000 chỉ rằng, nếu người kinh doanh không sử dụng hình
thức quảng cáo nào trên truyền hình ( nghĩa là chi phí quảng cáo = 0) thì giá trị dự
kiến của Carsale là 0.7 đơn vị, đó chính là 7 chiếc xe. Hệ số hồi quy ước tính ước tính
của doanh số trên quảng cáo T.V là 0.9000. Hệ số này chỉ rằng nếu biến quảng cáo
T.V được tăng lên 1 đơn vị thì giá trị dự kiến của Carsales tăng lên 0.9 đơn vị, điều đó
là 9 chiếc xe. Đây là những thông tin hữu ích đối với những nhà kinh doanh xe.
Nhưng người kinh doanh miễn cưỡng với việc tăng “polate”: điều này có nghĩa là
người kinh doanh không được sử dụng những thông tin có giá trị ngoài chương trình
16
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
quảng cáo trong khoảng từ 0 cho đến 4 mà nó đã thể hiện ở mẫu ( nhìn vào bảng
11.3).
Kết quả, hệ số tương quan ( R-sp). R
2
85,3% ( bình phương hệ số tương quan là
85,3%) hệ số này chỉ ra rằng việc xác định mẫu có hệ số tương quan R
2
ngang với giá
trị là 0.853. Nói một cách cụ thể, điều này có nghĩa mức độ biến đổi trong các biến ở
chương trình quảng cáo T.V được giải thích là 85,3 % của Carsales có thể biến đổi
trong mẫu của chúng tôi. Bình phương của mẫu là hệ số tương quan r. Giá trị P:
0.0009 là hệ số hồi quy, β là doanh số trên chương trình quảng cáo T.V nhỏ hơn an
pha 0.05, chúng tôi thừa nhận điều này theo quy ước chọn lựa của chúng tôi với mức
ý nghĩa. Có nghĩa là chúng tôi có thể loại bỏ giả thiết không có hiệu lực H
0
, tương ứng
với hệ số tương quan. β là ngang bằng với 0, là sử dụng được hai mặt. A
2
: β # 0 (sử
dụng hai mặt là sự mặc định của chương trình máy tính).
Tóm lại: Quảng cáo T. V và doanh số bán hàng có mối quan hệ ý nghĩa với
nhau. Từ đó nó có mối quan hệ là mật thiết không thể nào có chuyện gia tăng chí phí
quảng cáo mà dẫn đến kết quả là giảm doanh số bán ra, nó thật sự thích hợp cho việc
sử dụng một chiều, A
1
: β > 0. Điều đó có nghĩa là giá trị p được hệ thống sử lý của
máy tính chia làm 2 phần. Như thế giá trị có liên quan của p là (0.009/2) = 0.0045.
Đây là bằng chứng thiết thực cho kết quả là có mối quan hệ giữa quảng cáo T.V và
Carsales. Những trường hợp thiết thực này chúng ta chắc sẽ thấy sau này, một hệ số
có lẽ không tập hợp khi có sự khác biệt đáng kể từ 0 (zero) khi chúng ta sử dụng mối
liên hệ hai mặt, mặc dù nó đã được xác minh là có dấu hiệu khác biệt từ 0 ( zero) nếu
đã được trình bày là có mối liên hệ một mặt. Như vậy nó thật sự quan trọng trong việc
lực chọn một mặt trong điều kiện thích hợp ( xem phần 10.5 ). Biểu đồ ở bảng số 11.4
là mối liên hệ khác biệt cho vấn đề này.
Bảng 11.4 Những giá trị thặng dư và phù hợp
Hàng Kinh doanh
Quảng cáo
TV
Giá trị thặng
dư chuẩ
Thích hợp
Giá trị thặng
dư
1
2
3
4
5
1
1
2
3
4
0
1
2
2
3
0.77033
-1.18431
-0.92582
0.92582
1.18431
0.7
1.6
2.5
2.5
3.4
0.3
-0.6
-0.5
0.5
0.6
17
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
6 4 4 -0.77033 4.3 -0.3
Một biến là hữu ích nếu giá trị p của nó nhỏ hơn. Sử dụng thay thế một chiều
thay vì cách thức hai mặt là giá trị p thực tế sẽ giảm một nữa.
Sự phù hợp là ước tính dự kiến bán xe hơi hoặc doanh số bán xe hơi tương ứng
với các giá trị của biến độc lập quảng cáo truyền hình được tìm thấy trong mẫu. Phần
còn dư là độ lệch tương ứng từ ước lượng hồi quy đường thẳng. Chú ý rằng phương
trình thích hợp + giá trị thặng dư = Doanh số bán xe hơi là giá trị cho mỗi tháng ( mỗi
sự quan sát). Chúng ta thích sự để được gần gũi với doanh số bán hàng và gần gũi
quen thuộc với giá trị thặng dư để được gần với 0. Sau đó R
2
sẽ gần đến 1.
Giả định trong phân tích hồi quy.
Phân tích hồi quy là dựa trên một số giả định, bao gồm:
1. Giá trị kỳ vọng của sai số là không, E( = 0).
2. Phương sai của sai số cho mỗi x
i
là hằng số. Đây là được gọi là homo-
scedasticity. Nếu phương sai thay đổi theo x
i
được gọi là heteroscedasticity.
3. Sai sót cho các quan sát là không tương quan.
4. thường phân bổ cho mỗi x
i.
5. Các sai số không tương quan với x
i,
Corr( x
i
) = 0.
6. Nó cũng là một giả định phổ biến mà các mô hình hồi quy phải là tuyến tính
trong các tham số của nó.
Đó là thực hành các logic để kiểm tra các giả định. Kết quả của bạn của bạn có
thể hữu ích ngay cả khi tất cả các giải định tiêu chuẩn không đáp ứng, nhưng sau đó
kết quả thường không chắc chắn hơn so với số liệu thống kê cho thấy. Điều quan
trọng là bạn sử dụng logic phán đoán tất cả các giai đoạn mà bạn biết những gì bạn
đang làm.
Trong một thời gian ngắn chúng ta sẽ cho thấy kiểm tra một số giả định như thế
nào trong ví dụ của chúng ta. Nó nên được nhớ tới, tuy nhiên, chúng ta có quá ít quan
sát để có được một tình huống thực tế. Giả định của một mô hình tuyến tính có thể
18
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
kiểm tra bề ngoài bằng cách nhìn vào biểu đồ được cung cấp từ máy tính. Vài giả định
có thể có liên quan đến sự xáo lộn khó nhìn thấy được ước tính bằng giá trị thặng dư.
Giá trị thặng dư có thể biểu diễn theo nhiều cách – ví dụ tùy vào các biến độc lập.
Chúng ta có thể kiểm tra bề ngoài giả định của homo- scedasticity: nghĩa là, chúng ta
kiểm tra sự khác nhau của giới hạn xáo trộn không thay đổi khi giá trị của biến độc
lập thay đổi. Chúng ta thích nhìn thấy một bức tranh nơi mà biến thiên lên và xuống
trong biểu đồ là gần như nhau, nói, bên trái, ở giữa và một phần bên phải của biểu đồ.
Để có một vài ý tưởng cho sự phù hợp của các giả định của sự xáo lộn phân bổ
bình thường, nếu bạn có nhiều quan sát hơn chúng tôi, kết quả kiểm tra biểu đồ tần số
của giá trị thặng dư có một số trùng với mật độ bình thường, bạn cũng có thể sử dụng
biểu đồ sác xuất thông thường. Nếu kết quả các điểm trong biểu đồ của điểm bình
thường rơi khoảng trong một đường thẳng, giá trị thặng dư (và hy vọng cũng như sự
xáo trộn) dường như đến từ mật độ bình thường. Hệ số tương quan nói như thế nào về
một đường thẳng. Nếu cũng như dữ liệu ở đây là dữ liệu chuỗi thời gian, có thể tự
quan tự động trong các xáo trộn. Kiểm tra một sự thích hợp cho sự tự tương quan là 1.
Nếu số liệu thống kê D-W gần đến 2, cũng như ở đây, không có nguy cơ cho sự tương
quan tự động. Nếu như nó gần tới 0, có thể có sự tự tương quan tự động. Nếu như nó
gần tới 4, có thể có tương quan tiêu cực xảy ra (hiếm khi xảy ra). Một cuộc thảo luận
xuất sắc của kiểm tra phân tích hồi quy, xem Field 2000.
Lựa chọn của các biến
Nếu chúng ta muốn sử dụng hồi quy tuyến tính đơn giản, nhìn vào ví dụ, tuyến
tính Y trên x
1
, cũng như đã thực hiện. Nhưng chúng ta cũng có thể có hồi quy Y trên
x
2
hoặc hồi quy Y trên x
3
. Trong sự lựa chọn giữa hàm hồi quy khác nhau trong tình
huống như thế này nó rất hữu ích để xem xét các hệ số tương quan. Hệ số tương quan
được biểu diễn trong bảng 11.5.
Chúng ta chú ý rằng giữa ba biến độc lập, quảng cáo T.V là một trong những
cái mà trong đó sự tương quan mẫu là cao nhất với các biến bán hàng độc lập. Trước
đây chúng ta thấy hàm hồi quy tương ứng có vẻ là thỏa đáng trong tất cả các khía
cạnh. Vì vậy, nếu chúng ta quyết định chỉ sử dụng một biến độc lập, quảng cáo T.V là
được chọn. Xem xét kỹ lưỡng trên sự tương quan, chúng ta cũng nhìn thấy rằng quảng
19
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
cáo T.V tương quan mạnh với quảng cáo chữ in và quảng cáo chữ in tương quan mạnh
với kinh doanh. Hệ số tương quan cao giữa quảng cáo T.V và quảng cáo chữ in cho
thấy mức độ cao của đa cộng, là khả năng làm mờ các ước tính, cũng như chỉ ra rằng
biến này (quảng cáo chữ in) bao gồm biến phụ thuộc.
Đánh giá tốt sự thích hợp.
Làm thế nào để ước lượng mô hình hồi quy phù hợp với dữ liệu? (Điều này
được giới hạn “giải thích các biến”). Cũng như chú ý ở trên, bị chắn và hệ số hồi
quy có thể ước lượng.
Bảng 11.5 Tương quan hồi quy
Quảng cáo T.V Quảng cáo máy in Đối thủ cạnh tranh quảng cáo
Quảng cáo in 0.783
Đối thủ quảng cáo -0.060 0.472
Doanh số 0.923 0.918 0.155
Khi tổng kết tất cả i ở trên nó cũng có thể được biểu diễn:
TSS RSS ESS
Như chúng ta có thể nhìn thấy từ bình phương trên, chúng có tổng ở đây. Đầu
tiên, TTS là tổng số của các bình phương. Thứ hai, RSS là tổng hệ quy của các bình
phương, nó là những biến số trong những biến số độc lập được giải thích bởi những
mô hình hồi quy. Sau cùng, ESS là tổng bình phương của các sai số là tổng bình của
những giá trị thặng dư. Những phân số RSS/ TSS là một phần biến số trong biến số
độc lập được giải thích bởi những mô hình hồi quy, thường được cho là những hệ số
của biến số, R
2
như được đề cập ở trên.
Những tiêu chuẩn của hệ số hồi quy
Những hệ số hồi quy β
1
, như trình bày ở ví dụ trên thật là dễ dàng để giải thích
nếu như đo lường X và Y là có ý nghĩa. Điều này thường không phải là trường hợp
khó khăn để ước tính độ mạnh trong mối quan hệ tuyến tính khi chúng có các biến số
độc lập, đây cũng có thể là trường hợp đặc biệt. Trong các trường hợp chúng ta có thể
20
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
chuẩn hóa các hệ số hồi quy bởi sự tăng thêm của các hệ số hồi quy do độ lệch chuẩn
của phân số X vượt quá mức chuẩn của phân số Y.
2.3.2 Hồi quy bội số
Trong nhiều hồi quy hai hay nhiều biến độc lập được áp dụng để giải thích dự
đoán các biến phụ thuộc. Mục đích là để làm cho các mô hình thực tế hơn, kiểm soát
biến khác, và giải thích của phương sai trong biến phụ thuộc (và do đó để giảm dư).
Mô hình hồi quy chung nhiều có thể được viết như sau:
Y
i
= B
o
+ B
1
X
1
+ B
2
X
2
+ …+ E
i
So với (11.6) chúng ta thấy rằng sự khác biệt duy nhất là sự bao gồm của các
biến độc lập hơn.
Ví dụ : Các doanh nghiệp đều thường cũng quan tâm đến khai thác thương hiệu
của họ cũng như các thiết lập bằng cách mở rộng chúng thành các loại sản phẩm mới.
Nghiên cứu trước đây đã chỉ ra rằng sự thành công của chiến lược này bị ảnh hưởng
bởi, trong số những thứ khác, các yếu tố như danh tiếng của thương hiệu được mở
rộng và tương tự nhận thức của các loại sản phẩm mới và thương hiệu hiện có. Người
ta cũng tin rằng các yếu tố như kiến thức của người tiêu dùng về các nhóm sản phẩm
mới,và khả năng hậu quả tiêu cực trình tự cũng như sẵn sàng nhận thức không chắc
chắn nhiều người tiêu dùng ảnh hưởng để chấp nhận một phần mở rộng thương hiệu
(xemví dụ Keller, 1998). Một nhà sản xuất đã tiến hành một nghiên cứu để kiểm tra sự
sẵn sàng của người tiêu dùng chấp nhận một phần mở rộng thương hiệu(ACC). Chính
xác hơn, các nhà sản xuất kiểm tra năng giải thích của kiến thức về các loại sản phẩm
mới (PKNOW), hậu quả nhận thức (Phần kết luận) và sự không chắc chắn nhận thức
(UNCERT). Các nhà sản xuất cũng tin rằng kiến thức của người tiêu dùng có thể
tương tác với sự không chắc chắn nhận thức (tức là kiến thức của người tiêu dùng có
thể làm giảm sự không chắc chắn nhận thức được), UNCERT x PKNOW. Do đó,mô
hình được thử nghiệm là:
ACC = x
1
REP + x
2
SIM + x
3
CONC + x
4
UNCERT + x
5
PKNOW + x
6
UNCERT x PKNOW
Kết quả, theo báo cáo trong sản lượng máy tính SPSS, được trình bày trong
bảng 11.6, lần đầu tiên cho thấy một bản tóm tắt mô hình. Chúng tôi ở đây thấy rằng
các giải thích phương sai R
2
.
Bảng 11.6 Hồi quy bội số – xuất ra từ SPSS
21
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Mô hình tóm tắt
Mô hình R R
2
Điều chỉnh R
2
Std. Lỗi dự
toán
1 .620
a
.384 .372 1.0053
ANOVA
b
Mô hình
Tổng
bình
phương
df
Có nghĩa là
vuông
F Sig.
1. Hồi quy
Dư
Tổng
cộng
192.691
309.275
501.966
6
306
312
32.115
1.011
31.775 .000
a
Coefficients
c
Mô hình
Hệ số không tiêu chuẩn
Hệ số tiêu
chuẩn
t Sig.
B Std.Lỗi Beta
1. (Liên tục)
REP
SIM
CONC
UNCERT
UNCERT x
PKNOW
PKNOW
6.245E-02
.359
.516
6.796E-02
.106
-3.232E-02
7.496E-02
.475
.055
.050
.075
.103
.034
.141
.300
.481
.045
.103
111
.067
.132
6.491
10.291
.905
1.025
952
.532
.895
.000
.000
.366
.306
.342
.595
Là 0,384 và được điều chỉnh thấp hơn một chút 0.372. R
2
cho chúng ta biết bao
nhiêu của biến trongYchiếm bởi các mô hình hồi quy từ mẫu của chúng tôi, giá trị
điều chỉnh cho chúng ta biết bao nhiêu biến trongY được hạch toán nếu các mô hình
đã được bắt nguồn từ dân số mà từ đó mẫu đã được lấy. Tiếp theo, phân tích phương
sai (được biết đến từ phần11.2) được báo cáo. Khi trở lại (11.8) này là không đáng
ngạc nhiên. Phân tích hồi quy và phân tích phương sai có liên quan. Bằng việc tính
22
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
toán các phần của biến giải thích bằng mô hình hồi quy trên tổng phương sai, chúng
tôi có được 267.149/777.129=0,344.
Bằng cách kiểm tra mức độ quan trọng, chúng tôi cũng thấy rằng mô hình hồi
quy là rất quan trọng, chỉ ra rằng mô hình có sức mạnh giải thích, và giả thuyết, đó là,
mô hình hồi quy không cải thiện dự đoán, có thể bị từ chối. Phần cuối cùng của bảng
11.6 cho thấy các hệ số hồi quy ước lượng, sai số chuẩn của các ước tính, t – giá trị và
mức độ quan trọng. Hệ số chuẩn và không chuẩn đã được báo cáo. 6.245E-02 là
6.245×10-2, đó là 0.06245. Lưu ý rằng các phần bị chặn(β
0
) không được báo cáo khi
hệ số hồi quy chuẩn được ước tính. Kiểm tra các hệ số hồi quy chuẩn cho thấy SIM là
biến sở hữu sức mạnh giải thích cao nhất. Giá trị báo cáo(0,481) có nghĩa là một sự
thay đổi của một đơn vị tiêu chuẩn trong REP sẽ dẫn đến một sự thay đổi của
0,481đơn vị tiêu chuẩn trong các biến phụ thuộc.
2.3.3 Biến số giả
Biến tuyệt đối thường được bao gồm như là biến độc lập. Ví dụ, nhu cầu về
một sản phẩm hoặc dịch vụ có thể thay đổi theo mùa, chúng tôi có thể, ví dụ, chia
năm vào mùa hè, mùa thu, mùa đông và mùa xuân. Đây là một biến quy mô danh
nghĩa mà không thể được xếp hạng. Được áp dụng trong một hồi quy (và định lượng
khác) phân tích, mùa giải cần phải được con số được gán (xem bảng 11.7)
Kiểm tra bảng 11.7 cho thấy ba biến mới A, B và C. Chúng ta thấy rằng nếu
doanh số bán hàng trong mùa hè, 1 được mã hoá trong biến A, và số 0 trong biến B
và C. Bảng 11.7 cũng cho thấy bốn mùa có kết hợp khác nhau của số 0 và số 1. Giả
định rằng mô hình hồi quy sau đây để bán quần áo phụ nữ, mức giá cũng được bao
gồm, đã được ước tính:
Doanh số bán hàng = 1000 – 0.5 x đơn giá + 100A – 20B – 50C
Những phương trình cho chúng ta biết doanh số bán hàng cao nhất trong mùa
hè (A = 1, B = 0, C = 0)
Bảng 11.7 Mã hóa của biến giả
Mùa A B C
Mùa hè 1 0 0
Mùa thu 0 1 0
Mùa đông 0 0 1
Mùa xuân 0 0 0
23
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Sự thay đổi các đường hồi quy tuyến tính xảy ra bởi các biến số giả:Giả sử giá
là £200. Doanh số trong mùa hè là :
1000 – 0.5 x 200 + 200 x (1) – 20 x (0)– 50 x (0) = 100
Khi mức giá được giữ nguyên thì doanh số trong mùa thu là :
1000 – 0.5 x 200 + 200 x (0) – 20 x (1) – 80 x (0) = 880
2.3.4 Phân tích các biến số
Phân tích hồi quy áp dụng theo quy ước, đó là : các biến số độc lập trong một
khoảng thời gian hay là tỷ lệ quy mô. Tuy nhiên thường những biến số phụ thuộc là
tuyệt đối. Ví dụ: điều đáng quan tâm được giải thích tại sao là những công ty thành
công thì nó khác với những công ty không thành công với những sự phân biệt đối với
việc nuôi dưỡng và không nuôi dưỡng một sản phẩm mới…để phân tích các biến số là
tuyệt đối. Phân tích các biến số trong chủ thể là bắt nguồn từ sự thay đổi, sự kết hợp
tuyến tính của hai hay nhiều các biến số độc lập sẽ kết hợp tốt giữa hai hoặc nhiều
nhóm được xác định rõ ràng. Những biến số đạt được bởi sự thành lập của sự biến đổi
trọng lượng cho mỗi sự khác biệt để đạt được mức cao nhất giữa những nhóm biến đổi
liên quan tới những nhóm biến đổi khác. Việc kết hợp những tuyến tính cho một phân
tích biến số, nó được biết tới như một hàm số biến số, nó được bắt nguồn từ một
phương trình như sau :
Z
jk
= a + W
1
X
1k
+ W
2
X
2k
+ …. (11.9)
Trong đó :
Z
jk
= biến số Z mã hóa cho biến số hàm số j cho chủ thể k
a = đường thẳng
W
i
= biến số trọng lượng cho sự biến đổi độc lập i
X
ik
= biến đổi độc lập i cho chủ thể k.
Những biến số này thì tỷ lệ trung bình cho tất cả những biến số riêng lẻ với
từng nhóm đặc biệt, chúng đứng giũa mỗi nhóm và được nhắc tới như một trọng tâm.
Trọng lượng W
i
có thể được giải thích như những hệ số hồi quy β trong các phân tích
hồi quy. Hầu hết các chương trình báo cáo của máy tính bao gồm những biến số trọng
lượng chuẩn và không chuẩn. Khả năng biến số có thể được đánh giá như là sự cải
thiện đúng trong phân loại.
24
Tiểu luận Phương pháp NCKH GVHD: TS. Nguyễn Văn Tân
Ví dụ :
Giả sử rằng nhà máy có khả năng kiểm soát một tài liệu nghiên cứu nếu như nó
có thể tìm ra những biến số người mua và người không mua sản phẩm. Chính xác hơn,
nhà máy này phải biết quan tâm tới độ tuổi và có khả năngđạt mức thu nhập. Biến số
phụ thuộc là xác định tuyệt đối (mua thì bằng 1, không mua thì =0) trong khi những
biến số độc lập là theo quy ước. Phân tích các biến số của hai nhóm được xuất ra trong
chương trình máy vi tính thì xem ở bảng 11.8. Sự kiểm soát là một phần trình bày của
28 trong 30 lần quan sát được áp dụng trong các phân tích và hai hai quan sát còn lại
là không có dữ liệu. Chúng cũng nhìn thấy dữ liệu nhóm 0 bao gồm 19 chủ thể và 9
chủ thể của nhóm khác. Từ phần (b) chúng ta nhìn thấy những dữ liệu phân tích thì
phải đặt tất cả các đơn vị vào những nhóm mà ở đó chúng phụ thuộc đúng. Trường
hợp này thường không bắt buộc.
Hai hàm của phương trình biến số thì được tính toán theo phần (d). Cho nhóm
0 là : F
0
= -18.27 + 0.225 tuổi + 0.120 thu nhập. Cho nhóm F
1
= – 31.758 + 0.052 tuổi
+ 0.203 thu nhập. Hai phương trình này được sử dụng để tiên đoán nếu như một người
với độ tuổi 54 và thu nhập với mức 250 thì sẽ mua sản phẩm P. Đơn giản chúng ta có
thể gắn hai số liệu này vào hai hàm số và đạt được f
0
(54.250)= 24.023 và
f
1
(54.250)=21.800. Khi đó f
0
(54.250) > f
1
(54.250), chúng ta dự đoán rằng những
người thuộc vào nhóm 0 thì người đó sẽ không mua được sản phẩm này.
Bảng 11.8 Phân tích biến số của hai nhóm.
(a) Trường hợp
Nhóm 0 1
Đếm 19 9
28 trường hợp được sử dụng 2 trường hợp không có giá trị
(b) Tổng hợp của các phân loại
Đặt vào Đúng Nhóm…
Nhóm 0 1
0 19 0
1 0 9
Tổng số N 19 9
N số đúng 19 9
25
học tập, nên năng lực tìm hiểu và khám phá, nghiên cứu và tích lũy thông tin bị hạn chế. Vì vậy, sự sai sót không hề tránh khỏi. Tập thể nhóm rất mong nhận được sự đóng góp ý kiếncủa những anh chị trong lớp và đặc biệt quan trọng là sự hướng dẫn của Thầy để nhóm hoàn thiệnchuyên đề này tốt hơn. Tập thể thành viên nhómTiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn TânCHƯƠNG I : TỔNG QUAN VỀ PHƯƠNG PHÁPNGHIÊN CỨU ĐỊNH LƯỢNG1. 1 Định nghĩa : Nghiên cứu định lượng là chiêu thức thu thập dữ liệu bằng số và giải quyếtquan hệ trong triết lý và nghiên cứu theo quan điểm diễn dịch. Hay nói cách khácnghiên cứu định lượng là những nghiên cứu thu được những hiệu quả bằng việc sử dụngnhững công cụ thống kê giám sát, thống kê giám sát với những số lượng đơn cử. Nghiên cứu định lượng là đi tìm câu vấn đáp cho câu hỏi bao nhiêu, mức nào. 1.2 Lý thuyết : Nghiên cứu định lượng đa phần là kiểm định lý thuyết, sử dụng mô hìnhKhoa học tự nhiên thực chứng luận, giải pháp nghiên cứu định lượng hoàn toàn có thể chứngminh được trong thực tiễn và theo chủ nghĩa khách quan. 1.3 Phương pháp thực thi – Nghiên cứu thực nghiệm trải qua những biến. – Nghiên cứu đồng đại chéo có nghĩa là phong cách thiết kế nghiên cứu trong đó những dữliệu được tích lũy trong cùng một thời gian. Ví dụ : nghiên cứu việc học của con gái ở thành thị và nông thôn. Nghiên cứu lịch đại thì tài liệu tích lũy theo thời hạn trong đó những dữ liệuđược so sánh theo thời hạn. Nghiên cứu trường hợp là phong cách thiết kế nghiên cứu tập trung chuyên sâu vào một trường hợp cụthể. Nghiên cứu so sánh là phong cách thiết kế nghiên cứu trong cùng một thời gian hay quanhiều thời gian. 1. 4 Cách chọn mẫu : – Mẫu ngẫu nhiên đơn thuần. – Chọn mẫu hệ thống. – Chọn mẫu phân tầng. – Chọn mẫu cụm. 1.5 Cách lập bảng câu hỏi : Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tân – Theo thứ tự. – Câu hỏi đóng : Là dạng câu hỏi có số liệu tích lũy hoàn toàn có thể tương đối dễ dàngphân tích, mã hóa nhưng nó số lượng giới hạn sự vấn đáp. Thí dụ, sinh viên những khóa học đượcđưa ra những câu hỏi nhận xét về giáo trình, bài giảng, sách, … và được chỉ định trả lờitheo thang nhìn nhận 5 mức độ ( rất hài lòng : + 2 ; hài lòng : + 1 ; trung bình : 0 ; không hàilòng : – 1 ; rất không hài lòng : – 2 ) để biết sinh viên thỏa mãn nhu cầu hay không thỏa mãn nhu cầu. Đâylà những câu hỏi đóng biểu lộ sự mã hóa số liệu. – Câu hỏi mở : Là dạng câu hỏi có số liệu tích lũy không có cấu trúc hay số liệukhó được mã hóa. Câu hỏi được cho phép câu vấn đáp mở và có những miêu tả, tâm lý khácnhau hơn là ép hoặc khuynh hướng cho người vấn đáp. – Câu hỏi được soạn sẵn. – Câu hỏi ngắn gọn, xúc tích. – Câu hỏi không gây tranh luận. 1.6 Sử dụng những giải pháp toán học để để ứng dụng trong phân tíchđịnh lượng. – Thống kê kế toán : Là một bộ phận của toán học ứng dụng dành cho cácphương pháp giải quyết và xử lý và phân tích số liệu thống kê, mà những ứng dụng hầu hết của nótrong quản trị là những giải pháp giải quyết và xử lý kiểm tra và Dự kiến ( Dự kiến, tìm hiểu chọnmẫu, … ) – Mô hình toán : Là sự phản ánh những thuộc tính cơ bản nhất định của cácđối tượng nghiên cứu kinh tế tài chính, là công cụ quan trọng cho việc trừu tượng hoá một cáchkhoa học những quy trình và hiện tượng kỳ lạ kinh tế tài chính. Khoa học kinh tế tài chính từ lâu đã biết sử dụngcác quy mô kinh tế tài chính lượng như quy mô hàm sản suất Cobb – Douglas, quy mô cungcầu, giá thành v.v – Vận trù học : Là khoa học có mục tiêu nghiên cứu những chiêu thức phântích nhằm mục đích sẵn sàng chuẩn bị địa thế căn cứ đúng mực cho những quyết định hành động, đối tượng người dùng của nó là mạng lưới hệ thống, tức là tập hợp những thành phần và mạng lưới hệ thống có tác động ảnh hưởng qua lại với nhau nhằm mục đích đạt tới mộtmục tiêu nhất định. Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn TânCHƯƠNG 2 : PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNGChương này trình diễn một số ít chiêu thức tiếp cận thường được vận dụng đểphân tích tài liệu trong nghiên cứu kinh doanh thương mại cũng như những nghiên cứu khác. Đầutiên chúng tôi ra mắt những thử nghiệm của những giả thuyết về sự khác nhau. Sau đóchúng tôi kiểm tra những biến khác nhau và Dự kiến những mối liên hệ. Thêm vào đó, chúng tôi còn bàn luận những giải pháp để giảm tài liệu và rút ra khoanh vùng phạm vi cơ bản. 2.1 Kiểm tra sự khác nhau. Câu hỏi bạn đang hỏi là liệu rằng hiệu quả nghiên cứu khoa học trong kinhdoanh hoàn toàn có thể được hỏi bằng cách thống kê hay bằng những giải pháp nghiên cứukhác. Ví dụ nếu 81 % trong 100 người mua hài lòng với shop A và 71 % hài lòngvới shop B thì shop A có tốt hơn không ? 2.1.1 Những giả thiết về một giá trị trung bình. Trong nghiên cứu tất cả chúng ta thường phải làm những báo cáo giải trình về giá trị trungbình. Chúng ta phải lý giải độ lệch chuẩn và thông số Z có nghĩa là gì. Khi mà phươngsai mẫu chưa được biết và sai số chuẩn của giá trị trung bình thì cũng chưa được biết. Sai số chuẩn của giá trị trung bình phải được ước tính từ những số liệu mẫu. Sự ước tính : SD = ( 11.1 ) Trong đó : – SD : Sai số chuẩn của giá trị trung bình – SD ’ : Độ lệch chuẩn ước tính. – N : Kích thước mẫu ) ( XxSD ( 11.2 ) Giả thiết kiểm tra là phân phối t với bậc tự do N-1 và tiến đến phân phốithường khi số lần quan sát tăng lên. Ví dụ : Tại một chuỗi ẩm thực ăn uống đáp ứng mẫu sản phẩm mới, có tối thiểu 100 đơn vịsản phẩm được bán mỗi tuần. Sản phẩm mới được kiểm tra trong 10 loại sản phẩm ngẫunhiên được lựa chọn với một số lượng giới hạn thời hạn nhất định. Kiểm định một đầu, ví dụTiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tânkhi hướng tìm giả thuyết là thích hợp khi mà doanh thu ở mỗi shop tối thiểu là 100, mẫu sản phẩm sẽ được ra mắt trên quy mô toàn nước. Giả thuyết không ( giả thuyết đơn ) và giả thuyết thay thế sửa chữa ( H : X < 100 : X > 100G iả sử mức ý nghĩa α = 0.05, nghĩa là tất cả chúng ta bác bỏ giả thiết không ( H ), khimà xác xuất cho giả thiết không đúng mực là 5 %. Vì vậy mức ý nghĩa cho chúng tathấy rằng xác xuất mà tất cả chúng ta chờ đón để xem xét là một quyết định hành động sai, điều đónghĩa là đồng ý giả thuyết thay thế sửa chữa ( H ) khi trong thực tiễn giả thuyết không là đúng. Bằng việc thống kê giám sát tất cả chúng ta thấy rằng mức trung bình X = 109.4 và độ lệchchuẩn SD = 14.90 Chúng ta cũng hoàn toàn có thể thấy rằng sai số chuẩn của giá trị trung bình : SDx = = = 4.55 Chúng ta tìm t bằng cách tính : 07.255.41004.109 SDGiới hạn t ( ví dụ giá trị t được nhu yếu để phủ nhận giả thiết không ) như khi đọctừ bảng t với bậc tự do là 1.833 ( α = 0.05 ). Ở đây giá trị kiểm tra t được cho sẵn. Giá trị kiểm tra t giả sử là biến phân phốinhưng không tìm ra được giá trị nào thiết thực hơn. Khi N trở nên lớn ( ví dụ N > 30 ), phân phối t tiến gần đến phân phối thường. Hộp 11.1 Những giả thiếtGiả thiết đóng vai trò chính trong việc nghiên cứu. Chúng gợi ý một cách giántiếp những giả định hoặc những kỳ vọng và thường lao lý bởi những câu hỏi. Nếusự hài lòng của người mua ở shop A lớn hơn ở shop B thì liệu rằng sản phẩmmới sẽ bán mỗi tuần của shop A có nhiều hơn 100 đơn vị chức năng mẫu sản phẩm ? Những giảthiết hoàn toàn có thể được pháp luật ( về nguyên tắc cơ bản ). Để làm như vậy tất cả chúng ta phải đốichiếu với giả thiết. V í dụ : Với giả thiết không ( H ), sự hài lòng của người mua ở shop A tốthơn ở shop B thì sẽ không có sự độc lạ giữa shop A và shop B. ĐểTiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tânlàm điều đó tất cả chúng ta cần số liệu về việc triển khai giữa shop A và shop B.Nếu có đủ sự độc lạ để sống sót tất cả chúng ta bác bỏ giả thiết không ( H ) và chấp nhậngiả thiết thay thế sửa chữa ( H ). Vì vậy, trải qua việc giả định, tất cả chúng ta có được những hiểubiết, nghĩa là tất cả chúng ta đã kiểm nghiệm giả định hoặc kỳ vọng của tất cả chúng ta. 2.1.2 Những giả thiết về hai giá trị trung bình. Những người nghiên cứu thường đương đầu với những câu hỏi như : Thị hiếutrong khu vực A khác với thị hiếu trong khu vực B không ? Phân khúc người mua 1 với phân khúc người mua 2 không ? Có 1 chiến dịch quảng cáo hiệu suất cao hơn cái kháckhông ? Công thức để kiểm tra sự độc lạ giữa những nghiệm là được phân chia bìnhthường, và do đó những sự độc lạ của chúng cũng tạo ra sự phân chia thông thường, đơn cử theo công thức sau : Z = ( X – X ) – ( µ – µ Trong đó : = Nghiệm 1 = Nghiệm = Sai số của hai nghiệmvà µlà nghiệm kỳ vọng chưa biết Sai số của hai nghiệm được tính theo công thức sau : Giả định rằng 2 phương sai tổng thể và toàn diện bằng nhau, phương sai tổng thể và toàn diện chung cóthể được tạo ra bằng cách tổng hợp những mẫu. Khi phương sai không rõ và sai số chuẩncủa những mẫu phải được ước đạt, sau đó t đại diện thay mặt cho một số liệu thống kê kiểm traphân bổ tương thích với v = N + N – 2 bậc tự do. Ví dụ : Một nhà phân phối đang tăng trưởng 1 loại sản phẩm mới và tự hỏi liệu thương hiệu củasản phẩm nên có màu đỏ hay màu xanh dương. Những loại sản phẩm mới với hai nhãnhiệu khác nhau được thử nghiệm trong 10 shop được lựa chọn ngẫu nhiên. DoanhTiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tânthu trung bình đạt được với nhãn màu đỏ là 403.0 và với màu xanh dương là 390.3. Sai số chuẩn của việc ước đạt cho sự độc lạ giữa những mẫu là 8.15 Tính t = = = 1.56 Giá trị này được chuyển đến bảng t cho v = n + n-2 = 10 + 10 – 2 = 18 bậc tựdo. Kiểm nghiệm là hai phía vì giả thuyết là hai sắc tố tương thích như nhau. Với α = 0.05, và 18 bậc tự do, tới hạn t = 2.101. Điều này có nghĩa giả thuyết không được chấpnhận. Ở ví dụ trên tất cả chúng ta thấy rằng ( µ1 – µ2 ) = 0. Vì hai nghiệm kỳ vọng chưa biếtvà được giả định là như nhau. NB : Lưu ý rằng trong ví dụ trên hai mẫu được giả định là không tương quan, đólà được rút ra độc lập với nhau. 2.1.3 Các mẫu liên quanGiả sử tất cả chúng ta muốn khám phá xem thu nhập đã tăng lên từ năm ngoái đếnnay trên cơ sở tài liệu thu nhập của năm ngoái và thu nhập của năm nay trong mộtmẫu sau : NgườiThu nhậpnăm trướcThu nhậpnăm nayChênh lệch1 228 224 – 42 213 225 123 257 271 1430 260 292 32T iểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn TânĐiều này thường được gọi là yếu tố hai mẫu với sự quan sát theo cặp. Chúngtheo cặp chính do sự quan sát xảy ra trong một cặp thu nhập năm trước và năm nay củamỗi cá thể. Để xử lý yếu tố này tất cả chúng ta hoàn toàn có thể lấy giá trị thu nhập của nămnay ( cột 3 ) trừ đi giá trị thu nhập của năm trước ( cột 2 ), và giờ đây, tất cả chúng ta có giá trịkhác biệt ở cột chênh lệch ( cột 4 ). Cần quan tâm rằng sự độc lạ biệt được so sánh từ một mẫu quan sát đã thảo luậntrước đó, vì thế những giải pháp vận dụng là tựa như. Giả thuyết vô hiệu Hlà trung bình của tập hợp chính khác nhau, 30 mẫu khácnhau trong cột 4, khi giá tri này bằng 0. Giả thuyết sửa chữa thay thế Hlà giá trị trung bìnhdãy số lớn hơn 0. Từ tác dụng kiểm mẫu của sinh viên cho thấy : Với mức ý nghĩa = 8.13 Độ lệch chuẩn ước tính ( SD ) = 10,91 St sai số là = 1,99 t = 4,08 p = 0,0002 Từ những thống kê giám sát thống kê thấy t = 4,08. Tương ứng với giá trị p = 0,0002 lànhỏ hơn đáng kể so với 0,05 và do đó Hbị khước từ. Trong hầu hết những mẫu kiểm travà những chương trình giá trị thống kê kiểm tra và giá trị p tương ứng đều hiển thị do đókhông cần tìm chúng trong bảng phân phối thống kê tương ứng. Một số giải pháp phi tham số hữu dụng cũng có sẵn như thể những lựa chọnthay thế cho những chiêu thức cổ xưa. Chúng có lợi thế là yên cầu ít về những giảđịnh. Nhưng nếu giả định thiết yếu cho việc sử dụng t kiểm tra là hài hòa và hợp lý thì nó rấthữu ích vì thử nghiệm này thường có độ đúng chuẩn cao hơn. Ví dụ cho khoảng cách tincậy hẹp hơn so với chiêu thức phi tham số tương ứng. Chú ý giải pháp dựa trênphân phối t có tương quan tới phương sai, trong khi những giải pháp phi tham sốthường chăm sóc tới giá trị trung bình. Nhưng nếu phân phối là đối xứng thì hai giá trịtrên bằng nhau. Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn TânMột thử nghiệm phi tham số đơn thuần vận dụng cho những yếu tố thu nhập cao hơnlà kiểm tra tín hiệu. Giả sử trong trường hợp trên 30 mẫu kiểm 7 là dưới trung bìnhvà 23 là trên trung bình. Dấu hiệu trung bình p = 0,0026, P. giá trị chỉ ra sự khác biệtđáng kể giữa thu nhập năm trước và thu nhập năm nay. Kiểm tra tín hiệu trong ví dụtrên là dựa trên thực tiễn là 7 sự độc lạ xấu đi và 23 khác biệt tích cực. Không cóthông tin khác được sử dụng. Kiểm tra tín hiệu, hay nói cách khác là thông tin chứatrong tài liệu đó vì mốc giao động xung quanh giá trị trung bình. Một thử nghiệm thamsố, ví dụ t kiểm tra cũng có sự độc lạ rõ ràng với giá trị trung bình. 2.1.4 Sự so sánh từ hai nhóm trở lênTrong nghiên cứu tất cả chúng ta thường gặp sự so sánh từ hai nhóm trở lên xảy racùng một lúc. Để nghiên cứu những trường hợp như vậy thì nghiên cứu và phân tích phương sai ( ANOVA ) thường được sử dụng. Trước khi lý giải chiêu thức nghiên cứu này, tất cả chúng ta sẽ đề cập rằng tại sao cần phải triển khai một vài kiểm nghiệm t để so sánhtất cả sự tích hợp của những nhóm thì thật sự không thích hợp. Giả sử tất cả chúng ta chăm sóc đến sự khác nhau giữa ba nhóm. Nếu tất cả chúng ta tiếnhành kiểm nghiệm t tại mỗi nhóm, tất cả chúng ta phải so sánh giữa nhóm 1 và nhóm 2, giữanhóm 1 và nhóm 3, và giữa nhóm 2 và nhóm 3. Nếu mỗi kiểm nghiệm t này sử dụngmức ý nghĩa là 0.05, sau đó xác xuất nhầm lẫn của sự bác bỏ giả thiết không ( H ) là5 %. Do đó xác xuất không có lỗi loại I là 95 % cho mỗi kiểm nghiệm. Khi giả sử rằngcác cuộc kiểm nghiệm là độc lập với nhau, thì xác xuất không có lỗi loại I là ( 0.95 ) 0.95 x 0.95 x 0.95 = 0.857. Bây giờ xác xuất chắc như đinh không có lỗi loại I là 1 – 0.857 = 0.143, hay 14.3 % ( thí nghiệm thống kê qua tỷ suất sai số này được tính trên dữ liệuthực nghiệm giống nhau được biết đến như tỷ suất sai số thực nghiệm ). Phân tích phương sai dựa trên so sánh chỉ số của phương sai mạng lưới hệ thống vớiphương sai không có mạng lưới hệ thống. Giả sử một nghiên cứu thực nghiệm gồm có khảo sátcủa ba giải pháp phong cách thiết kế. Nếu những giải pháp biến hóa hiệu lực thực thi hiện hành, thì một khảnăng kỳ vọng sẽ đổi khác ít hơn trong một nhóm được thể hiện đến một loại phong cách thiết kế đặcthù hơn qua những nhóm. Phân tích phương sai được tính theo công thức như sau : 1. Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng trung bình. Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tân2. Phương sai giữa những nhóm, được tính bằng so sánh giải pháp giải quyết và xử lý với tổngbình quân ; 3. Phương sai trong nhóm, được tính bằng so sánh mỗi tác dụng trong nhóm vớibình quân nhóm. Ước lượng riêng không liên quan gì đến nhau của biến toàn diện và tổng thể trên trung bình bình phương : MS = = MS = = MS = = Trong đó : 1. MS = Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng trung bình. 2. MS = Phương sai giữa những nhóm, được tính bằng so sánh chiêu thức xử lývới tổng trung bình ; và3. MS = Phương sai trong nhóm, được tính bằng so sánh mỗi hiệu quả trongnhóm với trung bình nhóm. Ví dụ : Giả sử có ba nghiên cứu về quảng cáo trong 24 thành phố được lựa chọn ngẫunhiên, so sánh về kích cỡ và nhân khẩu. Giả sử tác dụng từ máy tính cho ra như sau : Nguồn biến thiênTổng bìnhphươngBậc tự doTrung bìnhbình phươngTỷ lệ FGiữa những nhómTrong những nhómTổng cộng49. 087.5136.5212324.14.175.88 Bậc tự do được thống kê giám sát như sau : Tổng cộng ( 24-1 ) = 23, phương sai giữa những nhóm ( 3-1 ) = 2, phương sai trong nhóm ( 23-2 ) = 21G iả thiết không ( Ho ) là những trung bình nhóm ví dụ như : XG1 = XG2 = XG2 ’ và giátrị tới hạn là α = 0.05. Để kiểm định giả thiết, một thí nghiệm F ( trên cơ sở phân phối10Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn TânF ) là tương thích. Thí nghiệm F hoàn toàn có thể được xem như thể khái quát của thí nghiệm t và chophép so sánh của hai nhóm trở lên cùng lúc. Giá trị F được tính bằng hiệu số giữatrung bình bình phương và bình phương phương sai trong nhóm, đó là 24,5 / 4,17. Khitra bảng phân phối F, tất cả chúng ta tìm thấy đơn vị chức năng tử số ( là 2 ) và mẫu số ( là 21 ) và tìmthấy giá trị là 3.47. Bởi vì 5.88 lớn hơn 3.47 tất cả chúng ta sẽ vô hiệu giả thiết không ( H ), tác dụng là, mức ý nghĩa của nhóm bằng nhau, và gật đầu giả thiết sửa chữa thay thế, như vậy, sự đổi khác chiến dịch quảng cáo là có hiệu suất cao. Nếu tất cả chúng ta nhìn nhận mức hiệu quảtrung bình của một trong ba chiến dịch quảng cáo trên tất cả chúng ta cũng nhận thấy rằngcó một chiến dịch là có hiệu suất cao nhất. NB : Trong nghiên cứu và phân tích dung sai, biến thiên phụ thuộc vào, hiệu suất cao của quảng cáo, được thừa nhận theo hệ mét, đó là khoảng cách hoặc chỉ số tỷ suất. Biến độc lập ( chiếndịch quảng cáo khác nhau ) là xác nhận. Ở trên là một ví dụ về nghiên cứu và phân tích dung sai đơn thuần. Chỉ một thông số, ảnh hưởngcủa biến hóa chiến dịch quảng cáo được nghiên cứu và phân tích như thế nào. Phân tích dung sai cóthể được lan rộng ra gồm có nhiều hơn hai biến độc lập một cách rõ ràng hơn ; ví dụ, thành tích của sinh viên ( biến phụ thuộc vào ) hoàn toàn có thể được nghiên cứu như đầu ra củanhững giải pháp khác nhau của phong cách thiết kế và người phong cách thiết kế chương trình giáo dục ( biến độc lập ). Phân tích phương sai cũng hoàn toàn có thể được lan rộng ra để kiểm tra sự tácđộng đồng thời trên hai biến phụ thuộc vào, số lượng giới hạn của sự phong phú nghiên cứu và phân tích dung sai. 2.2 Mối quan hệ ( sự biến thiên đồng thời ) giữa những biếnTrong nghiên cứu, tất cả chúng ta thường chăm sóc, quan tâm đến có 1, 2 hay nhiều mốiquan hệ giữa những biến số. Có nhiều phép đo về những mối quan hệ này, hãy xem ví dụcủa Frankfort – Nachmias và Nachmias ( 1996 ) về tổng quan 1 số ít phép đo phổ biếncủa sự liên hệ. 2.2.1 Hệ số tương quanMột phép đo quan trọng là sự đối sánh tương quan hay nói cách khác là thông số tươngquan tức thời : r đã được đề cập ở những chương trước. Hệ số đối sánh tương quan tức thời giớihạn bời khoảng cách của biến số hay qui mô của biến số. Giống như những phép đokhác về mối quan hệ, thông số đối sánh tương quan được xem là biến số chung của 2 phép đo. Hệsố đối sánh tương quan tức thời dùng để kiểm tra mối quan hệ tuyến tính giữa 2 biến số X vàY. 11T iểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn TânVề triết lý, thông số đối sánh tương quan có giá trị từ [ – 1,1 ] ( – 1 ≤ r ≤ 1 ) r = + 1, cho biết 2 biến số là biến số có thực ; r = – 1, cho biết 2 biến số có mối quan hệ hoản toàn ngược nhau ; r dần tới 0, chỉ ra rằng những biến số không có mối liên hệ với nhau. Công thức tính thông số đối sánh tương quan tức thời : xyTrong đó X, Y đại diện thay mặt cho mẫu X, Y tương ứng. Ta có công thức tương tự : xyTrong đó : là phương sai của Xlà phương sai của Ylà phương sai hợp của X và YHệ số đối sánh tương quan diển tả mối quan hệ giữa hai biến số và hệ quả của mối liênhệ đó. Bình phương thông số đối sánh tương quan là : Biến xem xétBiến tổng hợpĐiều này có nghĩa là nếu bình phương thông số đối sánh tương quan giữa X và Y là 50 % thì biến X là 50 % và biến Y là 50 %. Sự đối sánh tương quan thường được dùng để kiểm tra 2 chiều những mệnh đề giả thuyết, có nghĩa là kiểm tra giả thuyết về mối quan hệ giữa hai biến số. Từ yếu tố này, chúng12Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tânta thấy rằng, thông số đối sánh tương quan là số thống kê có ý nghĩa. Nó phụ thuộc vào vào cả độ lớncủa thông số đối sánh tương quan và số lượng quan sát. Độ lệch tiêu chuẩn của thông số đối sánh tương quan là : Ví dụ : Một bản thử nghiệm nghiên cứu, trong số 2 nhóm khảo sát về sự cảmnhận quảng cáo chịu tác động ảnh hưởng, tác động ảnh hưởng bởi sự lôi cuốn quảng cáo ( 1 = tích cực ; 0 = xấu đi ), sự tin chắc vào loại sản phẩm quảng cáo và giới tính ( 1 = nữ ; 0 = nam ). Số lượngkhảo sát là 60, hiệu quả được ghi nhận ở bảng 11.1. Qua bảng trên, chỉ ra rằng phụ nữthì ít có khuynh hướng cảm nhận quảng cáo và phụ nữ cũng hoàn toàn có thể ít tin vào sản phẩmquảng cáo. Chúng ta cũng thấy rằng, những khảo sát này có ý nghĩa quan trọng trongphân tích hai chiều ( nghiên cứu và phân tích 2 biến số ). Thêm vào đó, tất cả chúng ta chú ý quan tâm rằng : sự thuhút tích cực hoàn toàn có thể được cảm nhận hơn là sự lôi cuốn xấu đi ( mức ý nghĩa 0.05 ). 2.2.2 Tương quan một phầnTrong chương 10 ( cũng như chứng tỏ trong chương 5 ) tất cả chúng ta thảo luậnlàm cách nào mà tất cả chúng ta hoàn toàn có thể đưa ra trấn áp việc tương quan đến mối quan hệgiữa những biến bằng cách trấn áp biến thứ ba ( hoặc nhiều hơn ). Điều này cũng cóthể triển khai trong đối sánh tương quan. Bảng 11.1 Sự chồng chéo giữa cảm nhận quảng cáo, giới tính, tin cậy vàonhà sản xuất và sự mê hoặc. Cảm nhậnquảng cáoGiới tínhSự tintưởngSự hấp dẫnCảm nhận quảng cáo – – 0.33 * 0.25 * * 0.24 * * Giới tính – – 0.36 * 0.09 Sự tin chắc – 0.14 Sự lôi cuốn quảng cáo – – *, * * Phân tích, nghĩa là đối sánh tương quan một phần. Công thức cho thông số đối sánh tương quan mộtphần r12. 3 ( đọc giữa đối sánh tương quan một phần ( biến ) 1 và 2 chấm 3 ) là : 13T iểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tân12 3 = ( 11.5 ) Công thức được lặp đi lặp lại, và do đó sau khi trấn áp cho biến 3 biến tiếptheo hoàn toàn có thể được trấn áp. Ví dụ : Quan sát mối quan hệ giữa thừa nhận quảng cáo và sự mê hoặc ảnh hưởng tác động bởiđiều khiển của giới tính. Sử dụng trong công thức 11.5 ta thấy : Ad. rec., ad.appeals.sex = = 0.29 Điều này cho thấy rằng bằng cách trấn áp giới tính thì tương quan mối quan hệgiữa thừa nhận quảng cáo và quảng cáo mê hoặc ( xác nhận ) là trở nên vững chãi. 2.3 Giải thích và dự báo những mỗi quan hệ giữa những biếnMô tả, lý giải và dự báo mối quan hệ giữa những biến là việc làm quan trọngtrong nghiên cứu kinh doanh thương mại. Chẳng hạn, một người quản trị hoàn toàn có thể chăm sóc đến mốiqua hệ giữa lượng tiền phải trả cho quảng cáo và bán hàng hoặc là mối quan hệ giữasố lượng hàng bán và lượng khách đến du lịch thăm quan. Như vậy thông tin rất quan trọngtrong kinh doanh thương mại chính do nó cho phép xử lý một cách hoàn thành xong hơn, chẳng hạnlàm thế nào biết chi trả cho quảng cáo bao nhiêu là tốt. Một trong những chiêu thức tiếp cận ứng dụng và có ích nhất để kiểm tra mốiquan hệ giữa những biến là nghiên cứu và phân tích hồi quy. Trong nghiên cứu và phân tích hồi quy tất cả chúng ta có mộtbiến nhờ vào ( nghĩa là biến được lý giải ) va một hoặc nhiều hơn biến không phụthuộc. Cả biến phụ thuộc vào lẫn biến không phụ thuộc vào thường giả định là tham số ( nghĩalà khoảng chừng cáchhoặc là thước đo tỷ suất ). Như luận bàn ở dưới đây, cái gọi là biến giảcòn hoàn toàn có thể sử dụng như biến không phụ thuộc vào. Trong nghiên cứu và phân tích hồi quy ( như phântích nhiều loại khác ) tất cả chúng ta muốn có một quy mô tương thích nhất là miêu tả tài liệu, cái hoàn toàn có thể làm trong nghiên cứu và phân tích hồi quy bằng cách vận dụng giải pháp bình phươngnhỏ nhất. Chính xác hơn, điều này được triển khai bằng một đường thẳng tương thích màgiảm thiểu những độ lệch bình phương từ đó đường thẳng hiển thị như trong hình 11.114 Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tân2. 3.1 Hồi quy tuyến tính đơn thuần. Nó được biết rằng hoàn toàn có thể vẽ bất kể đường thẳng nếu bạn biết hai điều : ( 1 ) độdốc ( hoặc độ nghiêng ) của đường thẳng, và ( 2 ) điểm mà tại đó đường thẳng băng quatrục thẳng đứng của đồ thị ( được biết như là phần mặt phẳng bị chặn của đườngthẳng ). Hình 11.1 Mô hình tuyến tínhPhương trình của đường thẳng là : Y = β + β + εY là biến tác dụng tất cả chúng ta muốn dự báo, xlà điểm của đối tượng người dùng hoặc củangười dự báo biến ; βlà độ đốc của đường thẳng khít với tài liệu. βlà phần mặt phẳngbị chặn của đường thẳng ; εlà đại diện thay mặt cho sự độc lạ giữa điểm số dự báo tuyếntính cho đối tượng người dùng và điểm số mà đối tượng người tiêu dùng chắc như đinh thu được thường là số hạng còndư lại. Trong nghiên cứu và phân tích hồi quy ước lượng hồi quy đường thẳng mang lại giá trị dựbáo. Nếu quan sát toàn bộ giá trị giảm của dự báo tuyến tính. Không có những sự khácbiệt giữa dự báo và giá trị còn dư như thể hiện hình 11.1 Ví dụ : Giả sử một thương nhân xe hơi tập hợp tài liệu của 6 tháng với 4 biến : Quảngcáo TV, quảng cáo chữ in, quảng cáo người cạnh tranh đối đầu và bán hàng. Y là thương nhânxe hơi mong đợi việc bán xe hơi đối sánh tương quan với quảng cáo TV và quảng cáo chữ in. Mối đối sánh tương quan giữa bán xe hơi và đối thủ cạnh tranh cạnh tranh đối đầu quảng cáo hầu hết chắc như đinh làkhông. Nhưng nếu quảng cáo của đối thủ cạnh tranh cạnh tranh đối đầu lan rộng ra hàng loạt trên thị trường15Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tânhơn là hay biến hóa thị trường thị trường, mối đối sánh tương quan hoàn toàn có thể là dương. Giá trị của 4 biến được bộc lộ trong bảng 11.2 Bảng 11.2 Ma trận dữ liệuHàng QC TV QC chữ in Đối thủ cạnh tranh đối đầu QC Bán xe hơi1 0 1 2 12 1 0 0 13 2 2 4 24 2 3 6 35 3 3 3 46 4 3 0 4B ảng 11.3 Trung bình hồi quy giản đơn : Predictor Coef St. dev t-radio pConstant 0.70000 0.4453 1.57 0.191 TV – Ads 0.90000 0.1871 4.81 0.009 S = 0.5916 R-sp = 0.85.3 % R-sq ( adj ) = 81.6 % Sự cân đối của hồi quyCarSale = 0.7000 + 0.9000 TV-AdsĐầu tiên, tất cả chúng ta lý giải sự có ích của phương trình hồi quy tuyến tínhbằng việc dự kiến chỉ có quảng cáo trên T.V và Carsales là được theo dõi. Chúng taxem Carsales như là biến phụ thuộc vào và quảng cáo T.V là biến độc lập. Tiếp theo, tất cả chúng ta ước tính hàm số theo phương pháp quy hồi tuyến tính giản đơn của Caresalestrên quảng cáo T.V. Được bộc lộ như bảng 11.3 được in ra từ máy tính. Thời kỳ liên tục 0.7000 chỉ rằng, nếu người kinh doanh thương mại không sử dụng hìnhthức quảng cáo nào trên truyền hình ( nghĩa là ngân sách quảng cáo = 0 ) thì giá trị dựkiến của Carsale là 0.7 đơn vị chức năng, đó chính là 7 chiếc xe. Hệ số hồi quy ước tính ước tínhcủa doanh thu trên quảng cáo T.V là 0.9000. Hệ số này chỉ rằng nếu biến quảng cáoT. V được tăng lên 1 đơn vị chức năng thì giá trị dự kiến của Carsales tăng lên 0.9 đơn vị chức năng, điều đólà 9 chiếc xe. Đây là những thông tin hữu dụng so với những nhà kinh doanh xe. Nhưng người kinh doanh thương mại miễn cưỡng với việc tăng “ polate ” : điều này có nghĩa làngười kinh doanh thương mại không được sử dụng những thông tin có giá trị ngoài chương trình16Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tânquảng cáo trong khoảng chừng từ 0 cho đến 4 mà nó đã bộc lộ ở mẫu ( nhìn vào bảng11. 3 ). Kết quả, thông số đối sánh tương quan ( R-sp ). R85, 3 % ( bình phương thông số đối sánh tương quan là85, 3 % ) thông số này chỉ ra rằng việc xác lập mẫu có thông số đối sánh tương quan Rngang với giátrị là 0.853. Nói một cách đơn cử, điều này có nghĩa mức độ biến hóa trong những biến ởchương trình quảng cáo T.V được lý giải là 85,3 % của Carsales hoàn toàn có thể biến đổitrong mẫu của chúng tôi. Bình phương của mẫu là thông số đối sánh tương quan r. Giá trị P. : 0.0009 là thông số hồi quy, β là doanh thu trên chương trình quảng cáo T.V nhỏ hơn anpha 0.05, chúng tôi thừa nhận điều này theo quy ước lựa chọn của chúng tôi với mứcý nghĩa. Có nghĩa là chúng tôi hoàn toàn có thể vô hiệu giả thiết không có hiệu lực hiện hành H, tương ứngvới thông số đối sánh tương quan. β là ngang bằng với 0, là sử dụng được hai mặt. A : β # 0 ( sửdụng hai mặt là sự mặc định của chương trình máy tính ). Tóm lại : Quảng cáo T. V và doanh thu bán hàng có mối quan hệ ý nghĩa vớinhau. Từ đó nó có mối quan hệ là mật thiết không thể nào có chuyện ngày càng tăng chí phíquảng cáo mà dẫn đến hiệu quả là giảm doanh thu bán ra, nó thật sự thích hợp cho việcsử dụng một chiều, A : β > 0. Điều đó có nghĩa là giá trị p được mạng lưới hệ thống sử lý củamáy tính chia làm 2 phần. Như thế giá trị có tương quan của p là ( 0.009 / 2 ) = 0.0045. Đây là dẫn chứng thiết thực cho hiệu quả là có mối quan hệ giữa quảng cáo T.V vàCarsales. Những trường hợp thiết thực này tất cả chúng ta chắc sẽ thấy sau này, một hệ sốcó lẽ không tập hợp khi có sự độc lạ đáng kể từ 0 ( zero ) khi tất cả chúng ta sử dụng mốiliên hệ hai mặt, mặc dầu nó đã được xác định là có tín hiệu độc lạ từ 0 ( zero ) nếuđã được trình diễn là có mối liên hệ một mặt. Như vậy nó thật sự quan trọng trong việclực chọn một mặt trong điều kiện kèm theo thích hợp ( xem phần 10.5 ). Biểu đồ ở bảng số 11.4 là mối liên hệ độc lạ cho yếu tố này. Bảng 11.4 Những giá trị thặng dư và phù hợpHàng Kinh doanhQuảng cáoTVGiá trị thặngdư chuẩThích hợpGiá trị thặngdư0. 77033 – 1.18431 – 0.925820.925821.184310.71.62.52.53.40.3 – 0.6 – 0.50.50. 617T iểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tân6 4 4 – 0.77033 4.3 – 0.3 Một biến là có ích nếu giá trị p của nó nhỏ hơn. Sử dụng sửa chữa thay thế một chiềuthay vì phương pháp hai mặt là giá trị p thực tiễn sẽ giảm một nữa. Sự tương thích là ước tính dự kiến bán xe hơi hoặc doanh thu bán xe hơi tương ứngvới những giá trị của biến độc lập quảng cáo truyền hình được tìm thấy trong mẫu. Phầncòn dư là độ lệch tương ứng từ ước đạt hồi quy đường thẳng. Chú ý rằng phươngtrình thích hợp + giá trị thặng dư = Doanh số bán xe hơi là giá trị cho mỗi tháng ( mỗisự quan sát ). Chúng ta thích sự để được thân thiện với doanh thu bán hàng và gần gũiquen thuộc với giá trị thặng dư để được gần với 0. Sau đó Rsẽ gần đến 1. Giả định trong nghiên cứu và phân tích hồi quy. Phân tích hồi quy là dựa trên 1 số ít giả định, gồm có : 1. Giá trị kỳ vọng của sai số là không, E ( = 0 ). 2. Phương sai của sai số cho mỗi xlà hằng số. Đây là được gọi là homo-scedasticity. Nếu phương sai biến hóa theo xđược gọi là heteroscedasticity. 3. Sai sót cho những quan sát là không đối sánh tương quan. 4. thường phân chia cho mỗi xi. 5. Các sai số không đối sánh tương quan với xi, Corr ( x ) = 0.6. Nó cũng là một giả định phổ cập mà những quy mô hồi quy phải là tuyến tínhtrong những tham số của nó. Đó là thực hành thực tế những logic để kiểm tra những giả định. Kết quả của bạn của bạn cóthể hữu dụng ngay cả khi toàn bộ những giải định tiêu chuẩn không cung ứng, nhưng sau đókết quả thường không chắc như đinh hơn so với số liệu thống kê cho thấy. Điều quantrọng là bạn sử dụng logic phán đoán toàn bộ những quá trình mà bạn biết những gì bạnđang làm. Trong một thời hạn ngắn tất cả chúng ta sẽ cho thấy kiểm tra 1 số ít giả định như thếnào trong ví dụ của tất cả chúng ta. Nó nên được nhớ tới, tuy nhiên, tất cả chúng ta có quá ít quansát để có được một trường hợp trong thực tiễn. Giả định của một quy mô tuyến tính có thể18Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tânkiểm tra vẻ bên ngoài bằng cách nhìn vào biểu đồ được phân phối từ máy tính. Vài giả địnhcó thể có tương quan đến sự xáo lộn khó nhìn thấy được ước tính bằng giá trị thặng dư. Giá trị thặng dư hoàn toàn có thể màn biểu diễn theo nhiều cách – ví dụ tùy vào những biến độc lập. Chúng ta hoàn toàn có thể kiểm tra vẻ bên ngoài giả định của homo – scedasticity : nghĩa là, chúng takiểm tra sự khác nhau của số lượng giới hạn trộn lẫn không đổi khác khi giá trị của biến độclập đổi khác. Chúng ta thích nhìn thấy một bức tranh nơi mà biến thiên lên và xuốngtrong biểu đồ là gần như nhau, nói, bên trái, ở giữa và một phần bên phải của biểu đồ. Để có một vài sáng tạo độc đáo cho sự tương thích của những giả định của sự xáo lộn phân bổbình thường, nếu bạn có nhiều quan sát hơn chúng tôi, tác dụng kiểm tra biểu đồ tần sốcủa giá trị thặng dư có một số ít trùng với tỷ lệ thông thường, bạn cũng hoàn toàn có thể sử dụngbiểu đồ sác xuất thường thì. Nếu hiệu quả những điểm trong biểu đồ của điểm bìnhthường rơi khoảng chừng trong một đường thẳng, giá trị thặng dư ( và kỳ vọng cũng như sựxáo trộn ) có vẻ như đến từ tỷ lệ thông thường. Hệ số đối sánh tương quan nói như thế nào vềmột đường thẳng. Nếu cũng như tài liệu ở đây là tài liệu chuỗi thời hạn, hoàn toàn có thể tựquan tự động hóa trong những trộn lẫn. Kiểm tra một sự thích hợp cho sự tự đối sánh tương quan là 1. Nếu số liệu thống kê D-W gần đến 2, cũng như ở đây, không có rủi ro tiềm ẩn cho sự tươngquan tự động hóa. Nếu như nó gần tới 0, hoàn toàn có thể có sự tự đối sánh tương quan tự động hóa. Nếu như nógần tới 4, hoàn toàn có thể có đối sánh tương quan xấu đi xảy ra ( hiếm khi xảy ra ). Một cuộc thảo luậnxuất sắc của kiểm tra nghiên cứu và phân tích hồi quy, xem Field 2000. Lựa chọn của những biếnNếu tất cả chúng ta muốn sử dụng hồi quy tuyến tính đơn thuần, nhìn vào ví dụ, tuyếntính Y trên x, cũng như đã thực thi. Nhưng tất cả chúng ta cũng hoàn toàn có thể có hồi quy Y trênhoặc hồi quy Y trên x. Trong sự lựa chọn giữa hàm hồi quy khác nhau trong tìnhhuống như thế này nó rất hữu dụng để xem xét những thông số đối sánh tương quan. Hệ số tương quanđược màn biểu diễn trong bảng 11.5. Chúng ta chú ý quan tâm rằng giữa ba biến độc lập, quảng cáo T.V là một trong nhữngcái mà trong đó sự đối sánh tương quan mẫu là cao nhất với những biến bán hàng độc lập. Trướcđây tất cả chúng ta thấy hàm hồi quy tương ứng có vẻ như là thỏa đáng trong tổng thể những khíacạnh. Vì vậy, nếu tất cả chúng ta quyết định hành động chỉ sử dụng một biến độc lập, quảng cáo T.V làđược chọn. Xem xét kỹ lưỡng trên sự đối sánh tương quan, tất cả chúng ta cũng nhìn thấy rằng quảng19Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tâncáo T.V đối sánh tương quan mạnh với quảng cáo chữ in và quảng cáo chữ in đối sánh tương quan mạnhvới kinh doanh thương mại. Hệ số đối sánh tương quan cao giữa quảng cáo T.V và quảng cáo chữ in chothấy mức độ cao của đa cộng, là năng lực làm mờ những ước tính, cũng như chỉ ra rằngbiến này ( quảng cáo chữ in ) gồm có biến phụ thuộc vào. Đánh giá tốt sự thích hợp. Làm thế nào để ước đạt quy mô hồi quy tương thích với tài liệu ? ( Điều nàyđược số lượng giới hạn “ lý giải những biến ” ). Cũng như chú ý quan tâm ở trên, bị chắn và thông số hồiquy hoàn toàn có thể ước đạt. Bảng 11.5 Tương quan hồi quyQuảng cáo T.V Quảng cáo máy in Đối thủ cạnh tranh đối đầu quảng cáoQuảng cáo in 0.783 Đối thủ quảng cáo – 0.060 0.472 Doanh số 0.923 0.918 0.155 Khi tổng kết tổng thể i ở trên nó cũng hoàn toàn có thể được trình diễn : TSS RSS ESSNhư tất cả chúng ta hoàn toàn có thể nhìn thấy từ bình phương trên, chúng có tổng ở đây. Đầutiên, TTS là tổng số của những bình phương. Thứ hai, RSS là tổng hệ quy của những bìnhphương, nó là những biến số trong những biến số độc lập được lý giải bởi nhữngmô hình hồi quy. Sau cùng, ESS là tổng bình phương của những sai số là tổng bình củanhững giá trị thặng dư. Những phân số RSS / TSS là một phần biến số trong biến sốđộc lập được lý giải bởi những quy mô hồi quy, thường được cho là những hệ sốcủa biến số, Rnhư được đề cập ở trên. Những tiêu chuẩn của thông số hồi quyNhững thông số hồi quy β, như trình diễn ở ví dụ trên thật là thuận tiện để giải thíchnếu như đo lường và thống kê X và Y là có ý nghĩa. Điều này thường không phải là trường hợpkhó khăn để ước tính độ mạnh trong mối quan hệ tuyến tính khi chúng có những biến sốđộc lập, đây cũng hoàn toàn có thể là trường hợp đặc biệt quan trọng. Trong những trường hợp tất cả chúng ta có thể20Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tânchuẩn hóa những thông số hồi quy bởi sự tăng thêm của những thông số hồi quy do độ lệch chuẩncủa phân số X vượt quá mức chuẩn của phân số Y. 2.3.2 Hồi quy bội sốTrong nhiều hồi quy hai hay nhiều biến độc lập được vận dụng để lý giải dựđoán những biến nhờ vào. Mục đích là để làm cho những quy mô trong thực tiễn hơn, kiểm soátbiến khác, và lý giải của phương sai trong biến nhờ vào ( và do đó để giảm dư ). Mô hình hồi quy chung nhiều hoàn toàn có thể được viết như sau : = B + B + B + … + ESo với ( 11.6 ) tất cả chúng ta thấy rằng sự độc lạ duy nhất là sự gồm có của cácbiến độc lập hơn. Ví dụ : Các doanh nghiệp đều thường cũng chăm sóc đến khai thác thương hiệucủa họ cũng như những thiết lập bằng cách lan rộng ra chúng thành những loại mẫu sản phẩm mới. Nghiên cứu trước đây đã chỉ ra rằng sự thành công xuất sắc của kế hoạch này bị ảnh hưởngbởi, trong số những thứ khác, những yếu tố như khét tiếng của tên thương hiệu được mởrộng và tựa như nhận thức của những loại mẫu sản phẩm mới và tên thương hiệu hiện có. Ngườita cũng tin rằng những yếu tố như kỹ năng và kiến thức của người tiêu dùng về những nhóm sản phẩmmới, và năng lực hậu quả xấu đi trình tự cũng như chuẩn bị sẵn sàng nhận thức không chắcchắn nhiều người tiêu dùng tác động ảnh hưởng để đồng ý một phần lan rộng ra tên thương hiệu ( xemví dụ Keller, 1998 ). Một nhà phân phối đã triển khai một nghiên cứu để kiểm tra sựsẵn sàng của người tiêu dùng đồng ý một phần lan rộng ra tên thương hiệu ( ACC ). Chínhxác hơn, những nhà phân phối kiểm tra năng lý giải của kỹ năng và kiến thức về những loại sản phẩmmới ( PKNOW ), hậu quả nhận thức ( Phần Tóm lại ) và sự không chắc như đinh nhận thức ( UNCERT ). Các nhà phân phối cũng tin rằng kỹ năng và kiến thức của người tiêu dùng có thểtương tác với sự không chắc như đinh nhận thức ( tức là kiến thức và kỹ năng của người tiêu dùng cóthể làm giảm sự không chắc như đinh nhận thức được ), UNCERT x PKNOW. Do đó, môhình được thử nghiệm là : ACC = xREP + xSIM + xCONC + xUNCERT + xPKNOW + xUNCERT x PKNOWKết quả, theo báo cáo giải trình trong sản lượng máy tính SPSS, được trình diễn trongbảng 11.6, lần tiên phong cho thấy một bản tóm tắt quy mô. Chúng tôi ở đây thấy rằngcác lý giải phương sai RBảng 11.6 Hồi quy bội số – xuất ra từ SPSS21Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn TânMô hình tóm tắtMô hình R RĐiều chỉnh RStd. Lỗi dựtoán1. 620.384. 372 1.0053 ANOVAMô hìnhTổngbìnhphươngdfCó nghĩa làvuôngF Sig. 1. Hồi quyDưTổngcộng192. 691309.275501.96630631232.1151.01131.775. 000C oefficientsMô hìnhHệ số không tiêu chuẩnHệ số tiêuchuẩnt Sig. B Std. Lỗi Beta1. ( Liên tục ) REPSIMCONCUNCERTUNCERT xPKNOWPKNOW6. 245E-02. 359.5166.796 E – 02.106 – 3.232 E – 027.496 E – 02.475.055.050.075.103.034.141.300.481.045.103111.067.1326.49110.291.9051.025952.532.895.000.000.366.306.342.595 Là 0,384 và được kiểm soát và điều chỉnh thấp hơn một chút ít 0.372. Rcho tất cả chúng ta biết baonhiêu của biến trongYchiếm bởi những quy mô hồi quy từ mẫu của chúng tôi, giá trịđiều chỉnh cho tất cả chúng ta biết bao nhiêu biến trongY được hạch toán nếu những mô hìnhđã được bắt nguồn từ dân số mà từ đó mẫu đã được lấy. Tiếp theo, nghiên cứu và phân tích phươngsai ( được biết đến từ phần11. 2 ) được báo cáo giải trình. Khi trở lại ( 11.8 ) này là không đángngạc nhiên. Phân tích hồi quy và nghiên cứu và phân tích phương sai có tương quan. Bằng việc tính22Tiểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn Tântoán những phần của biến lý giải bằng quy mô hồi quy trên tổng phương sai, chúngtôi có được 267.149 / 777.129 = 0,344. Bằng cách kiểm tra mức độ quan trọng, chúng tôi cũng thấy rằng quy mô hồiquy là rất quan trọng, chỉ ra rằng quy mô có sức mạnh lý giải, và giả thuyết, đó là, quy mô hồi quy không cải tổ Dự kiến, hoàn toàn có thể bị phủ nhận. Phần sau cuối của bảng11. 6 cho thấy những thông số hồi quy ước đạt, sai số chuẩn của những ước tính, t – giá trị vàmức độ quan trọng. Hệ số chuẩn và không chuẩn đã được báo cáo giải trình. 6.245 E – 02 là6. 245×10 – 2, đó là 0.06245. Lưu ý rằng những phần bị chặn ( β ) không được báo cáo giải trình khihệ số hồi quy chuẩn được ước tính. Kiểm tra những thông số hồi quy chuẩn cho thấy SIM làbiến chiếm hữu sức mạnh lý giải cao nhất. Giá trị báo cáo giải trình ( 0,481 ) có nghĩa là một sựthay đổi của một đơn vị chức năng tiêu chuẩn trong REP sẽ dẫn đến một sự đổi khác của0, 481 đơn vị chức năng tiêu chuẩn trong những biến phụ thuộc vào. 2.3.3 Biến số giảBiến tuyệt đối thường được gồm có như là biến độc lập. Ví dụ, nhu yếu vềmột loại sản phẩm hoặc dịch vụ hoàn toàn có thể biến hóa theo mùa, chúng tôi hoàn toàn có thể, ví dụ, chianăm vào mùa hè, mùa thu, mùa đông và mùa xuân. Đây là một biến quy mô danhnghĩa mà không hề được xếp hạng. Được vận dụng trong một hồi quy ( và định lượngkhác ) nghiên cứu và phân tích, mùa giải cần phải được số lượng được gán ( xem bảng 11.7 ) Kiểm tra bảng 11.7 cho thấy ba biến mới A, B và C. Chúng ta thấy rằng nếudoanh số bán hàng trong mùa hè, 1 được mã hoá trong biến A, và số 0 trong biến Bvà C. Bảng 11.7 cũng cho thấy bốn mùa có tích hợp khác nhau của số 0 và số 1. Giảđịnh rằng quy mô hồi quy sau đây để bán quần áo phụ nữ, mức giá cũng được baogồm, đã được ước tính : Doanh số bán hàng = 1000 – 0.5 x đơn giá + 100A – 20B – 50CN hững phương trình cho tất cả chúng ta biết doanh thu bán hàng cao nhất trong mùahè ( A = 1, B = 0, C = 0 ) Bảng 11.7 Mã hóa của biến giảMùa A B CMùa hè 1 0 0M ùa thu 0 1 0M ùa đông 0 0 1M ùa xuân 0 0 023T iểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn TânSự đổi khác những đường hồi quy tuyến tính xảy ra bởi những biến số giả : Giả sử giálà £ 200. Doanh số trong mùa hè là : 1000 – 0.5 x 200 + 200 x ( 1 ) – 20 x ( 0 ) – 50 x ( 0 ) = 100K hi mức giá được giữ nguyên thì doanh thu trong mùa thu là : 1000 – 0.5 x 200 + 200 x ( 0 ) – 20 x ( 1 ) – 80 x ( 0 ) = 8802.3.4 Phân tích những biến sốPhân tích hồi quy vận dụng theo quy ước, đó là : những biến số độc lập trong mộtkhoảng thời hạn hay là tỷ suất quy mô. Tuy nhiên thường những biến số nhờ vào làtuyệt đối. Ví dụ : điều đáng chăm sóc được lý giải tại sao là những công ty thànhcông thì nó khác với những công ty không thành công xuất sắc với những sự phân biệt đối vớiviệc nuôi dưỡng và không nuôi dưỡng một mẫu sản phẩm mới … để nghiên cứu và phân tích những biến số làtuyệt đối. Phân tích những biến số trong chủ thể là bắt nguồn từ sự đổi khác, sự kết hợptuyến tính của hai hay nhiều những biến số độc lập sẽ tích hợp tốt giữa hai hoặc nhiềunhóm được xác lập rõ ràng. Những biến số đạt được bởi sự xây dựng của sự biến đổitrọng lượng cho mỗi sự độc lạ để đạt được mức cao nhất giữa những nhóm biến đổiliên quan tới những nhóm đổi khác khác. Việc tích hợp những tuyến tính cho một phântích biến số, nó được biết tới như một hàm số biến số, nó được bắt nguồn từ mộtphương trình như sau : jk = a + W1k + W2k + …. ( 11.9 ) Trong đó : jk = biến số Z mã hóa cho biến số hàm số j cho chủ thể ka = đường thẳng = biến số khối lượng cho sự đổi khác độc lập iik = biến hóa độc lập i cho chủ thể k. Những biến số này thì tỷ suất trung bình cho tổng thể những biến số riêng không liên quan gì đến nhau vớitừng nhóm đặc biệt quan trọng, chúng đứng giũa mỗi nhóm và được nhắc tới như một trọng tâm. Trọng lượng Wcó thể được lý giải như những thông số hồi quy β trong những phân tíchhồi quy. Hầu hết những chương trình báo cáo giải trình của máy tính gồm có những biến số trọnglượng chuẩn và không chuẩn. Khả năng biến số hoàn toàn có thể được nhìn nhận như là sự cảithiện đúng trong phân loại. 24T iểu luận Phương pháp NCKH GVHD : TS. Nguyễn Văn TânVí dụ : Giả sử rằng nhà máy sản xuất có năng lực trấn áp một tài liệu nghiên cứu nếu như nócó thể tìm ra những biến số người mua và người không mua mẫu sản phẩm. Chính xác hơn, nhà máy sản xuất này phải biết chăm sóc tới độ tuổi và có khả năngđạt mức thu nhập. Biến sốphụ thuộc là xác lập tuyệt đối ( mua thì bằng 1, không mua thì = 0 ) trong khi nhữngbiến số độc lập là theo quy ước. Phân tích những biến số của hai nhóm được xuất ra trongchương trình máy vi tính thì xem ở bảng 11.8. Sự trấn áp là một phần trình diễn của28 trong 30 lần quan sát được vận dụng trong những nghiên cứu và phân tích và hai hai quan sát còn lạilà không có tài liệu. Chúng cũng nhìn thấy tài liệu nhóm 0 gồm có 19 chủ thể và 9 chủ thể của nhóm khác. Từ phần ( b ) tất cả chúng ta nhìn thấy những tài liệu nghiên cứu và phân tích thìphải đặt tổng thể những đơn vị chức năng vào những nhóm mà ở đó chúng nhờ vào đúng. Trườnghợp này thường không bắt buộc. Hai hàm của phương trình biến số thì được thống kê giám sát theo phần ( d ). Cho nhóm0 là : F = – 18.27 + 0.225 tuổi + 0.120 thu nhập. Cho nhóm F = – 31.758 + 0.052 tuổi + 0.203 thu nhập. Hai phương trình này được sử dụng để tiên đoán nếu như một ngườivới độ tuổi 54 và thu nhập với mức 250 thì sẽ mua mẫu sản phẩm P. Đơn giản tất cả chúng ta cóthể gắn hai số liệu này vào hai hàm số và đạt được f ( 54.250 ) = 24.023 và ( 54.250 ) = 21.800. Khi đó f ( 54.250 ) > f ( 54.250 ), tất cả chúng ta Dự kiến rằng nhữngngười thuộc vào nhóm 0 thì người đó sẽ không mua được mẫu sản phẩm này. Bảng 11.8 Phân tích biến số của hai nhóm. ( a ) Trường hợpNhóm 0 1 Đếm 19 928 trường hợp được sử dụng 2 trường hợp không có giá trị ( b ) Tổng hợp của những phân loạiĐặt vào Đúng Nhóm … Nhóm 0 10 19 01 0 9T ổng số N 19 9N số đúng 19 925