Trong mô hình hồi quy tuyến tính, sử dụng phương pháp bình phương bé nhất dạng cổ điển (Ordinary Least Squares Estimation), chúng ta xem xét mối quan hệ phụ thuộc tuyến tính giữa biến phụ thuộc và các biến độc lập ở dạng định lượng. Yêu cầu đối với các biến số đưa vào mô hình phải là biến “số lượng”.
Trong trường hợp một doanh nghiệp muốn nghiên cứu xem liệu sản phẩm mới phát triển có khả năng bán được hay không, ngân hàng muốn nghiên cứu liệu người vay có khả năng trả nợ hay không thì mô hình hồi quy tuyến tính nói trên không áp dụng được. Các biến nghiên cứu như khả năng chấp nhận sản phẩm mới, khả năng trả được nợ hay không chỉ có hai biểu hiện là “có” hoặc “Không” như vậy gọi là các biến thay phiên. Khi nghiên cứu, chúng ta sẽ mã hóa các biểu hiện đó thành 1 và 0, gọi là các ”biến nhị phân”. Khi tiến hành hồi quy tuyến tính với biến phụ thuộc là biến nhị phân, mô hình hồi quy sẽ vi phạm giả thiết về tính phân phối chuẩn của sai số, do đó làm mất hiệu lực của các ước lượng hay kiểm định thống kê. Đồng thời, khi ước lượng giá trị của biến phụ thuộc là xác suất, giá trị ước lượng có thể không đúng vì có khả năng nhận giá trị lớn hơn một hoặc âm. Trong trường hợp này, chúng ta sử dụng mô hình hồi quy xác suất với biến nhị phân là Binary Logistics.
Chúng ta sẽ xem xét mô hình hồi quy Binary Logistics với ví dụ về một doanh nghiệp muốn nghiên cứu khả năng chấp nhấn sản phẩm mới của mình với mức giá mà doanh nghiệp đề xuất. Chúng ta tiến hành thu thập thông tin về việc sản phẩm bán thử nghiệm có được hay không theo các mức giá. Từ biến phụ thuộc nhị phân này, một thủ tục sẽ được sử dụng dùng để dự đoán xác suất sản phẩm được chấp nhận dựa trên nguyên tắc nếu xác suất được dự đoán lớn hơn 0,5 thì kết quả dự đoán được coi là “được chấp nhận”, và ngược lại là “không được chấp nhận”.
1. Mô hình hàm Binary Logistics như sau
Trong đó E(Y/X) là xác suất để Y = 1 (Tức xác suất để hàng hóa được chấp nhận) khi mức giá là Xi. Đặt (β0 + β1X) = Z, ta có thể viết lại hàm Binary Logistics như sau:
Và xác suất sản phẩm không được chấp nhận là 1 – (P(Y=1) =
Nếu ta so sánh xác suất sản phẩm được chấp nhận với xác suất sản phẩm không được chấp nhận, ta có công thức:
eZ
P(Y=1) 1+eZ
eZ
P(Y=0) 1-
1+eZ
Lấy Logarit cơ số e cả 2 vế phương trình và biến đổi kết quả, ta được:
Loge = logeeZ = z
Vậy:
Loge = β0 + β1X
2. Phương pháp ước lượng các hệ số β0; β1
Hiện tại, có rất nhiều phần mềm thống kê có sẵn chức năng hồi quy xác suất mô hình Binary Logistics như EVIEW, SPSS hoặc các phầm thềm thống kê khác.
Nếu chọn SPSS, trình tự hồi quy như sau: Mở cửa sổ SPSS, chọn file dữ liệu các bạn đã nhập (hoặc có thể nhập dữ liệu vào file Excel không có dấu),
Chọn Analyze ð Regression ð Binary Logistics.
Sau đó khai báo lựa chọn các biến số và hoàn tất quá trình. SPSS sẽ tự động ước lượng các hệ số hồi quy và rất nhiều các thông số khác phục vụ cho mục đích kiểm định và dự báo cần thiết.
Giả sử với số liệu mà chúng ta thu thập được, kết quả hồi quy như sau:
Loge = 9.003 - 0.27X
3. Ý nghĩa hệ số β1
β1 đo lường sự thay đổi về tỷ lệ (đã logarit) của xác suất sản phẩm được chấp nhận khi giá (X) thay đổi một đơn vị. Dễ hiểu hơn, chúng ta có thể lấy eβ1 và hiểu rằng, nếu giá sản phẩm tăng lên (hay giảm xuống) 1 đơn vị, xác suất để sản phẩm được chấp nhận sẽ giảm xuống (hoặc tăng lên) eβ1 lần so với khả năng sản phẩm không được chấp nhận.
Từ ví dụ về hàm Binary Logistics ở trên, chúng ta có thể kết luận: Trong trường hợp các yếu tố khác không đổi, nếu giá sản phẩm thử nghiệm tăng lên 1 đơn vị (giả sử là nghìn đồng), xác suất để sản phẩm không bán được sẽ giảm xuống e-0.27 = 0,763 lần so với khả năng không bán được.
4. Đo độ phù hợp của mô hình Binary Logistics
Đối với mô hình hồi quy tuyến tính cổ điển với các biến định lượng, chúng ta sử dụng tiêu chuẩn R2.
Đối với mô hình Binary Logistics, chúng ta sử dụng tiêu chuẩn -2LL (-2 Log likelihood). Điều khác biệt giữa R2 và -2LL ở chỗ, R2 càng lớn (gần bằng 1) càng tốt, -2LL càng nhỏ (gần bằng 0) thì mô hình càng có khả năng dự báo tốt về xác suất.
2
5. Dự báo xác suất bằng mô hình
Chúng ta muốn dự đoán xác suất sản phẩm được chấp nhận khi giá sản phẩm được ấn định trước, giả sử 20 nghìn đồng, chúng ta thay vào mô hình:
Với X = 20
e(9.003 - 0.27*20) 36,5
E(Y/X=20) = = = 0,97
1+ e(9.003- 0.27*20) 37,5
Như vậy nếu doanh nghiệp chào bán sản phẩm với giá 20 nghìn đồng, 97% khả năng sản phẩm sẽ được người tiêu dùng chấp nhận. Mức giá 20 nghìn đồng tương đối an toàn về mặt tiêu thụ. Tuy nhiên, chúng ta không nên quên rằng, mô hình Binary Logistics cũng giống như bất kỳ mô hình kinh tế lượng nào khác, đều có khả năng dự đoán sai một mức độ nhất định.