Fuzzy time series has been firstly proposed by Song & Chissom (1993) and
widely studied for forecasting purposes now. However, the accuracy of forecasts based on the
concept of fuzzy approach of Song & Chissom is not high because of such depends on very
many factors. Chen (1996) proposed an efficient fuzzy time series model which consists of
simple arithmetic calculations only. After that, this has been widely studied for improving
accuracy of forecasting in many applications to get better results. The hedge algebras
developed by Nguyen and Wechler (1990) was completely different from the fuzzy approach.
Fuzzy time series method generally embodies three stages such as fuzzification, determination
of fuzzy relations and defuzzification stages. In hedge algebras, instead of performing
fuzzification and defuzzification, more simple methods are adopted, termed as semantization
and desemantization, respectively. In this paper, we present a new approach using hedge
algebras to provide a computational model, which is completely different from the fuzzy
approach for fuzzy time series forecasting. The experimental results of forecasting
enrollments of students of the University of Alabama show that the model of fuzzy time series
based on hedge algebras is better than many existing models
17 trang |
Chia sẻ: honghp95 | Lượt xem: 634 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Dự báo chuỗi thời gian mờ dựa trên đại số gia tử, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỷ yếu công trình khoa học 2015 - Phần I
DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN ĐẠI SỐ GIA TỬ
Trần Quang Duy, Nguyễn Công Điều, Vũ Như Lân
Khoa Toán-Tin, Đại học Thăng Long
Email: Tr.qduy@gmail.com, ncdieu@yahoo.com, vnlan@ioit.ac.vn
Tóm tắt: Chuỗi thời gian mờ do Song & Chissom đưa ra năm 1993 và hiện nay được
nghiên cứu rộng rãi trên thế giới cho mục đích dự báo. Tuy nhiên, độ chính xác của dự báo
chuỗi thời gian theo tiếp cận mờ của Song & Chissom còn chưa cao do phụ thuộc vào quá
nhiều yếu tố. S.M Chen (1996) đã đề xuất mô hình dự báo chuỗi thời mờ rất hiệu quả chỉ sử
dụng các tính toán số học đơn giản. Sau đó mô hình này được nghiên cứu cải tiến trong nhiều
ứng dụng dự báo và đã có được nhiều kết quả chính xác hơn. Đại số gia tử (ĐSGT) là một
tiếp cận mới được các tác giả N.C.Ho và W. Wechler xây dựng vào những năm 1990. Mô
hình dự báo chuỗi thời gian mờ thể hiện qua ba giai đoạn như phép mờ hóa, xác định quan hệ
mờ và phép giải mờ. Trong ĐSGT, phép mờ hóa và phép giải mờ được thay thế bằng phép
ngữ nghĩa hóa và phép giải nghĩa tương ứng đơn giản hơn. Trong bài báo này, chúng tôi đưa
ra một tiếp cận mới sử dụng ĐSGT với khả năng cung cấp một mô hình tính toán hoàn toàn
khác biệt so với tiếp cận mờ cho mô hình dự báo chuỗi thời gian mờ. Các kết quả thử nghiệm
dự báo số sinh viên nhập học tại Đại học Alabama chứng minh rằng mô hình chuỗi thời gian
mờ dựa trên ĐSGT tốt hơn so với nhiều mô hình hiện có.
Từ khóa: Tập mờ, nhóm quan hệ mờ, đại số gia tử, dự báo chuỗi thời gian mờ.
1. MỞ ĐẦU
Dự báo chuỗi thời gian là vấn đề luôn được nhiều nhà khoa học trên thế giới quan tâm
nghiên cứu. Q.Song và B.S. Chissom [1] lần đầu tiên đã đưa ra quan niệm mới xem các giá trị
thực định lượng trong chuỗi thời gian từ góc độ định tính. Từ đó chuỗi thời gian có thể xem
như một biến ngôn ngữ và bài toán dự báo trở thành vấn đề dự báo các giá trị ngôn ngữ của
biến ngôn ngữ. Có thể coi đây là quan niệm mới về chuỗi thời gian có tính đột phá. Tuy
nhiên mô hình tính toán nhóm quan hệ mờ [2, 3] quá phức tạp và do đó độ chính xác của dự
báo không cao. Chen [4] đã thay đổi cách tính toán nhóm quan hệ mờ trong mô hình dự báo
[2, 3] với các phép tính số học đơn giản hơn để thu được kết quả dự báo chính xác hơn. Nhiều
nghiên cứu tiếp theo vẫn sử dụng phương pháp luận này và đã thu được nhiều kết quả quan
trọng [4, 9, 10]. Ở Việt Nam, bài báo [11] là kết quả nghiên cứu đầu tiên về dự báo chuỗi thời
gian mờ.
Các nghiên cứu trên thế giới chủ yếu tập trung giải quyết vấn đề nâng cao độ chính
xác dự báo. Có thể thấy một số vấn đề sau đây ảnh hưởng đến độ chính xác dự báo chuỗi thời
gian mờ:
a/ Mờ hóa các dữ liệu: Đây là vấn đề đòi hỏi phải có trực giác tốt để mô tả định tính
chuỗi thời gian một cách hợp lý, từ đó xây dựng nhóm quan hệ mờ cung cấp thông tin có giá
trị cho quá trình dự báo sau này. Đặc tính quan trọng của phép mờ hóa là số lượng khoảng
chia, độ dài khoảng chia. Nếu số lượng khoảng chia quá ít, dự báo có thể có độ sai lệch lớn do
chưa đủ thông tin. Nếu số lượng khoảng chia quá lớn, dự báo có thể mất hết ý nghĩa về tính
mờ của giá trị ngôn ngữ do không còn nhóm quan hệ mờ. Trong các nghiên cứu [7, 8]: số
lượng khoảng, độ dài khoảng và bậc của mô hình chuỗi thời gian mờ có ảnh hưởng đến độ
Trường Đại học Thăng Long 30
Kỷ yếu công trình khoa học 2015 - Phần I
chính xác của mô hình dự báo. Một số nghiên cứu sâu hơn về số lượng khoảng, độ dài khoảng
và bậc của mô hình chuỗi thời gian mờ tối ưu để có dự báo tốt nhất cho các dữ liệu trong
nhóm quan hệ mờ [12, 13, 14].
b/ Giải mờ: Đây là quá trình dự báo với rất nhiều kỹ thuật khác nhau trên cơ sở phép
mờ hóa trên đây. Cách giải mờ phổ biến dựa trên 3 luật cơ bản [4], tuy nhiên trong [10, 11] đã
tìm ra một số tham số định hướng cho quá trình giải mờ và đã thu được một số kết quả khá tốt
Tiếp cận đại số gia tử (ĐSGT) [15] là tiếp cận khác biệt so với tiếp cận mờ và đã có
một số ứng dụng thể hiện rõ hiệu quả của tiếp cận này so với tiếp cận mờ truyền thống trong
một số lĩnh vực như điều khiển [16, 18, 19], công nghệ thông tin [17]. Tiếp tục những nghiên
cứu ứng dụng trên đây, tiếp cận ĐSGT cũng cần được nghiên cứu thử nghiệm cho một lĩnh
vực ứng dụng mới, đó là bài toán xây dựng mô hình dự báo chuỗi thời gian mờ đã được nhiều
tác giả khác trên thế giới quan tâm hiện nay.
Bài báo được trình bày theo thứ tự sau đây: Sau mục MỞ ĐẦU là Mục II giới thiệu về
mô hình dự báo chuỗi thời gian mờ và ứng dụng cho dự báo số sinh viên nhập học tại trường
đại học Alabama của Song & Chissom [2,3] và Chen [4]. Mục III trên cơ sở bài toán dự báo
số sinh viên nhập học của trường đại học Alabama, nêu một số nội dung quan trọng của
ĐSGT cần thiết cho bài toán dự báo chuỗi thời gian mờ với bộ tham số hợp lý và so sánh với
các phương pháp của Chen và các phương pháp cải tiến khác sử dụng chuỗi thời gian mờ bậc
nhất với 7 khoảng chia. Mục IV tiếp tục trình bày phương pháp dự báo số sinh viên nhập học
của trường đại học Alabama trên cơ sở tiếp cận ĐSGT trong điều kiện phép ngữ nghĩa hóa phi
tuyến, phép giải nghĩa phi tuyến với các tham số tối ưu dựa trên đoạn giải nghĩa tối ưu. Từ đó
so sánh với một số phương pháp dự báo cải tiến theo tiếp cận mờ sử dụng bậc cao, số khoảng
chia lớn hơn 7 và một số mô hình dự báo chuỗi thời gian mờ tối ưu hiện nay. Độ chính xác dự
báo của các phương pháp trên được đánh giá qua sai số trung bình bình phương MSE (Mean
Square Error), qua đó có thể thấy rõ tính ưu việt của tiếp cận ĐSGT so với tiếp cận mờ.
2. MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ
2.1 Một số khái niệm cơ bản của mô hình dự báo chuỗi thời gian mờ
Mô hình chuỗi thời gian mờ lần đầu tiên được Song và Chissom đưa ra [1, 2, 3 ] và
được Chen cải tiến [4,5, 6] để có thể xử lý bằng các phép tính số học đơn giản hơn nhưng
chính xác hơn phù hợp với các ứng dụng dự báo chuỗi thời gian mờ. Có thể tóm lược qua một
số khái niệm cơ bản sau đây:
Định nghĩa 2.1: Chuỗi thời gian mờ
Giả sử Y(t), (t=... , 0,1,2,. .), là tập các số thực và cũng là tập nền trên đó xác định các
tập mờ f i (t), (i=1,2 , .. ). Biến t là thời gian. Nếu F(t) là một chuỗi các tập mờ của f i (t),
(i=1,2,...), thì F(t) được gọi là chuỗi thời gian mờ trên Y(t), (t=... , 0,1,2,. ..).
Định nghĩa 2.2: Quan hệ mờ
Nếu tồn tại quan hệ mờ R(t−1, t), sao cho F(t)=F(t−1)*R(t−1, t), trong đó dấu * ký
hiệu toán tử nào đó, thì F(t) được suy ra từ F(t−1). Quan hệ giữa F(t) và F(t−1) được xác định
bằng ký hiệu:
F(t−1)→F(t) (2.1)
Trường Đại học Thăng Long 31
Kỷ yếu công trình khoa học 2015 - Phần I
Ví dụ về toán tử * có thể là phép kết hợp MaxMin [2] hoặc MinMax [3] hay phép tính
số học [ 4] . Nếu F (t−1)=Ai and F (t)=Aj , quan hệ logic giữa F (t) and F(t−1) được ký hiệu
bằng Ai→Aj , trong đó Ai là vế trái và Aj là vế phải của quan hệ mờ mô tả tập mờ dự báo.
Định nghĩa 2.3: Quan hệ mờ bậc n
Giả sử F(t) là chuỗi thời gian mờ. Nếu F(t) được suy ra từ F(t−1), F(t−2),..., F(t−n), thì
quan hệ mờ này được biểu diễn bằng biểu thức:
F(t−n),...,F(t−2), F(t−1) → F(t) (2.2)
và được gọi là chuỗi thời gian mờ bậc n. .
Định nghĩa 2.4: Nhóm quan hệ mờ ( NQM )
Các quan hệ mờ với cùng một tập mờ bên vế trái có thể đưa vào một nhóm gọi là
nhóm quan hệ mờ hay nhóm quan hệ logic mờ.
Giả sử có các quan hệ mờ sau, khi vế trái là giống nhau:
Ai→ Aj1; Ai→ Aj2;....; Ai→ Ajn
Các quan hệ mờ trên có thể đưa vào một nhóm được ký hiệu như sau:
Ai→ Aj1, Aj2, , ..., Ajn . (2.3)
2.2 Mô hình dự báo Song và Chissom
Mô hình dự báo chuỗi thời gian mờ lần đầu tiên được Song và Chissom đưa ra vào
năm 1993 [1, 2, 3 ] và được ứng dụng để dự báo số sinh viên nhập học tại trường Đại học
Alabama với dữ liệu lịch sử qua 22 năm kể từ năm 1971 đến 1992 như trong Bảng 2.1 sau
đây:
Bảng 2.1 Số sinh viên nhập học tại trường đại học Alabama từ 1971 đến 1992
Năm Số sinh viên nhập
học
Năm Số sinh viển nhập
học
1971 13055 1982 15433
1972 13563 1983 15497
1973 13867 1084 15145
1974 14696 1985 15163
1975 15460 1986 15984
1976 15311 1987 16859
1977 15603 1988 18150
1978 15861 1989 18970
1979 16807 1990 19328
1980 16919 1991 19337
1981 16388 1992 18876
Trường Đại học Thăng Long 32
Kỷ yếu công trình khoa học 2015 - Phần I
Chuỗi thời gian lần đầu tiên được xem xét dưới góc độ biến ngôn ngữ và bài toán dự
báo đã có được một cách nhìn hoàn toàn mới trên quan điểm lý thuyết tập mờ. Mô hình dự
báo đầu tiên là mô hình dự báo chuỗi thời gian dừng [2, 3] và được triển khai qua các bước
sau đây:
Bước 1. Xác định tập nền
Bước 2. Chia miền xác định của tập nền thành những khoảng bằng nhau.
Bước 3. Xây dựng các tập mờ trên tập nền
Bước 4. Mờ hóa chuỗi dữ liệu
Bước 5. Xác định các quan hệ mờ
Bước 6. Dự báo bằng phương trình Ai=Ai−1* R, ở đây ký hiệu * là toán tử max-min
Bước 7. Giải mờ các kết quả dự báo.
Trong bước 5, quan hệ mờ R được xác định bằng biểu thức Ri=As TxAq , với mọi
quan hệ mờ k, As →Aq, R= ∪i=1,k Ri
(2.4)
Ở đây x là toán tử min, T là phép chuyển vị và ∪ là phép hợp.
2.3 Mô hình dự báo Chen
Do mô hình dự báo chuỗi thời gian mờ của Song & Chissom khá phức tạp trong bước
5 và bước 6, vì vậy Chen [4] đã cải tiến cách tính toán sao cho chính xác hơn cho các mô hình
dự báo chuỗi thời gian chỉ sử dụng các phép tính số học đơn giản trên cơ sở thông tin từ các
nhóm quan hệ mờ theo các bước sau đây:
Bước 1. Chia miền xác định của tập nền thành những khoảng bằng nhau.
Bước 2. Xây dựng các tập mờ trên tập nền.
Bước 3. Mờ hóa chuỗi dữ liệu.
Bước 4. Xác định các quan hệ mờ.
Bước 5. Tạo lập nhóm quan hệ mờ.
Bước 6. Xây dựng các luật dự báo trên các nhóm quan hệ
Bước 7. Giải mờ đầu theo luật và đưa ra dự báo.
3. MÔ HÌNH DỰ BÁO THEO TIẾP CẬN ĐẠI SỐ GIA TỬ
Đại số gia tử cung cấp một mô hình xử lý các đại lượng không chắc chắn khá hiệu quả
cho nhiều bài toán ứng dụng. Có thể thấy rõ rằng các giá trị ngôn ngữ với ngữ nghĩa vốn có
thứ tự chặt chẽ trong biến ngôn ngữ đã được mô tả bằng một cấu trúc đại số gia tử [15, 16], từ
đó tạo ra môi trường tính toán, suy luận tốt cho nhiều ứng dụng.
Gọi AX = ( X, G, C, H, ≤ ) là một cấu trúc đại số, với X là tập nền của AX; G = {c-,
c+} là tập các phần tử sinh; C = {0, W, 1}, trong đó 0, W và 1 tương ứng là những phần tử
đặc trưng cận trái (tuyệt đối nhỏ), trung hòa và cận phải (tuyệt đối lớn); H là tập các toán tử
Trường Đại học Thăng Long 33
Kỷ yếu công trình khoa học 2015 - Phần I
một ngôi được gọi là các gia tử; ≤ là biểu thị quan hệ thứ tự trên các giá trị ngôn ngữ. Gọi H-
là tập hợp các gia tử âm và H+ là tập hợp các gia tử dương của AX.
Ký hiệu H- = {h-1, h-2, h-q}, trong đó h-1 < h-2 < < h-q và H+ = {h1, h2, ,
hp}, trong đó h1 < h2 < < hp.
Định nghĩa 3.1: Độ đo tính mờ
fm: X → [0, 1] gọi là độ đo tính mờ nếu thỏa mãn các điều kiện sau::
fm(c-)+fm(c+) = 1 và ( )
h H
fm hx
∈∑ = fm(x), với ∀x ∈ X. (3.1)
Với các phần tử 0, W và 1, fm(0) = fm(W) = fm(1) = 0. (3.2)
Và với ∀x,y ∈ X, ∀h∈H, ( ) ( )( ) ( )
fm hx fm hy
fm x fm y= (3.3)
Đẳng thức (3.3) không phụ thuộc vào các phần tử x, y và do đó ta có thể ký hiệu là
µ(h) và đây là độ đo tính mờ của gia tử h. Tính chất của fm(x) và µ(h) như sau:
fm(hx) = µ(h)fm(x), ∀x∈X (3.4)
, 0
( ) ( )
p
i
i q i
fm h c fm c
=− ≠
=∑ , với c∈{c-, c+} (3.5)
, 0
( ) ( )
p
i
i q i
fm h x fm x
=− ≠
=∑ (3.6)
1
( )
q
i
i
hµ α
−
=−
=∑ và
1
( )
p
i
i
hµ β
=
=∑ , với α, β > 0 và α+β = 1 (3.7)
Định nghĩa 3.2: Hàm dấu
Hàm Sign: X→{-1, 0, 1} là một ánh xạ được gọi là hàm dấu với h, h'∈H và c ∈{c-,
c+} trong đó:
Sign(c-) = -1, Sign(c+) = +1; (3.8)
Sign(hc) = - Sign(c), nếu h là âm đối với c; (3.9)
Sign(hc) = + Sign(c), nếu h là dương đối với c; (3.10)
Sign(h'hx) = -Sign(hx), nếu h’hx ≠ hx và h' là âm đối với h; (3.11)
Sign(h'hx) = + Sign(hx), nếu h’hx ≠ hx và h' là dương đối với h; (3.12)
Sign(h'hx) = 0 nếu h’hx = hx. (3.13)
Gọi fm là một độ đo tính mờ trên X, ánh xạ ngữ nghĩa định lượng ν: X → [0,1], được
sinh ra bởi fm trên X, được xác định như sau:
(W) ( ),v fm cθ −= = (3.14)
( ) ( ) ( )v c fm c fm cθ α β− − −= − = , (3.15)
( ) ( ) 1 ( )v c fm c fm cθ α β+ + += + = − (3.16)
Trường Đại học Thăng Long 34
Kỷ yếu công trình khoa học 2015 - Phần I
( )( ) ( ) ( ){ ( ) ( ) ( )}
j
j j i j ji sign jv h x v x sign h x fm h x h x fm h xω== + −∑ (3.17)
với 1( ) [1 ( ) ( )( )] { , }
2j j p j
h x Sign h x sign h h xω β α α β= + − ∈ , (3.18)
j ∈ [-q^p], j ≠ 0.
Để thuận tiện cho việc biểu diễn ngữ nghĩa của các giá trị ngôn ngữ [16], giả sử rằng
miền tham chiếu thông thường của các biến ngôn ngữ X là đoạn [a, b] còn miền tham chiếu
ngữ nghĩa Xs là đoạn [as,bs] ( 0 ≤. as < bs ≤ 1 ). Việc chuyển đổi tuyến tính từ [a, b] sang
[as,bs] được gọi là phép ngữ nghĩa hóa tuyến tính (linear semantization) còn việc chuyển
ngược lại từ đoạn [as,bs] sang [a, b] được gọi là phép giải nghĩa tuyến tính (linear
desemantization). Đoạn [a, b ] được gọi là đoạn giải nghĩa.
Trong nhiều ứng dụng của ĐSGT đã sử dụng miền ngữ nghĩa là đoạn [as=0, bs=1], khi
đó phép ngữ nghĩa hóa tuyến tính được gọi là phép chuẩn hóa (linear Semantization =
Normalization) và phép giải nghĩa tuyến tính được gọi là phép giải chuẩn (Linear
Desemantization = Denormalization ). Nhiều ứng dụng của ĐSGT trong nhiều lĩnh vực khoa
học đòi hỏi mở rộng không gian tham số trong các phép ngữ nghĩa hóa và phép giải nghĩa để
có nhiều tham số lựa chọn mềm dẻo hơn nữa. Điều này chỉ có thể có được khi mở rộng phép
ngữ nghĩa hóa và phép giải nghĩa từ tuyến tính sang phi tuyến. Như vậy có thể biểu diễn phép
ngữ nghĩa hóa và phép giải nghĩa như sau:
Linear Semantization (x) = xs = as + ( bs – as ) ( x – a ) / ( b – a) (3.19a)
Normalization (x) = xs = ( x – a ) / (b – a ) (3.19b)
Nonlinear Semantization (x) = f(xs,sp) (3.19c)
Với điều kiện: 0 ≤ f(xs,sp) ≤ 1 và f(xs=0,sp) = 0 và f(xs=1,sp) = 1
Hàm f(.) được chọn tùy theo từng ứng dụng và là hàm liên tục, đồng biến để đảm bảo
thứ tự ngữ nghĩa. Ví dụ có thể chọn f(xs,sp) dựa trên Normalization(x) như sau:
Nolinear Normalization (x) = sp.xs(1-xs) + xs (3.19d)
Tương tự:
Linear Desemantization (xs) = x = a + (b – a) (xs – as) / (bs – as) (3.20a)
Denormalization (xs) = x = a + ( b – a )xs (3.20b)
Nonlinear Desemantization (xs) = g(x,dp) (3.20c)
Với điều kiện: a ≤ g(x,dp) ≤ b và g(x = a,dp) = a và g(x = b,dp) = b
Hàm g(.) được chọn tùy theo từng ứng dụng và là các hàm liên tục, đồng biến tương
ứng với thứ tự ngữ nghĩa. Ví dụ sau khi chọn f(xs,sp ), có thể tiếp tục chọn g(x,dp) dựa trên
Denormalization (f(xs,sp) ) như sau:
Nonlinear Denormalization (f(xs,sp)) = dp(( Denormalization (f(xs,sp))–a ).
(b – Denormalization (f(xs,sp))) / (b-a) + Denormalization (f(xs,sp)) ( 3.20d )
Trong đó Denormalization (f(xs,sp)) = (sp.x.(1-x)+x ).(b-a) + a ( 3.20d1)
Trường Đại học Thăng Long 35
Kỷ yếu công trình khoa học 2015 - Phần I
Hàm f(xs,sp) là hàm biểu diễn phép ngữ nghĩa hóa phi tuyến, g(x.dp) là hàm biểu diễn
phép giải nghĩa phi tuyến chưa được sử dụng trong các ứng dụng của ĐSGT, trong đó sp∈[-1
1] là tham số ngữ nghĩa hóa, dp ∈[-1 1] là tham số giải nghĩa.Khi sp=dp=0; tính phi tuyến bị
loại bỏ và biểu thức (3.19d) trở thành (3.19b) và (3.20d) trở thành (3.20b).
Cho trước độ đo tính mờ của các gia tử µ(h) và các giá trị độ đo tính mờ của các phần
tử sinh fm(c-), fm(c+) và θ là phần tử trung hoà (neutral). Khi đó mô hình tính toán của
ĐSGT được xây dựng trên cơ sở các biểu thức từ (3.1) đến (3.20) được kích hoạt và thực tế
đã được sử dụng hiệu quả trong rất nhiều ứng dụng. Phép mờ hóa và phép giải mờ trong tiếp
cận mờ được thay thế tương ứng bằng phép ngữ nghĩa hóa và phép giải nghĩa trong tiếp cận
ĐSGT. Hệ luật được thể hiện bằng siêu mặt làm cơ sở cho quá trình suy luận xấp xỉ. Một lưu
ý quan trọng của quá trình tính toán trong tiếp cận ĐSGT là cần xác định các tham số ban đầu
như độ đo tính mờ của các phần tử sinh và độ đo tính mờ của các gia tử trong biến ngôn ngữ
một cách thích hợp dựa trên cơ sở phân tích ngữ nghĩa của miền ngôn ngữ trong từng bài toán
ứng dụng cụ thể. Khi đó mô hình tính toán của tiếp cận ĐSGT sẽ cho các kết quả hợp lý trong
các ứng dụng.
Đối với mô hình dự báo chuỗi thời gian mờ của Song & Chissom và Chen, có thể thấy
rõ ba giai đoạn: mờ hóa, xác định quan hệ mờ và giải mờ. Như vậy, hoàn toàn có thể thay thế
tiếp cận mờ với ba giai đoạn trên đây bằng tiếp cận ĐSGT cũng với ba giai đoạn tương tự:
ngữ nghĩa hóa , xác định nhóm quan hệ ngữ nghĩa và giải nghĩa.
Mô hình dự báo chuỗi thời gian mờ dựa trên ĐSGT có các bước cơ bản sau đây:
Bước 1. Xác định tập nền, chia miền xác định của tập nền thành những khoảng bằng
nhau.
Bước 2. Xây dựng các nhãn ngữ nghĩa (giá trị ngôn ngữ theo tiếp cận ĐSGT) trên tập
nền.
Bước 3. Ngữ nghĩa hóa chuỗi dữ liệu.
Bước 4. Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa
Bước 5. Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa.
Bước 6. Giải nghĩa đầu ra dự báo.
Các bước trên đây tương tự với các bước dự báo trong mô hình Chen nhưng trong tiếp
cận ĐSGT không sử dụng tập mờ mà dùng ngữ nghĩa định lượng mô tả trực tiếp ngữ nghĩa
của giá trị ngôn ngữ.
Bài toán được chọn để so sánh và làm rõ hiệu quả dự báo của mô hình trên là bài toán
dự báo số sinh viên nhập học tại trường Alabama do Song & Chissom [2 3] và Chen [4] đặt ra
đầu tiên để nghiên cứu mô hình chuỗi thời gian mờ. Đây cũng là bài toán cho đến nay vẫn
được Chen [5,6,7,8] và nhiều tác giả trên thế giới quan tâm nghiên cứu cải tiến [9,10, 11, 12,
13, 14, 20, 21, 22, 23]. Chúng tôi cũng sử dụng số liệu này để xây dựng quá trình dự báo dựa
trên ĐSGT.
Các bước tính toán dựa trên ĐSGT cụ thể như sau:
Trường Đại học Thăng Long 36
Kỷ yếu công trình khoa học 2015 - Phần I
Bước 1: Xác định tập nền, chia miền xác định của tập nền thành những khoảng bằng
nhau.
Tập nền U được chọn tương tự mô hình Chen [4] có khoảng xác định: [Dmin−D1,
Dmax+D2] với Dmin và Dmax là số sinh viên nhập học thấp nhất và cao nhất theo dữ liệu
lịch sử nhập học của trường. Cụ thể Dmin=13055 và Dmax=19337, D1 = 55 và D2 = 663,
như vậy U= [13000, 20000]. Chia tập nền U thành 7 khoảng bằng nhau u1, u2, u3, u4, u5, u6
và u7. Trong đó u1 = [13000, 14000], u2 = [14000, 15000], u3 = [15000, 16000], u4 =
[16000, 17000], u5 = [17000, 18000], u6 = [18000, 19000] và u7 = [19000, 20000].
Bước 2. Xây dựng các nhãn ngữ nghĩa trên tập nền.
Để tiện theo rõi và so sánh với các bước dự báo trong mô hình Chen, ở đây sử dụng
một số ký hiệu tương tự những ký hiệu Chen đã sử dụng. Giả sử A1, A2 ,, Ak là các nhãn
ngữ nghĩa được gán cho các khoảng u1, u2,uk, k là số khoảng trên tập nền. Khác với tập
mờ trong nghiên cứu của Chen, các nhãn ngữ nghĩa ở đây được xây dựng từ các phần tử sinh
c-, c+ với các gia tử h ϵ H tạo thành các giá trị ngôn ngữ của biến ngôn ngữ “số sinh viên
nhập học ”. Khi đó các nhãn ngữ nghĩa A1, A2 ,, Ak có dạng sau đây: A1= hA1c; A2=
hA2c;.; Ak= hAkc, trong đó hAi, (i=1,2,k) là chuỗi gia tử tác động lên c với c ∈{c-, c+}.
Trong [4], Chen sử dụng các giá trị ngôn ngữ A1 = (not many), A2 = (not too many),
A3 = (many), A4 = (many many), A5 = (very many), A6 = (too many) và A7 = (too many
many). Theo tiếp cận ĐSGT, 2 gia tử “very”và “little” tác động lên 2 phần tử sinh “small”và
“large” được sử dụng để tạo ra 7 nhãn ngữ nghĩa tương ứng với 7 giá trị ngôn ngữ của Chen
như sau: A1 = (very small), A2 = (small), A3 = (little small), A4 = (midle), A5 = (little
large), A6 = (large) và A7 = (very large).
Bước 3. Ngữ nghĩa hóa chuỗi dữ liệu.
Để xác định ngữ nghĩa định lượng cho các nhãn ngữ nghĩa A1, A2,...,A7 ở bước 2,
cần chọn trước độ đo tính mờ của các gia tử µ(very), µ(little) và giá trị độ đo tính mờ của
phần tử sinh fm(c-) = θ với θ là phần tử trung hoà được cho trước. Nếu gia tử dương “very”
và gia tử âm “little ” tác động lên các phần tử sinh “large” hoặc “small” như trên, thì µ(little)
= α và µ(very) = 1- α = β theo(3.7). Như vậy ngữ nghĩa định lượng của các nhãn ngữ nghĩa sẽ
chỉ phụ thuộc vào các tham số của ĐSGT α, θ và hoàn toàn được xác định sau khi thay các
giá trị α, θ vào các phương trình tính toán ngữ nghĩa định lượng từ (3.14) đến (3.18). Cụ thể
là 7 giá trị ngữ nghĩa định lượng của 7 nhãn ngữ nghĩa A1,A2, ...A7 được gán tương ứng cho
7 khoảng u1, u2,..., u7 có dạng tham số hóa sau đây:
ν(very small) = θ(1-α)(1-α) (3.21)
ν(small) = θ(1-α) (3.22)
ν(little small) = θ(1-α+α2) (3.23)
ν(midle) = θ (3.24)
ν(little large) = θ+α(1-θ)(1-α) (3.25)
ν(large) = θ+(1-θ)α (3.26)
ν(very large) = θ+α(1-θ)(2-α) (3.27)
Trường Đại học Thăng Long 37
Kỷ yếu công trình khoa học 2015 - Phần I
Nếu chọn trước α = 0.5 và θ = 0.5, thì các phương trình từ (3.21) đến (3.27) trở thành:
ν(very small) = 0.125 (3.28)
ν(small) = 0.25 (3.29)
ν(little small) = 0.375 (3.30)
ν(midle) = 0.5 (3.31)
ν(little large) = 0.625 (3.32)
ν(large) = 0.75 (3.33)
ν(very large) = 0.875 (3.34)
Ký hiệu: SA = Semantization (A) là giá trị ngữ nghĩa định lượng theo nhãn ngữ nghĩa
A, khi đó: SA1 = ν(very small); SA2 = ν(small); SA3 = ν(little small); SA4 = ν(midle); SA5
= ν(little large); SA6 = ν(large) và SA7 = ν(very large) là các giá trị ngữ nghĩa định lượng
theo các tham số được chọn trước α, θ. Khi đó dễ dàng thấy rằng:
SA1 < SA2 < SA3 < SA4 < SA5 < SA6 < SA7 (3.35)
Tương tự như trên, có thể xây dựng các công thức tính toán các giá trị ngữ nghĩa định
lượng theo các nhãn ngữ nghĩa khi có nhiều gia tử tác động lên phần tử sinh.
Biểu thức (3.35) thể hiện rõ những tính chất quan trọng sau đây:
Thứ tự ngữ nghĩa luôn được đảm bảo.
Các nhãn ngữ nghĩa Ai có giá trị ngữ nghĩa định lượng SAi và luôn có quan hệ ngữ
nghĩa với nhau thông qua bộ tham số của ĐSGT α, θ, µ(hAi), i= 1, 2,
Như vậy, trong các ứng dụng cụ thể của tiếp cận ĐSGT, ảnh hưởng của bộ tham số
mang tính hệ thống. Có nghĩa là tất cả các giá trị ngôn ngữ trong biến ngôn ngữ đều chịu ảnh
hưởng bởi bộ tham sô của ĐSGT. Những tính chất trên đây tạo ra sự khác biệt giữa tiếp cận
ĐSGT và tiếp cận mờ. Trong tiếp cận mờ, các giá trị ngôn ngữ sử dụng tập mờ hoàn toàn
không có ràng buộc với nhau.
Bước 4: Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa.
Các quan hệ ngữ nghĩa được xác định trên cơ sở các dữ liệu lịch sử. Nếu đặt chuỗi thời
gian mờ F(t-1) là Ak có ngữ nghĩa định lượng SAk và F(t) là Am có ngữ nghĩa định lượng
SAm, thì Ak có quan hệ với Am và dẫn đến SAk có quan hệ với SAm. Quan hệ này được gọi
là quan hệ ngữ nghĩa theo nhãn ngữ nghĩa và được ký hiệu là:
SAk → SAm hoặc Semantization (Aj) → Semantization (Ak) (3.36)
Trong bài toán dự báo số sinh nhập học tại trường Alabama, ở đây Ak là nhãn ngữ
nghĩa mô tả số sinh viên nhập học của năm hiện tại với ngữ nghĩa định lượng SAk, Am là
nhãn ngữ nghĩa mô tả số sinh viên nhập học của năm tiếp theo với ngữ nghĩa định lượng
SAm.
Như vậy, trên cơ sở số liệu của Chen [4], có thể xác định được các quan hệ ngữ nghĩa
theo nhãn ngữ nghĩa ( kể cả số lần trùng nhau ) sau đây:
SA1 → SA1 (trùng nhau 2 lần); SA1 → SA2;
Trường Đại học Thăng Long 38
Kỷ yếu công trình khoa học 2015 - Phần I
SA2 → SA3; SA3 → SA3 (trùng nhau 7 lần);
SA3 → SA4 (trùng nhau 2 lần); SA4 → SA4 (trùng nhau 2 lần);
SA4 → SA3; SA4 → SA6; SA6 → SA6; SA6 → SA7;
SA7 → SA7 và SA7 → SA6 (3.37)
Bước 5. Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa.
Nếu một ngữ nghĩa định lượng (vế trái (3.37)) có quan hệ với nhiều ngữ nghĩa định
lượng (vế phải (3.37)), thì vế phải được chập lại thành một nhóm. Quan hệ được lập theo
nhóm như vậy được gọi là nhóm quan hệ ngữ nghĩa (NQHNN). Như vậy từ (3.37) nhận được
các NQHNN sau đây:
Nhóm 1: SA1 → (SA1, SA1, SA2)
Nhóm 2: SA2 → (SA3)
Nhóm 3: SA3 → (SA3, SA3, SA3, SA3, SA3, SA3, SA3, SA4, SA4)
Nhóm 4: SA4 → (SA4, SA4, SA3, SA6)
Nhóm 5: SA6 → (SA6, SA7)
Nhóm 6: SA7 → (SA7, SA6)
Bước 6. Giải nghĩa đầu ra dự báo.
Giả sử số sinh viên nhập học tại năm (t-1) của chuỗi thời gian mờ F(t-1) được ngữ
nghĩa hóa theo (3.19) là SAj, khi đó đầu ra dự báo của F(t) hay số sinh viên nhập học dự báo
tại năm t được xác định theo các nguyên tắc (luật) sau đây:
1. Nếu tồn tại quan hệ 1-1 trong nhóm quan hệ ngữ nghĩa theo nhãn ngôn ngữ Aj như
sau: SAj → SAk, theo (3.19d): Nonlinear Semantization (Aj) → Nonlinear Semantization
(Ak) , thì đầu ra dự báo được tính theo (3.20d): DSAj → Nonlinear Desemantization (SAk)
trên đoạn giải nghĩa uk được chọn sao cho bao được uk và thuộc khoảng xác định của tập nền
chuỗi thời gian mờ [Dmin−D1, Dmax+D2].
2. Nếu SAk là trống, SAj → ∅, thì đầu ra dự báo được tính theo (3.20d): DSAj →
Nonlinear Desemantization (∅) trên đoạn giải nghĩa được chọn sao cho bao được uj và thuộc
khoảng xác định của tập nền chuỗi thời gian mờ [Dmin−D1, Dmax+D2].
3. Nếu tồn tại quan hệ 1-nhiều trong nhóm quan hệ ngữ nghĩa (kể cả quan hệ trùng)
theo nhãn ngôn ngữ Aj: SAj → (SAi,SAk,, SAr), theo (3.19d): NonlinearSemantization
(Aj) → (NonlinearSemantization (Ai), NonlinearSemantization (Ak), ,
NonlinearSemantization (Ar)), thì đầu ra dự báo được xác định theo (3.20d) cho từng dữ liệu
lịch sử của nhóm quan hệ ngữ nghĩa: DSAj → NonlinearDesemantization (WSAiAj * SAi+
WSAkAj * SAk++ WSArAj * SAr) trên một đoạn giải nghĩa được chọn sao cho bao được
ui, uk ur và thuộc khoảng xác định của tập nền chuỗi thời gian mờ [Dmin−D1, Dmax+D2].
Trong đó WSAiAj, WSAkAj, WSArAj là trọng số ngữ nghĩa của từng thành phần trong
NQHNN theo nhãn ngữ nghĩa Aj và được tính bằng tỷ số giữa số dữ liệu thuộc khoảng ui và
tổng số dữ liệu thuộc các khoảng ui, uk,, ur của NQHNN.
Trường Đại học Thăng Long 39
Kỷ yếu công trình khoa học 2015 - Phần I
Lưu ý rằng cách chọn đoạn giải nghĩa như trên luôn đảm bảo không phá vỡ nhóm
quan hệ mờ nhưng đồng thời có thể cho phép tính toán dự báo cho từng điểm dự báo trong
cùng nhóm quan hệ mờ.
Trong bài toán dự báo số sinh viên nhập học tại trường đại học Alabama, có thể chọn
các đoạn giải nghĩa hợp lý theo phép thử – sai với các giá trị đầu, giá trị cuối như trong Bảng
3.1 sau đây:
Bảng 3.1 Giá trị đầu và giá trị cuối của các đoạn giải nghĩa được chọn
Các điểm dự
báo
Giá trị
đầu
Giá trị
cuối
Các điểm dự
báo
Giá trị
đầu
Giá trị
cuối
1 ( 1972 ) 13000 17000 12 ( 1983 ) 14000 18000
2 ( 1973 ) 13000 18000 13 ( 1984 ) 14000 17000
3 ( 1974 ) 13000 20000 14 ( 1985 ) 14000 17000
4 ( 1975 ) 15000 16000 15 ( 1986 ) 15000 18000
5 ( 1976 ) 14000 17000 16 ( 1987 ) 15000 19000
6 ( 1977 ) 14000 18000 17 ( 1988 ) 15000 20000
7 (1978 ) 15000 18000 18 ( 1989 ) 16000 20000
8 ( 1979 ) 15000 19000 19 ( 1990 ) 17000 20000
9 ( 1980 ) 15000 19000 20 ( 1991 ) 17000 20000
10 ( 1981 ) 14000 19000 21 ( 1992 ) 15000 20000
11 ( 1982 ) 13000 18000
Ví dụ tính toán dự báo cho năm 1972 với θ = 0.5, α = 0.5, sp = 0.3 và dp = - 0.2:
Thực hiện các bước 1, 2, 3 và 4 bước như ở trên, sau đó tính toán ngữ nghĩa cho nhóm
1 tại bước 5 với NQHNN SA1 → (SA1, SA1, SA2) như sau:
Theo Bảng 3.2: Nhóm 1 có NQHNN thuộc các khoảng u1 và u2. Số dữ liệu thuộc
khoảng u1 gồm 3 giá trị: 13055, 13563 và 13867 nhưng trùng nhau 2 lần. Do đó số dữ liệu
thuộc khoảng u1 là (3*2 = 6). Số dữ liệu thuộc khoảng u2 gồm 1 giá trị: 14696. Như vậy tổng
số dữ liệu thuộc các khoảng u1, u2 của nhóm 1 là (3*2+1) = 7 và trọng số ngữ nghĩa của SA1
theo nhãn ngữ nghĩa A1 là WSA1A1 = 3 / (3*2+1) = 3/7. Tương tự tính được trọng số ngữ
nghĩa của SA2 theo nhãn ngữ nghĩa A1 là WSA2A1 = 1/7. Với SA1 = 0.125, SA2 = 0.25,
ngữ nghĩa của nhóm 1 là:
(SA1, SA1, SA2) = WSA1A1*SA1 + WSA1A1*SA1 + WSA2A1*SA2
= (3/7)*0.125 + (3/7)*0.125 + (1/7)*0.25 = 0.143.
Đoạn giải nghĩa dự báo được chọn cho năm 1972 theo Bảng 3.1 là [13000 – 17000].
Trước hết tinh toán giá trị giải nghĩa tuyến tính cho phép ngữ nghĩa hóa phi tuyến theo
(3.20d1) với sp=0.3:
Trường Đại học Thăng Long 40
Kỷ yếu công trình khoa học 2015 - Phần I
Denormalization (f(xs,sp))=f(0.143,0.3)=(0.3*0.143*(1-0.143)+0.143)*(17000-13000)
+ 13000 = 13719.
Tiếp tục tính giá trị giải nghĩa phi tuyến cho phép ngữ nghĩa hóa phi tuyến theo
(3.20d) với dp = -0.2:
Nonlinear Denormalization (f(xs,sp )) = g(13719,-0.2) = (-0.2)*(13719-
13000)*(17000-13719) / (17000-13000) + 13719 = 13600.
Như vậy, giá trị dự báo cho năm 1972 theo (3.20d) là:
DSA1 → Nonlinear DeNormalization (f(xs,sp )) = g(13719,-0.2) = 13600
Bằng cách tương tự có thể tính toán dự báo cho các năm 1973, 1974 để nhận được
các giá trị dự báo cụ thể cho năm 1973, 1974, , 1992. Như vậy với số sinh viên nhập học từ
1971 đến 1992, trên cơ sở 6 bước theo tiếp cận ĐSGT, xây dựng được mô hình dự báo cho
năm 1971 → 1972 , 1972 → 1973, .. , 1991 → 1992.
Chương trình tính toán trên cơ sở sử dụng MATLAB R2013a. Kết quả của mô hình dự
báo sử dụng ĐSGT được mô tả trong Bảng 3.2. để so sánh với các kết quả của một số mô
hình dự báo khác hiện có với cùng 7 khoảng chia.
Trong trường hợp phép ngữ nghĩa hóa phi tuyến và phép giải nghĩa phi tuyến với sp =
0.3 và dp = - 0.2, kết quả tính toán nhận được MSE = 65020.
Bảng 3.2: So sánh các phương pháp dự báo với 7 khoảng chia
Năm
Số sinh viên
nhập học
Phương
pháp Chen
[4]
Phương
pháp Lee
[9]
Phương
pháp
ĐSGT
1971 13055
1972 13563 14000 13833 13600
1973 13867 14000 13833 13750
1974 14696 14000 13833 14050
1975 15460 15500 15500 15396
1976 15311 16000 15722 15232
1977 15603 16000 15722 15642
1978 15861 16000 15722 16232
1979 16807 16000 15722 16643
1980 16919 16833 16750 17027
1981 16388 16833 16750 16533
1982 15433 16833 16750 15533
1983 15497 16000 15722 15642
Trường Đại học Thăng Long 41
Kỷ yếu công trình khoa học 2015 - Phần I
1984 15145 16000 15722 15232
1985 15163 16000 15722 15232
1986 15984 16000 15722 16232
1987 16859 16000 15722 16643
1988 18150 16833 16750 17534
1989 18970 19000 19000 19288
1990 19328 19000 19000 19466
1991 19337 19000 19000 19466
1992 18876 19000 19000 19111
MSE 407507 397537 65020
4. MÔ HÌNH DỰ BÁO TỐI ƯU THEO TIẾP CẬN ĐSGT
Vấn đề dự báo tối ưu chuỗi thời gian mờ theo nghĩa cực tiểu sai số trung bình bình
phương MSE có thể được thực hiện trên cơ sở 46 tham số như sau: tham số sp của phép ngữ
nghĩa hóa (3.19d), tham số dp của phép giải nghĩa (3.20d) , 21 tham số giá trị đầu, 21 giá trị
cuối của đoạn giải nghĩa tương ứng với 21 điểm dự báo và 2 tham số θ, α của ĐSGT.
Chương trình tính toán trên cơ sở sử dụng phần mềm tối ưu hóa GA của MATLAB
R2013a. Kết quả của mô hình dự báo dựa trên ĐSGT với các tham số θ, α, sp, dp và 42 các
giá trị đầu, giá trị cuối của đoạn giải nghĩa được tìm tối ưu theo nghĩa cực tiểu hàm MSE và
kết quả được mô tả trong Bảng 4.1, trong đó MSE có dạng:
MSE = ∑
=
−
21
1
21/))((
i
SSVNHDBiSSVNHTTi ( 4.1 )
Ở đây: MSE (Mean Square Error) là sai số trung bình bình phương;
SSVNHTTi là số sinh viên nhập học thực tế năm i;
SSVNHDBi là số sinh viên nhập học dự báo năm i.
Bảng 4.1 Kết quả tính toán dự báo tối ưu số sinh viên nhập học tại trường đại học
Alabama từ 1971 đến 1992 theo tiếp cận ĐSGT
Bộ tham số tối ưu nhận được: θ* = 0.317; α* =0.382; sp* = 0.375 và dp* = 0.418 với
MSE= 35718
Năm Số sinh viên
nhập học
thực tế
Số sinh
viên nhập
học dự
báo
Năm Số sinh viển
nhập học
thực tế
Số sinh
viên nhập
học dự báo
1971 13055 1982 15433 16031
1972 13563 13574 1983 15497 15498
Trường Đại học Thăng Long 42
Kỷ yếu công trình khoa học 2015 - Phần I
1973 13867 13866 1084 15145 15146
1974 14696 14644 1985 15163 15164
1975 15460 15461 1986 15984 15983
1976 15311 15310 1987 16859 16858
1977 15603 15602 1988 18150 17526
1978 15861 15860 1989 18970 18971
1979 16807 16806 1990 19328 19329
1980 16919 16918 1991 19337 19338
1981 16388 16389 1992 18876 18877
Mô hình dự báo chuỗi thời gian mờ tối ưu theo tiếp cận ĐSGT ứng dụng cho bài toán
dự báo số sinh viên nhập học tại trường đại học Alabama được so sánh với các mô hình dự
báo khác theo tiếp cận mờ sử dụng bậc cao, số khoảng lớn hơn 7, được tổng hợp trong Bảng
4.2.
Bảng 4.2 So sánh các kết quả mô hình dự báo tối ưu theo tiếp cận ĐSGT và các kết
quả mô hình dự báo cải tiến khác .
Phương Pháp MSE Phương Pháp MSE
Witold Pedryczc
[23]
Tối ưu PSO (2015)
198203 (7 khoảng )
66689 (17 khoảng)
14544 (22 khoảng)
Ozdemir [12] Tối ưu
độ dài khoảng kết
hợp mạng nơron
(2012)
78073
Bai [14] bậc 2
(2011)
140676 Singh[21] bậc
3(2007)
87025
Uslu [20] tối ưu
DEA (2013)
106276 Egrioglu [13] (2010) 60714
Huarng [10] độ dài
khoảng khác nhau
hiệu quả (2001)
78792 Tiếp cận ĐSGT
sp* = 0.375
dp* = 0.418
θ* = 0.317; α*
=0.382
35718
5. KẾT LUẬN
Vấn đề dự báo chuỗi thời gian mờ trong những năm gần đây được rất nhiều chuyên gia
trên thế giới quan tâm nghiên cứu. Nhiều nghiên cứu sử dụng mô hình chuỗi thời gian mờ bậc
cao với độ dài khoảng và số lượng khoảng hợp lý đã cho kết quả dự báo số sinh viên nhập học
tại trường Đại học Alabama khá chính xác [7, 12, 13, 21] . Mô hình dự báo dựa trên ĐSGT là
Trường Đại học Thăng Long 43
Kỷ yếu công trình khoa học 2015 - Phần I
một mô hình mới, hoàn toàn khác biệt, có khả năng dự báo chuỗi thời gian mờ với độ chính
xác cao hơn so với một số mô hình dự báo hiện có. Sự khác biệt thể hiện ở phương pháp luận
khi lần đầu tiên sử dụng phép ngữ nghĩa hóa phi tuyến thay cho phép mờ hóa, nhóm quan hệ
ngữ nghĩa thay cho nhóm quan hệ mờ và phép giải nghĩa phi tuyến thay cho phép giải mờ.
Mặc dù chỉ sử dụng mô hình chuỗi thời gian mờ bậc nhất với 7 khoảng chia dữ liệu lịch sử
như mô hình dự báo đầu tiên của Chen [4], nhưng kết quả ứng dụng mô hình dự báo dựa trên
ĐSGT với sự tham số hóa các nhãn ngữ nghĩa từ (3.21) đến (3.27) của biến ngôn ngữ ( thể
hiện trong Bảng 3.3 ) đã cho thấy rõ hiệu quả dự báo tốt hơn so với một số phương pháp dự
báo cùng sử dụng 7 khoảng hiện có [4, 9]. Hơn nữa, mô hình dự báo với bộ tham số tối ưu
của ĐSGT (Bảng 4.2) cũng tốt hơn so với một số mô hình sử dụng nhiều kỹ thuật phức tạp
khác nhau như mô hình dự báo chuỗi thời gian mờ bậc cao, số khoảng chia lớn hơn 7 [13, 14,
21], hoặc một số mô hình dự báo tối ưu khác trong [10, 12, 20, 23]. Rõ ràng rằng: tính chính
xác hơn của mô hình dự báo tối ưu sai số trung bình bình phương MSE sử dụng ĐSGT so với
một số mô hình dự báo tối ưu khác được đảm bảo ở khả năng tối ưu bộ tham số của ĐSGT θ*,
α* trong sự kết hợp với các tham số mở rộng của phép ngữ nghĩa hóa phi tuyến sp* và phép
giải nghĩa phi tuyến dp* với 42 tham số của đoạn giải nghĩa trên cơ sơ sở khai thác toàn diện
và có tính hệ thống những thông tin ẩn chứa trong nhóm quan hệ ngữ nghĩa. Những kết quả
của bài báo này đã mở ra hướng nghiên cứu mới cho lĩnh vực dự báo chuỗi thời gian mờ.
6. TÀI LIỆU THAM KHẢO
[1]. Song Q, Chissom B.S. Fuzzy time series and its models. Fuzzy Sets and Syst. 54
269–277, 1993
[2]. Song Q, Chissom B.S, Forecasting enrollments with fuzzy time series – part 1.
Fuzzy Sets and Syst. 54, 1–9, 1993
[3]. Song Q, Chissom, B S, Forecasting enrollments with fuzzy time series – part 2.
Fuzzy Sets and Syst. 62, 1–8, 1994.
[4]. Chen, S.M, Forecasting Enrollments Based on Fuzzy Time Series. Fuzzy Sets and
Syst. 81, 311–319, 1996
[5]. Chen S M and Wang N Y, Fuzzy Forecasting Based on Fuzzy-Trend Logical
Relationship Groups. IEEE TRANSACTIONS ON SYSTEMS, MAN, AND
CYBERNETICS—PART B: CYBERNETICS, VOL. 40, NO. 5, 1343-1358, 2010
[6]. Chen S.M, Chen C D, Handling forecasting problems based on high-order fuzzy
logical relationships. Expert Systems with Applications 38, 3857–3864, 2011
[7]. Chen S M, Forecasting Enrollments based on High Order Fuzzy Time Series.
Cybernetics and Systems: An International Journal. 33,1-16, 2002.
[8]. Chen S.M and Chung N.Y, Forecasting enrollments using high-order fuzzy time
series and genetic algorithms, Int. Journal of Intelligent Systems 21, 485-501. 2006
[9]. Lee M H, Efendi R, Ismad Z, Modified Weighted for Enrollments Forecasting
Based on Fuzzy Time Series. MATEMATIKA, 25(1), 67-78, 2009.
[10]. Huarng K, Effective lengths of intervals to improve forecasting in fuzzy time
series. Fuzzy Sets and Systems 123 387–394, 2001.
Trường Đại học Thăng Long 44
Kỷ yếu công trình khoa học 2015 - Phần I
[11]. Nguyễn Công Điều: Một thuật toán mới cho mô hình chuỗi thời gian mờ. Tạp chí
KHOA HỌC VÀ CÔNG NGHỆ, Tâp 49, Số 4, 11-25, 2011.
[12]. Ozdemir O, Memmedli M, Optimization of Interval Length for Neural Network
Based Fuzzy Time Series. IV International Conference “Problems of Cybernetics and
Informatics”, September 12-14, 104-105, 2012
[13]. Egrioglu E, Aladag C H, Yolcu U,. Uslu V R, Basaran M A, Finding an optimal
interval length in high order fuzzy time series. Expert Systems with Applications 37 5052–
5055, 2010.
[14]. Bai E, Wong W K, Chu W C, Xia M and Pan F, A heuristic time invariant model
for fuzzy time series forecasting. Expert Systems with Applications, 38, 2701-2707, 2011.
[15]. Ho N. C. and Wechler W, Hedge algebras: An algebraic approach to structures of
sets of linguistic domains of linguistic truth variable, Fuzzy Sets and Systems, Vol. 35,3, 281-
293, 1990
[16]. Nguyen Cat Ho, Vu Nhu Lan, Le Xuan Viet, Optimal hedge-algebras-based
controller: Design and Application, Fuzzy Sets and Systems 159, 968– 989, 2008
[17]. Nguyen C.H, Huynh V.N, Pedrycz W, A Construction of Sound Semantic
Linguistic Scales Using 4-Tuple Representation of Term Semantics, Int. J. Approx. Reason 55
763–786, 2014
[18]. Dinko Vukadinović, Mateo Bašić, Cat Ho Nguyen, Nhu Lan Vu, Tien Duy
Nguyen, Hedge-Algebra-Based Voltage Controller for a Self-Excited Induction Generator,
Control Engineering Practice, 30, 78–90, 2014.
[ 19]. Hai-Le Bui , Cat-Ho Nguyen, Nhu-Lan Vu, Cong-Hung Nguyen, General
design method of hedge-algebras-based fuzzy controllers and an application for structural
active control. Applied Intelligence, Vol 43, N 2, 251-275, 2015
[20]. Uslu V R, Bas, E Yolcu U, Egrioglu E, A New Fuzzy Time Series Analysis
Approach by using Differential Evolution Algorithm and Chronologically-Determined
Weights. Vol. 2, No.1, 18-30, 2013.
[21]. Singh S R, A robust method of forecasting based on fuzzy time series.Applied
Mathematics and Computation 188, 427-484, 2007.
[22]. Hwang, J.-R., Chen, S.-M., Lee, C.-H. : Handling Forecasting problems using
fuzzy time series. Fuzzy Sets and Systems 100, 217-228, 1998.
[23]. Lua W, Chen X, Pedryczc W, Liu X, Yang J, Using interval information granules
to improve forecasting in fuzzy time series. International Journal of Approximate Reasoning,
57, 1–18, 2015.
FUZZY TIME SERIES FORECASTING BASED ON HEDGE ALGEBRAS
Tran Quang Duy, Nguyen Cong Dieu, Vu Nhu Lan
Abstract: Fuzzy time series has been firstly proposed by Song & Chissom (1993) and
widely studied for forecasting purposes now. However, the accuracy of forecasts based on the
concept of fuzzy approach of Song & Chissom is not high because of such depends on very
Trường Đại học Thăng Long 45
Kỷ yếu công trình khoa học 2015 - Phần I
many factors. Chen (1996) proposed an efficient fuzzy time series model which consists of
simple arithmetic calculations only. After that, this has been widely studied for improving
accuracy of forecasting in many applications to get better results. The hedge algebras
developed by Nguyen and Wechler (1990) was completely different from the fuzzy approach.
Fuzzy time series method generally embodies three stages such as fuzzification, determination
of fuzzy relations and defuzzification stages. In hedge algebras, instead of performing
fuzzification and defuzzification, more simple methods are adopted, termed as semantization
and desemantization, respectively. In this paper, we present a new approach using hedge
algebras to provide a computational model, which is completely different from the fuzzy
approach for fuzzy time series forecasting. The experimental results of forecasting
enrollments of students of the University of Alabama show that the model of fuzzy time series
based on hedge algebras is better than many existing models.
. Keywords: Fuzzy Sets, Fuzzy Logical Relationship Groups, Hedge Algebras, Fuzzy
Time Series Forecasting.
Trường Đại học Thăng Long 46
Các file đính kèm theo tài liệu này:
- vu_nhu_lan_5534.pdf