Thiết kế bộ điều khiển learning feedforward cho các hệ thống chuyển động điện cơ

Lời núi đầu Điều khiển chuyển động (motion control) lian quan việc sử dụng lực để điều khiển sự di chuyển của đối t-ợng điều khiển trong một hệ thống cơ vμ đ-ợc sử dụng rộng rãi trong c ̧c ứng dụng công nghiệp nh- đóng gói, in, dệt, hμn, cũng nh- nhiều ứng dụng kh ̧c. Hiện nay, phần lớn c ̧c lo1i hình điều khiển chuyển động đ-ợc thực hiện bằng c ̧ch sử dụng c ̧c động cơ điện, vμ đây chính lμ điều quan tâm chính của chúng tôi trong thiết kế. C ̧c hệ điều khiển chuyển động có thể lμ phức t1p vì có nhiều vấn đề kh ̧c nhau cần đ-ợc xem xét, ví dụ nh-: - Giảm thiểu ảnh h-ởng của nhiễu hệ thống. - Suy yếu t ̧c động xấu của nhiễu đo - Sự thay đổi thông số vμ cấu trúc không rõ của đối t-ợng điều khiển. Rất khó để tìm ra c ̧c ph-ơng ph ̧p thiết kế mμ có thể giải quyết đồng thời tất cả c ̧c vấn đề nau tran, đặc biệt đối với c ̧c ph-ơng ph ̧p điều khiển truyền thống mμ ở đó c ̧c thiết kế điều khiển lian quan tới sự th-ơng thảo giữa c ̧c mục tiau mang tính đối ng-ợc. Để kh3⁄4c phục khó kh ̈n đã nau, bộ điều khiển Learning FeedForward (LFF) sẽ đ-ợc giới thiệu trong nghian cứu nμy. Thực hiện luận văn tốt nghiệp trong khuụn khổ chương trỡnh đào tạo Thạc sỹ ngành tự động húa của trường Đại học Kỹ thuật Cụng nghiệp Thỏi Nguyờn, Tụi được giao đề tài: ’’ Thiết kế bộ điều khiển Learning FeedForward cho c ̧c hệ thống chuyển động điện cơ” Luận văn phõn tớch cỏc quỏ trỡnh động học đối tượng thụng qua mụ hỡnh toỏn học từ đú đưa ra và chứng minh tớnh phự hợp của cỏc phương ỏn điều khiển, cuối cựng là tiến kiểm chứng trờn phần mềm mụ phỏng 20-sim. Luận văn được trỡnh bày trong 4 chương: Chương 1: GIỚI THIỆU Tổng quan về Learning control Chương 2: PHÂN TÍCH ĐỘ ỔN ĐỊNH CỦA HỆ THỐNG LFFC PHỤ THUỘC THỜI GIAN Trong chương này đề cập đến bộ điều khiển LFFC phụ thuộc thời gian và phõn tớch tớnh ổn định của hệ thống phụ thuộc vào thời gian. Từ đú tỡm ra cụng thức tớnh giỏ trị nhỏ nhất của độ rộng mạng B-Spline Chương 3: THIẾT KẾ ỨNG DỤNG Trong cỏc chương trước, một số vấn đề về LFFC đó được đề cập đến. Ở chương này sẽ sử dụng cỏc kiến thức cú được nhằm thực hiện thiết kế một bộ LFFC thực tế. Chương 4: KẾT LUẬN MỤC LỤC Chương 1: Giới thiệu 1.1. Tổng quan về Learning Control (LC) .1 1.2. Learning Control (LC) là gì .2 1.3. Phản hồi sai số tự học . . 7 1.3.1. Một số ví dụ về ma sát độc lập 8 1.4. Điều khiển truyền thẳng tự học . 13 1.4.1. Đầu vào của mạng BSN .14 1.4.2. Sự phân bố B-Spline trên đầu vào của mạng BSN 14 1.4.3. Sự lựa chọn các cơ cấu học. 15 1.4.4. Sự lựa chọn tốc độ học. 15 1.5. Ứng dụng minh hoạ: Hệ thống động cơ chyển động tuyến tính .18 1.6. Bố cục luận văn 21 Chương 2: Các chuyển động lặp 22 2.1. Giới thiệu 22 2.2. Các giả định 22 2 3. Độ rộng của nội suy B-Spline .27 Thuật toán 2.2.1. (Tính toán giá trị ổn định nhỏ nhất của d dựa trên mô hình chi tiết của hệ thống điều khiển) .27 Chương 3: Thiết kế ứng dụng 34 3.1. Giới thiệu 34 3.1.1. Bộ điều khiển phản hồi .34 3.1.2.Các đầu vào của khâu truyền thẳng 34 3.1.3.Cấu trúc của khâu truyền thẳng .35 3.1.4. Phân bố B-Spline .35 3.1.5. Tỷ lệ học .35 3.1.6. Luyện các chuyển động 36 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên Trung tâm Học liệu | Kết nối tri thức nhân loại 3.2. LiMMS .36 3.2.1. Thiết lập 36 3.2.2. Thủ tụ thiết kế một hệ thống Time-indexed LFFC .37 3.2.3. Các thí nghiệm kiểm chứng cho hệ thống Time-indexed LFFC .40 3.2.4. Thiết kế một LFFC tối giản .48 3.2.5. Kết luận 62 3.3. Kết quả mô phỏng bằng phần mềm 20-sim .63 3.3.1. Mạng FeedBack .64 3.3.2. LFFC khi có ViscouNeural .65 3.3.3. LFFC khi có CoulombNeural và ViscouNeural .66 3.3.4. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural 68 3.3.5. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural, InertialNeural 69 Chương 4: Kết luận .71

82 trang | Chia sẻ: banmai | Lượt xem: 2506 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Thiết kế bộ điều khiển learning feedforward cho các hệ thống chuyển động điện cơ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ngoài các hiện tượng quan tâm rong phần lựa chọn cấu trúc của BSN. 3.3. Kết quả mô phỏng bằng phần mềm 20-sim. Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 63 3.3.1. Bộ điều khiển feedback. a. Sơ đồ mô phỏng : Hình 3.31: Sơ đồ mô phỏng hệ thống khi chỉ có FeedBack. b.Kết quả mô phỏng: Learning feed-forward control -0.05 0 0.05 0.1 Reference [m] -0.05 0 0.05 0.1 ProcessOutput [m] 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 64 Hình 3.32: Kết quả mô phỏng hệ thống khi chỉ có Feedback tham gia Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 65 3.3.2. LFFC khi có ViscouNeural. a. Sơ đồ mô phỏng : Hình 3.33: Sơ đồ mô phỏng b, So sánh kết quả mô phỏng. Hình 3.34: So sánh kết quả mô phỏng lực Viscou tạo ra và lực Viscou thật. a, Lực Viscou được tạo ra a, b, Learning feed-forward control -0.6 -0.4 -0.2 0 0.2 0.4 Estimated viscous force [N] 50 55 60 65 70 time {s} -0.6 -0.4 -0.2 0 0.2 0.4 0.6 True viscous force [N] {m/s} Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 66 b, Lực Viscou thật Vai trò của bù lực Viscou được thể hiện rõ ràng bằng cách so sánh kết quả mô phỏng như được chỉ ra trong Hình 3.35a và Hình 3.35b. Khi BSN Viscou được sử dụng, tín hiệu error được giảm đáng kể. Hình 3.35: So sánh kết quả mô phỏng error trước và sau khi có bù lực Viscou. a, Khi chỉ có Feedback b, Khi có thêm bù lực Viscou 3.3.3. LFFC khi có CoulombNeural và ViscouNeural. a. Sơ đồ mô phỏng : Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Le ning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] a, b, Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 67 Hình 3.36: Sơ đồ mô phỏng b. So sánh kết qủa mô phỏng: Hình 3.37: So sánh kết quả mô phỏng lực Coulomb được tạo ra và lực Coulomb thật. a, Lực Coulomb thực b, Lực Coulomb được tạo ra Vai trò của CoulombNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô phỏng của tín hiệu error như được chỉ ra trong Hình 3.38a và Hình 3.38b. Hình 3.38: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù lực Coulomb. a, Khi chỉ có Feedback và NeuralViscou 0 Learning feed-forward control -0.25 -0.15 -0.05 0.05 0.15 True coulomb force [N] 16 17 18 19 20 21 22 time {s} -2 -1 0 1 2 Estimated coulomb force [N] {N} 0. 4 0.2 0 -0.2 0 -0.4 -0.4 -0.2 0 0.2 0.4 a, b, Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Le ning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 68 b, Khi có thêm bù lực Coulomb Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 69 3.3.4. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural. a. Sơ đồ mô phỏng : Hình 3.39: Sơ đồ mô phỏng b. So sánh kết quá mô phỏng: Hình 3.40: So sánh kết quả mô phỏng tín hiệu lực Cogging được tạo ra và lực Cogging thật. a, Lực Cogging thật b, Lực Cogging được tạo ra Learning feed-forward control -0.3 -0.2 -0.1 0 0.1 0.2 True cogging force [N] 93 94 95 96 97 98 99 100 time {s} -0.2 -0.1 0 0.1 0.2 Estimated cogging force [N] a, b, Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 70 Vai trò của CoggingNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô phỏng của tín hiệu error như được chỉ ra trong Hình 3.41a và Hình 3.41b. Hình 3.41: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù lực Cogging. a, Khi chỉ có Feedback và ViscouNeural, CoulombNeural. b, Khi có thêm tín hiệu bù lực Cogging. 3.3.5. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural, InertialNeural. a. Sơ đồ mô phỏng : Hình 3.42: Sơ đồ mô phỏng Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Le ning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] a, b, Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 71 b. So sánh kết quá mô phỏng: Hình 3.43: So sánh kết quả mô phỏng lực Inertia được tạo ra và lực Inertia thật. a, Lực Inertia được tạo ra. b, Lực Inertia thật. Vai trò của InertiaNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô phỏng của tín hiệu error như được chỉ ra trong Hình 3.43a và Hình 3.43b. Hình 3.44: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù lực Inertia. a, Khi chỉ có Feedback và ViscouNeural, CoulombNeural, CoggingNeural b, Khi có thêm tín hiệu bù lực Inertia. Learning feed-forward control -0.6 -0.4 -0.2 0 0.2 0.4 Estimated inertia force [N] 10 15 20 25 30 time {s} -0.4 -0.2 0 0.2 0.4 0.6 True inertia force [N] {m/s} a, b, Le rning fe d-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 72 So sánh kết quả mô phỏng tín hiệu error khi bộ điều khiển chỉ có Feedback và khi có LFFC tham gia. Hình 3.45: So sánh kết quả mô phỏng tín hiệu error khi bộ điều khiển chỉ có Feedback và khi có LFFC tham gia a, Khi chỉ có Feedback b, Khi có thêm tín hiệu bù lực Viscou, lực Coulomb, lực Cogging lực Inertia Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Learning feed-forw rd control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] a, b, Chương 4: Kết luận Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 71 Chương 4: KẾT LUẬN Trong Chương 1, đưa ra khái niệm của LFFC, đó là một bộ điều khiển học có phản hồi sai số trong đó phần truyền thẳng là một mạng B-Spline (BSN). Vấn đề quan trọng là phải thiết kế phần truyền thẳng của LFFC sao cho quá trình học là hội tụ và cùng với đó là phải làm sao cho bậc của hệ thống phải được giữ ở mức tối thiểu. Đây là hai chủ đề chính được đề cập đến trong luận văn. Trong Chương 2 và 3, đề cập đến bộ điều khiển LFFC phụ thuộc thời gian, là bộ điều khiển mà thời gian chuyển động theo chu kỳ là đầu vào duy nhất của BSN. Trong trường hợp này, LFFC tương tự như điều khiển học lặp lại và điều khiển lặp lại. Do vậy, em đưa ra ý tưởng sử dụng các kết quả hội tụ của điều khiển học lặp lại và điều khiển lặp lại trong quá trình thiết lập LFFC. Trong điều khiển học lặp lại và điều khiển lặp lại phần truyền thẳng được thiết kế như một vòng lặp có nhớ. Thay vì luyện phần truyền thẳng bởi đầu ra của bộ điều khiển phản hồi, tín hiệu học có thể nhận được bằng cách lọc sai số bám nhờ một bộ lọc có khả năng học. Bộ lọc này được thiết kế dựa trên một mô hình gần đúng của hệ thống bị điều khiển. Phân tích về độ ổn định cho thấy rằng các yếu tố động học tần số cao không mô hình hóa được sẽ làm cho tín hiệu truyền thẳng của điều khiển học lặp lại và RC không hội tụ. Quá trình hội tụ có thể đạt được bằng việc điều chỉnh vòng lặp có nhớ theo cách thức sao cho các thành phần tần số làm cho mô hình của hệ thống bị điều khiển (kéo theo bộ lọc có khả năng học) trở nên không chính xác sẽ bị loại bỏ. LFFC phụ thuộc thời gian có thể được xem như là một loại điều khiển học lặp lại / điều khiển lặp lại trong đó quá trình học được ổn định hóa nhờ thay thế vòng lặp có nhớ bởi một BSN và phần điều khiển phản hồi được sử dụng như là một bộ lọc có học. Các thành phần tần số trong quan hệ vào ra của một BSN phụ thuộc vào độ rộng của miền xác định của B-Spline. Chọn độ rộng lớn sẽ ảnh hưởng đến tín hiệu truyền thẳng tần số thấp, trong khi đó độ rộng nhỏ sẽ tác động đến tín hiệu truyền thẳng tần số cao. Do vậy, các kết quả thu được từ điều khiển Chương 4: Kết luận Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 72 học lặp lại và điều khiển lặp lại cho ta thấy rằng quá trình học có thể được ổn định bằng cách chọn độ rộng của miền xác định của B-spline sao cho BSN không thể xấp xỉ thành phần tần số cao của tín hiệu học. Nhờ các giả định nghiêm ngặt (một trong số đó là hệ thống điều khiển phải là SISO LTI-Hệ thống tuyến tính bất biến một đầu vào một đầu ra) , chúng ta có thể mô tả một cách định lượng : chúng ta đưa ra các điều kiện ổn định cho độ rộng tối thiểu của miền xác định của các B-Spline, dmin, và cho tỷ lệ học tối đa. Các yếu tố ổn định này được kiểm chứng nhờ các quá trình mô phỏng. Trong luận văn này, LFFC phụ thuộc thời gian được áp dụng cho LiMMS. Do LiMMS là hệ thống phi tuyến, nó không thỏa mãn giả thiết cho việc phân tích sự ổn định. Bất chấp điều này, các kết quả trong quá trình mô phỏng cho thấy giá trị dmin là chính xác và tỷ lệ học tối đa cũng ổn định. Đối với các chuyển động đặt trước ngẫu nhiên, LFFC phụ thời gian không thể áp dụng được. Thay vào đó phải sử dụng hệ thống LFFC phụ thuộc quỹ đạo, có nghĩa là tín hiệu đặt trước cùng với đạo hàm hoặc tích phân của nó được sử dụng như là các đầu vào của phần truyền thẳng. Chúng ta không thể đưa ra các điều kiện ổn định cho quá trình thiết kế các tham số của một BSN trong LFFC phụ thuộc quỹ đạo. Trong một số trường hợp (ví dụ như khi vận tốc đặt trước là không đổi), các điều kiện ổn định của LFFC phụ thuộc thời gian có thể được chuyển thành các điều kiện ổn định cho LFFC phụ thuộc quỹ đạo. Về bản chất có thể nói rằng miền xác định của các B-Spline (đa chiều) pahỉ chứ tối thiểu dmin [s] của chuyển động đặt trước. Thiết kế một phân bố B-Spline thỏa mãn điều kiện này là rất khó và sẽ dần đến độ rộng B- Spline lớn, điều này làm cho vấn đề trở nên không hấp dẫn. Do vậy, một cách tiếp cận khác được xem xét. Chúng ta giả sử chọn một phân bố B-Spline mà không quan tâm đến các điều kiện ổn định và thêm một tiêu chuẩn ổn định hóa vào LFFC để làm cho quá trình học hội tụ. Một trong những sự lựa chọn để thực hiện vấn để này là tối thiểu hóa hàm lượng giá nhờ cơ chế Chương 4: Kết luận Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 73 học. Đây là một kỹ thuật nổi tiếng trong mô hình mạng mờ nơron và được gọi là kỹ thuật tối giản. Tuy nhiên, thực tế cho thấy rất khó để chọn các tham số của cơ chế học tối giản sao cho LFFC hội tụ. Do đó, một sự lựa chọn khác được đưa ra, lại bắt nguồn từ điều khiển học lặp lại. Việc tối giản được thực hiện nhờ việc lọc tín hiệu học của LFFC thay vì thay đổi cơ chế học. Ý tưởng chủ đạo là quá trình học hội tụ khi tín hiệu học được đảm bảo sao cho tất cả các thành phần tần số cao trên dmin -1[Hz] bị loại bỏ. Điều này (ví dụ) có thể đạt được nhờ kỹ thuật lọc với một BSN phụ thuộc thời gian phù hợp. Các kết quả mô phỏng xác nhận rằng bằng cách thêm một bộ lọc như vậy, sự hội tụ của LFFC phụ thuộc quỹ đạo có thể đạt được. Tuy nhiên, vẫn chưa có các phân tích khoa học nhằm giải thích được các kết quả quan sát. Các đầu vào đặc biệt nào sẽ được lựa chọn trong trường hợp một LFFC phụ thuộc quỹ đạo được xây dựng dựa trên cơ sở biểu diễn không gian trạng thái (chính xác về cấu trúc) của một hệ động học. chúng ta đã chỉ ra rằng một đối tượng chỉ có thể được điều khiển nhờ một LFFC phụ thuộc quỹ đạo khi biểu diễn không gian trang thái thảo mãn một số điều kiện. Do vậy, LiMMS có thể được điều khiển bởi LFFC phụ thuộc quỹ đạo. Khi các đầu vào của BSN được chọn thẳng dựa trên cơ sở của mô hình đối tượng sẽ cho ta một BSN đa chiều. Điều này dẫn đến vấn đề liên quan đến bậc của hệ thống. Mô hình mờ nơron cho thấy vấn đề này có thể được giải quyết bằng cách chia BSN đa chiều thành vài BSN có số chiều nhỏ hơn. Điều này được thực hiện dựa trên một cơ sở được gọi là biểu diễn phân ly các biến của một hàm số. Các kết quả lựa chọ BSN được biết đến như là một cấu trúc mạng suy biến. Cùng với vấn đề này, một LFFC phụ thuộc quỹ đạo được gọi là suy biến khi nó bao gồm nhiều khâu truyền thẳng thay vì một. Một cách thứ 2 (kém hiệu quả hơn) nhằm giảm thiểu bậc cảu hệ thống là chọn các phân bố B-Spline với càng ít B-Spline càng tốt. Có một vài phương pháp được xem xét khi thiết kế một LFFC suy biến. Chương 4: Kết luận Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 74 Luyện một LFFC suy biến không pahỉ là quá trình truyền thẳng. Khi tất cả các BSN được luyện đồng thời, không có gì đảm bảo rằng mỗi BSN sẽ học được đúng tín hiệu truyền thẳng của nó. Do vậy, chúng ta đưa ra một phương pháp luyện một LFFC hiệu quả, có nghĩa là bằng cách chọn một chuỗi các chuyển động luyện mạng nhờ đó các BSN được luyện một cách chính xác. Tuy nhiên, phương pháp này trong thực tế được gọi là phương pháp luyện mạng có chiến lược vẫn khá chủ quan, dựa trên kinh nghiệm. Các thủ tục thiết kế cho LFFC được tính toán và áp dụng trong các thí nghiệm thực tế cho điều khiển LiMMS. Trong đó, LiMMS được điều khiển bởi một LFFC phụ thuộc thời gian cũng như bởi một LFFC. Trong một loạt các thí nghiệm ban đầu sử dụng LFFC phụ thuộc thời gian, các điều kiện ổn định được kiểm chứng. Kết quả của các thí nghiệm này tương tự như kết quả trong phần mô phỏng điều này có nghĩa là giá trị của dmin là chính xác trong khi tỷ lệ học cực đại khá ổn định. Tiếp đó, phân bố B-Spline của LFFC phụ thuộc thời gian được tối ưu. Cuối cùng một LFFC suy biến được thiết kế và kiểm chứng. Phần truyền thẳng bao gồm 3 BSN bù quán tính, ma sát và cogging. Sau khi tiến hành các thí nghiệm luyện mạng có chiến lược, LFFC suy biến đạt được một sai số bám nhỏ đối với một dải lớn các chuyển động tham chiếu. Tuy nhiên, đối với các chuyển động lặp lại thì LFFC phụ thuộc thời gian là ưu việt hơn cả. Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 1 Chương 1: GIỚI THIỆU 1.1. Tổng quan về Learning control (LC). Một trong số các công cụ cạnh tranh mà các hãng sản xuất tuỳ ý sử dụng đó là chất lượng của sản phẩm. Đặc biệt là trong các thị trường có liên quan đến các sản phẩm công nghệ cao. Đó là một trong những nhân tố quan trọng mang tính sống còn để tạo ra các sản phẩm có chất lượng tốt hơn. Điều này được nhìn nhận trong thị trường đối với các sản phẩm mà chúng ta sẽ xem xét trong luận văn này, ví dụ như các hệ thống chuyển động cơ điện tử. Theo quan điểm cơ điện tử, chất lượng của các hệ thống cơ điện tử có thể được cải tiến bằng việc thay đổi thiết kế cơ khí và bộ điều khiển. Ví dụ như khi nghiên cứu các cánh tay robot, nơi mà chuyển động chính xác phụ thuộc vào độ cứng và quán tính của hệ thống. Nếu cánh tay không đạt được các yêu cầu nhất định, độ cứng của nó có thể được tăng lên hoặc quán tính của nó có thể được giảm bớt bằng cách thay đổi kết cấu cơ khí hoặc bằng việc ứng dụng vật liệu mới. Việc thay đổi bộ điều khiển có thể được thực hiện hoặc bằng cách thay đổi thông số của bộ điều khiển đang tồn tại hoặc bằng cách thiết kế bộ điều khiển mới. Khi một bộ điều khiển được cải tiến, chỉ đơn thuần là yêu cầu thay đổi phần mềm và trong một số trường hợp là thêm các sensor cách đánh giá này tương đối dễ dàng thực hiện được, khi đem so sánh với các cấu trúc tương ứng. Trong luận văn này chúng ta sẽ tập trung vào việc nâng cao chất lượng của hệ thống bằng bộ điều khiển. Việc thiết kế một bộ điều khiển nói chung thường dựa trên một mô hình của một đối tượng. Mô hình đối tượng càng chính xác bao nhiêu thì việc thiết kế bộ điều khiển càng hiệu quả bấy nhiêu. Khi mô hình hoá đối tượng, các vấn đề sau có thể gặp phải: 1. Hệ thống quá phức tạp để có thể hiểu hoặc trình bày một cách đơn giản. 2. Mô hình quá khó hoặc quá đắt để đánh giá. Một số đặc tính của một số hiệu ứng Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 2 (phi tuyến) khó có thể đạt được, ví dụ như ma sát… 3. Đối tượng có thể chịu ảnh hưởng lớn của nhiễu tác động từ môi trường, điều này khó dự đoán trước được. 4. Các thông số của đối tượng có thể biến đổi theo thời gian. Bộ điều khiển thích nghi có thể là một giải pháp khi cấu trúc của mô hình động học của đối tượng và nhiễu mô hình tác động lên nó được biết trước trong khi các giá trị của các thông số thì không thể xác định được. Khi mô hình không có giá trị hoặc có nhiều thông số không xác định được thì lúc đó điều khiển học sẽ được xét đến. 1,2 Learning Control (LC) là gì ? Các bộ LC thường được hình dung gần giống như là hệ thống điều khiển của con người và do đó nó có các thuộc tính giống với con người. Trong luận văn này không nghiên cứu các bộ LC theo quan điểm sinh học, nhưng đồng ý với một số định nghĩa sau: Định nghĩa 1.1 (LC) Một bộ LC là một hệ thống điều khiển bao gồm trong đó 1 hàm xấp xỉ các ánh xạ đầu vào - đầu ra tương ứng trong suốt quá trình điều khiển mà một hoạt động mong muốn của hệ thống điều khiển đạt được. Định nghĩa 1.2 (Hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xác định bởi một hàm đươc lựa chọn  .,F , với các véc tơ thông số  được lựa chọn để hàm  .F được xấp xỉ “tốt nhất”. Lưu ý 1.1 (Điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều khiển thích nghi có thể được xem xét giống như là một dạng của LC trong đó một hàm xấp xỉ được sử dụng có thể chỉ xấp xỉ một lớp giới hạn của các hàm mục tiêu. Nói chung, một bộ LC sẽ bao gồm một hàm xấp xỉ cho một lớp đối tượng có nhiều hàm mục tiêu hơn. Một biến mở rộng của các hàm xấp xỉ có thể được sử dụng như mạng nơron, mạng Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 3 mờ-nơron (cũng được biết đến với tên các bộ điều khiển logic mờ thích nghi)..v..v.. Nói một cách sơ bộ, các bộ hàm xấp xỉ có thể được sử dụng theo 2 cách: Trước hết, hàm xấp xỉ có thể được sử dụng để tạo (một phần) tín hiệu điều khiển. Việc học được thay thế bởi việc thích nghi vectơ thông số của hàm xấp xỉ theo cách mà một số các hàm giá trị chứa đựng sai lệch điều khiển là cực tiểu. Bộ điều khiển này được gọi là LC trực tiếp. Thứ hai, Hàm xấp xỉ có thể được sử dụng để học một mô hình đối tượng tương ứng được kiểm soát ví dụ như là để làm giảm hàm giá trị của sai số dự báo. Dựa trên cơ sở của mô hình đã được học một bộ điều khiển được xây dựng, Bộ điều khiển này được gọi là LC gián tiếp. Từ khi bộ LC đầu tiên được phát triển vào năm (1963) cho tới nay, lĩnh vực LC đã và đang phát triển rất rộng rãi. Rất nhiều các cấu trúc của bộ điều khiển khác nhau đã được đề xuất và các thuộc tính của chúng (như tính ổn định và tốc độ hội tụ đã được phân tích cả trong thực tế và lý thuyết. Tuy nhiên, mặc dù tất cả chúng đều được nghiên cứu nhưng chỉ có một số bộ LC được ứng dụng trong các sản phẩm mang tính thương mại. Có thể vì những lí do sau đây: Việc chứng minh sự ổn định được đánh giá cao. Phần lớn các nghiên cứu lý thuyết của các bộ LC được tập trung vào tính ổn định. Tuy nhiên, một bộ LC ổn định cũng không cần thiết mang lại một đáp ứng ngắn hạn học tốt …….Hoạt động của bộ LC đối với một con robot đã được quan sát bằng cách mô phỏng. Sau khi thực hiện với chuyển động 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8. Khi tiếp tục tự học, sai số hiệu chỉnh đã tăng lên đến hệ số 1051 tại bước lặp thứ 62.000 và cuối cùng giảm xuống hệ số 10-18 tại bước lặp thứ 250.000. Như vậy, mặc dù thực tế cuối cùng sai số hiệu chỉnh nhỏ đã đạt được nhưng bộ LC không có giá trị thực nghiệm vì nó có dải sai số hiệu chỉnh rất rộng ở giữa. Không nên quá quan tâm tới sai số hiệu chỉnh điểm 0. Một số LC cố gắng đạt Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 4 được sai số hiệu chỉnh điểm 0. Tuy nhiên, điều này yêu cầu có những tín hiệu điều khiển lớn ở những tần số trên băng thông hệ thống, các tần số này có thể gây nguy hiểm cho các cơ cấu chấp hành và nói chung là không đạt được như mong muốn. Loại sai số của hàm xấp xỉ. Trong đại đa số các bộ LC, hàm xấp xỉ được thực hiện với vai trò như một mạng nơron (Multi Layer Perceptron MLP). Như chúng tôi sẽ bàn tới ở dưới đây, loại mạng nơron này không tương thích một cách đặc biệt cho việc điều khiển. Trên cơ sở những suy xét này, chúng ta có thể đưa ra một số các thuộc tính sau mà một bộ LC nên có để để trở thành một mặt hàng được ưa chuộng về mặt thương mại: Dễ dàng sử dụng trong một hệ thống điều khiển có sẵn. Điều này có nghĩa là khi có một đáp ứng ngắn hạn học tốt, thì hiệu suất cực tiểu được bảo đảm. Ví dụ như là trong một bộ điều khiển hiện nay. Thậm chí trong suốt quá trình huấn luyện đối tượng vẫn có thể được duy trì trong quá trình vận hành, mà không gây ra những tổn thất của quá trình sản suất. Có khả năng sử dụng những kiến thức dự đoán của đối tượng. Nói chung các nhà thiết kế và/hoặc người vận hành có một số kiến thức về đối tượng ví dụ như trong cấu trúc của mô hình toán học (đơn giản) dưới dạng các hàm, một giản đồ Bode của đối tượng hoặc một mô tả dưới dạng biến ngôn ngữ của hành vi đối tượng. Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ điều khiển, để chọn các thông số của bộ điều khiển hợp lý và để tăng tốc độ học. Hàm xấp xỉ nên phù hợp cho việc điều khiển. Điều này có nghĩa rằng: Không gian nhớ cần thiết cho việc thực hiên nên nhỏ. Trong thực tế, bộ điều khiển được thực hiên bằng phần mềm được gắn vào máy tính. Dung lượng bộ nhớ là có hạn. Do đó, số lượng các thông số của hàm xấp xỉ mà yêu cầu phải xấp xỉ tín hiệu điều khiển không thể quá rộng. Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 5 Việc tính toán đầu ra của hàm xấp xỉ và sự tương thích của quan hệ vào / ra phải được thực hiện một cách nhanh chóng. Trong môi trường thời gian thực, trong một khoảng thời gian mẫu, các thông số của hàm xấp xỉ phải tương ứng và đầu ra được tính. Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ và cho phép thời gian tính toán là rất ít. Các hàm xấp xỉ mà bao gồm một lượng lớn các tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển. Cơ chế học nên hội tụ nhanh. Để giữ được lượng thời gian trong đó quá trình vận hành của hệ thống được điều khiển là cận tối ưu tới mức tối thiểu, cơ chế học nên hội tụ nhanh. Cơ chế học không nên bị tối thiểu cục bộ, khi bị lưu giữ trong mức tối thiểu cục bộ, Thì cơ chế học cho rằng các giá trị đạt được của các thông số của hàm xấp xỉ, được biểu thị bởi loc , sinh ra sai số xấp xỉ cực tiểu, được biểu thị bởi E( loc ). Mặc dù locglob   tồn tại, làm cho )()( locglob EE   . Trong ảnh 1.1 một ví dụ một chiều của hiện tường như vậy được giới thiệu. Ở mức tối thiểu cục bộ, loc  , độ dốc của sai số xấp xỉ bằng 0. Cơ cấu học mà sử chỉ sử dụng độ dốc của sai số xấp xỉ thì không thể thoát khỏi mức tối thiểu cục bộ. Hình 1.1 Cực tiểu cục bộ trong kỹ thuật học Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khó để huấn luyện LC để thu được hiệu quả cao. E(ω) Cùc tiÓu côc bé Cùc tiÓu toµn bé ωloc ωglob w Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 6 Quan hệ vào/ ra phải tương thích một cách cục bộ. Trong một số hàm xấp xỉ, quan hệ vào/ ra này là tương thích toàn cục. Điều này có nghĩa là nếu giá trị của một trong các thông số của hàm xấp xỉ được tương thích, thì quan hệ vào /ra trên toàn bộ phạm vi đầu vào bị thay đổi. Xét một bộ LC được huấn luyện để thực hiện một số chuyển động. Khi bộ LC được huấn luyện để thực hiện một chuyển động mới, điều này liên quan tới việc tương ứng các thông số của hàm xấp xỉ. Bởi vì mối quan hệ vào ra được tương thích toàn cục nên các tín hiệu điều khiển học trước đó bị thay đổi có thể gây ra nhưng tổn thất trong quá trình làm việc. Do đó điều mong đợi ở đây là mối quan hệ vào ra của hàm xấp xỉ được tương thích một cách cục bộ. Trong trường hợp này, việc học 1 chuyển động mới sẽ không làm thay đổi các tín hiệu đã được học trước đó. Hàm xấp xỉ có khả năng tự khái quát hoá tốt. Khả năng tự khái quát hoá là khả năng tạo ra một đầu ra nhạy cho một đầu vào không được thể hiện trong quá trình huấn luyện nhưng nó tương tự như các huấn luyện mẫu. Khi hàm xấp xỉ có khả năng khái quát hoá tốt, bộ LC cũng sẽ thu được một hiệu quả bám cao cho các chuyển động tương tự các chuyển động được huấn luyện. Vì vậy nó đủ để huấn luyện LC với một lượng nhỏ các đặc tính chuyển động huấn luyện. Khi bộ xấp xỉ không có khả năng tự khái quát hoá tốt, bộ LC phải được huấn luyện cho mỗi chuyển động quan trọng, nó tạo ra một quá trình huấn luyện mở rộng . Sự mềm mại của giá trị xấp xỉ nên dễ dàng điều khiển. Như nói ở phần trước đây, bộ LC không chỉ thu được sai số bằng không đối với một vài tần số, khi tín hiệu điều khiển có tần số cao sẽ không mong muốn. Người sử dụng phải có khả năng quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ. Đáp ứng ngắn hạn là học tốt. Đáp ứng ngắn hạn của bộ LC nên là loại đáp ứng mà có sai số bám dần hội tụ về giá trị mong muốn. Việc tăng sai số bám trong pha trung gian của quá trình học có thể làm hỏng đối tượng, hơn thế nữa, đây là trường Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 7 hợp quá trình làm việc tối thiểu có thể không còn được bảo đảm khi bộ điều khiển được sử dụng như một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn. Sự ổn định lâu dài cần phải được bảo đảm. Việc tự học có thể được thực hiện một cách liên tục hoặc được thực hiện trước khi vận hành. Việc học liên tục được yêu cầu khi các thông số của đối tượng thay đổi trong suốt quá trình vận hành. Ví dụ, do hao mòn hay chịu ảnh hưởng của môi trường. Trong trường hợp này, một bộ điều khiển phải có khả năng đảm bảo việc học ổn định bất chấp các điều kiện vận hành thay đổi như thế nào. 1.3. Bộ điều khiển học sai số phản hồi Một bộ LC thú vị cho các cánh tay robot mà phải bám một cách ngẫu nhiên theo các đường dẫn. Nói chung bộ điều khiển này được biết đến với cái tên là bộ điều khiển học sai số phản hồi: Bộ điều khiển (Feedback Error Learning FEL). Hệ thống LC bao gồm 2 phần: Bộ điều khiển Feef-forward được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ uF = F(r). Một bộ điều khiển Feed-forward thông thường có thể được sử dụng để bù thêm cho các hệ thống động học và theo cách này sẽ thu được độ bám chính xác cao. Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo F = P-1, thì đầu ra của đối tượng, y, sẽ bằng tín hiệu đặt , r. Hình 1.2 Bộ điều khiển FEL r - Hµm xÊp xØ C + + + UF P y r (n) r . . . . . Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 8 Đối tượng P, luôn chịu sự tác động của nhiễu. Các loại nhiễu ở bao gồm cả nhiễu ngẫu nhiên và nhiễu có bản chất tái sinh. Những nhiễu tái sinh tái diễn giống nhau khi một chuyển động cụ thể được lặp lại. Điều này có nghĩa rằng chúng có thể được xem xét như một hàm trạng thái của đối tượng, x, xem hình 1.3. Hình 1.3 đối tượng và nhiễu phát sinh 1.3.1. Một ví dụ về vị trí ma sát độc lập. Giống như đối tượng động học, các nhiễu tái sinh có thể được bù bởi một bộ điều khiển feed-forward. Để bù chính xác cho hệ thống động học và nhiễu tái sinh, yêu cầu cần phải có một mô hình chi tiết. Sự không chính xác về mô hình có thể làm cho bộ điều khiển feed-forward vận hành kém. Khi một mô hình chính xác khó có thể xác định được, thì một phương pháp thay thế có thể được thực hiện. Thay vì đi thiết kế một bộ điều khiển feed-forward dựa trên những đặc điểm cơ bản của mô hình thực hiện bộ điều khiển feed-forward giống như là một hàm xấp xỉ, ví dụ như là  ,F rFU  . Trong suốt quá trình điều khiển, quan hệ vào/ra của hàm xấp xỉ được tự thích ứng để học các đối tượng nghịch đảo và để bù các nhiễu phát sinh. Khó khăn chính ở đây là lựa chọn tín hiệu học mà chỉ ra được mối quan hệ vào/ra của hàm xấp xỉ phải được tương thích như thế nào. Tín hiệu học có thể thu được theo rất nhiều cách. Theo lý thuyết đã chứng minh chỉ ra rằng khi đầu ra của u + + P y x d(x) Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 9 F bộ điều khiển phản hồi được sử dụng làm tín hiệu học (hình 1.2) thì quan hệ vào/ra của hàm xấp xỉ hội tụ tới đối tượng nghịch đảo và giá trị bù của nhiễu tái sinh. Loại hàm xấp xỉ mà chúng ta sử dụng ở đây là mạng nơron MLP.   93,3,3,2,2,2,1,1,1, Rr T ddddddddd    (1.1) Trong trường hợp cánh tay 3 bậc tự do (Degrees Of Freedom DOF) sử dụng kinh nghiệm, đầu vào của MLP bao gồm góc khớp đặt θd và đạo hàm bậc 1 bậc 2 của chúng: Trong khi đầu ra uF được xét dưới dạng lực xoắn động cơ; (công thức 1.2)   3321 Ru T F   (1.2) Bộ điều khiển phản phản hồi. Như đã được nói tới, bộ điều khiển phản hồi trạng thái, đem lại các tín hiệu học cho bộ điều khiển feed-forward. Hơn thế, nó xác định quá trình bám cực tiểu tại thời điểm bắt đầu học. Cuối cùng, bộ điều khiển phản hồi bù các nhiễu ngẫu nhiên. Bộ điều khiển FEL đã được thực hiện trong nhiều ứng dụng của nhiều tác giả; ví dụ như là: - Hệ thống phanh tự động cho ôtô. - Điều khiển hệ thống camera. - Điều khiển cánh tay robot. - Máy hàn. Các ứng dụng chỉ ra rằng bộ điều khiển FEL đã cải thiện một cách rõ ràng dựa trên quá trình vận hành của bộ điều khiển phản hồi và các ứng dụng này cũng chỉ ra có thể thu được chất lượng bám cao mà không cần mô hình mở rộng. Cách hoạt động của một bộ FEL được so sánh với cách hoạt động của hệ thống điều khiển thích nghi. Kết luận rằng, trong trường hợp mô hình đối tượng chính xác được sử dụng trong các hệ thống điều khiển thích nghi, quá trình bám của bộ điều khiển thích nghi và của bộ điều khiển FEL là tương tự như nhau. Khi FEL hội tụ chậm hơn Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 10 bộ điều khiển thích nghi, trong tình huống này bộ điều khiển thích nghi được ưa chuộng hơn. Tuy nhiên khi chưa có một mô hình đối tượng chính xác, thì bộ điều khiển thích nghi sẽ không thể thu được hiệu suất bám như mong muốn. Bộ điều khiển FEL không phải trải qua điều này và nó vẫn đem lại hệ số bám chính xác. Khả năng này nâng cao giả thiết rằng bộ FEL có phù hợp cho hang loạt các ứng dụng mở rộng khi trong thực tế các đối tượng thường khó có một mô hình chính xác. Câu hỏi đặt ra là nếu xét về mặt thương mại thì nên sử dụng bộ điều khiển nào? Để trả lời cho câu hỏi này chúng ra sẽ đi đánh giá xem bộ điều khiển FEL có đáp ứng được đầy đủ các chỉ tiêu chất lượng mà ta đã đưa ra trong mục 1.2 hay không. Dễ dàng sử dụng trên hệ thống điều khiển có sẵn. Sự mở rộng duy nhất đối với hệ thống điều khiển có sẵn là hàm xấp xỉ. Khi hệ thống điều khiển được thực hiện bằng phần mềm điều này yêu cầu ít có sự thay đổi và có thể dễ dàng được thực hiện. Sự hợp nhất các kiến thức quan trọng trong thiết kế. Khi cấu trúc của đối tượng động học được xác định, thì mạng MLP trong bộ điều khiển feed-forward có thể tách ra thành một vài mạng MLP nhỏ hơn. Mỗi một mạng con này sẽ bù cho một phần riêng biệt của đối tượng động học. Những thí nghiệm đã chỉ ra rằng mạng này đã nâng tốc độ học lên đáng kể. Sự ổn định được xác lập. Điều này đã được chứng minh bằng lý thuyết rằng bộ điều khiển FEL sử dụng cho điều khiển cánh tay robot cho kết quả hội tụ. Với các hệ thống khác, sự ổn định chưa được xét đến trên phương diện lý thuyết. Đáp ứng ngắn hạn tốt. Trong quá trình học, sai số bám sẽ dần hội tụ đến giá trị cực tiểu của nó. Giống như sự ổn định, đáp ứng ngắn hạn cũng chưa được xét tới trên phương diện lý thuyết. Hàm xấp xỉ phù hợp cho việc điều khiển. Rất nhiều các giá trị thực của bộ một LC phụ thuộc vào loại hàm xấp xỉ được sử dụng. Mặc dù thực tế là bộ điều khiển Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 11 FEL cũng đạt được chất lượng bám cao nhưng cách học không phải là tối ưu cho mạng MLP. Yêu cầu bộ nhớ nhỏ. Một trong số những thuộc tính tốt của MLP là nó có thể xấp xỉ các hàm mục tiêu đa chiều với một số ít các thông số. Do đó tổng dung lượng bộ nhớ của máy tính yêu cầu cho việc thực hiện là rất nhỏ. Tốn kém cho việc tính toán giá trị. Việc tính toán đầu ra của mạng MLP và trọng số của bộ thích nghi bao gồm một số lượng lớn các tính toán phức tạp. Do đó, với một số ứng dụng điều khiển thời gian thực thì loại mạng mạng nơron này có thể không phù hợp. Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ. Cơ chế học dễ dàng đạt được tại vùng giá trị cực tiểu cục bộ. Hàm trọng lượng của mạng kết thúc ở vùng cực tiểu nào phụ thuộc vào hàm trọng lượng ban đầu của mạng. Do đó nó cần phải thực hiện nhiều thử nghiệm huấn luyện mạng với các cài đặt hàm trọng lượng ban đầu khác nhau, để thu được độ bám chính xác có thể chấp nhận được. Có khả năng tổng quát hoá tốt. Một thuận lợi thực tế là mối quan hệ vào ra chỉ có thể thích ứng toàn bộ đó là khi MLP có khả năng tổng quát tốt khi quá trình huấn luyện được thực hiện một cách tổng thể. Khi một hệ thống chuyển động phải vận hành ở tốc độ thấp, bộ điều khiển FEL có khuynh hướng đưa ra hiệu suất kém. Điều này là do thực tế mạng MLP gặp khó khăn trong việc học các dữ liệu có tương quan với nhau ở mức cao. Khi các dữ liệu có tương quan với nhau ở mức cao, mạng có khuynh hướng chuẩn hoá tín hiệu theo dữ liệu cuối cùng, kết quả là đưa ra khả năng khái quát hoá kém. Sự trơn tru của các giá trị xấp xỉ là không hoàn toàn điều khiển được. Số lượng các thông số của một bộ MLP quyết định tính chính xác cực đại của giá trị xấp xỉ. Nó không đảm bảo được độ trơn tru nhất định. Nhờ việc học, mạng MLP có thể xấp xỉ rất gần các hàm mục tiên trong phạm vi đầu vào và rất chính xác ở phần còn lại. Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 12 Nhìn vào các thuộc tính ở trên, ta có thể kết luận rằng trong trường hợp mà cách học tốt, bộ điều khiển FEL có khả năng đáp ứng rất tốt. Các nghiên cứu khác nhau nhằm mục đích khắc phục các vấn đề tồn tại của bộ điều khiển FEL. Theo đó ta sẽ giới thiệu tóm lược 3 phương pháp: 2 phương pháp đầu thay đổi cấu trúc của bộ điều khiển học. Trong khi ở phương pháp còn lại loại hàm xấp xỉ khác đựơc sử dụng. Trước tiên, phương pháp thứ nhất có thể cải thiện cách học bằng cách chọn các đầu vào khác nhau cho hàm xấp xỉ. Sai số tín hiệu được thêm vào như một đầu vào của bộ xấp xỉ, điều này sẽ làm thay đổi bộ điều khiển LC từ chỗ hoàn toàn là 1 bộ điều khiển feed-forward nguyên bản chuyển sang bộ điều khiển feed-forward (hình 1.4). Các thí nghiệm đã chỉ ra rằng bộ LC này khắc phục được một số lỗi của bộ điều khiển FEL gốc. Hình 1.4 Học theo sai số phản hồi. Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một bộ được huấn luyện để thực hiện một nhiệm vụ cụ thể. Một mạng neural giám sát học xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào. Bộ LC này đã được kiểm tra trên tay máy mà phải thực hiện các chuyển động với các đối tượng có trọng lượng khác nhau. Sau khi học, mỗi bộ điều khiển feed-forward đã học sẽ phải đảm r - Hµm xÊp xØ C + + + UF P y r (n) r . . . . Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 13 nhiệm cho một đối tượng xác định. Mạng giám sát đã học từ bộ điều khiển feed- forward nào được áp dụng cho đối tượng đó. Khi mạng MLP là nguyên nhân chính gây nên các khó khăn của điều khiển FEL, một phương pháp rõ ràng ở đây là phải tìm ra những hàm xấp xỉ khác nhau. Mạng MLP được thay thế bởi mạng (Cerebellar Model Articulation Controller CMAC). Mạng CMAC phụ thuộc vào các lớp mạng nơron mà làm việc với hàm cơ sở. Trong trường hợp mạng CMAC, hàm cơ sở bao gồm các hàm đa thức thông minh mà có giá trị khác không trên phần không gian đầu vào. Ở mỗi điểm trong không gian đầu vào p các hàm cơ sở chồng chéo lên nhau. Thông số của p được biết đến như là một thông số khái quát hoá và có thể được lựa chọn bởi nhà thiết kế. Đầu ra của mạng CMAC là tổng các trọng số của hàm ước lượng cơ sở. Việc học được tiến hành bằng cách mô phỏng theo các trọng số của mạng, chứ không phải là theo bản thân các hàm cơ sở. Tất cả điều này nhằm mục đích cải thiện những vấn đề sau: Độ hội tụ nhanh hơn. Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏ các hàm trọng lượng được thích nghi, gây ra độ hội tụ nhanh. Có thể học các dữ liệu tương quan. Các vùng của hàm cơ sở đã được trộn lẫn, điều này có ích cho quá trình học các dữ liệu tương quan. Không có cực tiểu cục bộ. Cơ cấu học không trải qua vùng cực tiểu cục bộ. Tuy nhiên một bất lợi là người thiết kế bộ điều khiển phải lựa chọn sự phân phối của các hàm cơ sở. Điều này yêu cầu phải có một số kiến thức nền tảng về ánh xạ vào/ra theo mong muốn và việc điều chỉnh sự phân phối của hàm cơ sở là cần thiết trước khi đạt được hiệu suất có thể chấp nhận được. Các nghiệm thí đã chỉ ra rằng việc thay thế mạng MLP bởi mạng CMAC đem lại một quá trình học tốt hơn và độ bám chính xác hơn. 1.4. Điều khiển truyền thẳng tự học. Trong luận văn này một hệ thống LC được xét có cấu trúc tương tự như cấu Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 14 trúc của bộ điều khiển FEL (hình 1.2). Tuy nhiên, phần feed-forward của bộ điều khiển LC được thực hiện giống như mạng B-Spline (BSN) thay vì mạng MLP. Loại điều khiển FEL được gọi là LFFC. Phương pháp BSN cũng tương tự như phương pháp CMAC. Giống như mạng CMAC, mạng BSN sử dụng các hàm cơ bản còn gọi là B-Spline để xấp xỉ hoá. Trong thiết kế LFFC các thông số sau của BSN phải được lựa chọn : 1.4.1. Đầu vào của mạng BSN. Đối với các hệ thống chuyển động, các đầu vào của BSN bao gồm các vị trí đặt, r, và các đạo hàm của nó (xem hình 1.2). 1.4.2. Sự phân bố B-Spline trên đầu vào của mạng BSN. Đầu ra của BSN là tổng trọng lượng của các B- spline ước lượng . Do đó, số lượng của các B-Spline và các vị trí của chúng quyết định tính chính xác của giá trị xấp xỉ. Các tín hiệu đích có dạng trơn có thể được xấp xỉ một cách chính xác với một số lượng thấp các B-Spline “rộng”. Các tín hiệu có độ dao động lớn yêu cầu một số lượng lớn các B-Spline “hẹp” (xem hình 1.5) Hình 1.5 ánh xạ BSN B-splines μ uF 0 1 --==Hàm mục tiêu --==Hàm xấp xỉ r[m] r[m] Hàm xấp xỉ Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 15 Một khả năng riêng biệt của việc phân bố các B-Spline có thể được tạo ra trên cơ sở kiến thức của đối tượng nghịch đảo và của các nhiễu, hoặc nhờ một tiến trình lặp đi lặp lại sử dụng các dữ liệu thực nghiệm. 1.4.3. Sự lựa chọn các cơ cấu học. Tự học ví dụ như là sự thích nghi của các trọng số mạng có thể được tiến hành sau mỗi một mẫu - được biết tới gọi là học trực tuyến hoặc sau mỗi chuyển động đã được thực hiện xong - được gọi là off-line learning. Luật online learning như sau: )()( rerw ii  (1.3) Và luật offline learning như sau:     s s N i ji N i jji i r rer w 1 1 )( )()(    (1.4) với: rj: đầu vào của BSN. Trong LFFC đầu vào bao gồm cả vị trí đặt và đạo hàm của nó  ,....,, jjj rrrf  )( ji r : thành phần của B-Spline thứ I  1.0)( ji r i : sự thích nghi của trọng số B-Spline thứ i  : tỷ lệ học 0 <   1 )( jre : Sai số xấp xỉ được tạo bởi mạng, trong LFFC e(rj) là đầu ra của bộ điều khiển phản hồi uC; Ns: Số lượng các mẫu đầu vào. 1.4.4. Sự lựa chọn tốc độ học. Tốc độ học càng lớn thì độ hội tụ của kỹ thuật học càng nhanh. Tuy nhiên một tốc độ học mà lớn thì sẽ làm cho giá trị xấp xỉ thêm nhạy cảm với nhiễu và có thể là nguyên nhân gây mất ổn định. Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 16 Bằng việc sử dụng BSN, ta đã có các ưu điểm sau: Không có cực tiểu cục bộ. Đầu ra của BSN là một hàm trọng số tuyến tính. Điều này có nghĩa là các kỹ thuật học được đưa ra trong (1.3) và (1.4) không trải qua vùng cực tiểu cục bộ. Điều này nhấn mạnh rằng các trọng số đầu của BSN không ảnh hưởng đến độ chính xác tự hiệu chỉnh cuối cùng. Học cục bộ. Khi B-Spline có một nền tảng chắc chắn, ánh xạ vào/ra của BSN có thể thích nghi một cách cục bộ. Việc huấn luyện một chuyển động mới không nhất thiết phải ảnh hưởng tới khả năng hiệu chỉnh các chuyển động đã học trước đó. Hơn thế nữa, do nền tảng chắc chắn của B-Spline chỉ có một số lượng nhỏ các trọng số góp phần cho đầu ra, trong quá trình huấn luyện, chỉ có các trọng số cần cần được đáp ứng. Điều này trái ngược với MLP nơi mà tất cả các trọng số của mạng bị thay đổi trong suốt quá trình học. Do đó, BSN hội tụ nhanh hơn nhiều so với MLP. Sự chính xác trong điều chỉnh. Độ trơn của quan hệ vào/ra là xác định được bằng cách chọn phân bố B-spline. Việc chọn B-spline mà có nền tảng vững chắc hơn, làm cho BSN có được giá trị xấp xỉ dữ liệu ở miền cao tần chính xác hơn. Khi mà, do sự giới hạn của cơ cấu chấp hành, ví dụ, với một giá trị xấp xỉ trơn hơn của dữ liệu được yêu cầu ở một phần xác định của không gian đầu vào, B-spline nên được sử dụng để có một nền tảng rộng hơn hoặc thức bậc cao hơn. Trong trường hợp của MLP, người dùng không thể xác định được độ trơn của các phần khác nhau trong không gian đầu vào, thay vào đó MLP xác định rõ vị trí nguồn của nó. Cho tới nay mạng CMAC cũng đã nắm bắt được những thuận lợi đã được liệt kê ở trên của mạng BSN. Chúng ta chọn BSN bởi vì nó đơn giản. Trong mạng CMAC các hàm phân bố cơ bản là các hàm mà ở mỗi giá trị đầu vào hàm cơ sở chính xác p có một định lượng lớn hơn 0. Một số hàm phân bố thoả mãn điều Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 17 này và mỗi hàm như vậy dẫn đến một giá trị xấp xỉ khác nhau. Người sử dụng phải chọn hàm phân bố nào là có khả năng xấp xỉ tốt nhất. Hơn thế, việc chọn lọc một giá trị xấp xỉ bằng cách thêm một số ràng buộc (thêm một hàm cơ sở), kết quả sẽ có được hàm phân bố cơ sở khác. Điều này có thể là không được như mong muốn cho lắm. Sự phân bố của các hàm cơ bản trong BSN là không phức tạp lắm. Hạn chế chính của các BSN (và của các NN với các hàm cơ bản) đó là số lượng các trọng số mạng tăng theo hàm mũ với kích thước của không gian đầu vào. Số lượng các trọng số trong một BSN - N chiều được cho bởi:    N j jt NN 1 (1.5) Với Nj là số lượng của B-Spline được định nghĩa ở đầu vào thứ j. Khi xét tới độ chính xác có thể sẽ yêu cầu nhiều B-Spline và vì vậy giá trị của Nj sẽ lớn hơn, ví dụ khi một hàm phi tuyến ở mức độ cao được xấp xỉ hoá, các mạng này là không thực tế khi số lượng đầu vào quá lớn. Điều này được gọi là sai lệch về kích thước và nó mang lại một số các vấn đề sau: Số lượng lớn các trọng số mạng. Nếu các đối tượng động học có thành phần phi tuyến ở mức độ cao, một hàm phi tuyến ở mức độ cao có thể bị ánh xạ bởi mạng B-Spline. Một mạng mà có khả năng ánh xạ những phi tuyến này một cách chính xác sẽ chiếm một phần lớn dung lượng lớn của bộ nhớ máy tính. Trong thực tế, các nguồn bộ nhớ là có giới hạn, do đó mạng phức hợp và ánh xạ chính xác của nó phải được cân bằng với nhau. Các bộ huấn luyện rộng. Khi thực thi một sự chuyển động định trước, chỉ có các trọng số mạng được lập bởi các đầu vào của mạng là được cập nhật. Để thích ứng một số lượng lớn các trọng số mạng, yêu cầu cần phải có một số lượng lớn các huấn luyện chuyển động. Điều này sẽ dẫn tới nhiều lần huấn luyện nếu Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 18 mạng được huấn luyện trực tuyến ví dụ trong suốt quá trình điều khiển. Khả năng khái quát kém. Việc bù của bộ phi tuyến có thể yêu cầu các B-Spline hẹp để thoả mãn các yêu cầu về độ chính xác. Tuy nhiên, với các B- Spline hẹp, các tín hiệu đầu ra của mạng rất khác nhau có thể xảy ra với các đường cong quỹ đạo mà “gần với nhau”. Vì lý do đó, mà các bộ huấn luyện rộng được đề cập ở trên đáp ứng được tất cả những gì cần thiết mà phải đưa ra trước khi đề cập tới hiệu quả lợi ích thu được. Có thể thấy rằng sai lệch về kích thước có thể gây hại nghiêm trọng tới giá trị thương mại của LFFC. Do đó, nên cố gắng để vượt qua sự sai lệch về kích thước. 1.5. Ứng dụng minh hoạ: Hệ thống chuyển động động cơ tuyến tính. Một ứng dụng thú vị của LC là động cơ tuyến tính đồng bộ dùng nam châm vĩnh cửu. Các động cơ tuyến tính thường được thiết kế để thực hiện các chuyển động tuyến tính với độ chính xác nhỏ hơn mm ví dụ như cắt lazer, máy quét, hoặc các máy thực hiện nhiệm vụ gắp - đặt. Động cơ tuyến tính được xét ở đây còn được gọi là Hệ thống chuyển động động cơ tuyến tính (Linear Motor Motion System LiMMS) được chế tạo bởi Philips. Cấu trúc động cơ bao gồm phần tĩnh bao phủ bởi đế kim loại và một phần động. Phần động này chứa cuộn điện và lõi sắt xem hình 1.6. Bằng cách cung cấp dòng điện 3 pha vào trong mỗi cuộn dây của phần động sẽ tạo ra một chuỗi lực hút và đẩy giữa các cực và đế kim loại. Kết quả là gây ra sự chuyển động giữa phần động và phần tĩnh . Các hoạt động cơ bản của động cơ là chuyển động gia trọng: trọng lượng của phần động với một tải (tải giả định), mL, có giá trị là 37(kg). Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 19 Hình 1.6: Nguyên lý làm việc của động cơ tuyến tính LiMMS Các đường chỉ thị là các đường cong từ hoá với A B C là các pha của dòng động cơ 3 pha. Trong quá trình làm việc, phần động sẽ chịu ảnh hưởng của các lực nhiễu tần số cao gây ra được gọi là lực dao động. Lực này được tạo bởi 2 nguyên nhân sau: Trước hết, một tương tác trường điện từ mạnh tồn tại giữa trường điện từ gây ra bởi nam châm trên phần tĩnh và lõi sắt trên đó có gắn các cuộn dây của phần động. Lõi sắt này có nhiệm vụ chính là để tăng hiệu quả làm việc của động cơ. Lực nhiễu này, được gọi là lực cogging, cố gắng căn chỉnh lõi sắt và nam châm để ổn định vị trí của phần động (vị trí chốt). Lực cogging này chỉ phụ thuộc vào mối qua hệ giữa vị trí của phần động với nam châm. Nó độc lập với dòng động cơ. Để đơn giản hoá trong mô phỏng, lực cogging, FC[N] , được mô hình hoá bởi dạng nhiễu đầu vào hình sin với biên độ 10 [N] và bước sóng 1,6.e-2(m) phụ thuộc vào vị trí của động cơ y[m]: FC(y) = 10sin (1.6e -2 y) (1.6) Thứ hai là lực dao động có thể được tạo ra bởi sai số trong quá trình đảo mạch. tức là cách cung cấp dòng cho cuộn dây. Khi chuyển động một cuộn dây thông qua trường điện từ biến thiên, một từ trường ngược sẽ được tạo ra phụ thuộc vào vận tốc của cuộn dây trong một đường tuyến tính. Nếu dòng cấp cho cuộn dây S N S N S N S N S N ΦA ΦB ΦC ΦA translator Base plate coils Permanent magnets Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 20 không cân xứng với một từ trường ngược thì khi đó lực dao động sẽ phụ thuộc vào vị trí và vận tốc của phần động. một từ trường ngược có thể tính toán được từ một mô hình chi tiết của phần động và nam châm trên phần tĩnh. Điều này yêu cầu về vị trí và thuộc tính điện từ của trường điện từ phải được biết một cách chính xác. Trong trường hợp LiMM sử dụng nam châm giá rẻ thì sẽ dẫn tới dung sai về từ tính lớn. Hơn thế nữa, các nam châm không được đặt ở vị trí chính xác cao nhất nên sẽ khó có thể thu được mô hình cần thiết để tính toán sự đảo mạch và do vậy sẽ gây ra các lực dao động. Ảnh hưởng này không được đưa vào trong mô hình mô phỏng. Các nhiễu khác tác động lên LiMMS là hiện tượng lực ma sát trong vòng bi giữa phần động và rãnh dẫn hướng đỡ nó. Giả thiết các đặc tính của cơ cấu ma sát thực có thể được mô tả bởi đường cong Stribeck, nghĩa là lực ma sát bao gồm ma sát Coulomb ma sát, ma sát Stiction và ma sát Viscous. Trong mô hình mô phỏng chỉ xét ma sát Viscous dL = 10 [Nms]:   yyFV  10 (1.7) Kết quả mô hình mô phỏng như hình 1.7 Hình 1.7: mô hình LiMMS Chương 2 sẽ trình bày kết quả với một LiMMS thực. + + y + - y .. y . . FV FC dL coogging mL 1 s 1 s 1 r Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 21 1.6. Bố cục luận văn. Chương 2: Phân tích tính ổn định của các chỉ số -Thời gian LFFC Sự ổn định lâu dài là một tài sản cần thiết cho một học điều khiển. Để có thể phân tích sự ổn định của các LFFC, ta xét một loại chuyển động đặc biệt là chuyển động lặp. Trong trường hợp này, LFFC sẽ trở nên tương tự như hai loại điều khiển học khác là: Điều khiển học tương tác (Iterative Learning Control ILC) và điều khiển lặp (Repetitive Control RC). Việc phân tích tính ổn định chặt chẽ tồn tại trong cả hai bộ ILC và RC. Trên cơ sở đó, việc một sự phân tích ổn định của LFFC sẽ được thực hiện. Việc phân tích tính ổn định sẽ cho ta cái nhìn sâu sắc hoạt động học của LFFC và cung cấp các quy tắc cho việc lựa chọn đúng đắn các tham số thiết kế. Chương 3: Thiết kế ứng dụng Ở chương này, các lý thuyết đã được làm rõ trong các chương trước được sử dụng thực hiện thủ tục thiết kế cho LFFC. Thủ tục này sẽ được áp dụng cho hệ thống LiMMS đã được trình bày trong phần 1.5. Chương 4: Thảo luận Chúng tôi sẽ thảo luận các kết quả của các chương trước đó và rút ra kết luận.

Các file đính kèm theo tài liệu này:

22LV09_CN_TudonghoaLamHoangBinh.pdf