Cơ sở dữ liệu - Chương 2: Nhập xuất dữ liệu Exporting anh importing data
Cơ sở dữ liệu -
Chương 2: Nhập xuất dữ liệu Exporting anh importing data
Package là đói ngjcoots lõi trong SQL server
SSIC dùng để chuyển dữ liệu từ nguồn đến đích và trình tự xử lý dữ liệu
71 trang |
Chia sẻ: huyhoang44 | Lượt xem: 730 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Cơ sở dữ liệu - Chương 2: Nhập xuất dữ liệu Exporting anh importing data, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
GV Phi Loan - Khoa CNTT – HUI 1
GV Phi Loan - Khoa CNTT – HUI
Nội dung
• Lệnh BCP
• Lệnh BULK INSERT
• Import And Export Wizard
• Project SSIS
2
GV Phi Loan - Khoa CNTT – HUI
Nhập xuá̂t dư ̃ liệu
• SQL Server cung cấp nhiè̂u tools thực
hiện việc copy hàng loạt hay nhâ ̣p/xuất
dữ liệu.
– Lê ̣nh BCP
– Lê ̣nh BULK INSERT
–Dùng lệnh SELECT INTO
–Dùng chức năng Import And Export Wizard
–Project SSIS
3
GV Phi Loan - Khoa CNTT – HUI
BCP (Bulk Copy Program)
• Là 1 tiện ích (utility) mà người dùng có thể
thực hiện từ dấu nhắc lệnh.
• Được dùng để copy dữ liệu từ SQL server
thành 1 file của hệ điều hành hay ngược lại.
• Rất thường hay dùng để chuyển 1 lượng lớn
dữ liệu vào các bảng của SQL server từ các
chương trình khác như từ các DBMS khác
4
GV Phi Loan - Khoa CNTT – HUI
BCP (Bulk Copy Program)
5
GV Phi Loan - Khoa CNTT – HUI
Tiện ích BCP
• Dữ liệu chuyển từ nguồn bên ngoài vào
database của SQL server được gọi là BCP IN
(còn được gọi là importing)
• Nếu dữ liệu được chuyển từ SQL Server ra
nguồn bên ngoài được gọi là BCP OUT (còn
được gọi là exporting). Nguồn ngoài phải là
file văn bản (flat file).
6
GV Phi Loan - Khoa CNTT – HUI
Tiện ích BCP
• Đẻ̂ nhâ ̣p dư ̃ liệu từ ngoài vào 1 ba ̉ng:
–Dùng file định da ̣ng sẵn cho ba ̉ng đó
–Hiẻ̂u rõ cấu trúc của ba ̉ng và kiẻ̂u dữ liệu
cho các cô ̣t của ba ̉ng.
7
GV Phi Loan - Khoa CNTT – HUI
Các yêu cầu khi thực hiện BCP
• File dữ liệu chứa dữ liệu được nhập vào
cần phải có dạng row/column.
• File dữ liệu nên có ký hiệu kết thúc hàng
(row terminator) và kết thúc cột (column
terminator) sao cho SQL Server có thể nhận
biết được khi truyền dữ liệu.
• Cấu trúc của file dữ liệu và bảng của SQL
Server cần phải đồng nhất.
8
GV Phi Loan - Khoa CNTT – HUI
Cú pháp lệnh BCP
BCP [[database_name.][owner].]table_name
{in|out|queryout|format} data_file
[-m max_errors] [-f format_file] [-x] [-e err_file]
[-F first_row] [-L last_row][-b batch_size]
[-n] [-c] [-w] [-N]
[-t field_term] [-r row_term]
[-i input_file] [-o output_file] [-a packet_size]
[-S server_name] [-U login_id] [-P password]
[-T]
9
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
• in|out|queryout|format là hướng của lệnh.
– In: copy dữ liệu từ 1 file dữ liệu vào bảng của
CSDL.
– Out: copy dữ liệu từ bảng CSDL vào 1 file dữ liệu.
– Queryout: copy dư ̃ liệu tư ̀ 1 truy vấn
– Format: ta ̣o 1 file định da ̣ng phụ thuô ̣c vào các tùy
cho ̣n (-n, -c, -w, or -N) và k{ hiệu phân cách
(delimiters) của ba ̉ng. Khi lệnh bcp được thực
hiện, dư ̃ liê ̣u sẽ lưu vào file theo định da ̣ng này.
Tùy cho ̣n này pha ̉i đi kèm cùng vơ ́i tùy cho ̣n –f
10
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
data_file là đường dẫn đầy đủ của file dữ
liệu, có thể chứa từ 1 đến 255 ký tự.
-m max_errors: là số lỗi cực đại có thể xảy ra
trong khi thực thi lệnh. Mỗi hàng không thể
copy bởi lệnh được tính là 1 lỗi. Mặc định là
10 lỗi.
11
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
• -f format_file : dùng đẻ̂ xác định đường dẫn
đâỳ đủ của file định da ̣ng.
–Nêú -f được dùng cùng với tùy cho ̣n
format, thì format_file được ta ̣o riêng cho
ba ̉ng hay view. Đê ̉ ta ̣o file định da ̣ng XML,
thì phải xác định thêm tùy chọn –x .
–Nếu –f được dùng vơ ́i tùy cho ̣n in hay out, -
f yêu cầu file định da ̣ng pha ̉i có sẵn.
12
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
-e err_file là đường dẫn đầy đủ của file lỗi (error
file). File này được dùng để lưu trữ các hàng mà lệnh
không thể copy được từ file vào CSDL. Nếu không có
tuz chọn này, file lỗi không thể tạo được.
-b batch_size là số hàng trên 1 batch dữ liệu sẽ được
copy. Trong trường hợp bị lỗi, SQL Server sẽ commit
hay rolls back giao dịch (transaction) theo từng batch
dữ liệu. Mặc định tất cả dữ liệu trong file dữ liệu xác
định sẽ được copy thành 1 batch.
13
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
• -F first_row : xác định vị trí hàng đầu tiên
được xuất tư ̀ bảng hay nhâ ̣p vào ba ̉ng tư ̀ file
bên ngoài. Mă ̣c định là hàng đầu tiên của file
hay ba ̉ng là 1.
• -L last_row : xác định vị trí hàng cuối cùng cần
sao chép.
• first_row, last_row có thể là 1 số nguyên
dương có thẻ̂ lên đêń 2^63-1.
14
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
• -n (native) copy các kiẻ̂u dư ̃ liệu gốc của chính
database.
• -c dùng kiẻ̂u dư ̃ liệu character. Mỗi trươ ̀ng được lưu
dưới da ̣ng char không dùng prefixes , vơ ́i \t như k{
hiệu phân cách trươ ̀ng, và \r\n (newline character)
như k{ hiệu ké̂t thúc hàng.
• -N dùng kiẻ̂u dữ liệu gốc cho các dữ liệu không pha ̉i
là character và dùng kiẻ̂u Unicode cho dư ̃ liệu là
character.
15
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
• -w dùng kiẻ̂u k{ tự Unicode (nchar), không prefixes,
vơ ́i \t (tab character) như k{ hiệu phân cách trươ ̀ng
(field separator), và \n (newline character) như k{
hiệu ké̂t thúc dòng.
-t field_term : xác định ký tự kết thúc cột (field
terminator). Mặc định là \t.
-r row_term: xác định ký tự kết thúc hàng (row
terminator). Mặc định là \n.
-i input_file: xác định tên của file ngõ vào.
-o output_file: xác định tên của file ngõ ra.
16
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
-a packet_size: xác định số byte cho 1 gói tin
trên mạng (network packet), có thể có từ 4096
đến 65535 bytes; Mặc định là 4096.
Kích cỡ gói tin càng lớn thì càng tăng khả năng
thực thi của lệnh. Nếu gói tin quá lớn không
thể tạo được thì kích cỡ mặc định sẽ được
dùng.
17
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
-S server_name[\instance_name]: xác định điển
hình của SQL Server được nối đến. Nếu không
dùng tùy chọn này, lệnh bcp kết nối đến điển
hình mặc định của SQL Server trên máy tính mặc
định. Tùy chọn này được yêu cầu khi thực thi
lệnh bcp từ 1 máy tính ở xa trên mạng.
-U login_id : xác định login ID được dùng để kết
nối tới SQL Server.
18
GV Phi Loan - Khoa CNTT – HUI
Cú pháp BCP
-P password: xác định passowrd cho login ID.
Nếu không dùng tùy chọn này, bcp sẽ hỏi
password khi chạy. Nếu dùng tùy chọn này mà
không xác định password thì bcp sẽ dùng
password mặc định.
-T: kêt́ nối SQL server bằng kêt́ nối tin câ ̣y
(trusted connection) của người dùng ma ̣ng,
không cần dùng –U va ̀ -P
19
GV Phi Loan - Khoa CNTT – HUI
Ví dụ
• bcp toyworld.dbo.Toys out “Toy type.txt" -T –
c
Chép dư ̃ liê ̣u tư ̀ ba ̉ng Toys vào tâ ̣p tin da ̣ng
text (kêt́ nối tự đô ̣ng –T)
• bcp toyworld.dbo.Toys out “Toy.txt" –Usa –
SPHILOAN-PC -P –c
Chép dư ̃ liê ̣u tư ̀ ba ̉ng Toys vào tâ ̣p tin da ̣ng
text thông qua kết nối vào SQL server thông
qua user sa
20
GV Phi Loan - Khoa CNTT – HUI
Ví dụ
• USE toyworld
SELECT * INTO toy2 from Toys where 1=2
bcp toyworld.dbo.toy2 in toy.txt –T –c
Chép dữ liệu từ file toy.txt bên ngoài vào ba ̉ng
toy2
• Bcp “SELECT vToyName FROM toyworld.dbo.
toys” queryout “ToyName.txt” –T –c
Chép cô ̣t vToyName ra thành file text bên ngoài
21
GV Phi Loan - Khoa CNTT – HUI
Lệnh BULK INSERT
• Được dùng để chuyển hàng loạt dữ liệu từ 1
file bên ngoài vào bảng SQL server
• Lệnh BULK INSERT có thể được thực thi từ
dấu nhắc lệnh hay từ query analyzer.
• Có thể dùng lệnh BULK INSERT để chèn dữ
liệu từ 1 hay nhiều nguồn vào bảng SQL
Server.
22
GV Phi Loan - Khoa CNTT – HUI
Cú pháp lệnh BULK INSERT
BULK INSERT [ [ 'database_name'.] [ 'owner' ].] {
'table_name' FROM 'data_file' }
[ WITH
(
[ BATCHSIZE [ = batch_size ] ]
[ [ , ] CHECK_CONSTRAINTS ]
[ [ , ] DATAFILETYPE [ =
{ 'char' | 'native'| 'widechar' | 'widenative' } ] ]
[ [ , ] FIELDTERMINATOR [ = 'field_terminator' ] ]
[ [ , ] FIRSTROW [ = first_row ] ]
[ [ , ] LASTROW [ = last_row ] ]
[ [ , ] MAXERRORS [ = max_errors ] ]
[ [ , ] ROWTERMINATOR [ = 'row_terminator' ] ]
)
]
23
GV Phi Loan - Khoa CNTT – HUI
Cú pháp lệnh BULK INSERT
• BATCHSIZE [ = batch_size ] : xác định số hàng
trong 1 batch. Mỗi batch được copy vào
server như 1 transaction.
• CHECK_CONSTRAINTS: yêu cầu bất kz
constraint trong bảng phải được kiểm tra
trong lúc thực thi lệnh. Mặc định lệnh bỏ qua
các constraint cua bảng.
24
GV Phi Loan - Khoa CNTT – HUI
Cú pháp lệnh BULK INSERT
• DATAFILETYPE [ = {'char' | 'native' | 'widechar'
| 'widenative' } ]:
–Char: file dữ liệu kiểu ký tự
–Native: sử dụng kiểu dữ liệu hiện có của
database
–Widechar: file dữ liệu kiểu ký tự Unicode
–Widenative: tương tự như native, ngoại
trừ các cột char, varchar và text sẽ được
lưu trữ theo kiểu Unicode
25
GV Phi Loan - Khoa CNTT – HUI
Cú pháp lệnh BULK INSERT
FIELDTERMINATOR [ = 'field_terminator' ] : xác
định ký tự kết thúc trường (field terminator)
cho các file dữ liệu kiểu char và widechar.
Mặc định là \t.
FIRSTROW [ = first_row ]: xác định số của hàng
đầu tiên được copy. Mặc định là 1.
LASTROW [ = last_row ]: xác định số của hàng
cuối cùng được copy. Mặc định là 0 để chỉ
hàng cuối cùng của file dữ liệu.
26
GV Phi Loan - Khoa CNTT – HUI
Cú pháp lệnh BULK INSERT
MAXERRORS [ = max_errors ] : xác định số lỗi
cực đại có thể xảy ra trước khi lệnh bulk copy
bị hủy bỏ. Mặc định là 10.
ROWTERMINATOR [ = 'row_terminator' ]: xác
định ký tự kết thúc hàng dùng cho file dữ liệu
kiểu char và widechar . Mặc định là \n
27
GV Phi Loan - Khoa CNTT – HUI
Ví dụ
BULK INSERT toyworld.dbo.toy2
FROM ‘C:\Users\Phi Loan\toy.txt'
WITH
( FIELDTERMINATOR = ‘\t', ROWTERMINATOR =
'\n' )
28
GV Phi Loan - Khoa CNTT – HUI
SSIS package
• Package là đối tượng cốt lõi trong SQL Server
Integration Services (SSIS) chư ́a business logic
đẻ̂ qua ̉n l{ trình tự xử l{ dư ̃ liệu.
• SSIS dùng đẻ̂ chuyẻ̂n dữ liệu tư ̀ nguò̂n đé̂n đích
và quản l{ trình tự xử l{ dư ̃ liệu.
• Có thẻ̂ ta ̣o package SSIS theo 2 cách:
– Dùng lệnh SQL Server Import And Export Wizard
trong SQL Server Management Studio (SSMS)
– Dùng SSIS Designer trong Business Intelligence
Development Studio (BIDS).
29
GV Phi Loan - Khoa CNTT – HUI
SSIS package
• Cho phép chuyẻ̂n đỏ̂i dư ̃ liệu đi và đé̂n tư ̀ các
nguồn sau:
– NET Framework Data Provider for SQLServer
– Flat File Source
– Microsoft Access
– Microsoft Excel
– Microsoft OLE DB Provider for Analysis Services
– Microsoft OLE DB Provider for Oracle
– Microsoft OLE DB Provider for SQL Server
– SQL Server Native Client
30
GV Phi Loan - Khoa CNTT – HUI
Trình tự thực hiê ̣n Import and Export
Wizard
• Cho ̣n Data Source
• Cho ̣n Destination
• Cho ̣n dư ̃ liệu cần Import hay Export
• Cho ̣n cách thực hiện: trực tié̂p hay lưu
lại như SSIS package
31
GV Phi Loan - Khoa CNTT – HUI
Project SSIS trong BIDS
• Package SSIS chứa:
– Business logic: bao gồm các nhiệm vụ như
trích dữ liệu, thao tác và bié̂n đỏ̂i dữ liệu
trước khi chuyẻ̂n đô ̉i dữ liệu.
– Workflow: chạy 1 thủ tục (stored procedure),
chuyẻ̂n 1 file từ FPT server đêń thư mục xác
định trên server, hay gửi email khi có lôĩ
– Các ké̂t nối với nguồn dữ liệu (data source) và
đích dữ liệu (data destination)
32
GV Phi Loan - Khoa CNTT – HUI
Khi nào nên dùng SSIS trong BIDS
• Khi package SSIS có nhiè̂u yêu câù phức
ta ̣p
• Câǹ ké̂t hợp nhiè̂u package SSIS lại.
33
GV Phi Loan - Khoa CNTT – HUI 34
GV Phi Loan - Khoa CNTT – HUI
Trình tự tạo 1 SSIS
• Ta ̣o Data Source ( tùy cho ̣n)
• Ta ̣o ké̂t nó̂i
• Ta ̣o các đó̂i tượng Control Flow
35
GV Phi Loan - Khoa CNTT – HUI
Tạo Data Source
• Chứa các chuỗi kết nối tro ̉ đến file hay
CSDL.
• Là 1 đồi tượng tùy cho ̣n của dự án SSIS,
được dùng khi:
–Mô ̣t số package cần dùng chung 1 CSDL hay
1 ké̂t nôí file.
–Cần thay đỏ̂i kết nối được dùng trong nhiều
package.
36
GV Phi Loan - Khoa CNTT – HUI
Package Connection Managers
• Connection manager cho phép ta ̣o các
loa ̣i ké̂t nó̂i khác nhau cho package.
–Các thành phần khác nhau trong SSIS có thẻ̂
kêt nối vơ ́i đối tượng bên ngoài package
(như database, file, hay server)
37
GV Phi Loan - Khoa CNTT – HUI
Tạo kết nối
• Cho ̣n loa ̣i ké̂t nó̂i:
–New Connection ( kết nối đô ̣c lâ ̣p)
–New Connection From Data Source
–New File connection
–New Analysis Services Connection
–New ADO.NET Connection
–New Flat File Connection
38
GV Phi Loan - Khoa CNTT – HUI
Thiêt́ kế package trong SSIS
• Màn hình thié̂t kế package chứa 4 tab
cho phép thực hiện các phâǹ việc khác
nhau.
39
GV Phi Loan - Khoa CNTT – HUI
Tab Control flow và Data flow
• Control flow: là cơ chế quản lý thứ tự
thực hiện bao gôm̀ control flow tasks,
containers, và các ràng buộc
• Data flow trực tiếp liên quan đến việc xử
lý và biến đổi dữ liệu từ nguồn đến đích.
40
GV Phi Loan - Khoa CNTT – HUI
Tab Control Flow
• Có ba loa ̣i đó̂i tượng control flow :
– Control flow tasks
– Control flow containers
– Constraints
41
GV Phi Loan - Khoa CNTT – HUI
Control flow task
• Là nơi mà ta xác định package sẽ phải
làm gì:
–gửi email, thực hiện lê ̣nh SQL hay copy file
tư ̀ FTP server.
• Khi 1 nhiệm vụ control flow hoàn tất thì
hoặc thành công (succeeded) hoă ̣c thât́
bại (failed)
42
GV Phi Loan - Khoa CNTT – HUI
Control flow task
• Dùng control flow đẻ̂ điè̂u khiẻ̂n việc
thực thi các nhiệm vụ song song hay đặt
trước các ràng buộc dựa vào tình trạng
hoàn thành của nhiệm vụ.
• Đẻ̂ ta ̣o nhiệm vụ mới: drag biẻ̂u tượng
tư ̀ toolbox vào màn hình của Control
Flow
43
GV Phi Loan - Khoa CNTT – HUI
Bốn nhóm biê ̉u tượng cu ̉a Control
Flow
1. Tasks : như ̃ng việc mà SSIS có thẻ̂ làm như thi
hành lệnh SQL, chuyẻ̂n đôí tượng tư ̀ SQL Server
sang Server khác.
2. Maintenance Plan tasks: nhóm nhiệm vụ đă ̣c biệt
qua ̉n l{ các công việc như kiẻ̂m tra tính ba ̉o toàn
dư ̃ liệu, xây dựng la ̣i chỉ mục,
3. Data Flow Task: là nhiệm vụ liên quan đến các
thao tác dư ̃ liệu ETL (extract, transform, and load)
4. Containers: là các đối tượng dùng đẻ̂ nhóm các
task.
44
GV Phi Loan - Khoa CNTT – HUI
Cá̂u hình task mới
• Mõ̂i task đều có 1 editor cho phép thay
đỏ̂i cấu hình của task.
–Nhấp đôi ta ̣i task
–hay nhấp pha ̉i và chọn lê ̣nh Edit.
45
GV Phi Loan - Khoa CNTT – HUI 46
GV Phi Loan - Khoa CNTT – HUI
Control Flow Container
• Cho phép nhóm các task và sắp xé̂p sao
cho các nhiệm vụ có thẻ̂ chạy song song,
hoặc sắp xé̂p thư ́ tự đăng nhập và thực
thi các giao dịch (transaction)
–Đẻ̂ sử dụng container, drag container tư ̀
toolbox vào màn hình của control flow.
47
GV Phi Loan - Khoa CNTT – HUI
Phân loại Container
1. Sequence Container
2. For Loop Container
3. Foreach Loop Container ( thực hiện
vòng lặp trên tâ ̣p các đó̂i tượng như
các file trong 1 folder)
48
GV Phi Loan - Khoa CNTT – HUI
Làm việc với biêń (variable)
• Các bié̂n được dùng đẻ̂ ké̂t hợp các đó̂i
tượng bằng cách:
– Truyè̂n giá trị giư ̃a các task và container
–Nhâ ̣n giá tri ̣ tư ̀ bên ngoài
– Trong các đoa ̣n mã tự ta ̣o
• Bié̂n còn được dùng đẻ̂ audit và đăng
nhập vào package.
49
GV Phi Loan - Khoa CNTT – HUI
Làm việc với biêń (variable)
• Đẻ̂ mở cửa số Variable:
SSIS\variable
• Mõ̂i bié̂n được xác định bởi:
–Name
– Scope,
–Data type
–Và giá trị của bié̂n
50
GV Phi Loan - Khoa CNTT – HUI
Phân loại biêń
• System variables
• User variables.
51
GV Phi Loan - Khoa CNTT – HUI
Biêń hệ thống (System variable)
• Không thẻ̂ chỉnh sửa được nhưng có thẻ̂
tham chié̂u đêń bên trong task hay
container.
• Đẻ̂ xem các bié̂n hệ thó̂ng: nhâṕ vào nút
Show System Variables. Trên thanh công
cụ Variables.
52
GV Phi Loan - Khoa CNTT – HUI
Biêń người dùng (user variable)
• Do ngươ ̀i dùng ta ̣o và xác định tùy theo
mục đích sử dụng.
• Ví dụ: trong vòng lă ̣p Foreach, bié̂n
ngươ ̀i dùng đẻ̂ đêḿ số lần lặp.
53
GV Phi Loan - Khoa CNTT – HUI
Nhiê ̣m vụ đánh giá dữ liê ̣u
Data Profiling Task
• Cho phép đánh giá (review) các thực thẻ̂ của
dữ liê ̣u nguồn (source), kiẻ̂m tra tính rõ ràng,
toàn ve ̣n của dư ̃ liê ̣u và tìm hiê ̉u cấu trúc dư ̃
liệu, mó̂i quan hệ giữa các cột, cột nào có
thê ̉ là khóa.
• Bao gồm 2 phần:
– Data Profiling Task : thực hiện việc phân tích
dữ liệu.
– Data Profile Viewer: xem ké̂t qua ̉.
54
GV Phi Loan - Khoa CNTT – HUI
Trình tự thực hiê ̣n Data Profiling Task
• B1: ta ̣o ké̂t nó̂i ADO.NET mà nguò̂n là các
bảng/view câǹ đánh giá.
• B2: drag biẻ̂u tượng Data Profiling task
tư ̀ toolbox vào control flow, mở và chỉnh
sửa thuộc tính của task.
–Cách đơn giản: nhấp nút Quick Profile ngay
trong cửa sô ̉ Data Profiling Task Editor.
55
GV Phi Loan - Khoa CNTT – HUI
Trình tự thực hiê ̣n Data Profiling Task
• B3: xác định file chứa ké̂t quả của task
(file XML) trong thuộc tính Destination.
• B4: xem kết quả bằng cách mở Data
Profile Viewer (Start\ All Programs\Microsoft
SQL Server 2008\ Integration Services\ Data
Profile Viewer)
56
GV Phi Loan - Khoa CNTT – HUI 57
GV Phi Loan - Khoa CNTT – HUI
Data Flow Task
• Là 1 trong như ̃ng task quan tro ̣ng nhất, cho
phép kiê ̉m soát và biến đô ̉i các dataset.
– Hoă ̣c drag biẻ̂u tượng Data Flow Task tư ̀ toolbox
vào vùng làm việc của tab Control Flow
– Hoă ̣c nhâṕ vào tab Data Flow
• Có 3 loại đôí tượng trong toolbox:
– Data flow source adapters
– Data flow transformations
– Data flow destination adapters
58
GV Phi Loan - Khoa CNTT – HUI
Phân loại Data flow
• Data Flow Source adapter: chỉ ra cách dư ̃
liệu được đưa vào hệ thò̂ng.
• Data Flow Transformations : chỉ ra các
cách thay đỏ̂i và thao tác dữ liệu.
• Data Flow Destination adapter: chỉ ra nơi
để gửi đến dữ liệu đã biến đô ̉i.
59
GV Phi Loan - Khoa CNTT – HUI
Trình tự thực hiện
• Cho ̣n 1 trong các data Flow Source và xác
định câú hình cho nguò̂n đã cho ̣n
• Cho ̣n 1 trong các data Flow Destination
và xác định câù hình cho đích đã chọn
• Xác định các phép bié̂n đỏ̂i dữ liệu từ
nguò̂n đé̂n đích.
60
GV Phi Loan - Khoa CNTT – HUI
Data Flow Source
61
GV Phi Loan - Khoa CNTT – HUI
Data Flow Destination
62
GV Phi Loan - Khoa CNTT – HUI
Data Flow Destination
63
GV Phi Loan - Khoa CNTT – HUI
Ví dụ minh họa
64
GV Phi Loan - Khoa CNTT – HUI
Chọn các phép biến đổi
(transformation)
• Logical row-level transformations
• Multi-input or multi-output transformations
• Multi-row transformations
• Advanced data -preparation transformations
65
GV Phi Loan - Khoa CNTT – HUI 66
GV Phi Loan - Khoa CNTT – HUI 67
GV Phi Loan - Khoa CNTT – HUI 68
GV Phi Loan - Khoa CNTT – HUI 69
GV Phi Loan - Khoa CNTT – HUI
Data Flow Transformations
70
GV Phi Loan - Khoa CNTT – HUI
Data Flow Transformations
71
Các file đính kèm theo tài liệu này:
- chapter_2_ktdbms_8909.pdf