Bài giảng Công nghệ thông tin và truyền thông - Bài 6: Cơ sở dữ liệu
Khai phá dữ liệu (Data Mining) là quá trình sàng lọc và
phân tích lượng lớn dữ liệu để trích xuất ra các mẫu và
các nghĩa ẩn và để phát hiện tri thức mới.
Kho dữ liệu (Data Warehouse) là cơ sở dữ liệu đặc biệt
của dữ liệu và siêu dữ liệu (metadata) sạch
Dữ liệu được đưa vào một kho dữ liệu thông qua các
bước sau:
Xác định và kết nối với các nguồn dữ liệu
Thực hiện tổng hợp dữ liệu và làm sạch dữ liệu
Nhận được cả dữ liệu và siêu dữ liệu (dữ liệu về dữ liệu)
Chuyển dữ liệu và siêu dữ liệu cho kho dữ liệu
25 trang |
Chia sẻ: huongthu9 | Lượt xem: 446 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Công nghệ thông tin và truyền thông - Bài 6: Cơ sở dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BÀI 6
CƠ SỞ DỮ LIỆU
Viện Công nghệ thông tin và Truyền thông
2017
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
HANOI UNIVERSITY OF SCIENCE AND TECHNOLOGY
Nội dung
1. Dữ liệu
2. Tổ chức dữ liệu
3. Cơ sở dữ liệu
4. Các mô hình cơ sở dữ liệu
5. Các kiểu cơ sở dữ liệu
6. Sử dụng CSDL
© SoICT 2017 Nhập môn CNTT&TT 2
1. Dữ liệu
Dữ liệu (data) bao gồm các yếu tố hay các quan
sát về con người, địa điểm, vạn vật và các sự
kiện.
Các kiểu dữ liệu:
Số
Ký tự
Âm thanh
Âm nhạc
Hình ảnh
Video
© SoICT 2017 Nhập môn CNTT&TT 3
Cách nhìn về dữ liệu
Cách nhìn về vật lý: Tập trung vào dạng thức
thực tế và nơi đặt dữ liệu.
Cách nhìn về logic: Tập trung vào ý nghĩa, nội
dung và ngữ cảnh của dữ liệu.
© SoICT 2017 Nhập môn CNTT&TT 4
2. Tổ chức dữ liệu
Ký tự (Character): là phần tử dữ liệu cơ bản nhất.
Trường (Field) : là nhóm các ký tự có quan hệ
với nhau để mô tả một thuộc tính của thực thể
(entity) (một người, vị trí, sự vật hay một đối
tượng).
Bản ghi (Record): tập hợp các trường có quan hệ
với nhau để mô tả các thuộc tính của thực thể.
Bảng (Table): tập hợp các bản ghi có quan hệ với
nhau, được lưu trữ dưới dạng file.
Cơ sở dữ liệu (Database): Tập hợp các bảng có
quan hệ logic với nhau
© SoICT 2017 Nhập môn CNTT&TT 5
Trường khóa (Key Field)
Còn gọi là Khóa chính (Primary Key)
Định danh duy nhất cho bản ghi
Ví dụ
Mã số công dân
Mã số sinh viên
Mã số cán bộ
Mã số phụ tùng (Part Number)
Số seri (Serial number)
© SoICT 2017 Nhập môn CNTT&TT 6
Ví dụ
© SoICT 2017 Nhập môn CNTT&TT 7
Họ đệm Tên Mã số SV Ngày sinh Nơi sinh
Bản ghi 1 Nguyễn Hoàng Long 20172168 02/06/1999 Hà Nội
Bản ghi 2 Trần Hoài Nam 20172912 21/10/1999 Hải Dương
Bản ghi 3 Lê Thu Trang 20173265 30/05/1999 Hải Phòng
Bảng dữ liệu sinh viên KT22 K62
Cơ sở dữ liệu sinh viên K62-ĐHBKHN
Xử lý theo lô và xử lý thời gian thực
Xử lý theo lô (Batch processing): Dữ liệu được
thu thập và tập hợp sau một khoảng thời gian
xác định, khi đó mới xử lý tất cả cùng một lần.
Xử lý thời gian thực (Real-time processing): dữ
liệu được xử lý cùng lúc với các giao tác dữ
liệu.
© SoICT 2017 Nhập môn CNTT&TT 8
3. Cơ sở dữ liệu (CSDL)
CSDL là tập các bảng dữ liệu có quan hệ logic được
tích hợp với nhau
CSDL cần có các đặc điểm sau:
Chia sẻ thông tin: thông tin từ bộ phận này có thể sẵn sàng
được chia sẻ với bộ phận khác.
An toàn: người dùng chỉ có thể truy cập được thông tin cần
thiết cho họ.
Ít dư thừa dữ liệu (less data redundancy): Nếu không có
CSDL chung, khi đó các bộ phận riêng lẻ cần phải tạo ra và
duy trì dữ liệu của mình và dẫn đến dư thừa dữ liệu.
Tính toàn vẹn dữ liệu (data integrity): khi có nhiều nguồn dữ
liệu, thông tin trong các nguồn có thể khác nhau.
© SoICT 2017 Nhập môn CNTT&TT 9
Hệ quản trị cơ sở dữ liệu
Hệ quản trị CSDL (DBMS - Database
Management System): là phần mềm để tạo,
biến đổi và truy cập cơ sở dữ liệu.
Ví dụ:
Microsoft Access
SQL Server
My SQL
Oracle
© SoICT 2017 Nhập môn CNTT&TT 10
Các thành phần của DBMS
DBMS engine: cung cấp cầu nối giữa dữ liệu logic và dữ
liệu vật lý.
Hệ thống con định nghĩa dữ liệu: định nghĩa cấu trúc logic
của CSDL bằng cách sử dụng từ điển dữ liệu hay lược đồ
dũ liệu.
Hệ thống con thao tác dữ liệu: cung cấp các công cụ để
duy trì và phân tích dữ liệu (thêm, xóa, sửa đổi, truy vấn).
Hệ thống con tạo ứng dụng: cung cấp các công cụ để tạo
các dạng vào dữ liệu và các ngôn ngữ lập trình chuyên
biệt.
Hệ thống con quản trị dữ liệu: để quản lý CSDL, nó bao
gồm: duy trì an toàn, cung cấp sự hỗ trợ khôi phục thảm
họa và giám sát hiệu năng tổng thể của các thao tác
CSDL.
© SoICT 2017 Nhập môn CNTT&TT 11
4. Các mô hình cơ sở dữ liệu
Cơ sở dữ liệu phân cấp (Hierarchical Database)
Cơ sở dữ liệu mạng (Network Database)
Cơ sở dữ liệu quan hệ (Relational Database)
Cơ sở dữ liệu đa chiều (Multidimensional
Database)
Cơ sở dữ liệu hướng đối tượng (Object-
Oriented Database)
© SoICT 2017 Nhập môn CNTT&TT 12
Cơ sở dữ liệu phân cấp
Các trường hoặc các bản ghi được cấu trúc theo node
Mỗi điểm vào có thể có một node cha với một vài node
con theo quan hệ một nhiều
Mỗi node con chỉ có một node cha
Không có quan hệ giữa các node con
© SoICT 2017 Nhập môn CNTT&TT 13
Cơ sở dữ liệu mạng
Tổ chức phân cấp cho các node
Mỗi node con có thể có nhiều hơn một node cha
Có thể có quan hệ nhiều-nhiều
Để truy cập vào một node có thể có các đường khác
nhau.
© SoICT 2017 Nhập môn CNTT&TT 14
Cơ sở dữ liệu quan hệ
Các phần tử dữ liệu được lưu trữ trong các
bảng khác nhau
Các bảng bao gồm các hàng và các cột
Các bảng cần có mục dữ liệu chung (trường
khóa) cho phép thông tin được lưu trong
bảng này có thể được liên kết với thông tin
trong bảng khác
Tổ chức đơn giản và dễ hiểu
Các thực thể dễ dàng thêm, xóa và thay đổi
Được sử dụng phổ biến nhất
© SoICT 2017 Nhập môn CNTT&TT 15
Ví dụ cơ sở dữ liệu quan hệ
© SoICT 2017 Nhập môn CNTT&TT 16
Ví dụ cơ sở dữ liệu quan hệ
Họ tên
sinh viên
Ngày
cấp
Số hiệu
sinh viên
Nơi sinh
Ngày
sinh
Sinh viên
Mã sách Ngôn ngữ
Năm
xuất bản
Tác giảTên sáchSách
Số hiệu
sinh viên
Ngày trảNgày mượn Mã sáchMượn/trả
Ngày
hết hạn
© SoICT 2017 Nhập môn CNTT&TT 17
Cơ sở dữ liệu đa chiều
© SoICT 2017 Nhập môn CNTT&TT 18
Mở rộng của cơ sở dữ liệu quan hệ từ hai chiều
thành nhiều chiều hơn
Sử dụng cho các quan hệ dữ liệu phức tạp
Tăng tốc độ xử lý
Cơ sở dữ liệu hướng đối tượng
Cơ sở dữ liệu hướng đối tượng lưu giữ dữ liệu
và cả lệnh để thao tác với dữ liệu đó.
Tổ chức của CSDL hướng đối tượng bao gồm:
Lớp (Classes): Định nghĩa khuôn mẫu chung cho các
đối tượng
Đối tượng (Objects): là các trường hợp cụ thể của
lớp chứa cả dữ liệu và lệnh để thao tác dữ liệu
Thuộc tính (Attributes): là các trường dữ liệu của đối
tượng sở hữu
Phương thức (Methods): là các lệnh để tìm kiếm
hoặc thao tác các giá trị của thuộc tính.
© SoICT 2017 Nhập môn CNTT&TT 19
Cơ sở dữ liệu hướng đối tượng
© SoICT 2017 Nhập môn CNTT&TT 20
5. Các kiểu cơ sở dữ liệu
CSDL cá nhân: dùng cho một người
CSDL công ty: được dùng chung chia sẻ bởi
nhiều người trong công ty
CSDL phân tán: phân bố ở các vị trí địa lý khác
nhau, được truy nhập thông qua các đường
truyền thông
CSDL thương mại: sẵn dùng với các thuê bao
(ngân hàng dữ liệu)
© SoICT 2017 Nhập môn CNTT&TT 21
6. Sử dụng CSDL
CSDL đưa ra cơ hội lớn để tăng năng suất lao động
Việc duy trì CSDL cần cố gắng để không bị xáo trộn
hoặc bị lạm dụng
Chiến lược sử dụng:
Thường xuyên cập nhật từ các nguồn thông tin bên trong hoặc
bên ngoài
Tổ chức thành kho dữ liệu (data warehouse)
Khai phá dữ liệu (data mining): là kỹ thuật dùng để tìm kiếm và
khai phá dữ liệu để lấy ra các thông tin và các mẫu liên quan.
An toàn cơ sở dữ liệu:
Chống sử dụng bất hợp pháp sử dụng firewalls
Chống truy cập không đúng thẩm quyền cần phân quyền truy
cập cho người dùng
© SoICT 2017 Nhập môn CNTT&TT 22
Khai phá dữ liệu và Kho dữ liệu
Khai phá dữ liệu (Data Mining) là quá trình sàng lọc và
phân tích lượng lớn dữ liệu để trích xuất ra các mẫu và
các nghĩa ẩn và để phát hiện tri thức mới.
Kho dữ liệu (Data Warehouse) là cơ sở dữ liệu đặc biệt
của dữ liệu và siêu dữ liệu (metadata) sạch
Dữ liệu được đưa vào một kho dữ liệu thông qua các
bước sau:
Xác định và kết nối với các nguồn dữ liệu
Thực hiện tổng hợp dữ liệu và làm sạch dữ liệu
Nhận được cả dữ liệu và siêu dữ liệu (dữ liệu về dữ liệu)
Chuyển dữ liệu và siêu dữ liệu cho kho dữ liệu
© SoICT 2017 Nhập môn CNTT&TT 23
Khai phá dữ liệu và Kho dữ liệu
© SoICT 2017 Nhập môn CNTT&TT 24
CÁM ƠN SỰ THEO DÕI!
Hết bài 6
25© SoICT 2017 Nhập môn CNTT&TT
Các file đính kèm theo tài liệu này:
- bai_giang_cong_nghe_thong_tin_va_truyen_thong_bai_6_co_so_du.pdf