Ký tự (character) đơn vị cơ bản để xây dựng thông tin, bao gồm chữ hoa, chữ thường, con số, hay các ký tự đặc biệt khác (như ! ; +; /…) . Các ký tự hợp lại thành trường.
Trường (field): đặc trưng bởi một cái tên, con số, hay các từ ngữ miêu tả một bộ phận của một đối tượng hay một hoạt động kinh doanh.
Mẩu tin (record): tập hợp các trường có liên hệ với nhau. Tổng hợp các trường miêu tả các bộ phận, ta được một đối tượng hay hoạt động kinh doanh hoàn chỉnh. VD, một mẩu tin về nhân công được tổng hợp từ các trường về một nhân công như họ, tên, địa chỉ, bộ phận, tiền lương …
Tập tin (file): là tập hợp các mẩu tin có liên hệ với nhau. VD tập tin về nhân viên là tập hợp của các mẩu tin về nhân viên trong công ty. Các phần mềm cơ sở dữ liệu thường biểu diễn tập tin bằng một bảng.
Cơ sở dữ liệu (database): tập hợp các tập tin có liên quan với nhau.
37 trang |
Chia sẻ: candy98 | Lượt xem: 543 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Hệ thống thông tin Kế toán P3 - Chương 5: Tổ chức dữ liệu và thông tin kế toán- ĐHCN TP.HCM, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1Organizing Data and InformationTổ chức dữ liệu và thông tin2Giới thiệu Nguyên nhân gây thất bại trong công việc kinh doanh hiện đại là có quá nhiều dữ liệu nhưng không đủ thông tin. Máy tính hiện nay có ở mọi nơi, lưu trữ hàng gigabytes dữ liệu, nhưng ñoàng thôøi gây khó khăn hơn trong việc rút ra những điều quan trọng trong hàng đống con số, sự kiện, những thống kê.Giống như các thành phần khác của hệ thống thông tin, nhiệm vụ của một cơ sở dữ liệu là giúp tổ chức đạt được mục đích của mình. Một cơ sở dữ liệu có thể đem lại thành công cho tổ chức bằng nhiều cách, bao gồm khả năng cung cấp cho nhà quản lý, người ra quyết định thông tin kịp thời, chính xác, thích hợp dựa trên các dữ liệu 3Giới thiệuMột cơ sở dữ liệu có thể đem lại thành công cho tổ chức bằng nhiều cách, bao gồm khả năng cung cấp cho nhà quản lý, người ra quyết định thông tin kịp thời, chính xác, thích hợp dựa trên các dữ liệu. Cơ sở dữ liệu còn giúp các công ty có thông tin để hạ chi phí, tăng doanh thu, theo dõi các hoạt động kinh doanh, có cơ hội khai phá thị trường mới. Thật vậy, khác biệt giữa kẻ thắng, người thua trong thương trường cạnh tranh cao độ là khả năng thu thập dữ liệu, phân tích, và hành động nhanh chóng. Vì dữ liệu có tính quyết định đến thành công của tổ chức, nhiều doanh nghiệp phát triển cơ sở dữ liệu để truy cập dữ liệu và sử dụng chúng một cách có hiệu quả hơn.4Giới thiệuCơ sở dữ liệu là tập hợp dữ liệu được tổ chức để đáp ứng nhu cầu của người dùng. Chúng ta đã tiếp cận nhiều cơ sở dữ liệu trực tiếp hay gián tiếp. Ta truy cập một cơ sở dữ liệu bằng phần mềm gọi là hệ quản trị cơ sở dữ liệu (database management system - DBMS), DBMS gồm một nhóm chương trình điều khiển cơ sở dữ liệu và cung cấp giao diện giữa cơ sở dữ liệu và người dùng và các chương trình ứng dụng khác. Một cơ sở dữ liệu, một DBMS, và các chương trình ứng dụng cơ sở dữ liệu tạo nên môi trường cơ sở dữ liệu. Hiểu rõ các khái niệm cơ bản của hệ thống cơ sở dữ liệu giúp tăng cường khả năng sử dụng sức mạnh hệ thống cơ sở dữ liệu được vi tính hóa để hỗ trợ hệ thống thông tin và mục tiêu của tổ chức. 5I- Quản lý dữ liệu Nếu thiếu dữ liệu và khả năng xử lý các dữ liệu nầy, một tổ chức không thể thực hiện thành công hầu hết các hoạt động kinh doanh. Dữ liệu chỉ bao gồm những sự kiện thô như số nhân viên, doanh số bán hàng Để dữ liệu chuyển thành thông tin hữu dụng, nó phải được tổ chức một cách có ý nghĩa. 6I- Quản lý dữ liệu - Hệ thống dữ liệuKý tự (character) đơn vị cơ bản để xây dựng thông tin, bao gồm chữ hoa, chữ thường, con số, hay các ký tự đặc biệt khác (như ! ; +; /) . Các ký tự hợp lại thành trường.Trường (field): đặc trưng bởi một cái tên, con số, hay các từ ngữ miêu tả một bộ phận của một đối tượng hay một hoạt động kinh doanh.Mẩu tin (record): tập hợp các trường có liên hệ với nhau. Tổng hợp các trường miêu tả các bộ phận, ta được một đối tượng hay hoạt động kinh doanh hoàn chỉnh. VD, một mẩu tin về nhân công được tổng hợp từ các trường về một nhân công như họ, tên, địa chỉ, bộ phận, tiền lương Tập tin (file): là tập hợp các mẩu tin có liên hệ với nhau. VD tập tin về nhân viên là tập hợp của các mẩu tin về nhân viên trong công ty. Các phần mềm cơ sở dữ liệu thường biểu diễn tập tin bằng một bảng.Cơ sở dữ liệu (database): tập hợp các tập tin có liên quan với nhau.7I- Quản lý dữ liệu 82- Các thực thể dữ liệu, thuộc tính, khoáThực thể (entity) biểu hiện một lớp khái quát các đối tượng con người, nơi chốn hay sự vật mà các dữ liệu thu thập, lưu trữ và bảo trì.Thuộc tính (attribute) biểu hiện một phần đặc trưng của thực thể. VD: mã nhân viên, tên, họ, bộ phận là các thuộc tính của nhân viên. Giá trị cụ thể của một thuộc tính gọi là data item, chứa trong các trường của mẩu tin thể hiện một thực thể.Khóa (key): là một trường hay một nhóm trường dùng để nhận biết mẩu tin. Khóa chính (primary key) là một hay một nhóm trường đặc biệt của mẩu tin, không mẩu tin nào khác có được, dùng để phân biệt các mẩu tin (VD mỗi nhân viên chỉ có duy nhất một mã số, không ai giống ai). Khi xác định mẩu tin cụ thể có nhiều tiêu chuẩn phân biệt, ta có thể dùng kết hợp các khóa phụ (secondary key). VD khi tìm một SV nhưng không biết khóa chính (mã số SV), ta có thể tìm theo một khóa phụ như lớp, rồi từ đó, kiểm tra các khóa khác như họ, tên, ngày sinh để tìm chính xác SV. 9Các thực thể dữ liệu, thuộc tính, khoá10Cách tiếp cận theo Truyền thốngPhương pháp quản lý dữ liệu truyền thống là cách tiếp cận các tập tin dữ liệu riêng biệt được thiết lập và lưu trữ cho từng chương trình ứng dụng. Ví dụ, các mẩu tin về khách hàng được giữ trong các tập tin khác nhau, mỗi tập tin dùng cho một hoạt động riêng như giao hàng, lập hóa đơn Khuyết điểm - Dư thừa dữ liệu (Không toàn vẹn dữ liệu) - Mỗi ứng dụng phụ thuộc một chương trình riêng, một dữ liệu riêng11Cách tiếp cận theo Cơ sở dữ liệuPhương pháp quản lý dữ liệu theo CSDL là cách tiếp cận khối dữ liệu có liên quan nhau, được chia xẻ sử dụng bởi nhiều chương trình ứng dụng.Ưu điểmNâng cao giá trị khối dữ liệu: dữ liệu chính xác, đầy đủ, cập nhật Giảm dữ liệu dư thừa: Cải thiện tính toàn vẹn dữ liệu: Dễ dàng chỉnh sửa và cập nhật: Vì không động chạm đến CTDữ liệu và chương trình độc lập nhau: Truy cập dữ liệu và thông tin tốt hơn: Chuẩn hóa cách truy cập dữ liệu: Tạo ra một khuôn mẫu để phát triển chương trình. chương trình phải thông qua các DBMS để lấy dữ liệu nên chuẩn hóa phương thức truy cập cơ.Bảo vệ dữ liệu tốt hơn. Các đoạn mã bảo mật và mật khẩu đảm bảo rằng chỉ những người được phép mới được truy cập Chia sẻ tài nguyên dữ liệu và thông tin. Chi phí phần cứng, phần mềm, nhân sự có thể trải rộng ra cho các ứng dụng và người dùng. Đây là đặc điểm quan trọng của DBMS 12Cách tiếp cận theo Cơ sở dữ liệuKhuyết điểm Chi phí mua và vận hành DBMS trên máy chủ cao.Tăng chi phí chuyên gia. Để thi hành và phối hợp CSDL cần thêm chuyên gia và nhân sự. Tuy nhiên, một số tổ chức đã áp dụng phương pháp CSDL mà không thêm nhân sự.Gia tăng nguy hiểm. Mặc dù CSDL có thể được bảo mật tốt hơn nhờ vào các mức độ bảo mật tập trung trong một hệ thống, nhưng dữ liệu dễ bị truy cập bởi tội phạm một khi các biện pháp bảo mật bị xâm hại. Thêm vào đó, vì một lý do nào đó mà DBMS bị lỗi, điều này sẽ làm ành hưởng đến nhiều chương trình ứng dụng.13II/ MÔ HÌNH HÓA DỮ LIỆU VÀ MÔ HÌNH CSDLKhi xây dựng một CSDL một tổ chức cần xem xét cẩn thận những câu hỏi sau: Nội dung: Những dữ liệu nào cần thu thập và giá bao nhiêu ?Truy cập: Những dữ liệu nào phục vụ ai và khi nào ?Cấu trúc luận lý: Dữ liệu được sắp xếp ra sao để có ý nghĩa đối với người dùng ? Cấu tạo vật lý: Vị trí lưu trữ dữ liệu ở đâu?14II/ MÔ HÌNH HÓA DỮ LIỆUChìa khóa quan trọng trong việc tổ chức dữ liệu của một CSDL bao gồm:Những dữ liệu nào được tập hợp trong CSDL.Ai sẽ sử dụng.Mục đích sử dụng dữ liệu.15II/ MÔ HÌNH HÓA DỮ LIỆUXây dựng một CSDL đòi hỏi hai loại thiết kế khác nhau: thiết kế luận lý & thiết kế vật lý.Thiết kế luận lý một CSDL tạo ra một mô hình trừu tượng, dữ liệu được tổ chức sắp xếp như thế nào để dễ dàng tìm thấy những thông tin cần thiết. Thiết kế luận lý của một CSDL bao gồm: - Nhận biết các mối quan hệ giữa những dữ liệu khác nhau và nhóm chúng theo thứ tự. - Bởi vì CSDL cung cấp cả đầu vào và đầu ra cho hệ thống thông tin trong suốt công ty, người dùng từ những khu vực chức năng khác nhau nên những người nầy cần hỗ trợ việc thiết kế luận lý để đảm bảo nhu cầu của họ được đáp ứng.16II/ MÔ HÌNH HÓA DỮ LIỆUThiết kế vật lý Bắt đầu từ bản thiết kế luận lý và tinh chỉnh để nó hoạt động và tính toán chi phí (VD cải thiện thời gian trả lời, giảm không gian lưu trữ, giảm chi phí vận hành). Những người tinh chỉnh thiết kế vật lý phải có sự hiểu biết sâu rộng về hệ thống quản lý dữ liệu để thi hành CSDL.Một trong những công cụ nhà thiết kế CSDL dùng để chỉ ra mối quan hệ luận lý giữa các dữ liệu là mô hình dữ liệu. Đó là một biểu đồ các thực thể và mối quan hệ giữa chúng. Việc mô hình hóa dữ liệu bao gồm việc nhận thức được một vấn đề cụ thể và phân tích dữ liệu cùng thông tin cần thiết để tìm ra giải pháp17II/ MÔ HÌNH CƠ SỞ DỮ LIỆU Cấu trúc của những mối quan hệ trong hầu hết những CSDL thường là một trong ba mô hình sau: Cây phân cấp (Hierarchical Models) Mạng (Network Model) Quan hệ. (Relational Model)Hầu hết CSDL mới đều được xây dựng theo mô hình quan hệ.18II/ MÔ HÌNH CƠ SỞ DỮ LIỆU – Mô hình cây phân cấpTrong mô hình cây phân cấp, dữ liệu được tổ chức theo cấu trúc từ trên xuống. Mô hình cây phân cấp được áp dụng trong những trường hợp mối quan hệ luận lý giữa các dữ liệu có thể diễn tả theo cách tiếp cận một-nhiều.19II/ MÔ HÌNH CƠ SỞ DỮ LIỆU – Mô hình mạngMô hình mạng là mô hình cây phân cấp mở rộng. Mô hình mạng là kiểu quan hệ chủ-thành viên (owner-member), trong đó mỗi thành viên có thể có nhiều chủ.20II/ MÔ HÌNH CƠ SỞ DỮ LIỆU – Mô hình quan hệ Trong một CSDL được tổ chức theo mô hình quan hệ, dữ liệu được đặt trong các bảng hai chiều gọi là các mối quan hệ, tương đương các tập tin. Các bảng tổ chức dữ liệu theo hàng và cột, đơn giản hóa việc truy cập và thao tác trên dữ liệu. Trong một bảng, mỗi hàng là một thực thể, mỗi cột là một thuộc tính. Mỗi thuộc tính đều có giá trị cụ thể, nằm trong một miền giá trị (domain). Khai báo rõ miền giá trị sẽ giúp dữ liệu được chính xác hơn.Ưu : dễ điều khiển, linh động, trực quan. Được dùng rộng rãi cho các CSDL lớn, trên các máy PC hoặc máy lớn21Ví dụ về mô hình quan hệ22II/ Thao tác cơ bản trên dữ liệuThao tác cơ bản trên dữ liệu bao gồm: Phép chọn, phép chiếu và phép nối.Phép chọn (Selecting) là thao tác lấy về các hàng theo điều kiện. Phép chiếu (Projecting) là thao tác lọc bớt các cột trong bảng. Phép nối (Joining) là thao tác nối hai hay nhiều bảng với nhau.23III- Hệ quản trị CSDL - DBMSMột hệ quản trị cơ sở dữ liệu là một nhóm những chương trình được dùng như là một giao diện giữa một cơ sở dữ liệu và những chương trình ứng dụng hay với người dùng. DBMS được phân loại theo kiểu mô hình cơ sở dữ liệu mà chúng hỗ trợ. Tất cả DBMS đều có vài chức năng chung, như là cung cấp cách xem CSDL, lưu trữ và trả lại dữ liệu, chỉnh sửa CSDL, thao tác trên dữ liệu, xuất báo cáo. 24Hệ quản trị CSDL – Cung cấp cách xem CSDLDBMS có thể tham khảo một sơ đồ để tìm nơi truy cập dữ liệu được yêu cầu trong mối liên hệ với những mẫu dữ liệu khác. Một DBMS cũng thực hiện như một giao diện với người sử dụng bằng cách cung cấp một cái nhìn tổng quan về cơ sở dữ liệu 25Hệ quản trị CSDL – Tạo và hiệu chỉnh CSDLDDL (data definition language) ngôn ngữ định nghĩa dữ liệu. DDL là một tập hợp những chỉ dẫn và câu lệnh được dùng để định nghĩa và mô tả dữ liệu cùng những mối quan hệ giữa dữ liệu trong một cơ sở dữ liệu cụ thể.Tự điển dữ liệu (data dictionary)Cung cấp một định nghĩa chuẩn cho những giới hạn và thành phần dữ liệu. Nó cung cấp các giới hạn và biến số nhất quán dùng cho tất cả các chương trình.Hỗ trợ lập trình viên trong việc thiết kế và viết chương trình Đơn giản hoá việc hiệu chỉnh cơ sở dữ liệu: Từ điển dữ liệu góp phần đem lại các ưu điểm cho cách tiếp cận CSDL.Giảm bớt dữ liệu dư thừa.Gia tăng độ tin cậy của dữ liệu. Phát triển chương trình nhanh hơn. Hiệu chỉnh dữ liệu và thông tin dễ dàng hơn 26Hệ quản trị CSDL – Thao tác trên dữ liệuKhi một DBMS được cài đặt, hệ thống có thể được dùng bởi tất cả những người sử dụng thông qua những lệnh cụ thể trong các ngôn ngữ lập trình khác nhau. Một ví dụ về câu truy vấn: SELECT * FROM EMPLOYEE WHERE JOB_CLASSIFICATION=”C2”. Dấu * lệnh cho chương trình lấy tất cả các cột từ bảng EMPLOYEE. TThường thì các lệnh được dùng để thao tác trên cơ sở dữ liệu thuộc ngôn ngữ thao tác dữ liệu (data manipulation language – DML), ngôn ngữ cho phép người quản lý và những người dùng khác truy cập, hiệu chỉnh và truy vấn dữ liệu trong cơ sở dữ liệu để ra những bản báo cáo 27Hệ quản trị CSDL – Thao tác trên dữ liệuNgôn ngữ truy vấn có cấu trúc (Structured query language- SQL)Năm 1986, Viện Tiêu Chuẩn Quốc Gia Mỹ (ANSI) đã công nhận SQL là ngôn ngữ truy vấn chuẩn cho cơ sở dữ liệu quan hệ. Từ đó, sự quan tâm trong việc làm cho SQL thành một phần đầy đủ của của cơ sở dữ liệu quan hệ trên cả máy tính lớn và máy tính cá nhân đã tăng lên.Các lập trình viên và người dùng cơ sở dữ liệu có thể thấy SQL có giá trị vì những lệnh của SQL có thể được nhúng vào nhiều ngôn ngữ lập trình, như C và COBOL. Vì SQL sử dụng những thủ tục được tiêu chuẩn và đơn giản hoá để lấy, lưu trữ, thao tác dữ liệu, nó có thể được sử dụng dễ dàng.285. Nhà quản trị cơ sở dữ liệu (Database Administrator)Những khả năng của DBA bao gồm thiết kế, thi hành và bảo dưỡng hệ thống cơ sở dữ liệu; thiết lập những chính sách và thủ tục liên quan đến quản lý, an ninh, bảo dưỡng và sử dụng hệ thống quản lý cơ sở dữ liệu; huấn luyện những nhân viên về quản lý và sử dụng cơ sở dữ liệu.Một vài tổ chức đã lập một vị trí gọi là data administrator (nhà quản trị dữ liệu). Nhà quản trị dữ liệu không có vai trò kỹ thuật, nhưng có vai trò quan trọng trong việc đảm bảo dữ liệu được quản lý như tài nguyên quan trọng của công ty. Nhà quản trị dữ liệu có trách nhiệm thiết lập các tiêu chuẩn và định nghĩa dữ liệu cho phù hợp với các CSDL mà tổ chức có.295. Các hệ quản trị CSDL phổ biểnCorel ‘s ParadoxFileMaker’s ProMicrosoft AccessLotus’s ApproachIBM DB2Oracle MicrosoftThị trường phần mềm BDMS mổi năm thu được khoảng 10 tỷ USD305. Lựa chọn một hệ quản trị CSDLCác căn cứ để lựa chọn một phần mềm DMMSKích thước cơ sở dữ liệuSố người sử dụng cùng lúcTốc độ cập nhật, số người được truy cập cùng lúcSự tích hợp (chạy trên hệ điều hành nào ?)Tính năng (bảo mật, dễ sử dụng, wizard)Hãng cung cấpChi phí315. Ứng dụng Cơ sở dữ liệuNhững kiểu dữ liệu và thông tin mà nhà quản trị cần, thay đổi theo sự thay đổi của quá trình kinh doanh. Nhiều ứng dụng CSDL có hiệu quả có khả năng đáp ứng nhu cầu nhà quản trị, chúng liên kết CSDL của công ty với Internet, thiết lập những trung tâm và kho dữ liệu, sử dụng những CSDL cho những chiến lược kinh doanh, cho phép tổ chức đặt dữ liệu ở các vị trí khác nhau, sử dụng tiến trình xử lý trực tuyến, mở ra những mức độ liên kết để tăng khả năng sản xuất, phát triển CSDL với phương pháp hướng đối tượng, nghiên cứu và sử dụng những dữ liệu không có cấu trúc như đồ họa và video. 325.Ứng dụng CSDL- liên kết CSDL của công ty với InternetKhách hàng, nhà cung cấp và nhân viên công ty phải có khả năng truy cập CSDL thông qua Internet, thông qua mạng nội bộ, mạng mở rộng để đáp ứng những nhu cầu khác nhau. Ví dụ như khi mua sắm qua Internet khách hàng có thể biết thêm chi tiết về thông tin sản phẩm bằng cách truy cập CSDL về sản phẩm, bao gồm kích cỡ, màu sắc, kiểu, và giá cả chi tiết. Nhà cung cấp sử dụng Internet và các mạng nội bộ mở rộng để xem CSDL hàng tồn kho để kiểm tra lượng nguyên liệu thô và những kế hoạch sản xuất hiện thời để xác định thời điểm và số lượng của những sản phẩm phải giao. Nhân viên công ty cần truy cập vào những CSDL để hỗ trợ cho việc ra quyết định ngay cả khi họ không có nơi đó. Trong các trường hợp trên, họ có thể sử dụng máy tính xách tay và truy cập dữ liệu thông qua Internet hoặc mạng nội bộ của công ty.335.Ứng dụng CSDL - Kho dữ liệu (data warehouse)Một kho dữ liệu là một CSDL tập hợp những thông tin kinh tế từ nhiều nguồn trong việc kinh doanh, bao gồm tất cả các quá trình của công ty, sản phẩm và khách hàng. Kho dữ liệu cung cấp cho nhà kinh doanh những khía cạnh khác nhau của dữ liệu mà họ cần để phân tích điều kiện kinh doanh Kho dữ liệu điển hình bắt đầu như một CSDL lớn, chứa đựng hàng triệu và thậm chí trăm triệu mẩu tin. Khi dữ liệu từ nhiều hệ thống khác nhau được thu thập, một CSDL có tính lịch sử được xây dựng cho các phân tích viên có thể sử dụng. Để luôn chính xác, rõ ràng, kho dữ liệu luôn cập nhật thường xuyên.Việc cập nhật phải nhanh, hiệu quả và tự động. Thông thường kho dữ liệu chứa dữ liệu 3-10 năm từ quá khứ đến hiện tại. Công cụ dọn dẹp dữ liệu (data cleanup) có thể nối kết các dữ liệu từ nhiều nguồn vào CSDL, tự động tập hợp dữ liệu và kiểm tra, xóa dữ liệu không mong muốn, và bảo vệ dữ liệu trong một hệ thống CSDL. 345.Ứng dụng CSDL - Kho dữ liệu355.Ứng dụng CSDL - Trung tâm dữ liệu (data mart)Trung tâm dữ liệu là tập con của kho dữ liệu. Trung tâm dữ liệu mang những khái niệm của kho dữ liệu (phân tích trực tuyến sự mua bán, kiểm kê và cần cho những dữ liệu kinh doanh khác, tập hợp từ hệ thống xử lý giao dịch) áp dụng cho các doanh nghiệp vừa và nhỏ, các phòng ban trong công ty lớn. Thay vì chứa tất cả các dữ liệu kinh doanh trong một khối CSDL , trung tâm dữ liệu chứa tập hợp những dữ liệu về một mặt của việc kinh doanh của công ty, ví dụ như tài chính, hàng tồn kho, nhân sự Trên thực tế, trung tâm dữ liệu có thể mang lại nhiều dữ liệu chi tiết về một lĩnh vực hơn một kho dữ liệu.Trung tâm dữ liệu hữu dụng cho những nhóm nhỏ người muốn truy cập dữ liệu chi tiết. Vì trung tâm dữ liệu chứa khoảng 10 GB dữ liệu, ngược với hàng trăm GB kho dữ liệu, chúng có thể triển khai trên một phần cứng yếu hơn với một thiết bị lưu trữ nhỏ hơn, tiết kiệm chi phí cho công ty. 365.Ứng dụng CSDL - Khai mỏ dữ liệu (data mining)Data mining là một công cụ phân tích thông tin, bao gồm việc tự động tìm ra các khuôn mẫu và các mối quan hệ trong một kho dữ liệu. Data mining dùng những kỹ thuật thống kê cao cấp và bộ máy nghiên cứu để tìm ra các sự kiện trong một CSDL lớn, kể cả CSDL trên Internet. Data mining dùng công cụ phân tích xây dựng sẵn để tự động rút ra các giả thuyết về các khuôn mẫu và những cái bất thường để dự báo hoạt động trong tương lai.375. Tình báo trong kinh doanh (business intelligence)Business intelligence là tiến trình thu thập đầy đủ và phân tích thông tin chính xác, hợp thời, với hình thức tiện lợi để tác động tích cực vào các chiến thuật, chiến lược hay hoạt động kinh doanh. Business intelligence bao gồm việc chuyển dữ liệu trở thành thông tin hữu ích được sắp xếp trong suốt quá trình kinh doanh. Công ty sử dụng những thông tin này để ra những chiến lược như thâm nhập thị trường nào, cách quản lý mối quan hệ khách hàng, lựa chọn và nâng cao chất lượng sản phẩm để tăng lợi nhuận và thị phần. Competitive intelligence là một mặt của business intelligence được giới hạn trong thông tin về những đối thủ cạnh tranh và cách tác động đến chiến lược,chiến thuật và hoạt động kinh doanh; là một tiến trình tiếp diễn bao gồm tập hợp những thông tin hợp pháp và đúng quy tắc