Dữ liệu cá nhân gồm những thông tin gì? Bảo vệ dữ liệu cá nhân là hoạt động như thế nào theo quy định của pháp luật Việt Nam?
Theo quy định tại Điều 2 Nghị định số 13/2023/NĐ-CP quy định về “Giải thích từ ngữ” như sau:
1. Dữ liệu cá nhân là thông tin dưới dạng ký hiệu, chữ viết, chữ số, hình ảnh, âm thanh hoặc dạng tương tự trên môi trường điện tử gắn liền với một con người cụ thể hoặc giúp xác định một con người cụ thể. Dữ liệu cá nhân bao gồm dữ liệu cá nhân cơ bản và dữ liệu cá nhân nhạy cảm.
2. Thông tin giúp xác định một con người cụ thể là thông tin hình thành từ hoạt động của cá nhân mà khi kết hợp với các dữ liệu, thông tin lưu trữ khác có thể xác định một con người cụ thể.
3. Dữ liệu cá nhân cơ bản bao gồm:
a) Họ, chữ đệm và tên khai sinh, tên gọi khác (nếu có);
b) Ngày, tháng, năm sinh; ngày, tháng, năm chết hoặc mất tích;
c) Giới tính;
d) Nơi sinh, nơi đăng ký khai sinh, nơi thường trú, nơi tạm trú, nơi ở hiện tại, quê quán, địa chỉ liên hệ;
đ) Quốc tịch;
e) Hình ảnh của cá nhân;
g) Số điện thoại, số chứng minh nhân dân, số định danh cá nhân, số hộ chiếu, số giấy phép lái xe, số biển số xe, số mã số thuế cá nhân, số bảo hiểm xã hội, số thẻ bảo hiểm y tế;
h) Tình trạng hôn nhân;
i) Thông tin về mối quan hệ gia đình (cha mẹ, con cái);
k) Thông tin về tài khoản số của cá nhân; dữ liệu cá nhân phản ánh hoạt động, lịch sử hoạt động trên không gian mạng;
l) Các thông tin khác gắn liền với một con người cụ thể hoặc giúp xác định một con người cụ thể không thuộc quy định tại khoản 4 Điều này.
4. Dữ liệu cá nhân nhạy cảm là dữ liệu cá nhân gắn liền với quyền riêng tư của cá nhân mà khi bị xâm phạm sẽ gây ảnh hưởng trực tiếp tới quyền và lợi ích hợp pháp của cá nhân gồm:
a) Quan điểm chính trị, quan điểm tôn giáo;
b) Tình trạng sức khỏe và đời tư được ghi trong hồ sơ bệnh án, không bao gồm thông tin về nhóm máu;
c) Thông tin liên quan đến nguồn gốc chủng tộc, nguồn gốc dân tộc;
d) Thông tin về đặc điểm di truyền được thừa hưởng hoặc có được của cá nhân;
đ) Thông tin về thuộc tính vật lý, đặc điểm sinh học riêng của cá nhân;
e) Thông tin về đời sống tình dục, xu hướng tình dục của cá nhân;
g) Dữ liệu về tội phạm, hành vi phạm tội được thu thập, lưu trữ bởi các cơ quan thực thi pháp luật;
h) Thông tin khách hàng của tổ chức tín dụng, chi nhánh ngân hàng nước ngoài, tổ chức cung ứng dịch vụ trung gian thanh toán, các tổ chức được phép khác, gồm: thông tin định danh khách hàng theo quy định của pháp luật, thông tin về tài khoản, thông tin về tiền gửi, thông tin về tài sản gửi, thông tin về giao dịch, thông tin về tổ chức, cá nhân là bên bảo đảm tại tổ chức tín dụng, chi nhánh ngân hàng, tổ chức cung ứng dịch vụ trung gian thanh toán;
i) Dữ liệu về vị trí của cá nhân được xác định qua dịch vụ định vị;
k) Dữ liệu cá nhân khác được pháp luật quy định là đặc thù và cần có biện pháp bảo mật cần thiết.
5. Bảo vệ dữ liệu cá nhân là hoạt động phòng ngừa, phát hiện, ngăn chặn, xử lý hành vi vi phạm liên quan đến dữ liệu cá nhân theo quy định của pháp luật.
6. Chủ thể dữ liệu là cá nhân được dữ liệu cá nhân phản ánh.
7. Xử lý dữ liệu cá nhân là một hoặc nhiều hoạt động tác động tới dữ liệu cá nhân, như: thu thập, ghi, phân tích, xác nhận, lưu trữ, chỉnh sửa, công khai, kết hợp, truy cập, truy xuất, thu hồi, mã hóa, giải mã, sao chép, chia sẻ, truyền đưa, cung cấp, chuyển giao, xóa, hủy dữ liệu cá nhân hoặc các hành động khác có liên quan.
8. Sự đồng ý của chủ thể dữ liệu là việc thể hiện rõ ràng, tự nguyện, khẳng định việc cho phép xử lý dữ liệu cá nhân của chủ thể dữ liệu.
9. Bên Kiểm soát dữ liệu cá nhân là tổ chức, cá nhân quyết định mục đích và phương tiện xử lý dữ liệu cá nhân.
10. Bên Xử lý dữ liệu cá nhân là tổ chức, cá nhân thực hiện việc xử lý dữ liệu thay mặt cho Bên Kiểm soát dữ liệu, thông qua một hợp đồng hoặc thỏa thuận với Bên Kiểm soát dữ liệu.
11. Bên Kiểm soát và xử lý dữ liệu cá nhân là tổ chức, cá nhân đồng thời quyết định mục đích, phương tiện và trực tiếp xử lý dữ liệu cá nhân.
12. Bên thứ ba là tổ chức, cá nhân ngoài Chủ thể dữ liệu, Bên Kiểm soát dữ liệu cá nhân, Bên Xử lý dữ liệu cá nhân, Bên Kiểm soát và xử lý dữ liệu cá nhân được phép xử lý dữ liệu cá nhân.
13. Xử lý dữ liệu cá nhân tự động là hình thức xử lý dữ liệu cá nhân được thực hiện bằng phương tiện điện tử nhằm đánh giá, phân tích, dự đoán hoạt động của một con người cụ thể, như: thói quen, sở thích, mức độ tin cậy, hành vi, địa điểm, xu hướng, năng lực và các trường hợp khác.
14. Chuyển dữ liệu cá nhân ra nước ngoài là hoạt động sử dụng không gian mạng, thiết bị, phương tiện điện tử hoặc các hình thức khác chuyển dữ liệu cá nhân của công dân Việt Nam tới một địa điểm nằm ngoài lãnh thổ của nước Cộng hòa xã hội chủ nghĩa Việt Nam hoặc sử dụng một địa điểm nằm ngoài lãnh thổ của nước Cộng hòa xã hội chủ nghĩa Việt Nam để xử lý dữ liệu cá nhân của công dân Việt Nam, bao gồm:
a) Tổ chức, doanh nghiệp, cá nhân chuyển dữ liệu cá nhân của công dân Việt Nam cho tổ chức, doanh nghiệp, bộ phận quản lý ở nước ngoài để xử lý phù hợp với mục đích đã được chủ thể dữ liệu đồng ý;
b) Xử lý dữ liệu cá nhân của công dân Việt Nam bằng các hệ thống tự động nằm ngoài lãnh thổ của nước Cộng hòa xã hội chủ nghĩa Việt Nam của Bên Kiểm soát dữ liệu cá nhân, Bên Kiểm soát và xử lý dữ liệu cá nhân, Bên Xử lý dữ liệu cá nhân phù hợp với mục đích đã được chủ thể dữ liệu đồng ý.
Một số kiến thức cần biết về dữ liệu
Dữ liệu là gì?
Dữ liệu là một tập hợp các thông tin, sự kiện, hay dấu hiệu được thu thập, lưu trữ và xử lý để sử dụng trong quá trình phân tích, tìm hiểu, hoặc đưa ra quyết định. Dữ liệu có thể là các con số, văn bản, hình ảnh, âm thanh, video, hay bất kỳ định dạng thông tin nào khác có thể được ghi lại và xử lý.
Các loại dữ liệu
Có hai loại chính của dữ liệu là:
- Dữ liệu Cấu trúc (Structured Data): Là dữ liệu có tổ chức rõ ràng, thường được lưu trữ trong cơ sở dữ liệu theo các định dạng như bảng, hàng, cột (ví dụ: cơ sở dữ liệu SQL, bảng tính Excel).
- Dữ liệu Phi cấu trúc (Unstructured Data): Là dữ liệu không có cấu trúc rõ ràng, thường không được tổ chức theo các định dạng cụ thể (ví dụ: văn bản tự do, hình ảnh, video, email).
Còn phân theo cấu trúc, tính chất, và mục đích sử dụng. Dưới đây là một số loại dữ liệu phổ biến:
- Dữ liệu Số (Numeric Data): Là dữ liệu được biểu diễn dưới dạng con số. Có thể chia thành hai loại là dữ liệu liên tục (continuous) như chiều cao, cân nặng và dữ liệu rời rạc (discrete) như số lượng sản phẩm bán được.
- Dữ liệu Văn bản (Text Data): Bao gồm văn bản, từ ngữ, và tài liệu văn bản tự do. Đây là loại dữ liệu phi cấu trúc và thường được sử dụng trong xử lý ngôn ngữ tự nhiên (NLP).
- Dữ liệu Hình ảnh (Image Data): Là dữ liệu được biểu diễn dưới dạng hình ảnh hoặc đồ họa. Các ứng dụng phổ biến bao gồm nhận diện đối tượng, xử lý ảnh y khoa, và nhận diện khuôn mặt.
- Dữ liệu Âm thanh (Audio Data): Bao gồm các tệp âm thanh, dữ liệu thu được từ micro và các loại dữ liệu âm thanh khác. Ứng dụng của dữ liệu âm thanh bao gồm nhận diện giọng nói, xử lý âm thanh y khoa và âm nhạc.
- Dữ liệu Video (Video Data): Là dữ liệu di động thời gian, thường được sử dụng trong các ứng dụng như nhận diện hoạt động, giám sát an ninh và trải nghiệm thực tế ảo.
- Dữ liệu Địa lý (Geospatial Data): Bao gồm thông tin liên quan đến vị trí vật lý của đối tượng, như tọa độ địa lý, độ cao, và thông tin địa lý khác.
- Dữ liệu Thời gian (Time Series Data): Là dữ liệu được thu thập theo thời gian liên tục. Ví dụ bao gồm dữ liệu về giá cổ phiếu, nhiệt độ hàng ngày, và dữ liệu sản xuất hàng ngày.
- Dữ liệu Danh mục (Categorical Data): Bao gồm các biến được phân loại thành các nhóm hoặc danh mục cụ thể. Ví dụ bao gồm loại hình sản phẩm, màu sắc, hoặc quốc gia.
- Dữ liệu Đồ thị (Graph Data): Được biểu diễn dưới dạng các mối quan hệ giữa các đối tượng trong một mạng lưới. Ứng dụng bao gồm xã hội học, mạng xã hội, và log mạng.
- Dữ liệu Chuỗi (Sequential Data): Là dữ liệu mà thứ tự của các quan sát quan trọng. Ví dụ bao gồm dữ liệu văn bản, âm thanh, hoặc thời gian.
Dữ liệu là nguồn lực quan trọng trong nhiều lĩnh vực, từ khoa học máy tính, kinh doanh, y tế, giáo dục, đến nghiên cứu khoa học và xã hội. Quản lý và phân tích dữ liệu đang trở thành một lĩnh vực quan trọng để đưa ra những thông tin quan trọng và hỗ trợ quyết định.
Trong tin học dữ liệu là gì?
Trong lĩnh vực tin học dữ liệu, “dữ liệu” (data) thường được hiểu là các thông tin, số liệu, và tập hợp các thông tin số có thể được thu thập, lưu trữ, và xử lý. Tuy nhiên, khái niệm về “dữ liệu” thường được mở rộng để bao gồm cả các dạng dữ liệu phi số hoặc phi cấu trúc như văn bản, hình ảnh, âm thanh, video, và các định dạng khác.
“Tin học dữ liệu” (data science) là một lĩnh vực nghiên cứu và ứng dụng các phương pháp, công cụ, và kiến thức từ nhiều lĩnh vực khác nhau như thống kê, toán học, khoa học máy tính, và kinh doanh để phân tích và hiểu rõ thông tin từ dữ liệu. Cụ thể, tin học dữ liệu bao gồm các giai đoạn như:
- Thu thập Dữ liệu: Bước này liên quan đến việc lấy dữ liệu từ nguồn cung cấp, có thể là các cơ sở dữ liệu, bảng tính, API (Application Programming Interface), logs hệ thống, hoặc các nguồn dữ liệu khác.
- Tiền xử lý Dữ liệu: Trước khi phân tích, dữ liệu thường cần được làm sạch và chuẩn hóa. Các bước tiền xử lý này bao gồm loại bỏ dữ liệu nhiễu, điền giá trị thiếu, và chuyển đổi dữ liệu thành định dạng phù hợp.
- Phân tích Dữ liệu: Sử dụng các phương pháp thống kê, máy học, và các kỹ thuật khác để phân tích dữ liệu và tìm ra các mẫu, xu hướng, hoặc thông tin quan trọng.
- Trực quan hóa Dữ liệu: Việc sử dụng các công cụ và biểu đồ để biểu diễn thông tin một cách trực quan, giúp người sử dụng hiểu rõ hơn về dữ liệu.
- Rút ra Kiến thức và Dự đoán: Dựa trên phân tích, từ dữ liệu có thể rút ra các thông tin quan trọng và thậm chí dự đoán xu hướng tương lai.
- Triển khai và Theo dõi: Cuối cùng, kết quả từ phân tích dữ liệu có thể được triển khai để đưa ra quyết định và theo dõi hiệu suất.
Dữ liệu trong máy tính là gì?
Trong máy tính, “dữ liệu” (data) là một thuật ngữ mô tả các thông tin đầu vào hoặc đầu ra mà máy tính sử dụng để thực hiện các phép tính, xử lý, hoặc lưu trữ. Dữ liệu có thể có nhiều định dạng và loại khác nhau tùy thuộc vào mục đích sử dụng.
Dữ liệu trong máy tính có thể được chia thành hai loại chính:
- Dữ liệu Đầu vào (Input Data): Là dữ liệu mà máy tính nhận từ các nguồn bên ngoài, chẳng hạn như từ bàn phím, chuột, cảm biến, tệp tin, hoặc các thiết bị ngoại vi khác. Dữ liệu đầu vào cung cấp thông tin mà máy tính sẽ xử lý.
- Dữ liệu Đầu ra (Output Data): Là kết quả sau khi máy tính đã xử lý dữ liệu đầu vào. Dữ liệu đầu ra có thể hiển thị trên màn hình, lưu trữ trong bộ nhớ, in ra giấy, hoặc được truyền đi qua mạng.
Dữ liệu có thể thuộc một số định dạng khác nhau, bao gồm:
- Dữ liệu Văn bản: Chuỗi các ký tự, từ ngữ được biểu diễn bằng các ký tự ASCII hoặc Unicode.
- Dữ liệu Số: Các giá trị số, có thể là số nguyên, số thực, hoặc các biểu diễn nhị phân.
- Dữ liệu Hình ảnh và Âm thanh: Dữ liệu biểu diễn hình ảnh và âm thanh, thường được lưu trữ dưới dạng file JPEG, PNG, MP3, WAV, và các định dạng khác.
- Dữ liệu Đồ thị và Mạng lưới: Dữ liệu biểu diễn các mối quan hệ giữa các đối tượng, thường được sử dụng trong lĩnh vực đồ thị và mạng lưới.
- Dữ liệu Tệp tin: Các tệp tin và thư mục được tổ chức để lưu trữ và quản lý dữ liệu.
Thông tin và dữ liệu khác gì nhau?
Thông tin và dữ liệu là hai khái niệm quan trọng, nhưng chúng có sự khác biệt về ý nghĩa và cách sử dụng:
- Dữ liệu (Data):
- Đặc điểm: Dữ liệu là tập hợp các thông tin, số liệu, sự kiện, hoặc các yếu tố khác có thể được thu thập và lưu trữ.
- Tính chất: Dữ liệu có thể là các con số, ký tự, hình ảnh, âm thanh, v.v.
- Ý nghĩa: Dữ liệu chưa được xử lý hoặc không có ngữ cảnh nào cụ thể nên nó không cung cấp thông tin ý nghĩa ngay từ đầu.
- Thông tin (Information):
- Đặc điểm: Thông tin là dữ liệu đã được xử lý và giải mã, đưa vào ngữ cảnh để có ý nghĩa và giúp hiểu rõ hơn về một tình huống hoặc vấn đề cụ thể.
- Tính chất: Thông tin thường được tổ chức, giải thích, và liên kết với các yếu tố khác để tạo ra kiến thức.
- Ý nghĩa: Thông tin mang lại sự hiểu biết và chiều sâu hơn về một chủ đề cụ thể, giúp đưa ra quyết định và hành động.
Ví dụ:
- Dữ liệu: Một dãy số: 1, 3, 5, 7, 9.
- Thông tin: Các số trong dãy trên đại diện cho các số lẻ từ 1 đến 9.
Trong quá trình xử lý, dữ liệu trở thành thông tin khi nó được hiểu và áp dụng trong một ngữ cảnh cụ thể. Tóm lại, dữ liệu là nguyên liệu cơ bản, trong khi thông tin là kết quả của việc xử lý và giải mã dữ liệu.
Ví dụ về dữ liệu
Dữ liệu
Trong ví dụ này, mỗi dòng đều chứa một phần thông tin về một cuốn sách cụ thể. Tuy nhiên, dữ liệu này chưa có ngữ cảnh và ý nghĩa một cách hoàn chỉnh. Đây chỉ là các dữ liệu cơ bản về một cuốn sách, và chúng có thể được sử dụng để tạo ra thông tin chi tiết về cuốn sách đó.
Thông tin (sau khi xử lý):
Ở đây, thông tin đã được tạo ra bằng cách kết hợp và giải thích các dữ liệu ban đầu. Thông tin này mang lại sự hiểu biết và ý nghĩa hơn về cuốn sách, bao gồm cả tác giả, năm xuất bản, số trang, và thể loại.