Bước tới nội dung

Khác biệt giữa bản sửa đổi của “Lưu trữ web”

Bách khoa toàn thư mở Wikipedia
Nội dung được xóa Nội dung được thêm vào
Không có tóm lược sửa đổi
Thẻ: Đã bị lùi lại Soạn thảo trực quan Edit Check (references) activated Sửa đổi di động Sửa đổi từ trang di động
n Đã lùi lại sửa đổi của 2402:9D80:21F:889A:D0B6:FCFF:FE7C:FC7 (thảo luận) quay về phiên bản cuối của P. ĐĂNG
Thẻ: Lùi tất cả
Dòng 1: Dòng 1:
'''Lưu trữ web''' ([[tiếng Anh]]: '''Web archiving''') là một quá trình thu thập các phần của [[World Wide Web|web]] để chắc chắn thông tin là dạng [[Lưu trữ dữ liệu máy tính|lưu trữ kỹ thuật số]] (''Digital preservation'') để các nhà nghiên cứu, sử gia và công chúng tra cứu trong tương lai.<ref>{{Chú thích tạp chí|title = Decay of References to Web sites in Articles Published in General Medical Journals: Mainstream vs Small Journals|url = http://www.schattauer.de/index.php?id=1214&doi=10.4338/ACI-2013-07-RA-0055|journal = Applied Clinical Informatics|date = ngày 1 tháng 1 năm 2013|volume = 4|issue = 4|doi = 10.4338/aci-2013-07-ra-0055|first = P.|last = Habibzadeh|first2 = Schattauer GmbH - Publishers for Medicine and Natural|last2 = Sciences|access-date = ngày 17 tháng 1 năm 2021 |archive-date = ngày 2 tháng 3 năm 2020 |archive-url = https://web.archive.org/web/20200302171336/http://www.schattauer.de/index.php?id=1214&doi=10.4338%2FACI-2013-07-RA-0055|url-status=dead}}</ref>
'''Lưu trữ web''' ([[tiếng Anh]]: '''Web archiving''') là một quá trình thu thập các phần của [[World Wide Web|web]] để chắc chắn thông tin là dạng [[Lưu trữ dữ liệu máy tính|lưu trữ kỹ thuật số]] (''Digital preservation'') để các nhà nghiên cứu, sử gia và công chúng tra cứu trong tương lai.<ref>{{Chú thích tạp chí|title = Decay of References to Web sites in Articles Published in General Medical Journals: Mainstream vs Small Journals|url = http://www.schattauer.de/index.php?id=1214&doi=10.4338/ACI-2013-07-RA-0055|journal = Applied Clinical Informatics|date = ngày 1 tháng 1 năm 2013|volume = 4|issue = 4|doi = 10.4338/aci-2013-07-ra-0055|first = P.|last = Habibzadeh|first2 = Schattauer GmbH - Publishers for Medicine and Natural|last2 = Sciences|access-date = ngày 17 tháng 1 năm 2021 |archive-date = ngày 2 tháng 3 năm 2020 |archive-url = https://web.archive.org/web/20200302171336/http://www.schattauer.de/index.php?id=1214&doi=10.4338%2FACI-2013-07-RA-0055|url-status=dead}}</ref>


<ref>{{Chú thích|title=Thảo luận Thành viên:2402:9D80:21F:889A:D0B6:FCFF:FE7C:FC7|date=2024-09-27|url=https://vi.m.wikipedia.org/w/index.php?title=Th%E1%BA%A3o_lu%E1%BA%ADn_Th%C3%A0nh_vi%C3%AAn:2402:9D80:21F:889A:D0B6:FCFF:FE7C:FC7#c-2402:9D80:21F:889A:D0B6:FCFF:FE7C:FC7-20240927165900|work=Wikipedia tiếng Việt|language=vi|access-date=2024-09-27}}</ref>Tổ chức lưu trữ web lớn nhất dựa trên phương pháp thu thập thông tin hàng loạt là [[Wayback Machine]] của [[Internet Archive]], duy trì một kho lưu trữ rất lớn của toàn bộ Web. [[Thảo luận Thành viên:2402:9D80:21F:889A:D0B6:FCFF:FE7C:FC7#c-2402:9D80:21F:889A:D0B6:FCFF:FE7C:FC7-20240927165900]]
Tổ chức lưu trữ web lớn nhất dựa trên phương pháp thu thập thông tin hàng loạt là [[Wayback Machine]] của [[Internet Archive]], duy trì một kho lưu trữ rất lớn của toàn bộ Web.


==Thu thập thông tin Web==
==Thu thập thông tin Web==

Phiên bản lúc 17:46, ngày 27 tháng 9 năm 2024

Lưu trữ web (tiếng Anh: Web archiving) là một quá trình thu thập các phần của web để chắc chắn thông tin là dạng lưu trữ kỹ thuật số (Digital preservation) để các nhà nghiên cứu, sử gia và công chúng tra cứu trong tương lai.[1]

Tổ chức lưu trữ web lớn nhất dựa trên phương pháp thu thập thông tin hàng loạt là Wayback Machine của Internet Archive, duy trì một kho lưu trữ rất lớn của toàn bộ Web.

Thu thập thông tin Web

Thông thường, các nhà lưu trữ nội dung thu thập thông tin các dạng nội dung web như HTML, style sheet (phát triển web), JavaScript, Hình ảnh kỹ thuật số, và video kỹ thuật số. Họ cũng lưu trữ siêu dữ liệu về các nguồn tài nguyên thu thập được như thời gian truy xuất, dạng media, và độ dài nội dung. Dạng siêu dữ liệu này hữu dụng trong việc thiết lập xác thựcnguồn gốc (provenance) của bộ sưu tập lưu trữ.

Tham khảo

  1. ^ Habibzadeh, P.; Sciences, Schattauer GmbH - Publishers for Medicine and Natural (ngày 1 tháng 1 năm 2013). “Decay of References to Web sites in Articles Published in General Medical Journals: Mainstream vs Small Journals”. Applied Clinical Informatics. 4 (4). doi:10.4338/aci-2013-07-ra-0055. Bản gốc lưu trữ ngày 2 tháng 3 năm 2020. Truy cập ngày 17 tháng 1 năm 2021.
Sách chuyên khảo

Liên kết ngoài