Máy quay lui

Từ Wikipedia, bách khoa toàn thư miễn phí
Chuyển đến điều hướng Chuyển đến tìm kiếm

Máy quay lui
Dòng chữ cách điệu có nội dung: "MÁY QUAY LẠI LƯU TRỮ INTERNET". Văn bản có màu đen, ngoại trừ "WAYBACK", có màu đỏ.
Ảnh chụp màn hình
20151221 Internet Archive Wayback Machine.png
Hình ảnh hóa các kho lưu trữ wikipedia.org trên Wayback Machine (tháng 12 năm 2015)
Loại trang web
Lưu trữ
Khu vực phục vụTrên toàn thế giới (trừ Trung Quốc)
Chủ nhânLưu trữ Internet
URLweb .archive .org Chỉnh sửa điều này tại Wikidata
Đăng kýKhông bắt buộc
Ra mắt24 tháng 10 năm 2001 ; 19 năm trước [1] [2] ( 2001-10-24 )
Tình trạng hiện tạiHoạt động
Viết vàoJava , Python

Các máy Wayback là một kỹ thuật số lưu trữ của World Wide Web , được thành lập bởi các Lưu trữ Internet , thư viện phi lợi nhuận có trụ sở tại San Francisco . [3] Nó cho phép người dùng quay ngược thời gian và xem các trang web trông như thế nào trong quá khứ. Những người sáng lập của nó, Brewster KahleBruce Gilliat , đã phát triển Wayback Machine với ý định cung cấp "quyền truy cập phổ quát vào tất cả kiến ​​thức" bằng cách bảo quản các bản sao lưu trữ của các trang web không còn tồn tại.

Kể từ khi ra mắt vào năm 1996, hơn 544 tỷ trang đã được thêm vào kho lưu trữ. Dịch vụ này cũng đã gây ra tranh cãi về việc liệu việc tạo các trang lưu trữ mà không có sự cho phép của chủ sở hữu có cấu thành vi phạm bản quyền ở một số khu vực pháp lý nhất định hay không.

Lịch sử [ sửa ]

Những người sáng lập Internet Archive, Brewster KahleBruce Gilliat đã tung ra Wayback Machine vào tháng 10 năm 2001 để giải quyết vấn đề nội dung trang web biến mất bất cứ khi nào nó được thay đổi hoặc khi một trang web bị đóng cửa. [4] Dịch vụ này cho phép người dùng xem các phiên bản đã lưu trữ của các trang web theo thời gian, mà cơ quan lưu trữ gọi là "chỉ mục ba chiều". [5] Kahle và Gilliat đã tạo ra chiếc máy này với hy vọng lưu trữ toàn bộ Internet và cung cấp "quyền truy cập phổ biến vào mọi kiến ​​thức." [6]

Cái tên Wayback Machine được chọn để ám chỉ một thiết bị du hành thời gian hư cấu , " Wayback Machine ", được sử dụng bởi các nhân vật Mister Peabody và Sherman trong phim hoạt hình Cuộc phiêu lưu của Rocky và Bullwinkle and Friends từ những năm 1960. [7] [8] Trong một trong những phân đoạn thành phần của phim hoạt hình, Lịch sử không thể cải thiện của Peabody , các nhân vật thường xuyên sử dụng máy để chứng kiến, tham gia và thường xuyên thay đổi các sự kiện nổi tiếng trong lịch sử.

Wayback Machine bắt đầu lưu trữ các trang web được lưu trong bộ nhớ cache vào tháng 5 năm 1996, [9] [10] với mục tiêu đưa dịch vụ ra công chúng 5 năm sau đó. [11] Từ năm 1996 đến năm 2001, thông tin được lưu trên băng kỹ thuật số, Kahle thỉnh thoảng cho phép các nhà nghiên cứu và nhà khoa học khai thác vào cơ sở dữ liệu khó hiểu . [12] Khi kho lưu trữ kỷ niệm lần thứ năm vào năm 2001, nó được công bố và mở cửa cho công chúng trong một buổi lễ tại Đại học California, Berkeley . [13] Vào thời điểm Wayback Machine ra mắt, nó đã chứa hơn 10 tỷ trang lưu trữ. [14]

Dữ liệu được lưu trữ trên cụm nút Linux lớn của Internet Archive . [6] Thỉnh thoảng, nó sẽ truy cập lại và lưu trữ các phiên bản mới của các trang web (xem chi tiết kỹ thuật bên dưới). [15] Các trang web cũng có thể được thu thập theo cách thủ công bằng cách nhập URL của trang web vào hộp tìm kiếm, với điều kiện trang web đó cho phép Wayback Machine "thu thập dữ liệu" và lưu dữ liệu. [11] Vào ngày 30 tháng 10 năm 2020, Wayback Machine bắt đầu kiểm tra nội dung xác thực. [16]

Chi tiết kỹ thuật [ sửa ]

Phần mềm đã được phát triển để "thu thập dữ liệu" trên Web và tải xuống tất cả các tệp dữ liệu và thông tin có thể truy cập công khai trên các trang web, hệ thống phân cấp Gopher , hệ thống bảng thông báo Netnews (Usenet) và phần mềm có thể tải xuống. [17] Thông tin được thu thập bởi những "trình thu thập thông tin" này không bao gồm tất cả thông tin có sẵn trên Internet, vì phần lớn dữ liệu bị nhà xuất bản hạn chế hoặc được lưu trữ trong cơ sở dữ liệu không thể truy cập được. Để khắc phục sự mâu thuẫn trong các trang web được lưu trong bộ nhớ cache một phần, Archive-It.org được Internet Archive phát triển vào năm 2005 như một phương tiện cho phép các tổ chức và người tạo nội dung tự nguyện thu thập và bảo quản các bộ sưu tập nội dung kỹ thuật số và tạo các kho lưu trữ kỹ thuật số. [18]

Thu thập thông tin được đóng góp từ nhiều nguồn khác nhau, một số được nhập từ các bên thứ ba và một số khác do Kho lưu trữ tạo nội bộ. [15] Ví dụ: thu thập thông tin được đóng góp bởi Sloan FoundationAlexa , thu thập thông tin do IA điều hành thay mặt NARAInternet Memory Foundation , phản ánh của Common Crawl . [15] "Worldwide Web Crawls" đã hoạt động từ năm 2010 và chiếm được trang Web toàn cầu. [15] [19]

Tần suất chụp ảnh nhanh khác nhau trên mỗi trang web. [15] Các trang web trong "Thu thập thông tin web trên toàn thế giới" được đưa vào "danh sách thu thập thông tin", với trang web được lưu trữ một lần cho mỗi lần thu thập thông tin. [15] Quá trình thu thập thông tin có thể mất vài tháng hoặc thậm chí nhiều năm để hoàn thành, tùy thuộc vào kích thước. [15] Ví dụ: "Wide Crawl Number 13" bắt đầu vào ngày 9 tháng 1 năm 2015 và hoàn thành vào ngày 11 tháng 7 năm 2016. [20] Tuy nhiên, có thể có nhiều lần thu thập thông tin diễn ra cùng một lúc và một trang web có thể được đưa vào nhiều hơn một danh sách thu thập thông tin, vì vậy tần suất một trang web được thu thập thông tin rất khác nhau. [15]

Kể từ tháng 10 năm 2019, người dùng bị giới hạn ở 5 yêu cầu lưu trữ và truy xuất mỗi phút. [ cần dẫn nguồn ] [ tại sao? ]

Khả năng lưu trữ và tốc độ tăng trưởng [ sửa ]

Khi công nghệ đã phát triển trong những năm qua, dung lượng lưu trữ của Wayback Machine đã tăng lên. Năm 2003, chỉ sau hai năm truy cập công khai, Wayback Machine đã phát triển với tốc độ 12 terabyte / tháng. Dữ liệu được lưu trữ trên hệ thống giá đỡ PetaBox do nhân viên của Internet Archive thiết kế. Giá đỡ 100TB đầu tiên bắt đầu hoạt động hoàn toàn vào tháng 6 năm 2004, mặc dù đã sớm trở nên rõ ràng rằng chúng sẽ cần nhiều dung lượng hơn thế. [21] [22]

Internet Archive di cư kiến trúc lưu trữ tùy chỉnh của mình cho Sun lưu trữ mở vào năm 2009, và chủ một trung tâm dữ liệu mới trong một Sun Modular Datacenter trên Sun Microsystems trường California. [23] Tính đến năm 2009 , Wayback Machine chứa khoảng ba petabyte dữ liệu và đang tăng với tốc độ 100 terabyte mỗi tháng. [24]

Một phiên bản mới, được cải tiến của Wayback Machine, với giao diện cập nhật và chỉ mục nội dung lưu trữ mới hơn, đã được cung cấp để thử nghiệm công khai vào năm 2011. [25] Vào tháng 3 năm đó, trên diễn đàn Wayback Machine đã nói rằng " Bản beta của Máy Wayback mới có chỉ mục cập nhật và đầy đủ hơn về tất cả các tài liệu được thu thập thông tin vào năm 2010 và sẽ tiếp tục được cập nhật thường xuyên. Chỉ mục điều khiển Máy Wayback cổ điển chỉ có một chút tài liệu trước năm 2008 và không có kế hoạch cập nhật chỉ mục nào nữa, vì nó sẽ bị loại bỏ dần trong năm nay. " [26] Cũng trong năm 2011, Internet Archive đã lắp đặt cặp giá đỡ PetaBox thứ sáu của họ, giúp tăng dung lượng lưu trữ của Wayback Machine lên 700 terabyte. [27]

Vào tháng 1 năm 2013, công ty đã công bố một cột mốc đột phá là 240 tỷ URL. [28]

Vào tháng 10 năm 2013, công ty đã giới thiệu tính năng "Lưu trang" [29] [30] cho phép bất kỳ người dùng Internet nào lưu trữ nội dung của URL và nhanh chóng tạo liên kết vĩnh viễn không giống như tính năng liveweb trước đó .

Vào tháng 12 năm 2014, Wayback Machine chứa 435 tỷ trang web — gần 9 petabyte dữ liệu và đang phát triển với tốc độ khoảng 20 terabyte một tuần. [14] [31] [32]

Vào tháng 3 năm 2015, các nhà nghiên cứu bảo mật [ cần xác minh ngày tháng ] đã nhận thức được mối đe dọa do dịch vụ vô tình lưu trữ các tệp nhị phân độc hại từ các trang web đã lưu trữ. [33] [34]

Vào tháng 7 năm 2016, Wayback Machine được báo cáo chứa khoảng 15 petabyte dữ liệu. [35]

Vào tháng 9 năm 2018, Wayback Machine chứa hơn 25 petabyte dữ liệu. [36] [37]

Tính đến tháng 12 năm 2020, Wayback Machine chứa hơn 70 petabyte dữ liệu. [38]

Sự phát triển của máy quay ngược lại [39] [40]
Máy quay lui theo nămSố trang được lưu trữ (tỷ)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452
Năm 2020
514

Từ tháng 10 năm 2013 đến tháng 3 năm 2015, thứ hạng Alexa toàn cầu của trang web đã thay đổi từ 163 [41] thành 208. [42] Vào tháng 3 năm 2019, thứ hạng này ở vị trí 244. [43]

Chính sách loại trừ trang web [ sửa ]

Về mặt lịch sử, Wayback Machine đã tôn trọng tiêu chuẩn loại trừ rô bốt (robots.txt) trong việc xác định xem một trang web sẽ được thu thập thông tin - hoặc nếu đã được thu thập thông tin, liệu các bản lưu trữ của nó có thể được xem công khai hay không. Chủ sở hữu trang web có tùy chọn từ chối Wayback Machine thông qua việc sử dụng robots.txt. Nó đã áp dụng các quy tắc robots.txt trở về trước; nếu một trang web đã chặn Internet Archive, thì bất kỳ trang nào đã được lưu trữ trước đó từ miền này cũng sẽ ngay lập tức không khả dụng. Ngoài ra, Internet Archive tuyên bố rằng "Đôi khi chủ sở hữu trang web sẽ liên hệ trực tiếp với chúng tôi và yêu cầu chúng tôi ngừng thu thập thông tin hoặc lưu trữ một trang web. Chúng tôi tuân thủ những yêu cầu này". [44]Ngoài ra, trang web cho biết: "Internet Archive không quan tâm đến việc bảo quản hoặc cung cấp quyền truy cập vào các trang Web hoặc các tài liệu Internet khác của những người không muốn tài liệu của họ trong bộ sưu tập." [45] [46]

Vào ngày 17 tháng 4 năm 2017, các báo cáo xuất hiện về các trang web đã không còn tồn tại và trở thành các tên miền trỏ hướng đang sử dụng robots.txt để tự loại trừ chúng khỏi công cụ tìm kiếm, dẫn đến việc chúng vô tình bị loại khỏi Wayback Machine. [47] Kho lưu trữ Internet đã thay đổi chính sách để hiện yêu cầu loại trừ rõ ràng để xóa nó khỏi Wayback Machine. [48]

Chính sách lưu trữ của Oakland [ sửa ]

Chính sách loại trừ có hiệu lực trở về trước của Wayback một phần dựa trên các Khuyến nghị về Quản lý Yêu cầu Xóa và Bảo tồn Tính toàn vẹn của Lưu trữ được xuất bản bởi Trường Quản lý Thông tin và Hệ thống tại Đại học California, Berkeley vào năm 2002, cho phép chủ sở hữu trang web có quyền chặn truy cập vào các kho lưu trữ của trang web . [49] Wayback đã tuân thủ chính sách này để giúp tránh kiện tụng tốn kém. [50]

Chính sách loại trừ có hiệu lực trở lại Wayback bắt đầu được nới lỏng vào năm 2017, khi nó ngừng tôn trọng robots.txt trên các trang web quân sự và chính phủ Hoa Kỳ cho cả việc thu thập dữ liệu và hiển thị các trang web. Kể từ tháng 4 năm 2017, Wayback đang bỏ qua robots.txt rộng rãi hơn, không chỉ cho các trang web của chính phủ Hoa Kỳ. [51] [52] [53] [54]

Sử dụng [ sửa ]

Từ khi ra mắt công chúng vào năm 2001, Wayback Machine đã được các học giả nghiên cứu cả về cách nó lưu trữ và thu thập dữ liệu cũng như các trang thực tế có trong kho lưu trữ của nó. Tính đến năm 2013, các học giả đã viết khoảng 350 bài báo trên Wayback Machine, chủ yếu từ các lĩnh vực công nghệ thông tin, khoa học thư viện và khoa học xã hội. Các học giả khoa học xã hội đã sử dụng Wayback Machine để phân tích sự phát triển của các trang web từ giữa những năm 1990 đến nay đã ảnh hưởng như thế nào đến sự tăng trưởng của công ty. [14]

Khi Wayback Machine lưu trữ một trang, nó thường bao gồm hầu hết các siêu liên kết, giữ cho các liên kết đó hoạt động khi chúng có thể dễ dàng bị phá vỡ do sự không ổn định của Internet. Các nhà nghiên cứu ở Ấn Độ đã nghiên cứu tính hiệu quả của khả năng lưu các siêu liên kết trong các ấn phẩm học thuật trực tuyến của Wayback Machine và nhận thấy rằng nó đã tiết kiệm được hơn một nửa trong số đó. [55]

"Các nhà báo sử dụng Wayback Machine để xem các trang web đã chết, các bản tin thời sự và các thay đổi đối với nội dung trang web. Nội dung của nó đã được sử dụng để buộc các chính trị gia phải chịu trách nhiệm và vạch trần những lời dối trá trên chiến trường." [56] Vào năm 2014, một trang mạng xã hội được lưu trữ của Igor Girkin , một thủ lĩnh phe nổi dậy ly khai ở Ukraine, cho thấy anh ta khoe khoang về việc quân đội của mình đã bắn hạ một máy bay quân sự bị tình nghi của Ukraine trước khi người ta biết rằng chiếc máy bay thực sự là máy bay phản lực dân sự của Malaysia Airlines. ( Chuyến bay 17 của Malaysia Airlines ), sau đó anh ta đã xóa bài đăng và đổ lỗi cho quân đội Ukraine vì đã bắn rơi máy bay. [56] [57] Vào năm 2017, March for Science bắt nguồn từ một cuộc thảo luận trên Redditđiều đó cho thấy ai đó đã truy cập Archive.org và phát hiện ra rằng tất cả các tham chiếu đến biến đổi khí hậu đã bị xóa khỏi trang web của Nhà Trắng. Đáp lại, một người dùng bình luận, "Cần phải có một cuộc hành trình của các nhà khoa học trên Washington". [58] [59] [60]

Hơn nữa, trang web được sử dụng nhiều để xác minh, cung cấp quyền truy cập vào tài liệu tham khảo và tạo nội dung bởi các biên tập viên Wikipedia . [61]

Vào tháng 9 năm 2020, một quan hệ đối tác đã được công bố với Cloudflare để tự động lưu trữ các trang web được cung cấp thông qua dịch vụ "Luôn trực tuyến", dịch vụ này cũng sẽ cho phép nó hướng người dùng đến bản sao của trang web nếu không thể truy cập được máy chủ lưu trữ ban đầu. [62]

Hạn chế [ sửa ]

Vào năm 2014, có khoảng thời gian trễ là sáu tháng từ khi thu thập thông tin trang web đến khi trang web đó có sẵn để xem trong Wayback Machine. [63] Hiện tại, thời gian trễ là 3 đến 10 giờ. [64] Wayback Machine chỉ cung cấp các phương tiện tìm kiếm hạn chế. Tính năng "Tìm kiếm trang web" của nó cho phép người dùng tìm một trang web dựa trên các từ mô tả trang web, thay vì các từ được tìm thấy trên chính các trang web. [65]

Máy Wayback không bao gồm mọi trang web từng được tạo do những hạn chế của trình thu thập thông tin web của nó. Wayback Machine không thể lưu trữ hoàn toàn các trang web có chứa các tính năng tương tác như nền tảng Flash và biểu mẫu được viết bằng JavaScript và các ứng dụng web tiến bộ , vì các chức năng đó yêu cầu tương tác với trang web chủ. Điều này có nghĩa là, kể từ tháng 6 năm 2013, Wayback Machine đã không thể hiển thị các nhận xét trên YouTube khi lưu các trang YouTube, vì theo Nhóm lưu trữ, các nhận xét không còn được "tải trong chính trang". [66]Trình thu thập thông tin web của Wayback Machine gặp khó khăn khi trích xuất bất kỳ thứ gì không được mã hóa trong HTML hoặc một trong các biến thể của nó, điều này thường có thể dẫn đến các siêu liên kết bị hỏng và hình ảnh bị thiếu. Do đó, trình thu thập thông tin web không thể lưu trữ "các trang mồ côi" không được liên kết với các trang khác. [65] [67] Trình thu thập thông tin của Wayback Machine chỉ tuân theo một số lượng siêu liên kết được xác định trước dựa trên giới hạn độ sâu đặt trước, vì vậy nó không thể lưu trữ mọi siêu liên kết trên mọi trang. [19]

Bắt đầu từ tháng 4 năm 2018, các nhân viên hành chính của nhóm lưu trữ của Wayback Machine đã thực thi quy tắc Quý tháng, bằng cách thỉnh thoảng xóa các khoảng thời gian là 23 ngày hoặc 39 ngày (tương ứng là 3/4 và 5/4 của một tháng) để giảm kích thước hàng đợi. [ cần dẫn nguồn ]

Bằng chứng pháp lý [ sửa ]

Tố tụng dân sự [ sửa ]

Netbula LLC v. Chordiant Software Inc. [ sửa ]

Trong một vụ kiện năm 2009, Netbula, LLC v. Chordiant Software Inc. , bị cáo Chordiant đã đệ đơn đề nghị buộc Netbula vô hiệu hóa tệp robots.txt trên trang web của mình. Điều này đã khiến Máy Wayback xóa bỏ quyền truy cập vào các phiên bản trước của các trang mà nó có. được lưu trữ từ trang của Netbula, các trang mà Chordiant tin rằng sẽ hỗ trợ trường hợp của nó. [68]

Netbula phản đối kiến ​​nghị trên cơ sở rằng các bị cáo yêu cầu thay đổi trang web của Netbula và lẽ ra họ phải trát trực tiếp Internet Archive về các trang này. [69] Tuy nhiên, một nhân viên của Internet Archive đã tuyên bố ủng hộ hành động của Chordiant, nói rằng họ không thể sản xuất các trang web bằng bất kỳ cách nào khác "mà không có gánh nặng, chi phí và gián đoạn đáng kể đối với hoạt động của mình." [68]

Thẩm phán Howard Lloyd ở Quận phía Bắc của California, Phân khu San Jose, đã bác bỏ các lập luận của Netbula và ra lệnh cho họ tạm thời vô hiệu hóa tính năng chặn robots.txt để cho phép Chordiant truy xuất các trang lưu trữ mà họ đã tìm kiếm. [68]

Telewizja Polska USA, Inc. v. Vệ tinh Echostar [ sửa ]

Trong một trường hợp tháng 10 năm 2004, Telewizja Polska USA, Inc. v. Echostar Satellite , số 02 C 3293, 65 Fed. R. Evid. Serv. 673 (ND Ill. 15 tháng 10, 2004), một đương sự đã cố gắng sử dụng kho lưu trữ Wayback Machine như một nguồn bằng chứng có thể chấp nhận được, có lẽ là lần đầu tiên. Telewizja Polska là nhà cung cấp TVP PoloniaEchoStar điều hành Mạng món ăn . Trước thủ tục xét xử, EchoStar cho biết rằng họ dự định cung cấp ảnh chụp nhanh Máy Wayback để làm bằng chứng cho nội dung trước đây của trang web Telewizja Polska. Telewizja Polska đã đưa ra một chuyển động trong limine để ngăn chặn các bức ảnh chụp nhanh với lý do là tin đồnvà nguồn tin chưa được xác thực, nhưng Thẩm phán Arlander Keys đã bác bỏ khẳng định của Telewizja Polska về tin đồn và bác bỏ đề nghị của TVP trong việc loại trừ bằng chứng tại phiên tòa. [70] [71] Tuy nhiên, tại phiên tòa, Thẩm phán Tòa án quận Ronald Guzman, thẩm phán phiên tòa, đã bác bỏ kết quả của Magistrate Keys và cho rằng cả bản khai của nhân viên Internet Archive cũng như các trang cơ bản (tức là, trang web Telewizja Polska ) được chấp nhận như một bằng chứng. Thẩm phán Guzman lý luận rằng bản tuyên thệ của nhân viên này chứa cả những lời khai và những tuyên bố hỗ trợ không thể kết luận, và trang web có mục đích, các bản in không tự xác thực. [72] [73]

Luật bằng sáng chế [ sửa ]

Với điều kiện đáp ứng một số yêu cầu bổ sung (ví dụ: cung cấp một tuyên bố có thẩm quyền của người lưu trữ), văn phòng cấp bằng sáng chế Hoa KỳVăn phòng Sáng chế Châu Âu sẽ chấp nhận dấu ngày tháng từ Kho lưu trữ Internet làm bằng chứng về thời điểm một trang Web nhất định có thể truy cập được đối với công chúng. Những ngày này được sử dụng để xác định xem một trang web có sẵn như là tình trạng kỹ thuật ví dụ trong việc kiểm tra một ứng dụng bằng sáng chế. [74]

Hạn chế của tiện ích [ sửa ]

Có những giới hạn kỹ thuật đối với việc lưu trữ một trang web và do đó, các bên đối lập trong vụ kiện có thể sử dụng sai các kết quả được cung cấp bởi các kho lưu trữ trang web. Vấn đề này có thể trở nên trầm trọng hơn do thực tế gửi ảnh chụp màn hình của các trang web trong các khiếu nại, câu trả lời hoặc báo cáo của nhân chứng chuyên môn khi các liên kết cơ bản không được hiển thị và do đó, có thể chứa lỗi. Ví dụ: các kho lưu trữ như Wayback Machine không điền vào biểu mẫu và do đó, không bao gồm nội dung của cơ sở dữ liệu thương mại điện tử không RESTful trong kho lưu trữ của chúng. [75]

Tình trạng pháp lý [ sửa ]

Ở Châu Âu, Wayback Machine có thể được hiểu là vi phạm luật bản quyền . Chỉ người tạo nội dung mới có thể quyết định nơi xuất bản hoặc sao chép nội dung của họ, vì vậy Cơ quan lưu trữ sẽ phải xóa các trang khỏi hệ thống của mình theo yêu cầu của người tạo. [76] Bạn có thể tìm thấy các chính sách loại trừ dành cho Wayback Machine trong phần Câu hỏi thường gặp của trang web. [77]

Các vấn đề pháp lý về nội dung được lưu trữ [ sửa ]

Một số trường hợp đã được đưa ra chống lại Internet Archive đặc biệt vì nỗ lực lưu trữ Wayback Machine của nó.

Khoa học học [ sửa ]

Cuối năm 2002, Internet Archive đã xóa nhiều trang web chỉ trích Khoa học giáo khỏi Wayback Machine. [78] Một thông báo lỗi cho biết rằng điều này là để đáp ứng "yêu cầu của chủ sở hữu trang web". [79] Sau đó, người ta đã làm rõ rằng các luật sư từ Nhà thờ Khoa học đã yêu cầu xóa và chủ sở hữu trang web không muốn tài liệu của họ bị xóa. [80]

Healthcare Advocates, Inc. [ sửa ]

Năm 2003, Harding Earley Follmer & Frailey đã bảo vệ một khách hàng khỏi tranh chấp nhãn hiệu bằng cách sử dụng Máy quay lui của Lưu trữ. Các luật sư đã có thể chứng minh rằng các khiếu nại của nguyên đơn là không hợp lệ, dựa trên nội dung trang web của họ từ vài năm trước. Nguyên đơn, những người ủng hộ chăm sóc sức khỏe, sau đó đã sửa đổi đơn khiếu nại của họ để đưa vào Kho lưu trữ Internet, cáo buộc tổ chức vi phạm bản quyền cũng như vi phạm DMCAĐạo luật Lạm dụng và Lừa đảo Máy tính . Những người ủng hộ chăm sóc sức khỏe đã tuyên bố rằng, vì họ đã cài đặt tệp robots.txtgửi trên trang web của họ, ngay cả khi sau khi đơn kiện ban đầu được đệ trình, Cơ quan lưu trữ lẽ ra đã xóa tất cả các bản sao trước đó của trang web nguyên đơn khỏi Wayback Machine, tuy nhiên, một số tài liệu vẫn tiếp tục được hiển thị công khai trên Wayback. [81] Vụ kiện được giải quyết ngoài tòa án, sau khi Wayback khắc phục sự cố. [82]

Suzanne Shell [ sửa ]

Nhà hoạt động Suzanne Shell đã nộp đơn kiện trong tháng 12 năm 2005, đòi hỏi Internet Archive trả US cô 100.000 $ để lưu trữ trang web của mình profane-justice.org từ năm 1999 đến năm 2004. [83] [84] Internet Archive nộp một phán xét một tuyên bố hành động trong Tòa án Quận Hoa Kỳ Quận phía Bắc của California vào ngày 20 tháng 1 năm 2006, tìm kiếm một quyết định tư pháp rằng Internet Archive không vi phạm bản quyền của Shell . Shell đáp lại và mang theo một countersuit chống lại Internet Archive để lưu trữ trang web của cô, mà cô cáo buộc là vi phạm của mình điều khoản dịch vụ . [85] Vào ngày 13 tháng 2 năm 2007, một thẩm phán choTòa án Quận của Hoa Kỳ cho Quận Colorado đã bác bỏ tất cả các yêu cầu phản tố ngoại trừ vi phạm hợp đồng . [84] Internet Archive đã không bác bỏ các khiếu nại vi phạm bản quyền mà Shell khẳng định là phát sinh từ các hoạt động sao chép của mình, điều này cũng sẽ được tiếp tục. [86]

Vào ngày 25 tháng 4 năm 2007, Internet Archive và Suzanne Shell cùng thông báo về việc giải quyết vụ kiện của họ. [83] Internet Archive cho biết họ "... không quan tâm đến việc đưa các tài liệu vào Máy quay lui của những người không muốn lưu trữ nội dung Web của họ. Chúng tôi nhận thấy rằng Ms Shell có bản quyền hợp lệ và có thể thực thi trên trang Web của mình và chúng tôi lấy làm tiếc rằng việc đưa trang web của cô ấy vào Wayback Machine đã dẫn đến vụ kiện tụng này. " Shell nói, "Tôi tôn trọng giá trị lịch sử của mục tiêu của Internet Archive. Tôi không bao giờ có ý định can thiệp vào mục tiêu đó cũng như không gây hại cho nó." [87]

Daniel Davydiuk [ sửa ]

Từ năm 2013 đến năm 2016, một diễn viên phim khiêu dâm tên là Daniel Davydiuk đã cố gắng xóa các hình ảnh lưu trữ của mình khỏi kho lưu trữ của Wayback Machine, trước tiên bằng cách gửi nhiều yêu cầu DMCA đến kho lưu trữ, sau đó kháng cáo lên Tòa án Liên bang Canada . [88] [89] [90]

Kiểm duyệt và các mối đe dọa khác [ sửa ]

Archive.org hiện bị chặn ở Trung Quốc . [91] [92] Sau khi tổ chức khủng bố Nhà nước Hồi giáo bị cấm, Kho lưu trữ Internet đã bị chặn toàn bộ ở Nga với tư cách là nơi lưu trữ các video tiếp cận từ tổ chức đó, trong một thời gian ngắn trong năm 2015–16. [56] [93] [94] [ cần cập nhật ] Kể từ năm 2016, trang web đã hoạt động trở lại, có sẵn toàn bộ, mặc dù các nhà vận động hành lang thương mại địa phương đang kiện Internet Archive tại một tòa án địa phương để cấm nó vì lý do bản quyền. [95]

Alison Macrina , giám đốc Dự án Tự do Thư viện, lưu ý rằng "trong khi các thủ thư vô cùng coi trọng quyền riêng tư của cá nhân, chúng tôi cũng phản đối mạnh mẽ việc kiểm duyệt". [56]

Đã có những trường hợp hiếm hoi mà việc truy cập trực tuyến vào nội dung "không có gì" khiến mọi người gặp nguy hiểm đã bị trang web vô hiệu hóa. [56] [ cần làm rõ ]

Các mối đe dọa khác bao gồm thiên tai, [96] sự phá hủy (từ xa hoặc vật lý), [97] thao túng nội dung của kho lưu trữ (xem thêm: tấn công mạng , sao lưu ), luật bản quyền có vấn đề [98] và giám sát người dùng của trang web. [99]

Alexander Rose, giám đốc điều hành của Long Now Foundation , nghi ngờ rằng trong dài hạn, nhiều thế hệ "bên cạnh không có gì" sẽ tồn tại một cách hữu ích, nói rằng, "Nếu chúng ta có sự liên tục trong nền văn minh công nghệ của mình, tôi nghi ngờ rất nhiều dữ liệu thô sẽ vẫn có thể tìm thấy và có thể tìm kiếm được. Nhưng tôi nghi ngờ rằng hầu như không có định dạng nào mà nó được phân phối sẽ có thể nhận ra được ", bởi vì các trang web" có phần hỗ trợ sâu của các hệ thống quản lý nội dung như Drupal và Ruby và Django "khó hơn kho lưu trữ. [100]

Trong một bài báo phản ánh về việc bảo tồn tri thức của con người, The Atlantic đã nhận xét rằng Kho lưu trữ Internet, tự mô tả là được xây dựng lâu dài, [101] "đang làm việc điên cuồng để thu thập dữ liệu trước khi nó biến mất mà không cần lâu dài. cơ sở hạ tầng để nói về. " [102]

Xem thêm [ sửa ]

  • Danh sách các sáng kiến ​​lưu trữ Web
  • Heritrix
  • Thư viện Genesis
  • Lưu trữ web
  • Viên nang thời gian
  • Du hành thời gian

Tài liệu tham khảo [ sửa ]

  1. ^ "WayBackMachine.org WHOIS, DNS và Thông tin tên miền - Công cụ tên miền" . WHOIS . Bản gốc lưu trữ ngày 14 tháng 5 năm 2020 . Truy cập ngày 13 tháng 3 năm 2016 .
  2. ^ "InternetArchive.org WHOIS, DNS và Thông tin tên miền - Công cụ tên miền" . WHOIS . Bản gốc lưu trữ ngày 12 tháng 5 năm 2020 . Truy cập ngày 13 tháng 3 năm 2016 .
  3. ^ "Thông tin chung về máy Wayback" . archive.org . Bản gốc lưu trữ ngày 5 tháng 12 năm 2019 . Truy cập ngày 2 tháng 3 năm 2021 .
  4. ^ Notess, Greg R. (tháng 3 - tháng 4 năm 2002). "The Wayback Machine: The Web's Archive". Trực tuyến . 26 : 59–61. DANH SÁCH : 13517724 .
  5. ^ "The Wayback Machine" , Câu hỏi thường gặp , được lưu trữ từ bản gốc vào ngày 18 tháng 9 năm 2018 , được truy xuất ngày 18 tháng 9 năm 2018
  6. ^ a b "20.000 ổ cứng khi thực hiện sứ mệnh | Blog lưu trữ trên Internet" . blog.archive.org . Ngày 25 tháng 10 năm 2016. Bản gốc lưu trữ ngày 20 tháng 10 năm 2018 . Truy cập ngày 15 tháng 10 năm 2018 .
  7. ^ Green, Heather (28 tháng 2 năm 2002). "Thư viện lớn như thế giới" . BusinessWeek . Bản gốc lưu trữ ngày 20 tháng 12 năm 2011.
  8. ^ Tong, Judy (ngày 8 tháng 9 năm 2002). "Bên có trách nhiệm - Brewster Kahle; Thư viện của web, trên web" . Thời báo New York . Bản gốc lưu trữ ngày 20 tháng 2 năm 2011 . Truy cập ngày 15 tháng 8 năm 2011 .
  9. ^ "MTV Online: Trang chính - Máy quay ngược" . Máy Wayback . Ngày 12 tháng 5 năm 1996. Bản gốc lưu trữ ngày 12 tháng 5 năm 1996 . Truy cập ngày 17 tháng 7 năm 2020 .
  10. ^ "Hướng dẫn Infoseek - Máy quay ngược" . Máy Wayback . Ngày 12 tháng 5 năm 1996. Bản gốc lưu trữ ngày 12 tháng 5 năm 1996 . Truy cập ngày 16 tháng 12 năm 2016 .
  11. ^ a b "Internet Archive: Wayback Machine" . archive.org . Bản gốc lưu trữ ngày 3 tháng 1 năm 2014 . Truy cập ngày 15 tháng 10 năm 2018 .
  12. ^ Cook, John (ngày 1 tháng 11 năm 2001). "Trang web đưa bạn trở lại lịch sử Internet" . Seattle Post-Intelligencer . Bản gốc lưu trữ ngày 12 tháng 8 năm 2014 . Truy cập ngày 15 tháng 8 năm 2011 .
  13. ^ Mayfield, Kendra (ngày 28 tháng 10 năm 2001). "Wayback Goes Way Back on Web" . Có dây . Bản gốc lưu trữ ngày 16 tháng 10 năm 2017 . Truy cập ngày 16 tháng 10 năm 2017 .
  14. ^ a b c Arora, Sanjay K .; Li, Âm; Youtie, Jan; Shapira, Philip (ngày 5 tháng 5 năm 2015). "Sử dụng máy quay lui để khai thác các trang web trong khoa học xã hội: Một nguồn tài nguyên phương pháp luận" . Tạp chí của Hiệp hội Thông tin Khoa học và Công nghệ . 67 (8): 1904–1915. doi : 10.1002 / asi.23503 . ISSN 2330-1635 . 
  15. ^ a b c d e f g h Kalev Leetaru (ngày 28 tháng 1 năm 2016). "Lưu trữ Internet bước sang tuổi 20: Hậu trường nhìn vào việc lưu trữ web" . Forbes . Bản gốc lưu trữ ngày 16 tháng 10 năm 2017 . Truy cập ngày 16 tháng 10 năm 2017 .
  16. ^ Graham, Mark (ngày 30 tháng 10 năm 2020). "Kiểm tra sự thật và bối cảnh cho các trang máy quay ngược" . Blog Lưu trữ Internet . Truy cập ngày 17 tháng 1 năm 2021 .
  17. ^ Kahle, Brewster. "Lưu trữ Internet" . Khoa học Mỹ - Số tháng 3 năm 1997. Bản gốc lưu trữ ngày 3 tháng 4 năm 2012 . Truy cập ngày 19 tháng 8 năm 2011 .
  18. ^ Jeff Kaplan (ngày 27 tháng 10 năm 2014). "Archive-It: Thu thập thông tin trên Web cùng nhau" . Blog Lưu trữ Internet . Bản gốc lưu trữ ngày 12 tháng 10 năm 2017 . Truy cập ngày 16 tháng 10 năm 2017 .
  19. ^ a b "Thu thập thông tin web trên toàn thế giới" . Lưu trữ Internet. Bản gốc lưu trữ ngày 19 tháng 10 năm 2017 . Truy cập ngày 16 tháng 10 năm 2017 .
  20. ^ "Số thu thập thông tin rộng 13" . Lưu trữ Internet. Bản gốc lưu trữ ngày 19 tháng 10 năm 2017 . Truy cập ngày 16 tháng 10 năm 2017 .
  21. ^ "Kho lưu trữ Internet: Petabox" . archive.org . Truy cập ngày 25 tháng 10 năm 2018 .
  22. ^ Kanellos, Michael (ngày 29 tháng 7 năm 2005). "Kho lớn với giá rẻ" . CNET News.com. Bản gốc lưu trữ ngày 3 tháng 4 năm 2007 . Truy cập ngày 29 tháng 7 năm 2007 .
  23. ^ "Internet Archive và Sun Microsystems Tạo ra Lịch sử Sống của Internet" . Sun Microsystems . Ngày 25 tháng 3 năm 2009. Bản gốc lưu trữ ngày 26 tháng 3 năm 2009 . Truy cập ngày 27 tháng 3 năm 2009 .
  24. ^ Mearian, Lucas (ngày 19 tháng 3 năm 2009). "Internet Archive để công bố trung tâm dữ liệu Wayback Machine khổng lồ" . Computerworld.com. Bản gốc lưu trữ ngày 23 tháng 3 năm 2009 . Truy cập ngày 22 tháng 3 năm 2009 .
  25. ^ "Máy quay lại cập nhật trong thử nghiệm beta" . Bản gốc lưu trữ ngày 23 tháng 8 năm 2011 . Truy cập ngày 19 tháng 8 năm 2011 .
  26. ^ "Beta Wayback Machine, trong diễn đàn" . Bản gốc lưu trữ ngày 17 tháng 4 năm 2014 . Truy cập ngày 16 tháng 4 năm 2014 .
  27. ^ "Diễn đàn lưu trữ Internet: Cặp giá đỡ thứ 6 đi vào hoạt động: hơn 2PB dung lượng dữ liệu được sử dụng" . archive.org . Bản gốc lưu trữ ngày 24 tháng 10 năm 2016 . Truy cập ngày 25 tháng 10 năm 2018 .
  28. ^ "Wayback Machine: Hiện có 240.000.000.000 URL | Blog lưu trữ trên Internet" . Ngày 9 tháng 1 năm 2013. Bản gốc lưu trữ ngày 14 tháng 4 năm 2014 . Truy cập ngày 16 tháng 4 năm 2014 .
  29. ^ Rossi, Alexis (ngày 25 tháng 10 năm 2013). "Sửa chữa các liên kết bị hỏng trên Internet" . archive.org . San Francisco, CA, US: Nhóm sưu tập, Kho lưu trữ trên Internet. Bản gốc lưu trữ ngày 7 tháng 11 năm 2014 . Truy cập ngày 25 tháng 3 năm 2015 . Chúng tôi đã thêm khả năng lưu trữ một trang ngay lập tức và lấy lại URL vĩnh viễn cho trang đó trong Wayback Machine. Dịch vụ này cho phép bất kỳ ai - biên tập viên wikipedia, học giả, chuyên gia pháp lý, sinh viên hoặc đầu bếp tại nhà như tôi - tạo một URL ổn định để trích dẫn, chia sẻ hoặc đánh dấu bất kỳ thông tin nào họ muốn vẫn có quyền truy cập trong tương lai.
  30. ^ "Máy Wayback lưu trữ Internet mới hiện đang trực tuyến" . www.digitaljournal.com . Ngày 23 tháng 10 năm 2013. Bản gốc lưu trữ ngày 19 tháng 11 năm 2020 . Truy cập ngày 19 tháng 11 năm 2020 . Cite sử dụng tiêu đề chung chung ( trợ giúp )
  31. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet" . Bản gốc lưu trữ ngày 21 tháng 10 năm 2009 . Truy cập ngày 17 tháng 1 năm 2015 .
  32. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet" . Ngày 18 tháng 12 năm 2014. Bản gốc lưu trữ ngày 18 tháng 12 năm 2014 . Truy cập ngày 13 tháng 12 năm 2018 .
  33. ^ Nhóm VirusTotal (ngày 25 tháng 3 năm 2015). "Thông tin địa chỉ IP 207.241.226.190" . virustotal.com . Dublin 2, Ireland: VirusTotal . Bản gốc lưu trữ ngày 14 tháng 7 năm 2014 . Truy cập ngày 25 tháng 3 năm 2015 . Ngày 25 tháng 3 năm 2015: Các URL mới nhất được lưu trữ trong địa chỉ IP này được phát hiện bởi ít nhất một máy quét URL hoặc tập dữ liệu URL độc hại. ... 2/62 2015-03-25 16:14:12 [URL hoàn chỉnh được biên tập lại] /Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [URL hoàn chỉnh được biên tập lại] /CBLightSetup.exeBảo trì CS1: vị trí ( liên kết )
  34. ^ Lời khuyên do Google cung cấp (ngày 25 tháng 3 năm 2015). "Trang Chẩn đoán Duyệt web An toàn cho archive.org" . google.com/safebrowsing . Mountain View, CA, US. Bản gốc lưu trữ ngày 6 tháng 4 năm 2015 . Truy cập ngày 25 tháng 3 năm 2015 .25-03-2015: Một phần của trang web này đã được liệt kê vì hoạt động đáng ngờ 138 lần trong 90 ngày qua. ... Điều gì đã xảy ra khi Google truy cập trang web này? ... Trong số 42410 trang mà chúng tôi đã kiểm tra trên trang web này hơn 90 ngày qua, 450 trang có phần mềm độc hại được tải xuống và cài đặt mà không có sự đồng ý của người dùng. Lần cuối cùng Google truy cập trang web này là vào ngày 23 tháng 3 năm 2015 và lần cuối cùng nội dung đáng ngờ được tìm thấy trên trang web này là vào ngày 25 tháng 3 năm 2015. ... Phần mềm độc hại bao gồm 169 trojan, 126 vi rút, 43 cửa hậu.
  35. ^ "Việc thao túng dữ liệu lớn có thể thay đổi cách suy nghĩ của thế giới không?" . Quốc gia . Bản gốc lưu trữ ngày 12 tháng 1 năm 2017 . Truy cập ngày 14 tháng 5 năm 2017 .
  36. ^ Crockett, Zachary (ngày 28 tháng 9 năm 2018). "Bên trong Máy Wayback, viên nang thời gian của Internet" . Hối hả . Bản gốc lưu trữ ngày 2 tháng 10 năm 2018 . Truy cập ngày 26 tháng 10 năm 2018 .
  37. ^ Heffernan, Virginia (ngày 18 tháng 9 năm 2018). "Mọi thứ tan vỡ và suy tàn trên Internet — Đó là một điều tốt" . CÓ DÂY . Bản gốc lưu trữ ngày 25 tháng 9 năm 2018 . Truy cập ngày 26 tháng 10 năm 2018 .
  38. ^ "Quyên góp cho Kho lưu trữ trên Internet: Thư viện kỹ thuật số gồm sách, phim, nhạc và máy quay ngược chiều miễn phí và có thể mượn" . quả táo. Bản gốc lưu trữ ngày 2 tháng 12 năm 2020 . Truy cập ngày 2 tháng 12 năm 2020 .
  39. ^ michelle (ngày 9 tháng 5 năm 2014). "Wayback Machine Hits 400.000.000.000!" . Lưu trữ Internet. Bản gốc lưu trữ ngày 26 tháng 8 năm 2014 . Truy cập ngày 25 tháng 3 năm 2015 .
  40. ^ "Kho lưu trữ Internet" . Lưu trữ Internet. Bản gốc lưu trữ ngày 31 tháng 12 năm 2020 . Truy cập ngày 8 tháng 3 năm 2021 .
  41. ^ "Thông tin trang web Archive.org" . Internet Alexa . Bản gốc lưu trữ ngày 28 tháng 10 năm 2013 . Truy cập ngày 29 tháng 10 năm 2013 .
  42. ^ "Tổng quan về trang web Archive.org" . Internet Alexa. Bản gốc lưu trữ ngày 9 tháng 4 năm 2015 . Truy cập ngày 9 tháng 4 năm 2015 .
  43. ^ "Lưu lượng truy cập, nhân khẩu học và đối thủ cạnh tranh trên Archive.org - Alexa" . Ngày 23 tháng 3 năm 2019. Bản gốc lưu trữ ngày 23 tháng 3 năm 2019 . Truy cập ngày 5 tháng 4 năm 2019 .
  44. ^ "Một số trang web không khả dụng do Robots.txt hoặc các loại trừ khác" . Bản gốc lưu trữ ngày 15 tháng 4 năm 2011.
  45. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet" . Bản gốc lưu trữ ngày 17 tháng 4 năm 2014.
  46. ^ Cox, Joseph (ngày 22 tháng 5 năm 2018). "Máy Wayback đang xóa bằng chứng về phần mềm độc hại được bán cho người theo dõi" . Bản gốc lưu trữ ngày 23 tháng 5 năm 2018 . Truy cập ngày 23 tháng 5 năm 2018 .
  47. ^ "Robots.txt dành cho các công cụ tìm kiếm không hoạt động tốt cho các kho lưu trữ web" . Lưu trữ Internet . Ngày 17 tháng 4 năm 2017 . Truy cập ngày 29 tháng 6 năm 2019 .
  48. ^ "Sử dụng Máy quay lui" . Trung tâm trợ giúp lưu trữ Internet .
  49. ^ "Các khuyến nghị để quản lý các yêu cầu xóa và duy trì tính toàn vẹn của tài liệu lưu trữ" . Đại học California . Ngày 14 tháng 12 năm 2002. Bản gốc lưu trữ ngày 18 tháng 9 năm 2017 . Truy cập ngày 14 tháng 9 năm 2017 .
  50. ^ "Loại bỏ robots.txt hồi tố của các lần thu thập thông tin trước đây Chính sách lưu trữ của AKA Oakland" . Lưu trữ Internet. Ngày 7 tháng 7 năm 2014. Bản gốc lưu trữ ngày 10 tháng 10 năm 2017 . Truy cập ngày 14 tháng 9 năm 2017 .
  51. ^ Mark Graham (ngày 17 tháng 4 năm 2017). "Robots.txt dành cho các công cụ tìm kiếm không hoạt động tốt cho các kho lưu trữ web" . Blog Lưu trữ Internet . Bản gốc lưu trữ ngày 17 tháng 4 năm 2017 . Truy cập ngày 16 tháng 4 năm 2017 .
  52. ^ "Archivierung des Internets: Internet Archive ignoreriert künftig robots.txt" (bằng tiếng Đức). heise trực tuyến. Bản gốc lưu trữ ngày 27 tháng 4 năm 2017 . Truy cập ngày 14 tháng 5 năm 2017 .
  53. ^ "Suchmaschinen: Internet Archive sẽ künftig Robots.txt-Einträge ignorerieren - Golem.de" (bằng tiếng Đức). Bản gốc lưu trữ ngày 19 tháng 6 năm 2017 . Truy cập ngày 14 tháng 5 năm 2017 .
  54. ^ "Internet Archive sẽ bỏ qua các tệp robots.txt để giữ cho hồ sơ lịch sử được chính xác" . Xu hướng kỹ thuật số. Ngày 24 tháng 4 năm 2017. Bản gốc lưu trữ ngày 16 tháng 5 năm 2017 . Truy cập ngày 14 tháng 5 năm 2017 .
  55. ^ Sampath Kumar, BT; Prithviraj, KR (ngày 21 tháng 10 năm 2014). "Đưa sự sống vào cõi chết: Vai trò của Wayback Machine trong việc truy xuất các URL đã biến mất". Tạp chí Khoa học Thông tin . 41 (1): 71–81. doi : 10.1177 / 0165551514552752 . ISSN 0165-5515 . S2CID 28320982 .  
  56. ^ a b c d e "Wayback Machine sẽ không kiểm duyệt kho lưu trữ vì hương vị, giám đốc nói sau khi bài báo Olympic được quét" . Bản gốc lưu trữ ngày 6 tháng 1 năm 2017 . Truy cập ngày 14 tháng 5 năm 2017 .
  57. ^ Lepore, Jill (ngày 26 tháng 1 năm 2015). "Hôm qua web nói gì" . Người New York . Bản gốc lưu trữ ngày 25 tháng 1 năm 2015 . Truy cập ngày 14 tháng 5 năm 2017 .
  58. ^ "Tháng 3 dành cho Khoa học bắt đầu với 'đường bỏ túi' của người này trên Reddit" . Bưu điện Washington . Bản gốc lưu trữ ngày 23 tháng 4 năm 2017 . Truy cập ngày 23 tháng 4 năm 2017 .
  59. ^ "Các nhà khoa học sẽ hành quân đến Washington?" . Bưu điện Washington . Bản gốc lưu trữ ngày 31 tháng 1 năm 2017 . Truy cập ngày 31 tháng 1 năm 2017 .
  60. ^ Foley, Katherine Ellen. "Tháng 3 toàn cầu về Khoa học bắt đầu với một chủ đề Reddit duy nhất" . Thạch anh . Bản gốc lưu trữ ngày 24 tháng 4 năm 2017 . Truy cập ngày 23 tháng 4 năm 2017 .
  61. ^ Graham, Mark (ngày 1 tháng 10 năm 2018). "Hơn 9 triệu liên kết bị hỏng trên Wikipedia hiện đã được giải cứu" .
  62. ^ Graham, Mark (ngày 17 tháng 9 năm 2020). "Cloudflare và Wayback Machine, hợp lực vì một trang Web đáng tin cậy hơn" . Blog Lưu trữ Internet . Truy cập ngày 17 tháng 9 năm 2020 .
  63. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet" . Lưu trữ Internet . 2 tháng 4 năm 2014. Bản gốc lưu trữ ngày 2 tháng 4 năm 2014 . Truy cập ngày 23 tháng 11 năm 2018 .
  64. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet" . archive.org . Truy cập ngày 23 tháng 11 năm 2018 .
  65. ^ a b Bates, Mary Ellen (2002). "Máy quay ngược". Trực tuyến . 26 : 80.
  66. ^ "YouTube - Archiveteam" . archiveteam.org . Bản gốc lưu trữ ngày 5 tháng 8 năm 2020 . Truy cập ngày 6 tháng 8 năm 2020 .
  67. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet" . archive.org . Bản gốc lưu trữ ngày 20 tháng 4 năm 2013 . Truy cập ngày 18 tháng 10 năm 2018 .
  68. ^ a b c Lloyd, Howard (tháng 10 năm 2009). "Lệnh vô hiệu hóa Robots.txt" (PDF) . Bản gốc lưu trữ (PDF) vào ngày 8 tháng 8 năm 2019 . Truy cập ngày 15 tháng 10 năm 2009 .
  69. ^ Cortes, Antonio (tháng 10 năm 2009). "Chuyển động phản đối loại bỏ Robots.txt" . Bản gốc lưu trữ ngày 27 tháng 10 năm 2010 . Truy cập ngày 15 tháng 10 năm 2009 .
  70. ^ Gelman, Lauren (ngày 17 tháng 11 năm 2004). "Ảnh chụp nhanh Trang Web của Kho lưu trữ Internet Được chấp nhận làm Bằng chứng" . Các gói tin . 2 (3). Bản gốc lưu trữ ngày 30 tháng 4 năm 2011 . Truy cập ngày 4 tháng 1 năm 2007 .
  71. ^ Howell, Beryl A. (tháng 2 năm 2006). "Chứng minh Lịch sử Web: Cách sử dụng Kho lưu trữ Internet" (PDF) . Tạp chí Luật Internet : 3–9. Bản gốc lưu trữ (PDF) ngày 5 tháng 7 năm 2010 . Truy cập ngày 6 tháng 8 năm 2008 .
  72. ^ "Tìm kiếm bằng chứng trong địa điểm ảo Sự chấp nhận của bằng chứng Internet" . Bản gốc lưu trữ ngày 1 tháng 7 năm 2019 . Truy cập ngày 14 tháng 6 năm 2020 .
  73. ^ Levitt, Carole A. .; Rosch, Mark E. (2010). Tìm thông tin giống như một chuyên gia: Khai thác các tài nguyên công khai có sẵn trên Internet để nghiên cứu điều tra, Tom 1 . Hiệp hội Luật sư Hoa Kỳ. trang 194–196. ISBN 978-1-60442-890-2. Bản gốc lưu trữ ngày 18 tháng 12 năm 2020 . Truy cập ngày 14 tháng 6 năm 2020 .
  74. ^ Wynn W. Coggins (Mùa thu năm 2002). "Nghệ thuật Sơ khai trong lĩnh vực Bằng sáng chế Phương pháp Kinh doanh - Khi nào một Tài liệu Điện tử là một Ấn phẩm In cho Các Mục đích Nghệ thuật Trước đó?" . USPTO . Bản gốc lưu trữ ngày 21 tháng 9 năm 2012 . Truy cập ngày 15 tháng 8 năm 2012 .
  75. ^ "Debunking the Wayback Machine" . Bản gốc lưu trữ ngày 29 tháng 6 năm 2010.
  76. ^ Bahr, Martin (2002). "Máy Wayback và Google Cache - eine Verletzung deutschen Urheberrechts?" . JurPC (bằng tiếng Đức): 9. doi : 10.7328 / jurpcb / 20021719 . Bản gốc lưu trữ ngày 23 tháng 8 năm 2009.
  77. ^ "Câu hỏi thường gặp về lưu trữ Internet" . Bản gốc lưu trữ ngày 17 tháng 4 năm 2014 . Truy cập ngày 16 tháng 4 năm 2014 .
  78. ^ Bowman, Lisa M (ngày 24 tháng 9 năm 2002). "Kho lưu trữ ròng làm im lặng nhà phê bình Khoa học học" . CNET News.com. Bản gốc lưu trữ ngày 15 tháng 5 năm 2012 . Truy cập ngày 4 tháng 1 năm 2007 .
  79. ^ Jeff (23 tháng 9 năm 2002). "loại trừ khỏi Wayback Machine" (Blog) . Diễn đàn Wayback Machine . Lưu trữ Internet. Bản gốc lưu trữ ngày 11 tháng 2 năm 2007 . Truy cập ngày 4 tháng 1 năm 2007 . Tác giả và Ngày cho biết bắt đầu chủ đề diễn đàn .
  80. ^ Miller, Ernest. "Sherman, thiết lập cỗ máy quay ngược cho khoa học giáo" . LawMeme . Trường Luật Yale. Bản gốc lưu trữ (Blog) ngày 16 tháng 11 năm 2012 . Truy cập ngày 4 tháng 1 năm 2007 .
  81. ^ Dye, Jessica (2005). "Trang web bị kiện cho chuyến đi gây tranh cãi vào quá khứ trên Internet". Nội dung . 28. 11 : 8–9.
  82. ^ Bangeman, Eric (ngày 31 tháng 8 năm 2006). "Kho lưu trữ Internet Giải quyết Bộ đồ trên Máy quay lui" . Ars Technica . Bản gốc lưu trữ ngày 5 tháng 11 năm 2007 . Truy cập ngày 29 tháng 11 năm 2007 .
  83. ^ a b Internet Archive v. Shell , 505 F.Supp.2d 755 tại justia.com , 1: 2006cv01726 ( Tòa án Quận Colorado ngày 31 tháng 8 năm 2006) ("'Ngày 25 tháng 4 năm 2007 Thỏa thuận dàn xếp được công bố.' Nộp hồ sơ 65, 2007- 04-30: '... do đó ĐÃ LỆNH rằng vấn đề này sẽ được LOẠI BỎ VỚI SỰ CHỨNG MINH ...' ").
  84. ^ a b Babcock, Lewis T., Chánh án (ngày 13 tháng 2 năm 2007). " Internet Archive v. Shell Civil Action số 06cv01726LTBCBS" (PDF) . Bản gốc lưu trữ (PDF) ngày 25 tháng 1 năm 2014 . Truy cập ngày 25 tháng 3 năm 2015 . 1) Đề nghị của Internet Archive bác bỏ yêu cầu phản đối của Shell về việc chuyển đổi và trộm cắp dân sự (Nguyên nhân Hành động Thứ hai) được CẤP, 2) Đề nghị của Internet Archive bác bỏ yêu cầu phản đối của Shell vì vi phạm hợp đồng (Nguyên nhân Hành động Thứ ba) là BỊ TỪ CHỐI; 3) Kiến nghị của Internet Archive nhằm bác bỏ yêu cầu phản đối của Shell đối với Racketcking theo RICO và COCCA (Nguyên nhân Hành động Thứ tư) được CẤP.
  85. ^ Claburn, Thomas (ngày 16 tháng 3 năm 2007). "Người phụ nữ Colorado kiện để nắm giữ trình thu thập thông tin web để ký hợp đồng" . New York, NY, US: InformationWeek , UBM Tech, UBM LLC. Bản gốc lưu trữ ngày 4 tháng 9 năm 2014 . Truy cập ngày 25 tháng 3 năm 2015 . Máy tính có thể thay mặt con người giao kết hợp đồng. Đạo luật thống nhất về giao dịch điện tử (UETA) nói rằng một 'hợp đồng có thể được hình thành bởi sự tương tác của các đại lý điện tử của các bên, ngay cả khi không có cá nhân nào biết hoặc đã xem xét các hành động của đại lý điện tử hoặc các điều khoản và thỏa thuận kết quả.
  86. ^ Samson, Martin H., Phillips Nizer LLP (2007). "Internet Archive v. Suzanne Shell" . internetlibrary.com . Thư viện Internet về Luật và các Quyết định của Tòa án. Bản gốc lưu trữ ngày 3 tháng 8 năm 2014 . Truy cập ngày 25 tháng 3 năm 2015 .Quan trọng hơn, trước tòa, việc Internet Archive chỉ sao chép trang của Shell và hiển thị chúng trong cơ sở dữ liệu của mình, không cấu thành việc thực thi quyền thống trị và kiểm soát cần thiết đối với tài sản của bị đơn. Điều quan trọng, tòa án lưu ý, bị đơn luôn sở hữu và điều hành trang web của riêng mình. Tòa án cho biết: 'Shell đã không thể cáo buộc các sự kiện cho thấy rằng Internet Archive thực hiện quyền thống trị hoặc kiểm soát trang web của cô ấy, vì đơn khiếu nại của Shell tuyên bố rõ ràng rằng cô ấy tiếp tục sở hữu và vận hành trang web trong khi nó được lưu trữ trên máy Wayback. Shell xác định không có cơ quan nào ủng hộ quan điểm rằng việc sao chép tài liệu tự nó đã đủ để tước quyền sử dụng để hỗ trợ chuyển đổi. Ngược lại, nhiều mạch đã xác định rằng không phải vậy. '
  87. ^ brewster (ngày 25 tháng 4 năm 2007). "Kho lưu trữ Internet và Vụ kiện định cư Suzanne Shell" . archive.org . Denver, CO, USA: Lưu trữ Internet. Bản gốc lưu trữ ngày 5 tháng 12 năm 2010 . Truy cập ngày 25 tháng 3 năm 2015 . Cả hai bên đều chân thành hối tiếc về bất kỳ xáo trộn nào mà vụ kiện có thể đã gây ra cho bên kia. Cả Internet Archive và Ms Shell đều không dung thứ cho bất kỳ hành vi nào có thể gây tổn hại cho một trong hai bên phát sinh khi công chúng chú ý đến vụ kiện này. Các bên đã không tham gia vào hành vi đó và yêu cầu phản ứng của công chúng đối với giải pháp thân thiện của vụ kiện tụng này phải phù hợp với mong muốn của họ để không gây thêm tổn hại hoặc xáo trộn cho một trong hai bên.
  88. ^ Stobbe, Richard (ngày 5 tháng 12 năm 2014). "Ý nghĩa bản quyền của" Quyền được lãng quên "? Hoặc Cách gỡ bỏ kho lưu trữ trên Internet" . Mondaq . Bản gốc lưu trữ ngày 18 tháng 11 năm 2018 . Truy cập ngày 8 tháng 3 năm 2019 .
  89. ^ McVeigh, Glennys (ngày 16 tháng 10 năm 2014). Philpott, James; Weissman, Adam; Bucholz, Ren; Ấm đun nước, Brent; Pearl, Aaron (biên tập). "Davydiuk v. Internet Archive Canada, 2014 FC 944" . CanLII . Liên đoàn các Hiệp hội Luật của Canada . Bản gốc lưu trữ ngày 18 tháng 12 năm 2020 . Truy cập ngày 8 tháng 3 năm 2019 .
  90. ^ Southcott, Richard F. (ngày 30 tháng 11 năm 2016). Philpott, John; Alton, Alex; Bucholz, Ren (biên tập). "Davydiuk v. Internet Archive Canada and Internet Archive, 2016 FC 1313 (CanLII)" . CanLII . Ottawa, Ontario: Liên đoàn các Hiệp hội Luật của Canada . Bản gốc lưu trữ ngày 29 tháng 6 năm 2019 . Truy cập ngày 8 tháng 3 năm 2019 .
  91. ^ Conger, Kate. "Sao lưu lịch sử của Internet ở Canada để cứu nó khỏi Trump" . TechCrunch . Bản gốc lưu trữ ngày 27 tháng 12 năm 2016 . Truy cập ngày 14 tháng 5 năm 2017 .
  92. ^ "Nơi để tìm những gì đã biến mất trên mạng và nhiều hơn thế nữa: Kho lưu trữ Internet" . Đài phát thanh quốc tế công cộng. Bản gốc lưu trữ ngày 28 tháng 3 năm 2017 . Truy cập ngày 14 tháng 5 năm 2017 .
  93. ^ Chirgwin, Richard. "Không có đường lùi ở Nga: Putin chặn Archive.org" . Bản gốc lưu trữ ngày 7 tháng 10 năm 2016 . Truy cập ngày 14 tháng 5 năm 2017 .
  94. ^ "Nga sẽ không quay trở lại, chặn Lưu trữ trên Internet" . Xu hướng kỹ thuật số. Ngày 26 tháng 6 năm 2015. Bản gốc lưu trữ ngày 17 tháng 4 năm 2016 . Truy cập ngày 14 tháng 5 năm 2017 .
  95. ^ "В России разблокирован крупнейший интернет-архив" . Российская газета (bằng tiếng Nga). Bản gốc lưu trữ ngày 5 tháng 4 năm 2019 . Truy cập ngày 18 tháng 10 năm 2020 .
  96. ^ "Giúp chúng tôi giữ cho người đọc được lưu trữ miễn phí, có thể truy cập và người đọc | Blog lưu trữ trên Internet" . Ngày 29 tháng 11 năm 2016. Bản gốc lưu trữ ngày 21 tháng 5 năm 2017 . Truy cập ngày 14 tháng 5 năm 2017 .
  97. ^ "Bản sao lưu trữ" . Bản gốc lưu trữ ngày 9 tháng 11 năm 2020 . Truy cập ngày 28 tháng 9 năm 2020 .Bảo trì CS1: bản sao lưu trữ dưới dạng tiêu đề ( liên kết )
  98. ^ "Internet Archive: Các thay đổi được đề xuất đối với DMCA sẽ khiến chúng tôi trở thành" Người kiểm duyệt trang web " " . Người tiêu dùng. 7 tháng 6 năm 2016. Bản gốc lưu trữ ngày 11 tháng 11 năm 2016 . Truy cập ngày 14 tháng 5 năm 2017 .
  99. ^ Herb, Ulrich. "Die Trump-Angst grassiert" (bằng tiếng Đức). heise trực tuyến. Bản gốc lưu trữ ngày 7 tháng 12 năm 2016 . Truy cập ngày 14 tháng 5 năm 2017 .
  100. ^ LaFrance, Adrienne. "Thời kỳ đen tối của Internet" . Đại Tây Dương . Bản gốc lưu trữ ngày 7 tháng 5 năm 2017 . Truy cập ngày 14 tháng 5 năm 2017 .
  101. ^ "Toàn bộ Internet sẽ được lưu trữ ở Canada để bảo vệ nó khỏi Trump" . Bo mạch chủ. Ngày 29 tháng 11 năm 2016. Bản gốc lưu trữ ngày 16 tháng 5 năm 2017 . Truy cập ngày 14 tháng 5 năm 2017 .
  102. ^ LaFrance, Adrienne (ngày 3 tháng 6 năm 2016). "Nỗi sợ hãi của con người về kiến ​​thức toàn diện" . Đại Tây Dương . Bản gốc lưu trữ ngày 2 tháng 12 năm 2016 . Truy cập ngày 14 tháng 5 năm 2017 .

Liên kết bên ngoài [ sửa ]

  • Trang web chính thức
  • Lịch sử Internet rất mong manh. Kho lưu trữ này đang đảm bảo rằng nó không biến mất . San Francisco: PBS Newshour . Truy cập ngày 19 tháng 9 năm 2018 .