Máy quay lui - Wayback Machine

Từ Wikipedia, Bách Khoa Toàn Thư MiễN Phí

Pin
Send
Share
Send

Máy quay lui
Dòng chữ cách điệu có nội dung:
Ảnh chụp màn hình
20151221 Internet Archive Wayback Machine.png
Hình ảnh hóa các kho lưu trữ wikipedia.org trên Wayback Machine (tháng 12 năm 2015)
Loại trang web
Lưu trữ
Khu vực phục vụToàn thế giới (ngoại trừ Trung Quốc và Nga)
Chủ nhânLưu trữ Internet
URLweb.archive.org Chỉnh sửa điều này tại Wikidata
Đăng kýKhông bắt buộc
Ra mắt24 tháng 10, 2001; 19 năm trước (2001-10-24)[1][2]
Tình trạng hiện tạiHoạt động
Viết vàoJava, Python

Các Máy quay lui là một kỹ thuật số kho lưu trữ sau đó World Wide Web, được thành lập bởi Lưu trữ Internet, một thư viện phi lợi nhuận có trụ sở tại San Francisco. Nó cho phép người dùng "quay ngược thời gian" và xem các trang web trông như thế nào trong quá khứ. Những người sáng lập nó, Brewster KahleBruce Gilliat, đã phát triển Wayback Machine với mục đích cung cấp "quyền truy cập phổ biến vào tất cả kiến ​​thức" bằng cách bảo quản các bản sao lưu trữ của các trang web không còn tồn tại.

Kể từ khi ra mắt vào năm 2001, hơn 463 tỷ trang đã được thêm vào kho lưu trữ. Dịch vụ này cũng đã gây ra tranh cãi về việc liệu việc tạo các trang lưu trữ mà không có sự cho phép của chủ sở hữu có phải là vi phạm bản quyền trong các khu vực pháp lý nhất định.

Lịch sử

Lưu trữ Internet người đồng sáng lập Brewster KahleBruce Gilliat ra mắt Wayback Machine vào năm 2001 để giải quyết vấn đề nội dung trang web biến mất bất cứ khi nào nó bị thay đổi hoặc tắt.[3] Dịch vụ cho phép người dùng xem các phiên bản đã lưu trữ của trang web theo thời gian, mà kho lưu trữ gọi là "chỉ mục ba chiều".[4] Kahle và Gilliat đã tạo ra chiếc máy này với hy vọng lưu trữ toàn bộ Internet và cung cấp "quyền truy cập phổ quát vào mọi kiến ​​thức."[5]

Tên Máy quay lui được chọn làm tham chiếu đến một tác phẩm hư cấu lịch trình du lịch thiết bị, "Máy quay lui"(phát âm đường về), được sử dụng bởi các ký tự Mister Peabody và Sherman trong phim hoạt hình The Rocky and Bullwinkle Show từ những năm 1960.[6][7] Trong một trong những phân đoạn thành phần của phim hoạt hình, Lịch sử không thể cải thiện của Peabody, các nhân vật thường xuyên sử dụng máy để chứng kiến, tham gia và thường xuyên thay đổi các sự kiện nổi tiếng trong lịch sử.

Máy Wayback đã bắt đầu lưu trữ được lưu vào bộ nhớ đệm các trang web vào tháng 5 năm 1996,[8][9] với mục tiêu đưa dịch vụ ra công chúng vào 5 năm sau.[10] Từ năm 1996 đến năm 2001, thông tin được lưu giữ trên băng kỹ thuật số, Kahle thỉnh thoảng cho phép các nhà nghiên cứu và nhà khoa học khai thác thông tin cơ sở dữ liệu.[11] Khi kho lưu trữ kỷ niệm lần thứ năm vào năm 2001, nó đã được công bố và mở cửa cho công chúng trong một buổi lễ tại đại học California, Berkeley.[12] Vào thời điểm Wayback Machine ra mắt, nó đã chứa hơn 10 tỷ trang lưu trữ.[13]

Ngày nay, dữ liệu được lưu trữ trên cụm lớn của Internet Archive gồm Linux điểm giao.[5] Nó thỉnh thoảng sẽ truy cập lại và lưu trữ các phiên bản mới của trang web (xem chi tiết kỹ thuật bên dưới).[14] Các trang web cũng có thể được chụp thủ công bằng cách nhập URL vào hộp tìm kiếm, với điều kiện trang web cho phép Wayback Machine "thu thập dữ liệu" và lưu dữ liệu.[10]Vào ngày 30 tháng 10 năm 2020, Wayback Machine bắt đầu kiểm tra nội dung xác thực.[15]

Chi tiết kỹ thuật

Phần mềm đã được phát triển để "thu thập thông tin" web và tải xuống tất cả các trang World Wide Web có thể truy cập công khai, Gopher hệ thống phân cấp, Netnews (Usenet) hệ thống bảng thông báo, và phần mềm có thể tải xuống.[16] Thông tin được thu thập bởi các "trình thu thập thông tin" này không bao gồm tất cả thông tin có sẵn trên Internet, vì phần lớn dữ liệu bị nhà xuất bản hạn chế hoặc được lưu trữ trong cơ sở dữ liệu không thể truy cập được. Để khắc phục sự mâu thuẫn trong các trang web được lưu trong bộ nhớ cache một phần, Archive-It.org được phát triển vào năm 2005 bởi Internet Archive như một phương tiện cho phép các tổ chức và người tạo nội dung tự nguyện thu thập và bảo quản các bộ sưu tập nội dung kỹ thuật số và tạo các kho lưu trữ kỹ thuật số.[17]

Thu thập thông tin được đóng góp từ nhiều nguồn khác nhau, một số được nhập từ các bên thứ ba và một số khác do Kho lưu trữ tạo nội bộ.[14] Ví dụ: thu thập thông tin được đóng góp bởi Tổ chức SloanAlexa, thu thập thông tin do IA điều hành thay mặt cho NARATổ chức bộ nhớ Internet, gương của Thu thập thông tin chung.[14] "Thu thập thông tin web trên toàn thế giới" đã chạy từ năm 2010 và nắm bắt được Web toàn cầu.[14][18]

Tần suất chụp ảnh nhanh khác nhau trên mỗi trang web.[14] Các trang web trong "Thu thập thông tin web trên toàn thế giới" được đưa vào "danh sách thu thập thông tin", với trang web được lưu trữ một lần cho mỗi lần thu thập thông tin.[14] Quá trình thu thập thông tin có thể mất vài tháng hoặc thậm chí nhiều năm để hoàn thành tùy thuộc vào kích thước.[14] Ví dụ: "Số thu thập thông tin rộng 13" bắt đầu vào ngày 9 tháng 1 năm 2015 và hoàn thành vào ngày 11 tháng 7 năm 2016.[19] Tuy nhiên, có thể có nhiều lần thu thập thông tin diễn ra cùng một lúc và một trang web có thể được đưa vào nhiều danh sách thu thập thông tin, do đó tần suất một trang web được thu thập thông tin rất khác nhau.[14]

Kể từ tháng 10 năm 2019, người dùng hạn chế tới 5 yêu cầu lưu trữ và truy xuất mỗi phút.[tại sao?]

Khả năng lưu trữ và tăng trưởng

Khi công nghệ đã phát triển trong những năm qua, dung lượng lưu trữ của Wayback Machine đã tăng lên. Năm 2003, chỉ sau hai năm truy cập công khai, Wayback Machine đã phát triển với tốc độ 12 terabyte / tháng. Dữ liệu được lưu trữ trên PetaBox hệ thống giá đỡ được thiết kế riêng bởi nhân viên của Internet Archive. Giá đỡ 100TB đầu tiên bắt đầu hoạt động hoàn toàn vào tháng 6 năm 2004, mặc dù đã sớm trở nên rõ ràng rằng chúng sẽ cần nhiều dung lượng hơn thế.[20][21]

Internet Archive đã di chuyển kiến ​​trúc lưu trữ tùy chỉnh sang Sun Open Storage vào năm 2009 và tổ chức một trung tâm dữ liệu mới trong một Sun Modular Datacenter trên Sun Microsystems'Khuôn viên California.[22] Tính đến năm 2009, Wayback Machine chứa khoảng ba petabyte dữ liệu và đang tăng với tốc độ 100 terabyte mỗi tháng.[23]

Một phiên bản mới, được cải tiến của Wayback Machine, với giao diện cập nhật và chỉ mục nội dung lưu trữ mới hơn, đã được cung cấp để thử nghiệm công khai vào năm 2011.[24] Vào tháng 3 năm đó, trên diễn đàn Wayback Machine đã nói rằng "Bản Beta của Wayback Machine mới có chỉ mục cập nhật và đầy đủ hơn về tất cả các tài liệu được thu thập thông tin vào năm 2010 và sẽ tiếp tục được cập nhật thường xuyên. Chỉ mục lái Wayback Machine cổ điển chỉ có một chút tài liệu về năm 2008 và không có kế hoạch cập nhật chỉ mục nào nữa, vì nó sẽ bị loại bỏ dần trong năm nay. "[25] Cũng trong năm 2011, Internet Archive đã lắp đặt cặp giá đỡ PetaBox thứ sáu của họ, giúp tăng dung lượng lưu trữ của Wayback Machine lên 700 terabyte.[26]

Vào tháng 1 năm 2013, công ty đã công bố một cột mốc đột phá là 240 tỷ URL.[27]

Vào tháng 10 năm 2013, công ty đã giới thiệu tính năng "Lưu một trang"[28][29] cho phép bất kỳ người dùng Internet nào lưu trữ nội dung của một URL và nhanh chóng tạo liên kết vĩnh viễn không giống như trước liveweb đặc tính.

Nó đã trở thành một mối đe dọa lạm dụng bởi dịch vụ cho lưu trữ các tệp nhị phân độc hại.[30][31]

Tính đến tháng 12 năm 2014, Wayback Machine chứa 435 tỷ các trang web — gần chín petabyte dữ liệu và đang tăng lên khoảng 20 terabyte một tuần.[13][32][33]

Tính đến tháng 7 năm 2016, Wayback Machine được báo cáo chứa khoảng 15 petabyte dữ liệu.[34]

Tính đến tháng 9 năm 2018, Wayback Machine chứa hơn 25 petabyte dữ liệu.[35][36]

Sự phát triển của máy quay ngược[37][38]
Máy quay ngược theo nămTrang được lưu trữ (tỷ)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452

Chính sách loại trừ trang web

Trong lịch sử, Wayback Machine đã tôn trọng tiêu chuẩn loại trừ rô bốt (robots.txt) để xác định xem một trang web có được thu thập thông tin hay không; hoặc nếu đã được thu thập thông tin, nếu kho lưu trữ của nó sẽ có thể xem được công khai. Chủ sở hữu trang web có tùy chọn từ chối Wayback Machine thông qua việc sử dụng robots.txt. Nó đã áp dụng các quy tắc robots.txt trở về trước; nếu một trang web đã chặn Internet Archive, thì bất kỳ trang nào đã được lưu trữ trước đó từ miền này cũng sẽ không khả dụng ngay lập tức. Ngoài ra, Internet Archive tuyên bố rằng "Đôi khi chủ sở hữu trang web sẽ liên hệ trực tiếp với chúng tôi và yêu cầu chúng tôi ngừng thu thập dữ liệu hoặc lưu trữ một trang web. Chúng tôi tuân thủ các yêu cầu này".[39] Ngoài ra, trang web cho biết: "Internet Archive không quan tâm đến việc bảo quản hoặc cung cấp quyền truy cập vào các trang Web hoặc các tài liệu Internet khác của những người không muốn tài liệu của họ trong bộ sưu tập."[40][41]

Vào ngày 17 tháng 4 năm 2017, các báo cáo xuất hiện về các trang web đã không còn tồn tại và trở thành Tên miền đậu đang sử dụng robots.txt để tự loại trừ khỏi công cụ tìm kiếm, dẫn đến việc chúng vô tình bị loại khỏi Wayback Machine.[42] Kho lưu trữ Internet đã thay đổi chính sách để hiện yêu cầu loại trừ rõ ràng để xóa nó khỏi Wayback Machine.[43]

Chính sách lưu trữ của Oakland

Chính sách loại trừ có hiệu lực trở về trước của Wayback một phần dựa trên Các khuyến nghị để quản lý các yêu cầu xóa và duy trì tính toàn vẹn của kho lưu trữ được xuất bản bởi Trường Quản lý Thông tin và Hệ thống tại đại học California, Berkeley vào năm 2002, điều này cho phép chủ sở hữu trang web có quyền chặn truy cập vào kho lưu trữ của trang web.[44] Wayback đã tuân thủ chính sách này để tránh kiện tụng tốn kém.[45]

Chính sách loại trừ có hiệu lực trở về trước của Wayback bắt đầu được nới lỏng vào năm 2017, khi nó ngừng tôn trọng robots.txt trên các trang web quân sự và chính phủ Hoa Kỳ cho cả việc thu thập dữ liệu và hiển thị các trang web. Kể từ tháng 4 năm 2017, Wayback đang bỏ qua robots.txt rộng rãi hơn, không chỉ cho các trang web của chính phủ Hoa Kỳ.[46][47][48][49]

Sử dụng

Từ khi ra mắt công chúng vào năm 2001, Wayback Machine đã được các học giả nghiên cứu cả về cách nó lưu trữ và thu thập dữ liệu cũng như các trang thực tế có trong kho lưu trữ của nó. Tính đến năm 2013, các học giả đã viết khoảng 350 bài báo về Wayback Machine, chủ yếu từ các lĩnh vực công nghệ thông tin, khoa học thư viện và khoa học xã hội. Các học giả khoa học xã hội đã sử dụng Wayback Machine để phân tích sự phát triển của các trang web từ giữa những năm 1990 đến nay đã ảnh hưởng như thế nào đến sự tăng trưởng của công ty.[13]

Khi Wayback Machine lưu trữ một trang, nó thường bao gồm hầu hết các siêu liên kết, giữ cho các liên kết đó hoạt động khi chúng có thể dễ dàng bị phá vỡ do sự không ổn định của Internet. Các nhà nghiên cứu ở Ấn Độ đã nghiên cứu tính hiệu quả của khả năng lưu các siêu liên kết trong các ấn phẩm học thuật trực tuyến của Máy Wayback và nhận thấy rằng nó đã tiết kiệm được hơn một nửa trong số đó.[50]

"Các nhà báo sử dụng Wayback Machine để xem các trang web đã chết, các bản tin ngày tháng và các thay đổi đối với nội dung trang web. Nội dung của nó đã được sử dụng để buộc các chính trị gia phải chịu trách nhiệm và vạch trần những lời dối trá trên chiến trường."[51] Năm 2014, một trang mạng xã hội được lưu trữ Igor Girkin, một thủ lĩnh phe nổi dậy ly khai ở Ukraine, cho thấy anh ta khoe khoang về việc quân đội của anh ta đã bắn hạ một máy bay quân sự Ukraine bị tình nghi trước khi người ta biết rằng chiếc máy bay thực sự là một máy bay phản lực dân sự của Malaysia Airlines (Chuyến bay 17 của Malaysia Airlines), sau đó anh ta đã xóa bài đăng và đổ lỗi cho quân đội Ukraine vì đã bắn rơi máy bay.[51][52] Trong năm 2017, Tháng 3 cho Khoa học bắt nguồn từ một cuộc thảo luận về reddit điều đó cho thấy ai đó đã truy cập Archive.org và phát hiện ra rằng tất cả các tham chiếu đến khí hậu thay đổi đã bị xóa khỏi trang web của Nhà Trắng. Đáp lại, một người dùng bình luận, "Cần phải có một cuộc hành trình của các nhà khoa học trên Washington".[53][54][55]

Hơn nữa, trang web được sử dụng nhiều để xác minh, cung cấp quyền truy cập vào các tài liệu tham khảo và tạo nội dung bởi Người biên tập Wikipedia.[56]

Vào tháng 9 năm 2020, một quan hệ đối tác đã được công bố với Cloudflare để tự động lưu trữ các trang web được cung cấp qua dịch vụ "Luôn trực tuyến", dịch vụ này cũng sẽ cho phép dịch vụ này hướng người dùng đến bản sao của trang web nếu không thể truy cập máy chủ lưu trữ ban đầu.[57]

Hạn chế

Vào năm 2014, có khoảng thời gian trễ là sáu tháng giữa thời điểm một trang web được thu thập thông tin và khi nó có sẵn để xem trong Wayback Machine.[58] Hiện tại, thời gian lag là 3 đến 10 giờ.[59] Wayback Machine chỉ cung cấp các phương tiện tìm kiếm hạn chế. Tính năng "Tìm kiếm trang web" của nó cho phép người dùng tìm một trang web dựa trên các từ mô tả trang web, thay vì các từ được tìm thấy trên chính các trang web.[60]

Wayback Machine không bao gồm mọi trang web từng được tạo do những hạn chế của trình thu thập thông tin web của nó. Wayback Machine không thể lưu trữ hoàn toàn các trang web có chứa các tính năng tương tác như nền tảng và biểu mẫu Flash được viết bằng JavaScript và ứng dụng web tiến bộ, bởi vì các chức năng đó yêu cầu tương tác với trang web chủ. Điều này có nghĩa là, kể từ tháng 6 năm 2013, Wayback Machine đã không thể hiển thị các nhận xét trên YouTube khi lưu các trang YouTube, vì theo Nhóm lưu trữ, các nhận xét không còn được "tải trong chính trang".[61] Trình thu thập thông tin web của Wayback Machine gặp khó khăn khi trích xuất bất kỳ thứ gì không được mã hóa trong HTML hoặc một trong các biến thể của nó, điều này thường có thể dẫn đến các siêu liên kết bị hỏng và hình ảnh bị thiếu. Do đó, trình thu thập thông tin web không thể lưu trữ "các trang mồ côi" không chứa liên kết đến các trang khác.[60][62] Trình thu thập thông tin của Wayback Machine chỉ tuân theo một số lượng siêu liên kết được xác định trước dựa trên giới hạn độ sâu đặt trước, vì vậy nó không thể lưu trữ mọi siêu liên kết trên mọi trang.[18]

Bắt đầu từ tháng 4 năm 2018, các nhân viên hành chính của nhóm lưu trữ của Wayback Machine đã thực thi quy tắc Quý tháng, bằng cách thỉnh thoảng xóa các khoảng thời gian là 23 ngày hoặc 39 ngày (tương ứng là 3/4 và 5/4 của một tháng) để giảm kích thước hàng đợi.[cần trích dẫn]

Bằng chứng pháp lý

Tố tụng dân sự

Netbula LLC v. Chordiant Software Inc.

Trong một trường hợp năm 2009, Netbula, LLC v. Chordiant Software Inc., bị cáo Chordiant đã đệ đơn đề nghị buộc Netbula vô hiệu hóa robots.txt tệp trên trang web của nó khiến Wayback Machine xóa quyền truy cập vào các phiên bản trước của các trang mà nó đã lưu trữ từ trang của Netbula, những trang mà Chordiant tin rằng sẽ hỗ trợ trường hợp của nó.[63]

Netbula phản đối kiến ​​nghị trên cơ sở rằng các bị cáo yêu cầu thay đổi trang web của Netbula và lẽ ra họ phải trực tiếp trát đòi Internet Archive cho các trang này.[64] Tuy nhiên, một nhân viên của Internet Archive đã tuyên bố ủng hộ hành động của Chordiant, nói rằng họ không thể sản xuất các trang web bằng bất kỳ cách nào khác "mà không có gánh nặng, chi phí và gián đoạn đáng kể đối với hoạt động của mình."[63]

Thẩm phán Howard Lloyd ở Quận phía Bắc của California, Phòng San Jose, đã bác bỏ lập luận của Netbula và ra lệnh cho họ tạm thời vô hiệu hóa tính năng chặn robots.txt để cho phép Chordiant truy xuất các trang lưu trữ mà họ đã tìm kiếm.[63]

Telewizja Polska

Trong một trường hợp tháng 10 năm 2004, Telewizja Polska USA, Inc. v. Vệ tinh Echostar, Số 02 C 3293, 65 Fed. R. Evid. Serv. 673 (Minh họa N.D. ngày 15 tháng 10 năm 2004), một đương sự đã cố gắng sử dụng kho lưu trữ Wayback Machine như một nguồn bằng chứng có thể chấp nhận được, có lẽ là lần đầu tiên. Telewizja Polska là nhà cung cấp TVP PoloniaEchoStar vận hành Mạng món ăn. Trước quá trình xét xử, EchoStar cho biết rằng họ dự định cung cấp ảnh chụp nhanh Máy Wayback để làm bằng chứng cho nội dung trước đây của trang web Telewizja Polska. Telewizja Polska đã mang đến một chuyển động trong limine để ngăn chặn các bức ảnh chụp nhanh vì lý do tin đồn và nguồn chưa được xác thực, nhưng Thẩm phán Arlander Keys đã bác bỏ khẳng định của Telewizja Polska về tin đồn và phủ nhận động thái của TVP trong limine để loại trừ các bằng chứng tại phiên tòa.[65][66] Tuy nhiên, tại phiên tòa, Thẩm phán Tòa án quận Ronald Guzman, thẩm phán xét xử, đã bác bỏ kết quả của Magistrate Keys và cho rằng cả bản khai của nhân viên Internet Archive cũng như các trang cơ bản (tức là trang web Telewizja Polska) đều không được chấp nhận làm bằng chứng. Thẩm phán Guzman lý luận rằng bản tuyên thệ của nhân viên này chứa cả những lời khai và những tuyên bố hỗ trợ không thể kết luận, và trang web có mục đích, bản in không tự xác thực.[67][68]

Luật sáng chế

Với điều kiện đáp ứng một số yêu cầu bổ sung (ví dụ: cung cấp một tuyên bố có thẩm quyền của người lưu trữ), Văn phòng bằng sáng chế Hoa KỳVăn phòng Sáng chế Châu Âu sẽ chấp nhận dấu ngày tháng từ Kho lưu trữ Internet làm bằng chứng về thời điểm một trang Web nhất định có thể truy cập được vào công chúng. Những ngày này được sử dụng để xác định xem một trang Web có sẵn như nghệ thuật nguyên thủy chẳng hạn trong việc kiểm tra đơn đăng ký sáng chế.[69]

Hạn chế của tiện ích

Có những giới hạn kỹ thuật đối với việc lưu trữ một trang web, và do đó, các bên đối lập trong vụ kiện có thể sử dụng sai kết quả được cung cấp bởi các kho lưu trữ trang web. Vấn đề này có thể trở nên trầm trọng hơn do thực tế gửi ảnh chụp màn hình của các trang web trong các khiếu nại, câu trả lời hoặc báo cáo của nhân chứng chuyên môn khi các liên kết cơ bản không được hiển thị và do đó, có thể chứa lỗi. Ví dụ: các kho lưu trữ như Máy quay lui không điền vào biểu mẫu và do đó, không bao gồm nội dung củaRESTful cơ sở dữ liệu thương mại điện tử trong kho lưu trữ của họ.[70]

Tình trạng pháp lý

Ở Châu Âu, Wayback Machine có thể được hiểu là vi phạm bản quyền luật. Chỉ người tạo nội dung mới có thể quyết định nơi xuất bản hoặc sao chép nội dung của họ, vì vậy Cơ quan lưu trữ sẽ phải xóa các trang khỏi hệ thống của mình theo yêu cầu của người tạo.[71] Bạn có thể tìm thấy các chính sách loại trừ cho Wayback Machine trong phần Câu hỏi thường gặp của trang web.[72]

Nội dung lưu trữ vấn đề pháp lý

Một số trường hợp đã được đưa ra chống lại Internet Archive đặc biệt vì nỗ lực lưu trữ Wayback Machine của nó.

Khoa học học

Cuối năm 2002, Cơ quan lưu trữ Internet đã xóa nhiều trang web chỉ trích Khoa học học từ Wayback Machine.[73] Một thông báo lỗi cho biết rằng điều này là để đáp ứng "yêu cầu của chủ sở hữu trang web".[74] Sau đó, người ta đã làm rõ rằng các luật sư từ Nhà thờ Khoa học đã yêu cầu xóa và chủ sở hữu trang web không muốn tài liệu của họ bị xóa.[75]

Healthcare Advocates, Inc.

Năm 2003, Harding Earley Follmer & Frailey đã bảo vệ một khách hàng khỏi tranh chấp nhãn hiệu bằng cách sử dụng Máy quay lui của Lưu trữ. Các luật sư đã có thể chứng minh rằng các khiếu nại của nguyên đơn là không hợp lệ, dựa trên nội dung trang web của họ từ vài năm trước. Sau đó, nguyên đơn, Healthcare Advocates, đã sửa đổi đơn khiếu nại của họ để đưa vào Kho lưu trữ Internet, cáo buộc tổ chức vi phạm bản quyền cũng như vi phạm DMCAĐạo luật Lạm dụng và Lừa đảo Máy tính. Những người ủng hộ chăm sóc sức khỏe tuyên bố rằng, vì họ đã cài đặt robots.txt gửi trên trang web của họ, ngay cả khi sau khi đơn kiện ban đầu được đệ trình, Cơ quan lưu trữ lẽ ra đã xóa tất cả các bản sao trước đó của trang web nguyên đơn khỏi Wayback Machine, tuy nhiên, một số tài liệu vẫn tiếp tục hiển thị công khai trên Wayback.[76] Vụ kiện đã được giải quyết ngoài tòa án, sau khi Wayback khắc phục sự cố.[77]

Suzanne Shell

Nhà hoạt động Suzanne Shell đệ đơn kiện vào tháng 12 năm 2005, yêu cầu Internet Archive trả cho cô 100.000 đô la Mỹ vì đã lưu trữ trang web profane-justice.org của cô từ năm 1999 đến năm 2004.[78][79] Kho lưu trữ Internet đã nộp một bản án tuyên bố hành động trong Tòa án Quận Hoa Kỳ cho Quận phía Bắc của California vào ngày 20 tháng 1 năm 2006, tìm kiếm một quyết định tư pháp rằng Internet Archive không vi phạm Shell's bản quyền. Shell phản hồi và mang lại một bộ trang phục chống lại Internet Archive vì đã lưu trữ trang web của cô ấy, mà cô ấy cho là vi phạm cô ấy điều khoản dịch vụ.[80] Vào ngày 13 tháng 2 năm 2007, một thẩm phán cho Tòa án Quận của Hoa Kỳ cho Quận Colorado bác bỏ tất cả các tuyên bố phản đối ngoại trừ vi phạm hợp đồng.[79] Kho lưu trữ Internet không chuyển sang loại bỏ vi phạm bản quyền tuyên bố Shell khẳng định việc phát sinh từ các hoạt động sao chép của mình, điều này cũng sẽ tiếp diễn.[81]

Vào ngày 25 tháng 4 năm 2007, Internet Archive và Suzanne Shell cùng thông báo về việc giải quyết vụ kiện của họ.[78] Internet Archive cho biết họ "... không quan tâm đến việc đưa các tài liệu vào Máy quay lui của những người không muốn lưu trữ nội dung Web của họ. Chúng tôi nhận thấy rằng Ms Shell có bản quyền hợp lệ và có thể thực thi trên trang Web của mình và chúng tôi rất tiếc rằng việc đưa trang web của cô ấy vào Wayback Machine đã dẫn đến vụ kiện tụng này. " Shell nói, "Tôi tôn trọng giá trị lịch sử của mục tiêu của Internet Archive. Tôi không bao giờ có ý định can thiệp vào mục tiêu đó cũng như không gây hại cho nó."[82]

Daniel Davydiuk

Từ năm 2013 đến năm 2016, a diễn viên khiêu dâm tên là Daniel Davydiuk đã cố gắng xóa các hình ảnh đã lưu trữ của mình khỏi kho lưu trữ của Wayback Machine, trước tiên bằng cách gửi nhiều Yêu cầu DMCA vào kho lưu trữ và sau đó bằng cách kháng nghị Tòa án liên bang Canada.[83][84][85]

Kiểm duyệt và các mối đe dọa khác

Archive.org hiện là bị chặn ở Trung Quốc.[86][87] Sau khi tổ chức khủng bố Nhà nước Hồi giáo bị cấm, Kho lưu trữ Internet đã bị chặn toàn bộ ở Nga với tư cách là người dẫn chương trình video tiếp cận cộng đồng từ tổ chức đó, trong một thời gian ngắn trong năm 2015–16.[51][88][89][cần cập nhật] Kể từ năm 2016, trang web đã hoạt động trở lại, có sẵn toàn bộ, mặc dù các nhà vận động hành lang thương mại địa phương đang kiện Internet Archive ra tòa án địa phương để cấm nó vì lý do bản quyền.[90]

Alison Macrina, giám đốc Dự án Tự do Thư viện, lưu ý rằng "trong khi các thủ thư coi trọng sự riêng tư cá nhân một cách sâu sắc, chúng tôi cũng phản đối mạnh mẽ việc kiểm duyệt".[51]

Đã có những trường hợp hiếm hoi mà việc truy cập trực tuyến vào nội dung "chẳng có gì" khiến mọi người gặp nguy hiểm đã bị trang web vô hiệu hóa.[51]

Các mối đe dọa khác bao gồm thiên tai,[91] phá hủy (từ xa hoặc vật lý),[92] thao tác với nội dung của kho lưu trữ (xem thêm: Tấn công mạng, sao lưu), luật bản quyền có vấn đề[93] và giám sát người dùng của trang web.[94]

Kevin Vaughan nghi ngờ rằng trong dài hạn của nhiều thế hệ "bên cạnh không có gì" sẽ tồn tại một cách hữu ích, nói rằng, "Nếu chúng ta có sự liên tục trong nền văn minh công nghệ của mình" thì "rất nhiều dữ liệu trần sẽ vẫn có thể tìm thấy và tìm kiếm được ".[95]

Trong một bài báo phản ánh về việc bảo tồn tri thức của con người, Đại Tây Dương đã nhận xét rằng Kho lưu trữ Internet, tự mô tả rằng sẽ được xây dựng lâu dài,[96] "đang làm việc điên cuồng để thu thập dữ liệu trước khi nó biến mất mà không có bất kỳ cơ sở hạ tầng dài hạn nào để nói đến."[97]

Xem thêm

Người giới thiệu

  1. ^ "WayBackMachine.org WHOIS, DNS và Thông tin tên miền - Công cụ tên miền". AI LÀ. Đã lấy Ngày 13 tháng ba, 2016.
  2. ^ "InternetArchive.org WHOIS, DNS và Thông tin tên miền - Công cụ tên miền". AI LÀ. Đã lấy Ngày 13 tháng ba, 2016.
  3. ^ Notess, Greg R. (tháng 3 - tháng 4 năm 2002). "The Wayback Machine: The Web's Archive". Trực tuyến. 26: 59–61 - qua EBSCOhost.
  4. ^ "The Wayback Machine", Các câu hỏi thường gặp, lưu trữ từ bản gốc vào ngày 18 tháng 9 năm 2018, lấy lại 18 tháng 9 năm 2018
  5. ^ a b "20.000 ổ cứng khi thực hiện sứ mệnh | Blog lưu trữ trên Internet". blog.archive.org. Ngày 25 tháng 10 năm 2016. Đã lưu trữ từ bản gốc vào ngày 20 tháng 10 năm 2018. Đã lấy Ngày 15 tháng 10, 2018.
  6. ^ Green, Heather (ngày 28 tháng 2 năm 2002). "Thư viện lớn như thế giới". BusinessWeek. Đã lưu trữ từ bản gốc vào ngày 20 tháng 12 năm 2011.
  7. ^ Tong, Judy (ngày 8 tháng 9 năm 2002). "Bên có trách nhiệm - Brewster Kahle; Thư viện web, trên web". Thời báo New York. Đã lưu trữ từ bản gốc vào ngày 20 tháng 2 năm 2011. Đã lấy 15 tháng 8 năm 2011.
  8. ^ "MTV Online: Trang chính - Máy quay ngược". Máy quay lui. Ngày 12 tháng 5 năm 1996. Lưu trữ từ bản gốc vào ngày 12 tháng 5 năm 1996. Đã lấy 17 tháng 7 năm 2020.
  9. ^ "Hướng dẫn Infoseek - Máy quay ngược". Máy quay lui. Ngày 12 tháng 5 năm 1996. Lưu trữ từ bản gốc vào ngày 12 tháng 5 năm 1996. Đã lấy 16 tháng 12 năm 2016.
  10. ^ a b "Internet Archive: Wayback Machine". archive.org. Đã lưu trữ từ bản gốc vào ngày 3 tháng 1 năm 2014. Đã lấy Ngày 15 tháng 10, 2018.
  11. ^ Cook, John (ngày 1 tháng 11 năm 2001). "Trang web đưa bạn trở lại lịch sử Internet". Seattle Post-Intelligencer. Đã lưu trữ từ bản gốc vào ngày 12 tháng 8 năm 2014. Đã lấy 15 tháng 8 năm 2011.
  12. ^ Mayfield, Kendra (ngày 28 tháng 10 năm 2001). "Wayback Goes Way Back on Web". Có dây. Đã lưu trữ từ bản gốc vào ngày 16 tháng 10 năm 2017. Đã lấy 16 tháng 10 năm 2017.
  13. ^ a b c Arora, Sanjay K .; Li, Âm; Youtie, Jan; Shapira, Philip (ngày 5 tháng 5 năm 2015). "Sử dụng máy quay lui để khai thác các trang web trong khoa học xã hội: Một tài nguyên phương pháp luận". Tạp chí của Hiệp hội Thông tin Khoa học và Công nghệ. 67 (8): 1904–1915. doi:10.1002 / asi.23503. ISSN 2330-1635.
  14. ^ a b c d e f g h Kalev Leetaru (ngày 28 tháng 1 năm 2016). "Kho lưu trữ Internet bước sang tuổi 20: Hậu trường nhìn vào việc lưu trữ web". Forbes. Đã lưu trữ từ bản gốc vào ngày 16 tháng 10 năm 2017. Đã lấy 16 tháng 10 năm 2017.
  15. ^ http://blog.archive.org/2020/10/30/fact-checks-and-context-for-wayback-machine-pages/
  16. ^ Kahle, Brewster. "Lưu trữ Internet". Khoa học Mỹ - Số tháng 3 năm 1997. Đã lưu trữ từ bản gốc vào ngày 3 tháng 4 năm 2012. Đã lấy 19 tháng 8 năm 2011.
  17. ^ Jeff Kaplan (ngày 27 tháng 10 năm 2014). "Archive-It: Thu thập thông tin trên Web cùng nhau". Blog Lưu trữ Internet. Đã lưu trữ từ bản gốc vào ngày 12 tháng 10 năm 2017. Đã lấy 16 tháng 10 năm 2017.
  18. ^ a b "Thu thập thông tin web trên toàn thế giới". Lưu trữ Internet. Đã lưu trữ từ bản gốc vào ngày 19 tháng 10 năm 2017. Đã lấy 16 tháng 10 năm 2017.
  19. ^ "Số thu thập thông tin rộng 13". Lưu trữ Internet. Đã lưu trữ từ bản gốc vào ngày 19 tháng 10 năm 2017. Đã lấy 16 tháng 10 năm 2017.
  20. ^ "Kho lưu trữ Internet: Petabox". archive.org. Đã lấy 25 tháng 10 năm 2018.
  21. ^ Kanellos, Michael (ngày 29 tháng 7 năm 2005). "Bộ nhớ lớn với giá rẻ". CNET News.com. Đã lưu trữ từ bản gốc vào ngày 3 tháng 4 năm 2007. Đã lấy 29 tháng 7 năm 2007.
  22. ^ "Internet Archive và Sun Microsystems Tạo nên Lịch sử Sống của Internet". Sun Microsystems. Ngày 25 tháng 3 năm 2009. Đã lưu trữ từ bản gốc vào ngày 26 tháng 3 năm 2009. Đã lấy 27 tháng 3, 2009.
  23. ^ Mearian, Lucas (ngày 19 tháng 3 năm 2009). "Internet Archive để công bố trung tâm dữ liệu Wayback Machine khổng lồ". Computerworld.com. Đã lưu trữ từ bản gốc vào ngày 23 tháng 3 năm 2009. Đã lấy 22 tháng 3, 2009.
  24. ^ "Máy Wayback được cập nhật trong thử nghiệm beta". Đã lưu trữ từ bản gốc vào ngày 23 tháng 8 năm 2011. Đã lấy 19 tháng 8 năm 2011.
  25. ^ "Beta Wayback Machine, trong diễn đàn". Đã lưu trữ từ bản gốc vào ngày 17 tháng 4 năm 2014. Đã lấy 16 tháng 4 năm 2014.
  26. ^ "Diễn đàn lưu trữ Internet: Cặp giá đỡ thứ 6 đi vào hoạt động: hơn 2PB dung lượng dữ liệu được sử dụng". archive.org. Đã lưu trữ từ bản gốc vào ngày 24 tháng 10 năm 2016. Đã lấy 25 tháng 10 năm 2018.
  27. ^ "Wayback Machine: Hiện có 240.000.000.000 URL | Blog lưu trữ trên Internet". Ngày 9 tháng 1 năm 2013. Đã lưu trữ từ bản gốc vào ngày 14 tháng 4 năm 2014. Đã lấy 16 tháng 4 năm 2014.
  28. ^ Rossi, Alexis (ngày 25 tháng 10 năm 2013). "Sửa các liên kết bị hỏng trên Internet". archive.org. San Francisco, CA, US: Nhóm sưu tập, Kho lưu trữ trên Internet. Đã lưu trữ từ bản gốc vào ngày 7 tháng 11 năm 2014. Đã lấy 25 tháng Ba, 2015. Chúng tôi đã thêm khả năng lưu trữ một trang ngay lập tức và lấy lại URL vĩnh viễn cho trang đó trong Wayback Machine. Dịch vụ này cho phép bất kỳ ai - người biên tập wikipedia, học giả, chuyên gia pháp lý, sinh viên hoặc đầu bếp tại nhà như tôi - tạo một URL ổn định để trích dẫn, chia sẻ hoặc đánh dấu bất kỳ thông tin nào họ muốn vẫn có quyền truy cập trong tương lai.
  29. ^ "Máy Wayback lưu trữ Internet mới hiện đã trực tuyến". www.digitaljournal.com. Ngày 23 tháng 10 năm 2013.
  30. ^ Nhóm VirusTotal (ngày 25 tháng 3 năm 2015). "Thông tin địa chỉ IP 207.241.226.190". virustotal.com. Dublin 2, Ireland: VirusTotal. Đã lưu trữ từ bản gốc vào ngày 14 tháng 7 năm 2014. Đã lấy 25 tháng Ba, 2015. Ngày 25 tháng 3 năm 2015: Các URL mới nhất được lưu trữ trong địa chỉ IP này được phát hiện bởi ít nhất một máy quét URL hoặc tập dữ liệu URL độc hại. ... 2/62 2015-03-25 16:14:12 [URL hoàn chỉnh được biên tập lại] /Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [hoàn thành URL đã biên tập lại] /CBLightSetup.exeBảo trì CS1: vị trí (liên kết)
  31. ^ Lời khuyên do Google cung cấp (ngày 25 tháng 3 năm 2015). "Trang Chẩn đoán Duyệt web An toàn cho archive.org". google.com/safebrowsing. Mountain View, CA, US. Đã lưu trữ từ bản gốc vào ngày 6 tháng 4 năm 2015. Đã lấy 25 tháng Ba, 2015. 25/03/2015: Một phần của trang web này đã được liệt kê vì hoạt động đáng ngờ 138 lần trong 90 ngày qua. ... Điều gì đã xảy ra khi Google truy cập trang web này? ... Trong số 42410 trang mà chúng tôi đã kiểm tra trên trang web này hơn 90 ngày qua, 450 trang có phần mềm độc hại được tải xuống và cài đặt mà không có sự đồng ý của người dùng. Lần cuối cùng Google truy cập trang web này là vào ngày 23 tháng 3 năm 2015 và lần cuối cùng nội dung đáng ngờ được tìm thấy trên trang web này là vào ngày 25 tháng 3 năm 2015. ... Phần mềm độc hại bao gồm 169 trojan, 126 vi rút, 43 cửa hậu.
  32. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet". Đã lưu trữ từ bản gốc ngày 21 tháng 10 năm 2009. Đã lấy 17 tháng 1 năm 2015.
  33. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet". Ngày 18 tháng 12 năm 2014. Đã lưu trữ từ bản gốc vào ngày 18 tháng 12 năm 2014. Đã lấy Ngày 13 tháng 12, 2018.
  34. ^ "Việc thao túng dữ liệu lớn có thể thay đổi cách suy nghĩ của thế giới không?". Quốc gia. Đã lưu trữ từ bản gốc vào ngày 12 tháng 1 năm 2017. Đã lấy 14 tháng 5 năm 2017.
  35. ^ Crockett, Zachary (ngày 28 tháng 9 năm 2018). "Inside Wayback Machine, viên nang thời gian của Internet". Hối hả. Đã lưu trữ từ bản gốc vào ngày 2 tháng 10 năm 2018. Đã lấy 26 tháng 10 năm 2018.
  36. ^ Heffernan, Virginia (ngày 18 tháng 9 năm 2018). "Mọi thứ tan vỡ và suy tàn trên Internet — Đó là một điều tốt". CÓ DÂY. Đã lưu trữ từ bản gốc vào ngày 25 tháng 9 năm 2018. Đã lấy 26 tháng 10 năm 2018.
  37. ^ michelle (ngày 9 tháng 5 năm 2014). "Wayback Machine Hits 400.000.000.000!". Lưu trữ Internet. Đã lưu trữ từ bản gốc vào ngày 26 tháng 8 năm 2014. Đã lấy 25 tháng Ba, 2015.
  38. ^ "Máy quay lui lưu trữ Internet". Lưu trữ Internet. Đã lưu trữ từ bản gốc vào ngày 13 tháng 2 năm 2015. Đã lấy 25 tháng Ba, 2015.
  39. ^ "Một số trang web không khả dụng do Robots.txt hoặc các loại trừ khác". Đã lưu trữ từ bản gốc vào ngày 15 tháng 4 năm 2011.
  40. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet". Đã lưu trữ từ bản gốc vào ngày 17 tháng 4 năm 2014.
  41. ^ Cox, Joseph (ngày 22 tháng 5 năm 2018). "Máy Wayback đang xóa bằng chứng về phần mềm độc hại được bán cho người theo dõi". Đã lưu trữ từ bản gốc vào ngày 23 tháng 5 năm 2018. Đã lấy 23 tháng 5 năm 2018.
  42. ^ "Robots.txt dành cho các công cụ tìm kiếm không hoạt động tốt cho các kho lưu trữ web". Lưu trữ Internet. Ngày 17 tháng 4 năm 2017. Đã lấy 29 tháng 6 năm 2019.
  43. ^ https://help.archive.org/hc/en-us/articles/360004651732-Using-The-Wayback-Machine
  44. ^ "Khuyến nghị để quản lý yêu cầu xóa và bảo toàn tính toàn vẹn của kho lưu trữ". Đài học của California. Ngày 14 tháng 12 năm 2002. Đã lưu trữ từ bản gốc vào ngày 18 tháng 9 năm 2017. Đã lấy 14 tháng 9 năm 2017.
  45. ^ "Xóa tệp robots.txt hồi tố của các lần thu thập thông tin trước đây Chính sách lưu trữ AKA Oakland". Lưu trữ Internet. Ngày 7 tháng 7 năm 2014. Đã lưu trữ từ bản gốc vào ngày 10 tháng 10 năm 2017. Đã lấy 14 tháng 9 năm 2017.
  46. ^ Mark Graham (ngày 17 tháng 4 năm 2017). "Robots.txt dành cho các công cụ tìm kiếm không hoạt động tốt cho các kho lưu trữ web". Blog Lưu trữ Internet. Đã lưu trữ từ bản gốc vào ngày 17 tháng 4 năm 2017. Đã lấy 16 tháng 4 năm 2017.
  47. ^ "Archivierung des Internets: Internet Archive ignoreriert künftig robots.txt" (bằng tiếng Đức). heise trực tuyến. Đã lưu trữ từ bản gốc vào ngày 27 tháng 4 năm 2017. Đã lấy 14 tháng 5 năm 2017.
  48. ^ "Suchmaschinen: Internet Archive sẽ künftig Robots.txt-Einträge lờrieren - Golem.de" (bằng tiếng Đức). Đã lưu trữ từ bản gốc vào ngày 19 tháng 6 năm 2017. Đã lấy 14 tháng 5 năm 2017.
  49. ^ "Internet Archive sẽ bỏ qua các tệp robots.txt để giữ cho hồ sơ lịch sử được chính xác". Xu hướng kỹ thuật số. Ngày 24 tháng 4 năm 2017. Đã lưu trữ từ bản gốc vào ngày 16 tháng 5 năm 2017. Đã lấy 14 tháng 5 năm 2017.
  50. ^ Sampath Kumar, B.T .; Prithviraj, K.R. (Ngày 21 tháng 10 năm 2014). "Đưa sự sống vào cõi chết: Vai trò của Wayback Machine trong việc truy xuất các URL đã biến mất". Tạp chí Khoa học Thông tin. 41 (1): 71–81. doi:10.1177/0165551514552752. ISSN 0165-5515. S2CID 28320982.
  51. ^ a b c d e "Máy Wayback sẽ không kiểm duyệt kho lưu trữ cho hương vị, giám đốc nói sau khi bài báo Olympic được quét". Đã lưu trữ từ bản gốc vào ngày 6 tháng 1 năm 2017. Đã lấy 14 tháng 5 năm 2017.
  52. ^ Lepore, Jill (Ngày 26 tháng 1 năm 2015). "Hôm qua web nói gì". Người New York. Đã lưu trữ từ bản gốc vào ngày 25 tháng 1 năm 2015. Đã lấy 14 tháng 5 năm 2017.
  53. ^ "Tháng 3 dành cho Khoa học bắt đầu với 'dòng quảng cáo' của người này trên Reddit". Bưu điện Washington. Đã lưu trữ từ bản gốc vào ngày 23 tháng 4 năm 2017. Đã lấy 23 tháng 4 năm 2017.
  54. ^ "Các nhà khoa học sẽ hành quân về Washington?". Các bài viết washington. Đã lưu trữ từ bản gốc vào ngày 31 tháng 1 năm 2017. Đã lấy 31 tháng 1 năm 2017.
  55. ^ Foley, Katherine Ellen. "Tháng 3 toàn cầu về Khoa học bắt đầu với một chuỗi Reddit duy nhất". Thạch anh. Đã lưu trữ từ bản gốc vào ngày 24 tháng 4 năm 2017. Đã lấy 23 tháng 4 năm 2017.
  56. ^ http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued
  57. ^ Graham, Mark (ngày 17 tháng 9 năm 2020). "Cloudflare và Wayback Machine, hợp lực vì một trang Web đáng tin cậy hơn". Blog Lưu trữ Internet. Đã lấy 17 tháng 9, 2020.
  58. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet". Lưu trữ Internet. Ngày 2 tháng 4 năm 2014. Đã lưu trữ từ bản gốc vào ngày 2 tháng 4 năm 2014. Đã lấy 23 tháng 11 năm 2018.
  59. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet". archive.org. Đã lấy 23 tháng 11 năm 2018.
  60. ^ a b Bates, Mary Ellen (2002). "Máy quay ngược". Trực tuyến. 26: 80 - qua EBSCOhost.
  61. ^ "YouTube - Archiveteam". archiveteam.org. Đã lấy 6 tháng 8 năm 2020.
  62. ^ "Các câu hỏi thường gặp về kho lưu trữ Internet". archive.org. Đã lưu trữ từ bản gốc vào ngày 20 tháng 4 năm 2013. Đã lấy 18 tháng 10 năm 2018.
  63. ^ a b c Lloyd, Howard (tháng 10 năm 2009). "Lệnh tắt Robots.txt" (PDF). Đã lưu trữ từ bản gốc (PDF) vào ngày 8 tháng 8 năm 2019. Đã lấy Ngày 15 tháng 10, 2009.
  64. ^ Cortes, Antonio (tháng 10 năm 2009). "Chuyển động phản đối loại bỏ Robots.txt". Đã lưu trữ từ bản gốc vào ngày 27 tháng 10 năm 2010. Đã lấy Ngày 15 tháng 10, 2009.
  65. ^ Gelman, Lauren (ngày 17 tháng 11 năm 2004). "Ảnh chụp nhanh trang web của kho lưu trữ Internet được chấp nhận làm bằng chứng". Gói tin. 2 (3). Đã lưu trữ từ bản gốc vào ngày 30 tháng 4 năm 2011. Đã lấy 4 tháng 1 năm 2007.
  66. ^ Howell, Beryl A. (tháng 2 năm 2006). "Chứng minh Lịch sử Web: Cách sử dụng Kho lưu trữ Internet" (PDF). Tạp chí Luật Internet: 3–9. Đã lưu trữ từ bản gốc (PDF) vào ngày 5 tháng 7 năm 2010. Đã lấy 6 tháng 8 năm 2008.
  67. ^ "Tìm kiếm bằng chứng trong địa điểm ảo Sự chấp nhận của bằng chứng Internet". Đã lưu trữ từ bản gốc vào ngày 1 tháng 7 năm 2019. Đã lấy Ngày 14 tháng 6, 2020.
  68. ^ Levitt, Carole A.; Rosch, Mark E. (2010). Tìm thông tin giống như một chuyên gia: Khai thác các tài nguyên công khai có sẵn trên Internet để nghiên cứu điều tra, Tom 1. Hiệp hội Luật sư Hoa Kỳ. trang 194–196. ISBN 978-1-60442-890-2. Đã lấy Ngày 14 tháng 6, 2020.
  69. ^ Wynn W. Coggins (Mùa thu 2002). "Nghệ thuật trước trong lĩnh vực bằng sáng chế phương pháp kinh doanh - Khi nào thì một tài liệu điện tử là một ấn phẩm in cho các mục đích nghệ thuật trước?". USPTO. Đã lưu trữ từ bản gốc vào ngày 21 tháng 9 năm 2012. Đã lấy 15 tháng 8 năm 2012.
  70. ^ "Debunking the Wayback Machine". Đã lưu trữ từ bản gốc vào ngày 29 tháng 6 năm 2010.
  71. ^ Bahr, Martin (2002). "Máy Wayback và Google Cache - eine Verletzung deutschen Urheberrechts?". JurPC (bằng tiếng Đức): 9. doi:10.7328 / jurpcb / 20021719. Đã lưu trữ từ bản gốc vào ngày 23 tháng 8 năm 2009.
  72. ^ "Câu hỏi thường gặp về lưu trữ Internet". Đã lưu trữ từ bản gốc vào ngày 17 tháng 4 năm 2014. Đã lấy 16 tháng 4 năm 2014.
  73. ^ Bowman, Lisa M (ngày 24 tháng 9 năm 2002). "Kho lưu trữ ròng làm im lặng nhà phê bình Khoa học học". CNET News.com. Đã lưu trữ từ bản gốc vào ngày 15 tháng 5 năm 2012. Đã lấy 4 tháng 1 năm 2007.
  74. ^ Jeff (ngày 23 tháng 9 năm 2002). "loại trừ khỏi Wayback Machine" (Blog). Diễn đàn Wayback Machine. Lưu trữ Internet. Đã lưu trữ từ bản gốc ngày 11 tháng 2 năm 2007. Đã lấy 4 tháng 1 năm 2007. Tác giả và Ngày cho biết bắt đầu chuỗi diễn đàn.
  75. ^ Miller, Ernest. "Sherman, thiết lập cỗ máy quay ngược cho khoa học giáo". LawMeme. Trường Luật Yale. Đã lưu trữ từ bản gốc (Blog) vào ngày 16 tháng 11 năm 2012. Đã lấy 4 tháng 1 năm 2007.
  76. ^ Thuốc nhuộm, Jessica (2005). "Trang web bị kiện cho chuyến đi gây tranh cãi vào quá khứ Internet". EContent. 28. 11: 8–9.
  77. ^ Bangeman, Eric (ngày 31 tháng 8 năm 2006). "Kho lưu trữ Internet giải quyết Suit Over Wayback Machine". Ars Technica. Đã lưu trữ từ bản gốc ngày 5 tháng 11 năm 2007. Đã lấy 29 tháng 11 năm 2007.
  78. ^ a b Internet Archive v. Shell, 505 F.Supp.2d 755 tại justia.com, 1: 2006cv01726 (Tòa án quận Colorado Ngày 31 tháng 8 năm 2006) ("'Ngày 25 tháng 4 năm 2007 Thỏa thuận dàn xếp được công bố.' Nộp hồ sơ 65, 2007-04-30: '... do đó ĐÃ ĐẶT CHỖ rằng vấn đề này sẽ được BỎ QUA VỚI SỰ KIỆN TRƯỚC ...'").
  79. ^ a b Babcock, Lewis T., Chánh án (ngày 13 tháng 2 năm 2007). "Internet Archive v. Shell Hành động dân sự số 06cv01726LTBCBS " (PDF). Đã lưu trữ (PDF) từ bản gốc vào ngày 25 tháng 1 năm 2014. Đã lấy 25 tháng Ba, 2015. 1) Đề nghị của Internet Archive bác bỏ yêu cầu phản tố của Shell về hành vi chuyển đổi và hành vi trộm cắp dân sự (Nguyên nhân Hành động Thứ hai) được CẤP, 2) Đề nghị của Internet Archive bác bỏ yêu cầu phản đối của Shell vì vi phạm hợp đồng (Nguyên nhân Hành động Thứ ba) là BỊ TỪ CHỐI; 3) Đề xuất của Internet Archive nhằm bác bỏ yêu cầu phản đối của Shell về hành vi Racketcking theo RICO và COCCA (Nguyên nhân Hành động Thứ tư) được CẤP.
  80. ^ Claburn, Thomas (ngày 16 tháng 3 năm 2007). "Người phụ nữ Colorado kiện để nắm giữ trình thu thập thông tin web để ký hợp đồng". New York, NY, Hoa Kỳ: InformationWeek, UBM Tech, UBM LLC. Đã lưu trữ từ bản gốc vào ngày 4 tháng 9 năm 2014. Đã lấy 25 tháng Ba, 2015. Máy tính có thể thay mặt con người giao kết hợp đồng. Đạo luật thống nhất về giao dịch điện tử (UETA) nói rằng 'hợp đồng có thể được hình thành bởi sự tương tác của các đại lý điện tử của các bên, ngay cả khi không có cá nhân nào biết hoặc đã xem xét các hành động của đại lý điện tử hoặc các điều khoản và thỏa thuận kết quả.'
  81. ^ Samson, Martin H., Phillips Nizer LLP (2007). "Internet Archive v. Suzanne Shell". internetlibrary.com. Thư viện Internet về Luật và các Quyết định của Tòa án. Đã lưu trữ từ bản gốc vào ngày 3 tháng 8 năm 2014. Đã lấy 25 tháng Ba, 2015. Quan trọng hơn, trước tòa, việc Internet Archive chỉ sao chép trang của Shell và hiển thị chúng trong cơ sở dữ liệu của mình, không cấu thành việc thực thi quyền thống trị và kiểm soát cần thiết đối với tài sản của bị đơn. Điều quan trọng, tòa án lưu ý, bị đơn luôn sở hữu và điều hành trang web của riêng mình. Tòa án cho biết: 'Shell đã không thể cáo buộc các dữ kiện cho thấy rằng Internet Archive thực hiện quyền thống trị hoặc kiểm soát trang web của cô ấy, vì đơn khiếu nại của Shell tuyên bố rõ ràng rằng cô ấy tiếp tục sở hữu và vận hành trang web trong khi nó được lưu trữ trên máy Wayback. Shell xác định không có cơ quan nào ủng hộ quan điểm cho rằng việc sao chép tài liệu tự nó đã đủ để tước quyền sử dụng để hỗ trợ chuyển đổi. Ngược lại, nhiều mạch đã xác định rằng không phải vậy. '
  82. ^ nhà sản xuất bia (ngày 25 tháng 4 năm 2007). "Kho lưu trữ Internet và Vụ kiện định cư Suzanne Shell". archive.org. Denver, CO, USA: Lưu trữ Internet. Đã lưu trữ từ bản gốc ngày 5 tháng 12 năm 2010. Đã lấy 25 tháng Ba, 2015. Cả hai bên đều chân thành hối tiếc về bất kỳ xáo trộn nào mà vụ kiện có thể đã gây ra cho bên kia. Cả Internet Archive và Ms Shell đều không dung thứ cho bất kỳ hành vi nào có thể gây tổn hại cho một trong hai bên phát sinh do công chúng chú ý đến vụ kiện này. Các bên đã không tham gia vào hành vi như vậy và yêu cầu phản ứng của công chúng đối với cách giải quyết hữu nghị của vụ kiện tụng này phải phù hợp với mong muốn của họ để không gây ra thêm tổn hại hoặc xáo trộn cho một trong hai bên.
  83. ^ Stobbe, Richard (ngày 5 tháng 12 năm 2014). "Ý nghĩa bản quyền về" quyền được lãng quên "? Hoặc cách gỡ bỏ kho lưu trữ trên Internet". Mondaq. Đã lấy 08 Tháng 3, 2019.
  84. ^ McVeigh, Glennys (Ngày 16 tháng 10 năm 2014). Philpott, James; Weissman, Adam; Bucholz, Ren; Ấm đun nước, Brent; Pearl, Aaron (biên tập). "Davydiuk v. Internet Archive Canada, 2014 FC 944". CanLII. Liên đoàn các Hiệp hội Luật của Canada. Đã lấy 08 Tháng 3, 2019.
  85. ^ Southcott, Richard F. (ngày 30 tháng 11 năm 2016). Philpott, John; Alton, Alex; Bucholz, Ren (biên tập). "Davydiuk v. Internet Archive Canada and Internet Archive, 2016 FC 1313 (CanLII)". CanLII. Ottawa, Ontario: Liên đoàn các Hiệp hội Luật của Canada. Đã lấy 08 Tháng 3, 2019.
  86. ^ Conger, Kate. "Sao lưu lịch sử của Internet ở Canada để cứu nó khỏi Trump". TechCrunch. Đã lưu trữ từ bản gốc vào ngày 27 tháng 12 năm 2016. Đã lấy 14 tháng 5 năm 2017.
  87. ^ "Nơi để tìm những gì đã biến mất trên mạng và hơn thế nữa: Kho lưu trữ Internet". Đài phát thanh quốc tế công cộng. Đã lưu trữ từ bản gốc vào ngày 28 tháng 3 năm 2017. Đã lấy 14 tháng 5 năm 2017.
  88. ^ Chirgwin, Richard. "Không có đường lùi ở Nga: Putin chặn Archive.org". Đã lưu trữ từ bản gốc vào ngày 7 tháng 10 năm 2016. Đã lấy 14 tháng 5 năm 2017.
  89. ^ "Nga sẽ không đi ngược lại, chặn Lưu trữ Internet". Xu hướng kỹ thuật số. Ngày 26 tháng 6 năm 2015. Đã lưu trữ từ bản gốc vào ngày 17 tháng 4 năm 2016. Đã lấy 14 tháng 5 năm 2017.
  90. ^ "В России разблокирован крупнейший интернет-архив". Российская газета (ở Nga). Đã lấy 18 tháng 10 năm 2020.
  91. ^ "Giúp chúng tôi Giữ Kho lưu trữ Miễn phí, Có thể truy cập và Người đọc ở chế độ Riêng tư | Các Blog Lưu trữ trên Internet". Ngày 29 tháng 11 năm 2016. Đã lưu trữ từ bản gốc vào ngày 21 tháng 5 năm 2017. Đã lấy 14 tháng 5 năm 2017.
  92. ^ https://www.engadget.com/2013-11-07-wayback-machine-internet-archive-fire.html
  93. ^ "Kho lưu trữ trên Internet: Những thay đổi được đề xuất đối với DMCA sẽ khiến chúng tôi phải lòng" Người kiểm duyệt web"". Người tiêu dùng. Ngày 7 tháng 6 năm 2016. Đã lưu trữ từ bản gốc vào ngày 11 tháng 11 năm 2016. Đã lấy 14 tháng 5 năm 2017.
  94. ^ Herb, Ulrich. "Die Trump-Angst grassiert" (bằng tiếng Đức). heise trực tuyến. Đã lưu trữ từ bản gốc vào ngày 7 tháng 12 năm 2016. Đã lấy 14 tháng 5 năm 2017.
  95. ^ LaFrance, Adrienne. "Thời kỳ đen tối của Internet". Đại Tây Dương. Đã lưu trữ từ bản gốc vào ngày 7 tháng 5 năm 2017. Đã lấy 14 tháng 5 năm 2017.
  96. ^ "Toàn bộ Internet sẽ được lưu trữ ở Canada để bảo vệ nó khỏi Trump". Bo mạch chủ. Ngày 29 tháng 11 năm 2016. Đã lưu trữ từ bản gốc vào ngày 16 tháng 5 năm 2017. Đã lấy 14 tháng 5 năm 2017.
  97. ^ LaFrance, Adrienne (ngày 3 tháng 6 năm 2016). "Nỗi sợ hãi của con người về kiến ​​thức toàn diện". Đại Tây Dương. Đã lưu trữ từ bản gốc vào ngày 2 tháng 12 năm 2016. Đã lấy 14 tháng 5 năm 2017.

liện kết ngoại

Pin
Send
Share
Send