Google News Archive Search tìm cả những bài báo đã có 200 tuổi

Ngày hôm qua (6/9), Google chính thức ra mắt một dịch vụ mới cho phép người dùng Internet có thể tìm kiếm được các bài viết trên báo in, tạp chí cũng như các dạng ấn phẩm in khác.

Google tuyên bố dịch vụ mới của hãng có thể lục tìm trong cơ sở dữ liệu báo in và tìm ra được cả những tài liệu đã có hơn … 200 tuổi.

Dịch vụ Google News Archive Search sẽ chuyển hướng người dùng tìm kiếm đến trang web của những nhà xuất bản nội dung - cả miễn phí và phải trả phí sử dụng. Tuy nhiên, Google lại không hề thu được chút doanh thu nào từ việc chuyển hướng trang web như vậy.

Hiện Google vẫn chưa tiết lộ đã có bao nhiêu nhà xuất bản tham gia vào dịch vụ mới của hãng này. Tuy nhiên, hãng này cũng cho biết đã có một số tên tuổi trong làng báo chí như The Wall Street Journal, The New York Times, The Washington Post, Time, Guardian Unlimited, Factiva, Lexis-Nexis, HighBeam Research và Thomson Gale tham gia vào dự án dịch vụ mới với Google.

Nhưng thực tế Google hoàn toàn độc lập trong việc xây dựng cơ sở dữ liệu nguồn tài nguyên được sử dụng trong dịch vụ mới. Kết quả tìm kiếm thông qua dịch vụ Google News Archive Search sẽ được hiển thị trên một trang tìm kiếm mới.

Không giống với dự án đưa sách từ các thư viện lên mạng Internet trước đây - dự án đã mang lại cho Google không ít những va chạm pháp lý với các nhà xuất bản – thì trong dự án mới các đối tác của Google khẳng định chính họ là người thúc ép Google tung ra dịch vụ này nhằm cho phép độc giả tiếp cận với hệ thống cơ sở lưu trữ dữ liệu của họ đã được xây dựng từ nhiều năm qua.

Cơ sở dữ liệu được sử dụng trong dịch vụ mới của Google trước đây được gọi với tên “dark Web” (Web tối) bởi vì đây chính là dữ liệu mà các công cụ tìm kiếm chuẩn không thể “sục” vào tìm được.

Chúng tôi đã đề nghị Google cùng với một số nhà cung cấp dịch vụ tìm kiếm khác trên Internet lập chỉ mục tìm kiếm cơ sở dữ liệu của chúng tôi,” Patrick Spain – Giám đốc điều hành thư viện nội dung điện tử HighBeam Research - khẳng định.

Đây là biểu tượng cho một bước phát triển mới,” Allen Weiner – Giám đốc nghiên cứu của Gartner - nhận định. Google đã thiết lập được một mối quan hệ tốt đẹp với các hãng cung cấp nội dung. Mối quan hệ này sẽ mang lại lợi ích cho cả hai phía.


Trong một số trường hợp, toàn bộ cơ sở dữ liệu các ấn phẩm của Time và The Washington Post cũng sẽ được đưa vào dịch vụ mới của Google cho phép người dùng tìm kiếm. Ví dụ như cơ sở dữ liệu của Time gồm 4.300 ấn phẩm đã phát hành và 300.000 bài báo được phát hành từ những năm 1923 - tức là đã cách đây hơn 200 năm. Time cũng đã chính thức cung cấp dịch vụ tìm kiếm trong cơ sở dữ liệu các ấn phẩm của hãng trong tháng trước.

Trong một số trường hợp khác như The New York Times và The Washington Post, người tìm kiếm sẽ được chuyển đến những trang web cho phép họ mua từng bài viết riêng biệt thay vì phải mua cả ấn phẩm của nhà xuất bản.

Lãnh đạo của Google khẳng định dịch vụ mới sẽ không mang lại nguồn doanh thu trực tiếp. Thậm chí hiện Google còn chưa biết phải kiếm lời từ dịch vụ này như thế nào nữa.

Chúng tôi không hề chú trọng đến vấn đề lợi nhuận,” Anurag Acharya - một kỹ sư có tên tuổi tại Google - khẳng định. “Đây hoàn toàn là một lĩnh vực mới đối với chúng tôi”.

Dịch vụ mới của chúng tôi không phải là một cuốn từ điển bách khoa,” Acharya khẳng định. “Thay vì hiển thị những bài viết có liên quan đến từ khoá tìm kiếm như trước đây, kết quả tìm kiếm trong dịch vụ mới sẽ được sắp xếp theo trình tự thời gian".

Hoàng Dũng

Theo New York Times, VnMedia
Danh mục

Khám phá khoa học

Sinh vật học

Khảo cổ học

Đại dương học

Thế giới động vật

Khoa học vũ trụ

Danh nhân thế giới

Ngày tận thế

1001 bí ẩn

Chinh phục sao Hỏa

Kỳ quan thế giới

Người ngoài hành tinh - UFO

Trắc nghiệm Khoa học

Khoa học quân sự

Lịch sử

Tại sao

Địa danh nổi tiếng

Hỏi đáp Khoa học

Công nghệ mới

Khoa học máy tính

Phát minh khoa học

AI - Trí tuệ nhân tạo

Y học - Sức khỏe

Môi trường

Bệnh Ung thư

Ứng dụng khoa học

Câu chuyện khoa học

Công trình khoa học

Sự kiện Khoa học

Thư viện ảnh

Video