Sinh viên đại học dùng AI viết blog “giả”, lên đầu bảng xếp hạng Hacker News

1.020

Sinh viên này phát biểu rằng, "Việc tôi làm quá dễ dàng. Và đó mới chính là điều nguy hiểm nhất."

Mới đầu tuần, Liam Porr mới chỉ "nghe nói" đến GPT-3. Vậy mà đến cuối tuần, sinh viên đại học này đã có thể sử dụng mô hình trí tuệ nhân tạo (AI) nói trên để tạo ra một trang blog giả hoàn toàn, với một cái tên tất nhiên cũng… giả nốt!

Ban đầu, đây vốn chỉ là một thử nghiệm "cho vui". Nhưng cuối cùng, một trong những bài đăng trên trang blog này đã "leo" lên vị trí số 1 trên bảng xếp hạng của chuyên trang Hacker News. Rất ít người để ý rằng trang blog này là do trí tuệ nhân tạo viết ra. Thậm chí có vài người còn nhấn luôn vào nút "Theo dõi".

Mặc dù nhiều người đã truyền miệng nhau thông tin về việc GPT-3, công cụ trí tuệ nhân tạo về ngôn ngữ mạnh mẽ nhất đến thời điểm hiện tại, có thể ảnh hưởng nghiêm trọng đến ngành công nghiệp sản xuất nội dung, nhưng đây là một trong số những trường hợp minh hoạ hiếm hoi cho thấy tiềm năng của AI này. Điều đáng ngạc nhiên nhất về trải nghiệm này, theo Porr – sinh viên ngành khoa học máy tính tại Đại học California, Berkeley – là: "Toàn bộ quá trình này thực sự quá đơn giản, và điều đó mới chính là điểm đáng sợ".

GPT-3 là mô hình trí tuệ nhân tạo ngôn ngữ mới nhất và lớn nhất của OpenAI, một phòng thí nghiệm nghiên cứu của trụ sở tại bang San Francisco Mỹ - OpenAI đã bắt đầu phát hành "nhỏ giọt" bộ công cụ này từ giữa tháng 7 năm ngoái. Vào tháng 2 năm 2020, OpenAI đã gây chú ý lớn từ dư luận với mô hình GPT-2, phiên bản tiền nhiệm của thuật toán GPT-3, song công ty tuyên bố sẽ không công khai vì sợ công cụ này sẽ bị lạm dụng cho những mục đích xấu. Quyết định này ngay lập tức gây ra phản ứng dữ dội, với việc các nhà nghiên cứu cáo buộc phòng thí nghiệm này đã "lừa dối" về kết quả nghiên cứu và chỉ sử dụng một "diễn viên đóng thế" để qua mặt dư luận. Đến tháng 11/2019, phòng thí nghiệm OpenAI đã thay đổi quan điểm và quyết định phát hành công khai mô hình hình và tuyên bố "chưa có bằng chứng mạnh mẽ nào về hành vi lạm dụng bộ công cụ đó".

Phòng thí nghiệm đã chọn cách tiếp cận khác với GPT-3; họ không giữ công cụ đó cho riêng mình, nhưng cũng như không cấp quyền truy cập công khai. Thay vào đó, phòng thí nghiệm này đã cung cấp thuật toán này cho các nhà nghiên cứu đăng ký tham gia thử nghiệm bản beta riêng tư, với mục tiêu thu thập phản hồi của những người thử nghiệm để cuối cùng, đi tới thương mại hóa công nghệ vào cuối năm nay.

Porr đã gửi đơn đăng ký tham gia. Anh quyết định điền biểu mẫu với một bảng câu hỏi đơn giản, chủ yếu hỏi về mục đích sử dụng công cụ. Nhưng anh ấy cũng không chờ đợi đến khi được cấp quyền. Sau khi trao đổi với một số thành viên của cộng đồng Berkeley AI, anh ấy đã nhanh chóng tìm được một nghiên cứu sinh tiến sĩ đã có quyền truy cập vào bộ công cụ trên. Sau khi nghiên cứu sinh trên đồng ý hợp tác, Porr đã viết một đoạn mã để cộng sự của mình chạy. Đoạn mã trên đưa cho mô hình AI GPT-3 tiêu đề và phần giới thiệu cho một bài đăng trên blog và AI sẽ tạo ra một vài phiên bản hoàn chỉnh cho bài viết. Bài đăng đầu tiên của Porr (bài đăng trên Hacker News) và mọi bài đăng sau đó, đều được sao chép và dán từ một trong những kết quả mà công cụ AI tạo ra mà không qua bất kỳ thao tác chỉnh sửa nào của con người.

"Bắt đầu từ thời điểm tôi nghĩ ra ý tưởng và liên hệ với nghiên cứu sinh tiến sĩ cho tới khi tôi hoàn thành trang blog và bài đăng đầu tiên trở nên phổ biến – chỉ mất có vài tiếng đồng hồ", anh cho biết.

Bài đăng blog giả của Porr, viết dưới nickname giả "adolos", đứng thứ nhất trên bảng xếp hạng của chuyên trang Hacker News. Porr cho biết anh dùng 3 tài khoản khác nhau để đăng bài và vote cho bài viết của mình trên trang Hacker News nhằm mục đích "đẩy" bài lên thứ hạng cao hơn. Tuy nhiên, quản trị viên của trang khẳng định chiến thuật này không có hiệu quả, mà chính nhờ tiêu đề "câu view" của bài đã giúp bài viết đạt được thành tích đó.

Mẹo để có thể tạo ra nội dung mà không cần sự can thiệp, biên tập quá nhiều của con người là phải hiểu được những điểm mạnh và điểm yếu của GPT-3. Porr nói: "Công cụ này khá giỏi trong việc tạo ra ngôn ngữ đẹp, nhưng không làm tốt lắm về khía cạnh độ logic và hợp lý". Vì vậy, anh ấy đã chọn một thể loại blog phổ biến không yêu cầu mức độ logic chặt chẽ: đó là chủ đề công việc và tư vấn cho mọi người.

Từ đó, Porr viết các tiêu đề bài đăng của mình theo một công thức đơn giản: anh ấy sẽ ngồi lướt trên các trang Medium và Hacker News để xem những chủ đề nào đang "nổi" trong danh mục đó và tập hợp những chủ đề tương đối giống nhau. "Cảm thấy bản thân đang làm việc không hiệu quả? Có lẽ bạn nên ngừng suy nghĩ quá mức," anh chọn tiêu đề này cho một bài đăng. Với một bài đăng khác, anh viết: "Sự táo bạo và sáng tạo sẽ vượt trội hơn so với trí thông minh". Trong một vài trường hợp, các "tít" này không dẫn tới một bài viết hay. Song miễn là anh ấy đi đúng chủ đề "thế mạnh" của bộ công cụ AI, thì quá trình này rất dễ dàng.

Sau hai tuần đăng bài gần như hàng ngày, Porr đã kết thúc dự án với một thông điệp cuối cùng, khó hiểu và do AI tự viết. Với tiêu đề "Tôi sẽ làm gì với GPT-3 nếu tôi là một người không có đạo đức", bài viết này mô tả hành trình của Porr như một dạng giả thuyết. Cùng ngày, anh ấy cũng đăng một lời thú nhận trung thực trên blog thật của mình.

Porr nói rằng anh ấy muốn chứng minh rằng GPT-3 có thể làm được những gì mà một tác giả "người thật" có thể làm. Thật vậy, bất chấp phong cách viết có phần kỳ lạ và thi thoảng "có lỗi" của thuật toán, chỉ có ba hoặc bốn trong số hàng chục người bình luận về bài đăng "đứng đầu bảng xếp hạng" của Porr trên Hacker News bày tỏ sự nghi ngờ rằng bài viết có thể được tạo ra bởi một thuật toán. Song, tất cả những bình luận đó ngay lập tức bị các thành viên khác trong cộng đồng phản đối.

Người nghi ngờ về trang blog "giả" của Porr ngay lập tức đã bị "dislike" bởi các thành viên khác.
Những người (ít ỏi) bày tỏ sự nghi ngờ về trang blog "giả" của Porr ngay lập tức đã bị "dislike" bởi các thành viên khác.

Đối với các chuyên gia, các thuật toán tạo ngôn ngữ như vậy từ lâu đã trở thành mối lo ngại lớn. Kể từ khi OpenAI lần đầu tiên công bố mô hình GPT-2, nhiều người đã đưa ra dự đoán rằng công cụ này rất dễ bị lạm dụng. Trong bài đăng trên blog của riêng mình, phòng thí nghiệm OpenAI tập trung vào những gì mô hình này có thể làm nếu bị "vũ khí hoá" trở thành một công cụ sản xuất hàng loạt thông tin sai lệch. Nhiều người đã tự hỏi liệu công cụ này có thể được ứng dụng để loại bỏ các bài đăng spam với đầy đủ các từ khóa có liên quan để đánh lừa Google hay không.

Porr cho biết thử nghiệm của anh ấy đã cho thấy một giải pháp thay thế "đời thường" hơn nhưng vẫn có khả năng gây ra những rắc rối: mọi người có thể sử dụng công cụ này để tạo ra nhiều nội dung "câu view", "câu click". "Có thể nguy cơ sẽ chỉ là một loạt những bài blog với chất lượng tầm thường, bởi hiện nay việc tạo ra một trang blog riêng quá dễ dàng", anh cho biết. "Tôi nghĩ giá trị của nội dung trực tuyến sẽ bị giảm đi rất nhiều".

Porr có kế hoạch sẽ làm thêm nhiều thử nghiệm nữa với công cụ GPT-3. Nhưng anh vẫn đang chờ được OpenAI cấp quyền truy cập chính thức. "Có thể họ sẽ không hài lòng với những gì tôi đã làm. Thực tế thì điều này cũng hơi ngu ngốc", anh thừa nhận.

Cập nhật: 05/01/2021 Theo VnExpress