Bài được đăng trên tạp chí Fortune – Lược dịch nhân ngày An Toàn Thông Tin Việt Nam 2023 đang diễn ra với chủ đề “An toàn dữ liệu trong thời đại Điện toán đám mây & Trí tuệ nhân tạo”.
Về tác giả: John Licato là trợ lý giáo sư Khoa học Máy tính và giám đốc Phòng thí nghiệm AMHR tại Đại học Nam Florida.
Mỗi ngày, tin nhắn từ các hoàng tử Nigeria, những người bán thuốc thần kỳ và những người quảng bá các khoản đầu tư không thể bỏ lỡ làm tắc nghẽn hộp thư email. Những cải tiến đối với bộ lọc thư rác dường như chỉ truyền cảm hứng cho các kỹ thuật mới để vượt qua các biện pháp bảo vệ.
Giờ đây, cuộc chạy đua vũ trang giữa những người chặn thư rác và những người gửi thư rác sắp leo thang với sự xuất hiện của một loại vũ khí mới: trí tuệ nhân tạo có khả năng sáng tạo. Với những tiến bộ gần đây về AI nhờ ChatGPT, những kẻ gửi thư rác có thể có các công cụ mới để trốn tránh các bộ lọc, thu hút sự chú ý của mọi người và thuyết phục họ nhấp vào, mua hoặc từ bỏ thông tin cá nhân.
Với tư cách là giám đốc phòng thí nghiệm Tiến bộ về Con người và Máy móc tại Đại học Nam Florida, John Licato nghiên cứu sự giao thoa giữa trí tuệ nhân tạo, xử lý ngôn ngữ tự nhiên và lý luận của con người. John Licato đã nghiên cứu cách AI có thể tìm hiểu sở thích cá nhân, niềm tin và những đặc điểm tính cách của con người.
Điều này có thể được sử dụng để hiểu rõ hơn cách tương tác với mọi người, giúp họ tìm hiểu hoặc cung cấp cho họ những đề xuất hữu ích. Nhưng điều này cũng có nghĩa là bạn nên chuẩn bị trước những thư rác thông minh hơn biết rõ điểm yếu của bạn – và có thể sử dụng chúng để chống lại bạn.
Thư rác, thư rác, thư rác
Vậy thư rác là gì?
Thư rác được định nghĩa là các email thương mại không được yêu cầu được gửi bởi một thực thể không xác định . Thuật ngữ này đôi khi được mở rộng sang tin nhắn văn bản, tin nhắn trực tiếp trên mạng xã hội và các đánh giá giả mạo về sản phẩm . Những kẻ gửi thư rác muốn thúc đẩy bạn hành động: mua thứ gì đó, nhấp vào liên kết lừa đảo, cài đặt phần mềm độc hại hoặc thay đổi chế độ xem.
Thư rác mang lại lợi nhuận. Một vụ gửi email có thể kiếm được 1.000 đô la Mỹ chỉ trong vài giờ , khiến những kẻ gửi thư rác chỉ tốn vài đô la – không bao gồm thiết lập ban đầu. Một chiến dịch thư rác dược phẩm trực tuyến có thể tạo ra khoảng 7.000 USD mỗi ngày.
Các nhà quảng cáo hợp pháp cũng muốn thúc đẩy bạn hành động – mua sản phẩm của họ, tham gia khảo sát, đăng ký nhận bản tin – nhưng trong khi email của nhà tiếp thị có thể liên kết đến trang web của công ty đã thành lập và chứa tùy chọn hủy đăng ký theo quy định của liên bang thì email spam có thể không.
Những kẻ gửi thư rác cũng không có quyền truy cập vào danh sách gửi thư mà người dùng đã đăng ký. Thay vào đó, những kẻ gửi thư rác sử dụng các chiến lược phản trực giác như lừa đảo “hoàng tử Nigeria” , trong đó một hoàng tử Nigeria tuyên bố cần bạn giúp đỡ để mở khóa một số tiền vô lý, hứa sẽ thưởng cho bạn một cách hậu hĩnh. Những người bản xứ kỹ thuật số hiểu biết ngay lập tức bác bỏ những lời cầu xin như vậy, nhưng sự vô lý của yêu cầu thực sự có thể chọn lọc những người còn ngây thơ hoặc đã cao tuổi , lọc ra những người có nhiều khả năng rơi vào trò lừa đảo nhất.
Tuy nhiên, những tiến bộ trong AI có nghĩa là những kẻ gửi thư rác có thể không phải dựa vào các phương pháp trúng hoặc trượt như vậy. AI có thể cho phép họ nhắm mục tiêu vào các cá nhân và làm cho thông điệp của họ trở nên thuyết phục hơn dựa trên thông tin dễ truy cập, chẳng hạn như các bài đăng trên mạng xã hội.
Tương lai của thư rác
Có thể bạn đã nghe nói về những tiến bộ trong các mô hình ngôn ngữ lớn có tính tổng quát như ChatGPT . Nhiệm vụ mà các LLM tổng quát này thực hiện rất đơn giản: đưa ra một chuỗi văn bản, dự đoán mã thông báo nào – hãy coi đây là một phần của từ – sẽ xuất hiện tiếp theo. Sau đó, dự đoán token nào xuất hiện sau đó. Và cứ thế, lặp đi lặp lại.
Bằng cách nào đó, chỉ đào tạo về nhiệm vụ đó, khi được thực hiện với đủ văn bản trên LLM đủ lớn, dường như là đủ để truyền cho những mô hình này khả năng thực hiện tốt một cách đáng kinh ngạc trong nhiều nhiệm vụ khác.
Nhiều cách sử dụng công nghệ đã xuất hiện, cho thấy khả năng của công nghệ trong việc nhanh chóng thích ứng và tìm hiểu về các cá nhân. Ví dụ: LLM có thể viết email đầy đủ theo phong cách viết của bạn, chỉ đưa ra một số ví dụ về cách bạn viết. Và có một ví dụ kinh điển – đã hơn một thập kỷ – về việc Target phát hiện ra một khách hàng đã mang thai trước khi cô ấy mang thai.
Những kẻ gửi thư rác cũng như các nhà tiếp thị sẽ được hưởng lợi từ việc có thể dự đoán nhiều hơn về các cá nhân có ít dữ liệu hơn. Với trang LinkedIn của bạn, một vài bài đăng và một hoặc hai hình ảnh hồ sơ, những kẻ gửi thư rác được trang bị LLM có thể đưa ra những phỏng đoán khá chính xác về khuynh hướng chính trị, tình trạng hôn nhân hoặc các ưu tiên trong cuộc sống của bạn.
Nghiên cứu của John Licato cùng đồng sự cho thấy rằng LLM có thể được sử dụng để dự đoán từ mà một cá nhân sẽ nói tiếp theo với mức độ chính xác vượt xa các phương pháp tiếp cận AI khác trong một nhiệm vụ tạo từ được gọi là nhiệm vụ lưu loát ngữ nghĩa. Nghiên cứu cũng chỉ ra rằng LLM có thể lấy một số loại câu hỏi nhất định từ các bài kiểm tra khả năng suy luận và dự đoán cách mọi người sẽ trả lời câu hỏi đó. Điều này cho thấy LLM đã có một số kiến thức về khả năng suy luận điển hình của con người.
Nếu những kẻ gửi thư rác vượt qua được các bộ lọc ban đầu và khiến bạn đọc email, nhấp vào một liên kết hoặc thậm chí tham gia vào cuộc trò chuyện, khả năng áp dụng sự thuyết phục tùy chỉnh của họ sẽ tăng lên đáng kể . Ở đây một lần nữa, LLM có thể thay đổi trò chơi. Kết quả ban đầu cho thấy LLM có thể được sử dụng để tranh luận một cách thuyết phục về các chủ đề từ chính trị đến chính sách y tế công cộng.
Tốt cho cả 2 phía
Tuy nhiên, AI không thiên vị bên này hay bên kia. Các bộ lọc thư rác cũng sẽ được hưởng lợi từ những tiến bộ trong AI, cho phép chúng dựng lên các rào cản mới đối với các email không mong muốn.
Những kẻ gửi thư rác thường cố gắng đánh lừa các bộ lọc bằng các ký tự đặc biệt, từ sai chính tả hoặc văn bản ẩn , dựa vào xu hướng của con người là bỏ qua những điểm bất thường trong văn bản nhỏ – ví dụ: “c1îck h.ere n0w”. Nhưng khi AI hiểu rõ hơn về thư rác, các bộ lọc có thể xác định và chặn thư rác không mong muốn tốt hơn – và thậm chí có thể cho phép vượt qua thư rác mong muốn, chẳng hạn như email tiếp thị mà bạn đã đăng ký rõ ràng. Hãy tưởng tượng một bộ lọc dự đoán liệu bạn có muốn đọc email trước khi bạn đọc nó hay không.
Bất chấp những lo ngại ngày càng tăng về AI – bằng chứng là Elon Musk, Giám đốc điều hành Tesla, SpaceX và Twitter/X, người sáng lập Apple Steve Wozniak và các nhà lãnh đạo công nghệ khác kêu gọi tạm dừng phát triển AI – rất nhiều điều tốt đẹp có thể đến từ những tiến bộ trong công nghệ. AI có thể giúp chúng ta hiểu những điểm yếu trong lý luận của con người có thể bị những kẻ xấu khai thác như thế nào và tìm ra cách chống lại các hoạt động xấu.
Tất cả các công nghệ mới đều có thể mang lại cả điều kỳ diệu và nguy hiểm. Sự khác biệt nằm ở chỗ người tạo ra và kiểm soát các công cụ cũng như cách chúng được sử dụng.