Các công cụ tốt nhất hiện có để có thể kiểm tra đạo văn, phát hiện nội dung do AI viết, thậm chí cả content được tạo bằng ChatGPT.
Thị trường hiện đang tràn ngập các công cụ AI có thể tạo nội dung với nhiều bổ sung hơn xảy ra mỗi ngày. Và mặc dù không có hại gì khi nhận sự trợ giúp từ các công cụ AI (trên thực tế, có thể tốt hơn nếu kết hợp các công cụ AI vào thói quen của bạn để luôn dẫn đầu), việc sử dụng chúng để tạo ra các khối nội dung chất lượng thấp hoàn chỉnh sẽ gây hại cho bạn.
May mắn thay, với rất nhiều công cụ tạo nội dung AI xuất hiện, một thị trường mới để phát hiện nội dung được tạo bằng các công cụ như vậy cũng đã xuất hiện. Và mặc dù nó vẫn còn khá thô sơ, nhưng có một vài công cụ tốt mà bạn có thể sử dụng để phát hiện những nội dung như vậy.
Tại sao bạn cần một công cụ phát hiện nội dung AI?
Tùy thuộc vào nghề nghiệp của bạn, nhu cầu của bạn về trình phát hiện nội dung AI có thể khác nhau. Ví dụ: nếu bạn là Content Marketing, các công cụ tìm kiếm như Google có thể phạt trang web của bạn nếu bạn xuất bản nội dung AI chất lượng thấp trên trang web của mình. Ngay cả khi bạn đang nhờ sự trợ giúp của AI để tạo nội dung, thì nội dung đó vẫn phải vượt qua bài kiểm tra phát hiện AI. Việc thêm sự tiếp xúc của con người vào nội dung do AI viết sẽ giúp nó vượt qua bài kiểm tra trong hầu hết các trường hợp.
Nhưng nếu bạn là một nhà giáo dục, bạn có thể muốn đảm bảo rằng bài luận mà học sinh của bạn đã nộp hoàn toàn không phải do AI viết.
Bất kể yêu cầu của bạn là gì, chúng tôi đã biên soạn một danh sách các công cụ phát hiện nội dung tốt nhất hiện có.
1. Originality.AI
Originality.AI là một công cụ chuyên nghiệp để phát hiện việc tạo nội dung AI. Nó marketing bản thân như một công cụ dành cho các nhà xuất bản nội dung nghiêm túc với các tính năng như phát hiện nội dung AI và kiểm tra đạo văn. Họ thậm chí còn nói rằng trong khi hầu hết các công cụ phát hiện nội dung AI hiện có tập trung vào giới học thuật và hiển thị kết quả theo đó, thì Originality.AI là một trong số ít công cụ phục vụ cho các nhà xuất bản web.
Đây không phải là công cụ miễn phí nhưng là một trong số ít công cụ hiện có có thể phát hiện nội dung được viết bởi GPT-3, GPT 3.5 và ChatGPT với độ chính xác rất cao. Nó chính xác hơn 94%.
Sử dụng nó là khá dễ dàng. Bạn chỉ cần tải lên nội dung bạn muốn quét và phần mềm sẽ tạo điểm số cho biết phần trăm nội dung là bản gốc và phần trăm là AI. Tỷ lệ phần trăm AI càng cao thì càng có nhiều khả năng AI đã viết nó. Xếp hạng 90% do con người và 10% AI không có nghĩa là 90% nội dung được viết bởi con người và 10% bởi AI. Nó đơn giản có nghĩa là xác suất một người viết nội dung là 90%.
Để sử dụng công cụ này, bạn sẽ cần phải mua các khoản tín dụng. Với 1 tín chỉ, bạn có thể quét 100 từ; bạn có thể mua 1 tín dụng với giá 0,01 đô la. Hãy nghĩ về nó, nó không phải là đắt tiền. Bạn có thể quét một bài đăng blog 1000 từ chỉ với $0,10 để phát hiện AI hoặc đạo văn.
Nó cũng cung cấp các tính năng khác như Quản lý nhóm, Thanh toán tự động và Lịch sử quét của người dùng. Họ cũng đang có kế hoạch sớm thêm chức năng Quét toàn bộ trang web. Nói chung, đây là một công cụ tuyệt vời cho các doanh nghiệp cần xuất bản nội dung web thường xuyên và đảm bảo rằng Google không phạt họ vì sử dụng nội dung AI chất lượng thấp hơn. Ngoài ra còn có một tiện ích mở rộng của Chrome mà bạn có thể sử dụng Originality.AI.
2. GPTZero
Được phát triển bởi Edward Tian, một sinh viên Đại học Princeton, chủ yếu dành cho các nhà giáo dục, GPTZero là một lựa chọn tuyệt vời khác để phát hiện nội dung do AI viết. Nó cũng có thể phát hiện nội dung được tạo bởi ChatGPT, GPT-3 và GPT 3.5.
Hơn nữa, nó không giống bất kỳ tùy chọn nào khác trong danh sách này. Nó không chỉ có thể phát hiện xem AI có viết văn bản hay không mà còn có thể đánh dấu các câu riêng lẻ mà nó tin là do AI tạo ra để lại những câu mà nó tin là do con người viết.
Bạn có thể dán trực tiếp nội dung (tối thiểu 250 ký tự) hoặc tải file PDF, DOC hoặc TXT lên để quét. Không có giới hạn về độ dài của văn bản bạn có thể nhập. Nó cũng cho thấy kết quả khá nhanh chóng. Nhưng kết quả nó cho thấy là khá mới lạ. Công cụ chấm điểm văn bản dựa trên sự phức tạp và bùng nổ, điều này có thể gây nhầm lẫn.
Theo GPTZero, độ phức tạp của một tài liệu “là phép đo tính ngẫu nhiên của văn bản” trong khi tính bùng nổ của nó “là phép đo biến thể của độ phức tạp” .
Edward Tian giải thích sự phức tạp là tính ngẫu nhiên của văn bản đối với một mô hình hoặc mức độ mà một mô hình ngôn ngữ thích một văn bản. Văn bản do AI tạo có xu hướng đồng nhất hơn trong khi văn bản do con người viết ngẫu nhiên hơn. Vì vậy, điểm bối rối trung bình càng cao thì càng có nhiều khả năng một người đã viết nó.
Nhưng riêng sự phức tạp không thể là một chỉ báo đầy đủ vì một văn bản càng dài, thậm chí là văn bản do con người viết, thì nó càng trở nên ít ngẫu nhiên hơn. Vì vậy, nó cũng sử dụng sự bùng nổ như một thước đo khác. Sau đó, nó cho biết liệu văn bản có khả năng được viết bởi con người hay AI theo cách đơn giản hơn.
Nó vẫn đang trong giai đoạn phát triển ban đầu nên vẫn đang thay đổi và không có nhiều tùy chọn như quét hàng loạt. Và có vẻ như Edward Tian sẽ tập trung nhiều hơn vào phát triển học thuật trong tương lai. Nhưng bất kể nhu cầu của bạn là gì, dù sao đó cũng là một lựa chọn tuyệt vời để xem xét.
3. HuggingFace GPT-2 Output Detector Demo
Bộ phát hiện GPT-2 Output của HuggingFace là một công cụ khá đơn giản, không có bất kỳ tính năng đáng tiền nào và tôi càng hoan nghênh công cụ này hơn nữa. Và mặc dù có tên là “GPT-2 Output”, nhưng nó đã hoạt động với nội dung được tạo từ ChatGPT (sử dụng GPT 3.5) trong các thử nghiệm của tôi. Và nó hoạt động tốt hơn nhiều công cụ khác trong danh sách này.
Giao diện khá đơn giản. Bạn dán văn bản vào hộp văn bản được cung cấp; không có giới hạn từ. Cũng không có tùy chọn để tải lên các tập tin. Ngay sau khi bạn dán văn bản vào hộp văn bản, công cụ sẽ hoạt động. Nó hiển thị kết quả bên dưới hộp văn bản theo tỷ lệ phần trăm của “thực” và “giả”, trong đó thực rõ ràng có nghĩa là do con người tạo ra.
Nhưng tôi muốn đặt nó nhiều hơn dưới một công cụ có thể phát hiện văn bản do AI tạo chất lượng thấp hơn một cách tuyệt vời thay vì một thứ có thể phát hiện nội dung do AI tạo ở cấp độ chi tiết như GPTZero. Trong các thử nghiệm của tôi, nó sẽ coi một văn bản hoàn toàn do AI tạo ra gần 99% là giả mạo. Nhưng khi bạn nhập văn bản đã được chỉnh sửa bởi con người sau khi được tạo bởi AI, tỷ lệ phần trăm không đáng tin cậy. Nó được coi là một văn bản 50-50, tức là 50% do con người viết và 50% do AI tạo ra, giống như thật 98%.
4. GLTR
GLTR (viết tắt từ Giant Language Model Test Room) không giống bất kỳ công cụ nào khác trong danh sách này và nó thậm chí có vẻ hơi phức tạp khi sử dụng ngay từ cái nhìn đầu tiên. Nhưng câu nói rằng cái nhìn đầu tiên có thể bị đánh lừa phù hợp với GLTR như một chiếc găng tay. Đúng là nó không trực quan như các công cụ còn lại nhưng nó là một công cụ tuyệt vời cần có trong kho vũ khí của bạn.
Phân tích một văn bản khá dễ dàng. Khi bạn dán văn bản vào hộp văn bản và nhấn phân tích, nó sẽ trả về kết quả gần như ngay lập tức. Nhưng đó là nơi nó trở nên phức tạp – hiểu kết quả. Nó không đưa ra tỷ lệ phần trăm hoặc phân tích đơn giản về việc AI hay con người đã viết văn bản. Thay vào đó, nó trả về văn bản với mỗi từ được đánh dấu bằng một trong 4 màu: xanh lục, vàng, đỏ và tím.
Nó phân tích từng từ về khả năng dự đoán từ đó dựa trên ngữ cảnh bên trái của nó. Nếu từ nằm trong Top 10 từ được dự đoán dựa trên từ ở bên trái, thì nền của từ đó có màu xanh lục, từ đó có màu vàng đối với Top 100, màu đỏ đối với Top 1000 và ngược lại, từ đó có màu tím. Vì vậy, vì một văn bản do AI viết có tính dự đoán cao hơn so với của con người, nên nó chủ yếu sẽ có màu xanh lá cây hoặc màu vàng. Nhưng nếu văn bản có màu đỏ hoặc tím trong đó, thì rất có thể, một người đã viết nó.
Ví dụ: khi phân tích một văn bản do ChatGPT tạo ra, văn bản đó hoàn toàn có màu xanh lục.
Nhưng đây là cách nó trông như thế nào khi phân tích thứ gì đó được viết bởi một con người (tôi). Xem Cách nó có màu đỏ và tím ở đây và ở đó? Đó là gợi ý của bạn.
Sau khi bạn vượt qua các vấn đề phức tạp, công cụ này trở nên khá hữu ích, chính xác và hoàn toàn miễn phí sử dụng!
5. Writer’s AI Content Detector
Writer là một AI tổng quát giúp người dùng tạo nội dung cho doanh nghiệp của họ. Nhưng họ cũng đã thêm công cụ AI Content Detector vào trang web của mình.
Bạn có thể quét văn bản có độ dài tối đa 1500 ký tự bằng công cụ này và nó hiển thị kết quả ngay lập tức (hầu hết thời gian; trong thử nghiệm của tôi, nó đã từ chối hoạt động hoàn toàn trong một thời gian ngắn nhưng bắt đầu hoạt động trở lại sau một thời gian). Các kết quả được hiển thị đơn giản theo tỷ lệ phần trăm văn bản được cho là do con người tạo ra. Vì vậy, tỷ lệ phần trăm càng thấp thì càng có nhiều khả năng AI đã viết văn bản. Nếu bạn đã là người dùng của Writer, khách hàng Nhóm của nó có thể quét 500 nghìn từ mỗi tháng bằng API. Mặt khác, sử dụng công cụ miễn phí, bạn chỉ có thể quét 1500 ký tự cùng một lúc.
Rõ ràng, nó cũng có thể phát hiện nội dung được tạo bởi ChatGPT và GPT 3.5 nhưng kết quả không phải lúc nào cũng đáng tin cậy. Nhưng trong thử nghiệm của tôi, 2 trong số 4 lần, nó đã gắn nhãn văn bản do ChatGPT tạo ra là do AI tạo đủ. Trong khi 2 lần còn lại, nó cho tỷ lệ phần trăm khá cao (66% trong một trường hợp) cho thấy khả năng con người viết nó cao hơn.
6. AI Content Detector của Content At Scale
Content At Scale là một công cụ AI tổng quát khác cũng cung cấp Content Detector . Đây là một trình phát hiện nội dung đáng tin cậy cũng có thể phát hiện nội dung GPT-3, GPT 3.5 và ChatGPT. Bạn có thể tải lên tối đa 25000 ký tự trong một lần và công cụ sẽ hoàn tất quá trình quét khá nhanh.
Sau đó, nó sẽ cung cấp cho nó một tỷ lệ phần trăm cho nội dung của con người trong đó tỷ lệ phần trăm thấp hơn có nghĩa là văn bản được viết bởi AI.
Đó là một công cụ khá đơn giản và miễn phí sử dụng. Không có tùy chọn để tải file lên hoặc quét nội dung hàng loạt nhưng nó hoàn thành công việc. Và nó hoạt động khá chính xác.
7. AI Text Classifier by OpenAI
AI Text Classifier là một công cụ phát hiện nội dung AI của OpenAI, công ty đứng sau ChatGPT, điều mà một số người sẽ coi là một điều trớ trêu. Nhưng mỉa mai hay không, đó là một công cụ cần có trong kho vũ khí của bạn nếu tính năng phát hiện nội dung do AI tạo nằm trong chương trình làm việc của bạn. Nó cũng có thể phát hiện văn bản do ChatGPT tạo ra.
Nó yêu cầu bạn nhập tối thiểu 1000 ký tự và sẽ đưa ra một trong số 5 câu trả lời sau khi phân tích – rất khó xảy ra (ít hơn 10% cơ hội), không chắc (từ 10% đến 45% cơ hội), không rõ liệu có (cơ hội từ 45% đến 90%), có thể (cơ hội từ 90% đến 98%) hoặc có khả năng do AI tạo ra (cơ hội trên 98%).
Công cụ này không phải là hoàn hảo và ngay cả OpenAI cũng gợi ý rằng bạn không thể chỉ dựa vào nó để phát hiện nội dung AI của mình. Nó thường có thể đưa ra những phân tích sai. Nhưng nó có thể giúp bạn phát hiện nội dung được viết bởi ChatGPT và vì thế, nó xứng đáng được đề cập ở đây.
8. AI Content Detector by CopyLeaks
Công cụ phát hiện đạo văn CopyLeaks cũng đã thêm một công cụ AI detection vào trang web của mình. Hiện tại, nó miễn phí sử dụng nhưng có thể chỉ miễn phí khi đang ở giai đoạn thử nghiệm. Tuy nhiên, đây là một công cụ tốt để phát hiện nội dung bằng AI. Nó cũng có thể phát hiện văn bản ChatGPT, GPT 3.5 và GPT-3.
Không có giới hạn về độ dài của văn bản mà bạn có thể quét và kết quả hiển thị rất nhanh và chính xác. Nó hiển thị kết quả bằng các thuật ngữ đơn giản hơn cho dù nó được viết bởi con người hay AI. Bạn cũng có thể di chuột qua văn bản để xem xác suất.
Ngoài nền tảng CopyLeaks nơi bạn có thể sử dụng trình phát hiện AI, còn có một tiện ích mở rộng Chrome miễn phí mà bạn có thể cài đặt trên trình duyệt của mình để truy cập nhanh.
9. SEO Kazan
Kazan SEO là một công cụ miễn phí cung cấp công cụ phát hiện AI đáng tin cậy cùng với nhiều tính năng khác như tối ưu hóa SEO, tìm cụm từ khóa, v.v. Tất cả những gì bạn cần làm là tạo một tài khoản trên trang web để truy cập tất cả các công cụ.
Công cụ phát hiện AI có đầu ra khá đáng tin cậy và hoạt động tốt hơn trên các văn bản dài hơn. Tất cả những gì bạn cần làm là dán nội dung vào hộp văn bản và phân tích nội dung đó và bạn sẽ nhận được phân tích rõ ràng giữa hàng thật (con người) và hàng giả (AI).
Nó thậm chí còn có tùy chọn phát hiện hàng loạt nội dung AI bằng cách nhập URL cho văn bản bạn muốn quét. Bạn thậm chí có thể nhập một tên miền trang web và công cụ sẽ quét 100 kết quả hàng đầu cho tên miền đó và hiển thị cho bạn kết quả.
Trong tương lai, các công cụ kiểm tra đạo văn, phát hiện nội dung do AI tạo ra sẽ trở thành một công cụ bình thường. Nhưng bạn nên lưu ý rằng không có công cụ nào trong danh sách này hoạt động chính xác mọi lúc. Và với tốc độ phát triển của các mô hình ngôn ngữ, không phải tất cả các công cụ đều có thể phát hiện nội dung được viết bởi các mô hình AI mới nhất. Thậm chí không phải tất cả các công cụ trong danh sách này đều có thể phát hiện chính xác nội dung do ChatGPT viết và đôi khi có thể đánh dấu nhầm nội dung đó là do con người viết.