Pomimo upływu czasu wygląda na to, że lęk przed sztuczną inteligencją rośnie zamiast maleć. Sami twórcy tworzą narzędzia mające na celu wykrywanie tekstów ChatGPT.
OpenAI, czyli firma stojąca m.in. za takimi rozwiązaniami jak ChatGPT i DALL-E, stworzyło i przetestowało nowe narzędzie do wykrywania, czy jakikolwiek tekst został napisany z pomocą ich modelu językowego. Jednak jak donosi Wall Street Journal, firma wstrzymała się przed udostępnieniem go użytkownikom publicznym. Opinie o nowym rozwiązaniu są mieszane, ale wcale nie chodzi o jego skuteczność – ta jest podobno bardzo wysoka.
OpenAI rozważa znakowanie tekstów z ChatGPT
Narzędzie o wciąż nieznanej nazwie dodaje do odpowiedzi udzielanych przez ChatGPT unikalny wzór, który później pozwala na wykrycie występowania materiałów AI w tekście. Sam watermark jest podobno niezauważalny dla ludzi, dzięki czemu nie wpływa na jakość generowanych tekstów. Wewnętrzna dokumentacja twierdzi, że narzędzie jest skuteczne w 99,9% w wykrywaniu treści wygenerowanych przez ChatGPT.
Nowe rozwiązanie byłoby jednak bezużyteczne dla innych popularnych modeli jak Gemini AI czy Llama 3. Dodatkowo technikę tę można w łatwy sposób obejść. Wystarczy na przykład, przetłumaczyć wygenerowany tekst na inny język z pomocą Google Translate, a następnie z powrotem na oryginalny, co skutecznie usunie ślady po znakowaniu. Innym sposobem może być zmodyfikowanie polecenia dla AI tak, aby dodawało ono specjalnie znaki czy frazy. Następnie możemy je ręcznie usunąć, co także popsuje „niewidzialny podpis”.
OpenAI zapytało o zdanie swoich klientów. Z przeprowadzonych ankiet wynika, że aż 69% użytkowników ChatGPT uważa, iż narzędzie tego typu spowoduje fałszywe oskarżenia. 30% stwierdziło nawet, że przeniesie się do konkurencji, jeśli firma wdroży narzędzie tego typu. Kolejnym powodem do wstrzymania „wykrywacza AI” wewnątrz OpenAI jest lękprzed faktem, że niektórzy użytkownicy byliby w stanie rozgryźć działanie narzędzie i stworzyć wtyczkę, która sprawiłaby, że znakowanie stanie się bezużyteczne.
Najnowsze Komentarze