След телеграфиране на нанасянето медийни изявиOpenAI има стартиран инструмент, който се опитва да направи разлика между текст, написан от хора и генериран от изкуствен интелект – като текста, произведен от собствения текст на компанията ChatGPT и GPT-3 модели. Класификаторът не е особено точен – неговият процент на успеваемост е около 26%, отбелязва OpenAI – но OpenAI твърди, че той, когато се използва в тандем с други методи, може да бъде полезен за предотвратяване на злоупотреби с AI текстови генератори.
„Класификаторът има за цел да помогне за смекчаване на неверните твърдения, че генерираният от AI текст е написан от човек. Въпреки това, той все още има редица ограничения – така че трябва да се използва като допълнение към други методи за определяне на източника на текст, вместо да бъде основен инструмент за вземане на решения“, каза говорител на OpenAI пред TechCrunch по имейл. „Правим достъп до този първоначален класификатор, за да получим обратна връзка дали инструменти като този са полезни и се надяваме да споделим подобрени методи в бъдеще.“
Тъй като пламът около генеративния AI – особено AI за генериране на текст – расте, критиците призоваха създателите на тези инструменти да предприемат стъпки за смекчаване на техните потенциално вредни ефекти. Някои от най-големите училищни квартали в САЩ имат забранен ChatGPT в техните мрежи и устройства, опасявайки се от въздействието върху обучението на учениците и точността на съдържанието, което инструментът произвежда. И сайтове включително Stack Overflow забрани потребителите от споделяне на съдържание, генерирано от ChatGPT, заявявайки, че изкуственият интелект улеснява потребителите да наводнят дискусионни теми със съмнителни отговори.
Класификаторът на OpenAI — уместно наречен OpenAI AI Text Classifier — е интригуващ от архитектурно отношение. Той, подобно на ChatGPT, е езиков модел на AI, обучен върху много, много примери за публично достъпен текст от мрежата. Но за разлика от ChatGPT, той е прецизно настроен, за да предвиди колко вероятно е част от текст да е генериран от AI – не само от ChatGPT, но и от всеки модел на AI, генериращ текст.
По-конкретно, OpenAI обучи OpenAI AI Text Classifier върху текст от 34 системи за генериране на текст от пет различни организации, включително самия OpenAI. Този текст беше съчетан с подобен (но не съвсем подобен) текст, написан от хора от Wikipedia, уебсайтове, извлечени от връзки, споделени в Reddit, и набор от „човешки демонстрации“, събрани за предишна система за генериране на текст OpenAI. (OpenAI признава в a подкрепящ документобаче, че може по невнимание да е класифицирал погрешно някакъв текст, написан от AI, като написан от човек „като се има предвид разпространението на генерирано от AI съдържание в интернет.“)
Текстовият класификатор на OpenAI няма да работи върху произволен текст, което е важно. Необходими са минимум 1000 знака или около 150 до 250 думи. Не открива плагиатство – особено жалко ограничение, като се има предвид, че е доказано, че AI за генериране на текст повръщам текста, по който е обучено. И OpenAI казва, че има по-голяма вероятност да обърка нещата в текст, написан от деца или на език, различен от английски, благодарение на своя набор от данни за английски напред.
Детекторът малко хеджира отговора си, когато оценява дали даден текст е генериран от AI. В зависимост от нивото на увереност, той ще маркира текста като „много малко вероятно“ генериран от AI (по-малко от 10% шанс), „малко вероятно“ генериран от AI (между 10% и 45% шанс), „неясно дали е ” Генерирано от AI (45% до 90% шанс), „евентуално“ генерирано от AI (90% до 98% шанс) или „вероятно“ генерирано от AI (над 98% шанс).
От любопитство пуснах малко текст през класификатора, за да видя как може да се справи. Въпреки че уверено, правилно прогнозира, че няколко параграфа от статия на TechCrunch за Meta’s Horizon Worlds и фрагмент от страница за поддръжка на OpenAI не са генерирани от AI, класификаторът имаше по-трудно време с текст с дължина на статия от ChatGPT, като в крайна сметка не успя да го класифицира напълно. Той обаче успешно забеляза изхода на ChatGPT от Gizmodo парче за – какво друго? — ChatGPT.
Според OpenAI, класификаторът неправилно етикетира текст, написан от хора, като написан от AI в 9% от случаите. Тази грешка не се появи при моето тестване, но я приписвам на малкия размер на извадката.

Кредити за изображения: OpenAI
На практическо ниво открих, че класификаторът не е особено полезен за оценка на по-кратки текстове. Наистина, 1000 знака е труден праг за достигане в областта на съобщенията, например имейли (поне тези, които получавам редовно). И ограниченията дават пауза – OpenAI подчертава, че класификаторът може да бъде избегнат чрез модифициране на някои думи или клаузи в генерирания текст.
Това не означава, че класификаторът е безполезен – далеч от това. Но със сигурност няма да спре отдадените измамници (или студенти, ако е така) в сегашното си състояние.
Въпросът е дали други инструменти? Появи се нещо като домашна промишленост, за да отговори на търсенето на текстови детектори, генерирани от AI. ChatZero, разработен от студент от Принстънския университет, използва критерии, включително „обърканост“ (сложността на текста) и „избухване“ (вариациите на изреченията), за да открие дали текстът може да е написан с AI. Детектор за плагиатство Турнитин разработва собствен детектор на текст, генериран от AI. Освен тях, търсенето в Google дава най-малко половин дузина други приложения, които твърдят, че могат да отделят генерираното от AI жито от генерираната от човека плява, за да измъчват метафората.
Вероятно ще се превърне в игра на котка и мишка. С подобряването на изкуствения интелект за генериране на текст, детекторите също ще се подобряват – безкрайно движение напред-назад, подобно на това между киберпрестъпниците и изследователите по сигурността. И както OpenAI пише, въпреки че класификаторите могат да помогнат при определени обстоятелства, те никога няма да бъдат надеждно единствено доказателство при решаването дали текстът е генериран от AI.
Това е всичко, за да се каже, че няма сребърен куршум за решаване на проблемите, генерирани от AI текст. Много вероятно никога няма да има.