Специалисты Тюбингенского университета и Северо-Западного университета (Германия) научились выявлять созданную с помощью искусственного интеллекта (ИИ) научную статью. Об этом сообщается в статье, опубликованной на сервере препринтов arXiv.
Авторы исследования нашли связь между употреблением ИИ и использованием определенных слов-маркеров, которые обычный ученый применяет редко. Они выяснили, что с появлением ИИ в науке частота использований некоторых слов и выражений заметно выросла. Специалисты сравнили этот феномен с пандемией коронавируса или вспышкой лихорадки Зика, так как обычно частота применения конкретных слов в статьях возрастает во время эпидемий или стихийных бедствий.
Специалисты изучили 14 миллионов статей, опубликованных в базе PubMed с 2010 по 2024 годы, и зафиксировали частоту употребления каждого слова. Затем они сравнили ожидаемую частоту этих слов с материалами 2023-2024 годов, когда генеративный ИИ начали широко применять в науке. В результате авторы исследования нашли некоторые контрольные слова, частота употреблений которых выросла за последние годы.
Так, слово «копаться» (delves) встречалось в новых статьях в 25 раз чаще, чем в работах до 2023 года. «Демонстрация» (showcasing) и «подчеркивание» (underscores) — в 10 раз, «потенциал» (potential) — на 4,1 процента, «выводы» (findings) — 2,7 процента, «решающий» (crucial) — 2,6 процента.
По словам ученых, при всей пользе новых технологий использование ИИ нужно контролировать. Так, чат-боты и модели ИИ могут генерировать ложные заявления, «которые звучат авторитетно и убедительно».
В апреле представители сервиса по обнаружению плагиата Turnitin заявили, что за 2023 год учащиеся различных образовательных учреждений подали свыше 22 миллионов научных работ, написанных ИИ. Также они отметили, что обнаружить написанный компьютером текст крайне сложно.