【要注意】レポート・論文でAIを使うとバレる?バレない?
2022年11月30日にOpenAI社がChatGPTというテキスト生成AIを発表し、公開後わずか5日間でユーザー100万人を突破しました。
生成AIの発展は、社会にとってさまざまなメリットとデメリットを生み出し続けています。
その中でも注目されているのが、生成AIを使用したレポートや論文における盗用です。
ChatGPTなどの生成AIはインターネット上に公開されているコンテンツなどから得られる膨大な量のデータを学習し、それらをもとに回答を生成しています。
このような生成AIは簡単に文章を作成できる一方で、知らず知らずのうちに盗用や剽窃(ひょうせつ)に繋がるというリスクをはらんでいます。
この記事では、生成AIがもたらす盗用・剽窃のリスクについて説明していきます。
1. なぜ大学側がAIの使用を禁止するのか?
そもそも大学などの学術機関が論文やレポート・課題などでAIの使用を禁止するのは大きく分けて2つの理由があります。
1つ目は、論文やレポートなどの課題の意義は生徒が自身が学んだことをアウトプットするものであるはずですが、AIの使用によって課題に対する生徒の理解度が適切に評価できなくなってしまうからです。
AIが生成した論文やレポートをもとに学生を評価してしまうと、それは学生本人の評価ではなくAIのコンテンツの評価になってしまいます。
さらに、万が一AIで生成されたものだと気づかずに大学側が論文やレポートを評価してしまうと、AIを使わずに自力で課題をこなした生徒にたいして不公平になってしまいます。
このように本来であれば学生の理解度に対して下されるべき評価が、AIの成果物の評価へとすり替わってしまうことは本末転倒といえるでしょう。
そのため、学生の実力を真に評価したい大学はAIの使用を認めないケースがほとんどです。
2つ目の理由としては、AIを使うことが剽窃や盗用に繋がる可能性があるためです。
まずは「剽窃」(ひょうせつ)の定義をみてみましょう。
「‘剽窃(ひょうせつ)‘とは他人の著作から全部または部分的に文章、図表、語句、話の筋、思想などを盗み、自作の中に自分のものとして用いることです。」 引用元:剽窃防止の啓発
では、生成AIの利用はこの「剽窃」に該当するのでしょうか?
そもそも生成AIはインターネット上にあるさまざまな情報を常に学習しています。そのため、AIが他者のデータを無断で学習してしまう例が実際に起きています。
たとえば、日本経済新聞がウェブメディア「The HEADLINE」に対し、記事の中身が酷似していると指摘した事例がありました。
原因としては、「The HEADLINE」がAIに記事を書かせており、AIが日経の記事を学習していたことから酷似した記事を生成してしまったようです。
最終的に、「The HEADLINE」はこの記事が剽窃・盗用に当たると認め、公式に謝罪することとなりました。
このように、AIを利用した記事や論文の作成は、意図せず他人の作品を盗用してしまうケースもあるので注意が必要です。
2. AIをレポートで使うとどうバレるのか?
では、どのようにして生成AIを使用して作成したコンテンツの剽窃や盗用がバレるのでしょうか?
ChatGPTがリリースされてからまもなく2年が経とうとしていますが、その中でAI検知ツールというものが開発されてきました。中でも注目のAI検知ツールがCopyLeaks(コピー・リークス)です。
大学でmoodle(ムードル)という学習支援プラットフォームを利用したことがある方も多いと思います。
CopyLeaksはこのmoodleなどのプラットフォームにインストールすることができ、教授や講師は簡単に生徒の提出物の剽窃や盗用をチェックすることが出来ます。
(引用元:Detecting LLM-Generated Text in Computing Education: A Comparative Study for ChatGPT Cases)
この表を見ればわかるようにCopyLeaksは他人のデータからの盗用、ChatGPTのデータの盗用ともに高い精度で検知することが出来ます。
3. AIを使う上での注意点
注意点として、生成AIを学習補助のツールとして使う場合にもAI検知ツールによってAI生成コンテンツと判断されてしまう場合があります。
例えばGrammarly(グラマーリー)などのツールを使って文法やスタイルをチェックし、指示に従って修正するとAI生成物として検知されてしまう場合があります。
また、Undetectable AI(アンディテクタブルAI)というテキストを人間っぽくすることでAI検知ツールに検知されないようにするというツールもあります。
このツールを使うことでAI検知ツールの監視の目を掻い潜ることが可能になりますが、AI検知ツールもAI検知ツールを騙すためのツールも時間とともに進化していきます。
Undetectable AIを使って書いた論文が現時点でAI検知ツールに検知されなかったとしても、数ヶ月後には進化したAI検知ツールに検知されてしまうということは十分にあり得る話です。
これらのリスクを踏まえると、AIツールに頼らず真っ当な方法で論文やレポートを執筆するのがリスクのない安全な方法だといえるでしょう。
4. まとめ
いかがでしたでしょうか。
AIを使って大学のレポートを作成すると盗用・剽窃にあたることがあります。
それでもAIを使いたい場合は、AIの文章を流用することは避け、アイデアのブレインストーミングなどあくまで補助ツールとして活用し、それらをもとに最終的な成果物はご自身の手で仕上げるのが良いでしょう。
もしレポートにつまずいたりしたらAI相談.comのAIキャラクターにご相談ください!
参考文献
・Detecting LLM-Generated Text in Computing Education: A Comparative Study for ChatGPT Cases
・Third-Party Studies Continue to Confirm Copyleaks AI Detector as the Most Accurate
・剽窃防止の啓発
・生成AIを使って書いた記事、盗用で謝罪 専門家「技術以前の問題」
・GrammarlyはAIか?洞察と活用のヒント