AI はパブリッシャーにとって存続の脅威となる可能性がある – だからこそマムズネットは反撃している |ジャスティン・ロバーツ

AI はパブリッシャーにとって存続の脅威となる可能性がある – だからこそマムズネットは反撃している |ジャスティン・ロバーツ


マムズネットの創設者として 25 年近く働いてきた私は、ビッグテクノロジーの仕組みに関しては、自分はまったくショックを受けないと思っていました。しかし先週、Googleが英国の著作権法の見直しを進めており、商業的利益を得るために無償で他の出版社のコンテンツを自由にマイニングできるようにする方向で進めているという記事を読んだとき、私の顎は床に突き当たった。

マムズネットでは、この慣行に対して鋭角で取り組んできており、最近、テクノロジー大手 OpenAI に対して英国初の訴訟を起こしました。今年の初めに、おそらく大規模言語モデル (LLM) をトレーニングするために、このウイルスがコンテンツをスクレイピングしていることに私たちは気づきました。このような許可のないスクレイピングは著作権法違反であり、明示的に利用規約に違反するため、私たちは OpenAI に相談し、ライセンス契約を提案しました。長い交渉の末(そして機密保持契約に署名した)、同社は「あまりオープンではない」データソースを求めているとして、興味がないと私たちに伝えた。

モデルトレーニングのためのオンラインコンテンツの解禁がなぜ問題になるのか疑問に思われるかもしれません – Google はインターネットの黎明期以来、Web サイト中を巡回し、検索目的でそのデータを取り込んできたのではないでしょうか?それは事実ですが、Google がそのデータ、つまり Google によってインデックス付けされることによって得られる検索トラフィックにアクセスできるようにすることには、明確な価値交換が存在します。対照的に、LLM は、予想されるあらゆる質問に対する答えを提供する ChatGPT などのモデルを構築しています。これは、人々が解決策を得るために他の場所に行く必要がなくなることを意味します。そして彼らは、置き換えようとしているまさにそのウェブサイトから違法にスクレイピングしたコンテンツを使用してそれらのモデルを構築しています。

AI企業に単純にコンテンツを盗むことを許すことは、自分たちが費やした仕事やリスクに対して何の見返りもないと考えているパブリッシャーにとって極めて不公平であるだけでなく、パブリッシャーにとっては存続の脅威でもある(そして最終的には逆効果)。 AI がすべてのトラフィックを取り締まったせいでパブリッシャーが衰退した場合、モデルにフィードするコンテンツを作成するのは誰が残るでしょうか?正直に言うと、テクノロジー大手がパブリッシャーに適切な補償をする余裕がないわけではありません。 OpenAIは現在、単独のベンチャーキャピタルラウンドとしては史上最大となる65億ドル相当の資金を調達しており、企業価値は1500億ドル相当と評価されている。実際、同社はその構造を変更し、営利企業になることを計画していると報じられたばかりである。

法的および財政的な力を持つ一部の大手出版社はAI大手とのライセンス契約を打ち切ることに成功しており、他のいくつかの出版社は権利を守るために訴訟を起こしている。しかし、小規模な出版社は後手に回ることになり、Googleなどが著作権法の言いなりになった場合、決して補償を受けられない可能性がある。

マムズネットでは、トラフィックの多くが検索エンジン経由ではなく直接流入するため、AI の猛攻撃に対抗する上で、他の企業よりも強い立場にあります。 AI チャットボットは、子育ての質問に対して「マムズネット スタイル」の答えを吐き出すことはできますが、駐車場争いについては決して面白くないし、人間関係についても残酷なまでに正直ではありませんし、約 1,000 人が見るような精神的なサポートを提供することも決してありません。私たちの推定によれば、1 年間に、他のマムズネット ユーザーによる虐待的なパートナーとの別れに貢献した女性がいます。しかし、これらの数兆ドル規模の巨大企業がコンテンツ制作者に対して乱暴な態度をとり、それを逃れることを許されれば、彼らはその多くを破壊し、彼らに依存するすべての仕事を破壊することになるだろう。

私は反AIではありません。それは人類の進歩を促進し、無数の方法で私たちの生活を改善する可能性を明らかに持っています。 Mumsnet ではこれを使用して MumsGPT を構築しました。MumsGPT は、美容トレンドからスーパーマーケット、政治家に至るまで、親が考えていることを明らかにして要約し、それを構築するために OpenAI の API (アプリケーション プログラミング インターフェイス) のライセンスを取得しました。さらに、これらの AI モデルがモデルをトレーニングするためにマムズネットの会話を取り込む必要がある十分な理由がいくつかあると考えています。マムズネット上の 60 億語以上の単語は、世界政治から義理の両親との関係に至るまで、あらゆるものに関する 24 年間にわたる女性たちの交流を記録したユニークな記録です。対照的に、ウェブ上のコンテンツのほとんどは男性によって男性のために書かれています。 AI モデルには女性蔑視が組み込まれており、私たちは彼らのジェンダーバイアスに対抗する手助けをしたいと考えています。

しかし、法律を改正するというグーグルの提案は、数十億ドル規模の企業が急速な「発展」の名の下に、公正価値交換の概念を自由に行き来できるようにするものだ。小規模なパブリッシャーサイトのユニークで優れた点はすべて失われ、シリコンバレーの一握りの巨大企業が世界のコンテンツとコマースをさらにコントロールできるようになるだろう。

このようになる必要はありません。誰もがその貢献に対して公平かつ持続的に報酬を得るには十分すぎるほどの資金が AI 企業に流れ込んでいます。しかし、私たち、つまり出版業界と政府は、目を覚ましてコーヒーの匂いを嗅ぐ必要がある。なぜなら、最近米国で行われたグーグルの独占禁止法裁判が示したように、大手ハイテク企業は自らの判断に任せれば、喜んで法律を無視して強硬手段に出るだろうからである。彼らの優位性を高めるために。

  • ジャスティン・ロバーツはマムズネットのCEOです

  • この記事で提起された問題について意見はありますか?メールセクションでの掲載を検討するために、最大 300 ワードの回答を電子メールで送信したい場合は、ここをクリックしてください。



Source link

By admin

Leave a Reply

Your email address will not be published. Required fields are marked *