財産と契約

今日の大規模な協力のほとんどは、有限責任事業組合、市民団体、宗教団体、業界団体、組合、そしてもちろん営利株式会社など、法人認可された団体に資産をプールして実施されている。それらの法的根拠は、共通の目的に向けた共通の事業における資産(不動産、知的資産、人的資産、および財務資産)の共有を規定した、契約上の取り決めにある。賃貸契約などの最も単純で一般的かつ小規模な契約でさえ、人々の間での資産共有が伴う。

リックライダーの「銀河間計算機ネットワーク」の中心的な目的は、ストレージ、計算能力、データなどのデジタル資産の共有を促進することだった。そして、ある意味では、そのような共有は今日のデジタル経済の核心であり、「クラウド」は共有計算とストレージの広大なプールを提供し、オンラインで共有される幅広い情報は、IT業界を席巻している生成基盤モデル(GFM)の基礎を形成する。しかし、この取り組みが成功したとはいえ、デジタル世界の限られた部分に限定されている。そしてせいぜい一握りの国に拠点を置く、少数の非常に儲かっている営利団体に管理されており、機会の大きな浪費と権力の集中の両方が生じている。インターネットが広範かつ水平的な資産共有を可能にするという夢は、依然として夢のままだ。

本章で説明した他の基本的なプロトコルと同様に、これらのギャップに対処するための重要な取り組みが最近見られる。ここでは、デジタル資産の共有の可能性を確認し、既存のデジタル資産の共有の取り組みを概観する。そして既存の取り組みの成果と限界を見極め、堅牢で⿻なオンライン資産共有エコシステムへの道筋を描く。

デジタル時代の資産

ケイト・クロフォードの『AIのアトラス』(未邦訳)で大きく強調されているように、デジタル世界は物理世界の上に構築されている。コンピュータ回路は、各種の社会的課題を引き起こしつつ採掘された希少金属から作られ、データセンターは発電所とよく似た働きをし、しばしば発電所と同じ場所に設置され、データはメアリー・グレイやシッダールタ・スリなどが記録した「ゴーストワーカー」のような人々によって作成される[1]。したがって、デジタル領域について本気で検討するなら、実際の財産関係も扱わねばならない。しかし、これらの物理基盤をもとにしつつ、デジタルネイティブの抽象概念として出現し、オンライン生活の重要な構成要素となる重要な資産がある。

ここでは、最も遍在する3つのカテゴリである、ストレージ、計算、データに焦点を当てる。とはいえ、電磁スペクトル、コード、名前やその他のアドレス(URLなど)、仮想世界内の「物理的な」空間、非代替性トークン(NFT)など、これらと交差し、多くの関連する課題を抱える例は他にも多い。

ストレージ、計算、データは、基本的にすべてのオンライン活動の中核にある。オンラインで発生するすべてが、ある瞬間から次の瞬間まで存続するのは、どこかに保存されているデータのおかげだ。その発生は、命令とアクションの結果を決定するために実行される計算で実現される。そして、操作の入力と出力はすべてデータだ。この意味で、ストレージは実体経済における土地のような役割を果たし、計算は燃料のような役割を果たし、データは人間の入力(労働とも呼ばれる)や人が作成して再利用する成果物(資本とも呼ばれる)のような役割を果たす。

土地、燃料、労働、資本は、しばしば均質な「商品」として扱われるが、社会理論家カール・ポランニーの有名な議論にあるように、これは単純化されたフィクションだ[2]。ストレージ、計算能力、そして特にデータは、場所、人々、文化に結びついていて異質性を持ち、そうした結び付きは、それらのパフォーマンス特性および、デジタル経済と社会でそれらを使用する社会的影響と意味の両方とに影響する。これらの課題は、「現実の生活」におけるフィクション的な商品にとっても重要だが、ある意味ではデジタル資産の場合のほうがさらに深刻だ。社会として、経済構造と社会構造をそうしたデジタル資産の性質に適応させる時間がはるかに少なかったのは間違いない。こうした課題は、共有、財産、契約の機能的なデジタルシステムの阻害要因の主要なものだ。

銀河間計算機ネットワーク

リックライダーの1963年「メモ:銀河間計算機ネットワークのメンバーおよび関係者向け」は、同時代およびその後の著作の多くを特徴づけるオンラインのソーシャル化や商取引の可能性には焦点を当てていない[3]。代わりに、おそらく当時の聴衆が科学系の人々だったため、分析ツール、メモリ、ストレージ、計算、研究結果を共有することで、科学者がコンピュータネットワークを通じて生産性を大幅に向上できるのではという話と、これが関連する軍事用途にもたらす可能性を強調している。これは、リックライダーが資金提供した最初のプロジェクトのひとつである「時分割」システムの自然な延長でもある。多くのユーザーが大型計算機へのアクセス共有を可能にすることで、大型メインフレームコンピュータの時代に、後の「パーソナルコンピューティング」体験に似たものを実現しようとしたのだ。この意味で、インターネットは、そもそもがここで扱う大規模な計算リソース共有のためのプラットフォームとして始まっている[4]

なぜこんな退屈そうな話題が、これほど(いつもは)壮大な考えを抱く人物を刺激したかを理解するには、彼が克服しようとしていた限界を振り返る必要がある。そして彼のビジョンを実現することで私たち自身がどんな限界を克服できるのかも考えよう。1950年代から1960年代にかけて、コンピューティングの主流は、主にIBMが販売していた大型の「メインフレーム」だった。これらは、企業全体、大学の学部といった大規模集団のニーズに応えるための高価なマシンだ。これらのマシンにアクセスするには、ユーザーは中央管理者にプログラムを持ち込む必要があり、希望する計算を実行する「高リスク」のチャンスが1回だけ与えられるのが常だった。バグが見つかった場合(ほぼいつもだ)、出直してくるしかなく、実践的なテストなしでこれらのエラー修正を綿密にやらねばならない。またプログラムの準備とマシンの管理が非常に困難だったため、ユーザーの時間の多くは、プログラム実行の順番待ちでアイドル状態になっていた。

これを今日のパソコンの世界と比べよう。先進国のほとんどの人々は、デスクトップ、ラップトップ、手首、ポケットの中にコンピュータを持ち、目が回るような計算を処理しつつ、ほぼ瞬時のフィードバックを得ている。もちろん、その多くは、1単位あたりの計算能力が18カ月ごとに2倍になるというムーアの法則によって実現されている。しかし、リックライダーと、マサチューセッツ工科大学などの大学で彼が資金提供した初期のプロジェクトのいくつかが気づいたのは、当時のコンピュータでも、効率的に使用し、航空機のインターフェースの設計で彼が研究した人間のフィードバックの必要性にもっと注意を払えば、ある程度はパソコンのような使い方もできるということだった。

当時は限られた計算能力がアイドル時間に浪費されており、ユーザーが望むフィードバックのためには各デスクにフル装備のマシンは必要なかった。各ユーザーは基本的なディスプレイと入力ステーション(「クライアント」)をネットワーク経由で中央マシン(「サーバー」)に接続し、その時間を共有すればよかった。このセットアップはその数年前にイリノイ大学アーバナ・シャンペーン校の[Platoプロジェクト]((http://friendlyorangeglow.com/)でコンピュータベースの教育システムとして初めて導入された[5]。これにより、ダグラス・エンゲルバートなどのARPANETメンバーは、メインフレーム時代にいながらパソコンの未来をシミュレートできたのだ。

計算資産を効果的に共有できれば、どんなすばらしい未来をシミュレートできるだろうか? デジタル資産の活用度合いを現在よりも厳密に計算しないと、それはなかなかわからない。しかし、休眠状態のデジタル資産をもっとうまく活用するだけで、ムーアの法則の有効期間を少なくとも5年は延命させられそうだ。データ共有の可能性はもっと豊かで、さらに変革をもたらすことができる。医療診断、環境資源の最適化、工業生産などは、組織や行政区の境界を越えてデータを共有するという現在の課題のために制約されてしまっている。それを解決し、GFMによって解き放たれるパワーを適用できれば、今日の最も解決困難な問題の多くに答えが見つかる。

共有の現状

半導体業界の調査によると、個人用デバイス(PC、スマートフォン、スマートウォッチ、ビデオゲームコンソールなど)に使用される半導体の数は、クラウドインフラやデータセンターに使用される半導体の数倍に上る[6]。系統立った調査はほとんどないが、個人的な経験から見て、これらのデバイスの大半は、ほとんど一日中遊んでいる。これは、非常に価値のあるグラフィックス処理ユニット(GPU)を不釣り合いに多く搭載しているビデオゲームコンソールで特に顕著だ。クラウドインフラでさえ無駄が蔓延している。ここから見て、かなり、いや相当部分の計算とストレージが常に休眠状態にある。データはさらに極端だ。こちらは定量化がさらに困難だが、データ科学者なら誰でも経験上、切実に必要なデータの圧倒的多数が組織または管轄区域のタコツボ内に存在し、共同インテリジェンスやGFMの構築を阻害していることはよく知っている。

資産共有は、国家安全保障や環境などといった価値にも大きく影響する。資源の無駄は、国家安全保障政策が最大化を目指してきた半導体の供給を減らすも同然で、他の無駄と同様に、単位出力あたりの環境資源の需要を増加させる。ただし、分散デバイスで使用されるエネルギー源と、このエネルギーを計算に変換する効率は、クラウドプロバイダよりも低いかもしれないという点には留意しよう。だからデジタル資産共有の改善と消費者の電力網のグリーン化を組み合わせることが重要となる。おそらく、デジタル資産共有が安全保障に及ぼす最も重要な影響は、これらの共有ネットワークの参加者間の相互依存性が高まることで、参加者間の地政学的すり合わせが緊密になるという点だろう。このため、特にプライバシーとコラボレーションの規制の整合が必要になってくる。

これらの数字がどれほど衝撃的か理解するには、物理的な資産と比較してみよう。物理的な資産は、輸送や物理的な再配置の難しさを考えると、共有し、十分な活用を確保することが困難なのは当然だろう。労働者の失業率や住宅の空室率がひと桁を超えたら、通常は政治的に大問題となる。だがこの程度の無駄はデジタルの世界ではどこにでもある。物理的な資産の無駄率(実効的な過少雇用および失業率)がデジタル資産の水準に近づくだけでも、世界的な危機と見なされる。

この静かな危機が数字上で見るほど衝撃に思えないのは、主にこれらの純粋にデジタルな資産が比較的新しいためだろう。社会は、その成員のニーズを満たすために、さまざまな社会組織システムの実験に数千年、いや数万年を費やしてきた[7]。現代の財産システム(賃貸システム、資本管理)、労働、および抽象的な価値表現を伴う慣行[8](証書、人々に発行された文書、サプライチェーン取引、お金)の起源は、1000年の文化的慣習の後に生じたある種の社会的心理的性質にまで遡れる。キリスト教ヨーロッパでのいとこ婚の禁止により、新しい制度を自由に形成し、財産の保有方法を再構成できる人々が出現し、以前には存在しなかった新しいタイプの民主的な機関が生まれた[9]。車を効率的にレンタルする方法や、こうした資産の共有を改善するためにデジタルツールを活用する方法(ライドシェアやハウスシェアのプラットフォームなど)を解明するには、何十年もかかった。デジタル資産、特に技術者以外の大勢の人々の手に渡ったデジタル資産は、ほんのここ数十年の産物でしかない。したがって、私たちの前に立ちはだかる重要な課題は、物理的資産に求められる水準の効率でデジタル資産を活用する上での、社会的および技術的障壁が何かを見極めることだ。

計算資産の共有を何が阻んでいるか考える方法のひとつは、比較的成功している分野を検討し、そうした分野とこれまでほとんど失敗している分野との違いを明らかにすることだ。右記の3つの重点分野、つまりストレージ、計算、データを検討しよう。

資産共有のオープン標準に最も近いフレームワークは、ストレージ分野で見られる。これは、Interplanetary File System(IPFS)を通じて実現されている。IPFSは、明らかにリックライダーのビジョンをお手本に、ジュアン・ベネットと彼のプロトコル・ラボ(PL)が開発した。PLは、本書の作成をサポートしたソフトウェア構築のパートナーだった。このオープンプロトコルにより、世界中のコンピュータが、ピアツーピアの、断片化、暗号化、分散化された方法で、合理的なコストで相互にストレージを提供できる。そして冗長性、堅牢性、データの機密性/整合性が確保される。このプロトコル上に構築された著名なサービスは、台湾のデジタル省などの各国政府も使用している。そうした国は、より中央集権的なサービスプロバイダに対して強い影響力を行使しかねない強力な敵に直面しているからだ。PLは、データとストレージ市場の永続性を確保するために、Filecoinシステムも作成し、商業取引を可能にし、ユーザーがネットワーク全体のデータをできるだけ多く保存するように促している。しかし、IPFSでさえ、世界中の多くの場所から迅速にアクセスできるようにファイルを保存する必要がある「リアルタイム」ストレージでは限定的な成功しかおさめていない。したがって、IPFSが生き残れたのは、「ディープ」ストレージ(現実世界でコモディティサービスとして提供される「パブリックストレージ」スペースに相当するもの)が比較的単純であるためなのだろう。

遅延を最適化するというもっと複雑な課題を扱っているのが、大規模な企業「クラウド」プロバイダ、たとえばMicrosoft AzureAmazon Web ServiceGoogle Cloud PlatformSalesforceなどだ。先進国で消費者におなじみのデジタルサービス(個人ファイルをデバイスをまたがる形で保存するリモートのストレージ、音声やビデオコンテンツのストリーミング、ドキュメント共有など)はこうしたプロバイダに依存している。また今日のほとんどのデジタルビジネスの中核でもあるビジネスデータの60%は独占クラウドに保存されており、中でもトップ2のクラウドプロバイダ(AmazonとMicrosoft)が市場の3分の2近くを占める[10]

しかし、少数の営利企業支配という欠点以外にも、これらのクラウドシステムは多くの点で、リックライダーのような先見の明のある人々のビジョンにはかなり劣る。

まず、この機会を追求するよう同社を説得したMicrosoftチームなどの「クラウド時代」の先駆者たちは、クラウドによる利益の多くは、テナントやアプリケーション間でリソース共有効率を上げ、完全な利用を保証することから生まれると考えていた[11]。しかし、実際には、クラウドによる利益のほとんどは、テナント間のまともなリソース共有から来るものではない。十分な電源を併設し、効率的に維持されているデータセンターの物理的なコスト削減から生まれている。この種の市場を効果的に促進しているクラウドプロバイダはほとんどなく、共有リソースをうまく機能させる方法を見つけた顧客もほとんどいないからだ。

さらに劇的なのは、クラウドは主に世界中の新しいデータセンターに構築されている。だが世界中のパソコン所有者のポケットや膝や机の上にある利用可能な計算能力とストレージのほとんどは、まったく活用されていないのだ。さらに、これらのコンピュータは、特注のクラウドデータセンターよりも、計算リソースの消費者に物理的に近いし、緊密にネットワーク化されていることが多い……それなのに、クラウドシステムは実に近視眼的に、それらを体系的に無駄にしてきた。つまり、クラウドは多くの成功を収めてはいるが、リックライダーが実現を支援した時分割処理の指向を実現するどころか、それに先立つ「メインフレーム」モデルよりも中央集中的な代物に退行した面すら多いのだ。

しかし、データ共有面のお粗末さを見れば、こうした限られた成功ですらずっとマシに見えてくる。今日の最大規模のデータ利用は、企業や機関の境界内にタコツボ化されているだけでなく、それらのタコツボ内ですら、各種のプライバシー方針によって極度に細分化されている。そうでなければ、データ作成者の認識どころか同意もないまま取り込まれた、オンライン公開データに基づくものとなっている。後者の代表的な例は、GFMが訓練に使用した未公開のデータセットだ。公衆衛生や病気の治療など、明らかに公共の利益となるケースですら、データ共有を認めようと何年も前から多くの形で主張されてきてはいるが、民間部門でもオープン標準ベースのコラボレーションでもほとんど進展がない。

この問題は広く認識されており、世界中でさまざまな動きが見られる。たとえばEUのGaia-Xデータ連携インフラとデータガバナンス法、インドの国家データ共有およびアクセシビリティ政策、シンガポールの信頼できるデータ共有フレームワーク、台湾の多元的イノベーション戦略などは、こうした課題を克服しようとする試みのほんの一例だ。

共有の障害

これらの失敗から、デジタル資産をもっとうまく共有する上での障害についてどのような教訓が得られるだろうか。最も成功していないのがデータ共有だという点、ストレージ共有で最も苦労しているのがデータ共有をめぐる問題だという点を見ると、データ共有にまつわる課題こそがデジタル資産共有の相当部分で問題の核心になっているのではと見るのが自然だろう。結局のところ、データ共有に関連する課題は、これらすべての領域で繰り返し発生しているのだから。IPFSの構造とそれが直面する課題の多くは、データのプライバシーを維持しながら、このプライバシーを維持しようとしている個人または組織から離れた場所にデータを保管する方法をめぐるものだ。クラウドプロバイダの中心的な利点は、顧客データのセキュリティとプライバシーについての評判となる。それを維持しつつ顧客自身はデバイス間でデータを共有し、大規模な計算を実行できることが評価されているのだ。

こうした課題を理解するためには、データと多くの現実世界の資産との基本的な違いを理解すべきだ。右で説明したように、資産の貸し出しとプールは経済のいたるところで行われている。そこで重要なのは、資産に対する権利を分解できるかどうか、という点となる。法律学者は、通常、財産の3つの属性を「usus」(使用する権利)、「abusus」(変更または処分する権利)、「fructus」(それが生み出す価値に対する権利)と定義する。たとえば、標準的な賃貸契約では、ususは借り手に譲渡され、abususとfructusは家主に留保される。企業は、多くの資産のususを従業員に付与し、abususは上級管理職にのみ付与し、多くの場合はそこに抑制と均衡の仕組みを必ずつける。そしてfructusは株主のために留保される。

この重要な分離をデータで実現しようとすると、話が違ってくるし困難さも増す。データのususへのアクセスを許可する最も簡単な方法では、アクセスを許可された人がデータを悪用したり他の人に転送したりすること(abusus)と、データから他の人が金銭的利益を得て(fructus)、下手をするとデータを共有した人が犠牲になる可能性も許可されてしまう。GFMに組み込まれたデータのオンライン公開を選択した人の多くは、他の人が使用できるように情報を共有しているつもりだったが、共有がもたらす影響を完全には理解していなかった。もちろん、規範、法律、暗号化はすべて、この状況の改善に貢献できる。これらについては後述する。だが現状では、これらはすべて企業ガバナンスや住宅賃貸などより未発達であり、それがデータ共有を普及しづらくしている。

さらにやっかいなのは、このような一連の標準の決定は、「4–2団体と⿻公衆」で強調した理由により、データのもうひとつの重要な特性という壁にぶちあたるということだ。その特性とは、データをめぐる利害は、ほとんどの場合にはある個人だけの権利として捉えてもほとんど役に立たないという問題だ。データは本質的に集団的、社会的、交差的であるため、この問題に対する最も単純な「お手軽な解決策」の多くは(お手軽というのは、プライバシー規制と暗号化の観点からの話)あまりにも不適合で、進歩を促進するよりむしろ妨げてしまう。

さらに、これらの課題に対する明確な解決策があったとしても、それを直接実装するのは容易なことではない。契約というのは、最も単純に言えば文書化され相互に合意された当事者間の約束だ。契約の自由は、これらの強制を要求するものでしかない。しかし、現実はもっと複雑だ。契約書で発生する可能性のある紛争のすべてについて、解決方法を指定しておくことは不可能だし、可能だったにしても、そんな詳細な文書を読んで処理できる人は誰もいない[12]

契約書は必然的に多くの点で曖昧であり、重要ではあるが正確に特定するのが難しい多くの問題(「労働者は本当に業務に専念すべきである」や「雇用主は公平であるべきである」など)には意図的に触れない。したがって、ほとんどの契約上の取り決めは、主に慣習的な期待、法的先例、対応する法令、相互に期待される規範などによって規定される。多くの場合、このように発達してきた原則に反する契約条項は無効とされる。これらの規範と法的構造は、賃貸や雇用などの標準的な関係を規定するために数十年、さらには数世紀にわたって共進化しており、正式な裁判所ベースの契約条項と法執行が果たす役割を最小限に抑えている。つまり自己執行型のデジタル契約「スマートコントラクト」でそのような規範をスムーズに実装できても、データコラボレーションの仕組み、さまざまな関係者に何を期待できるか、さまざまな法的および技術的な執行メカニズムがいつ発動すべきか、発動されるかについての安定した社会的理解を構築するプロセスは不可欠なのだ。

データなどデジタル資産の共有インフラを構築する取り組みでは、こうした課題が山積している。基本的な問題は、情報にはほぼ無限の用途があり、当事者が情報をどのように使用するかを正確に定義しようとする「契約主義」的なアプローチは、手に負えないほど複雑になるということだ。そのような契約の「不完備性」の領域は圧倒的な広さを持つ。なぜなら、遺伝情報や地理位置情報などの情報について、将来あり得るすべての用途を、想像することなど不可能であり、ましてそれをカタログ化して交渉するなどなおさら不可能だからだ。つまり、データ共有の最も有望な利点(それを実現するには、世界中の遠く離れた当事者への情報伝達など、新しい技術的アフォーダンスの利用が必要)は、同時に最も危険で手に負えないものでもあるということになる。したがって、潜在的な市場は身動きがとれない。従来の契約でこれらの問題に対処できなければ、情報共有の理想的な範囲は、私たちの所属団体の範囲と一致することになる。つまり、団体的なつながりのマップ改善と、本書の他の部分で議論したように、信頼されたコミュニティからのものを含む情報漏洩を防げるような保証が必要なのだ。

もちろん、デジタル資産共有のハードルは、他にいくらでもある。遅延の最適化、セキュリティ対策のマッピング、計算単位の適切な標準化といった技術的な障害も重要だ。しかし、共有中のデータを保護する明確で実効性のある標準(法的および技術的)の欠如によって生じる課題は、スケーラブルなデジタル協力のほぼすべての側面に波及する。もちろんそのような標準に到達するためには社会的実験と進化が必須で、演繹的な分析だけではすまない。だが右記の中心的な緊張に対処できそうな、いくつかのコンポーネントと取り組みに光を当てることはできる。したがって、デジタル資産の共有に対する現在のハードルを乗り越えるには、そうした演繹的な分析も社会的探索のために重要になるはずだ。

⿻財産

最初に取り組むべき最も単純な問題は、計算資産の共有に関するパフォーマンスとセキュリティの標準だ。ユーザーがデータを保存したり、計算を他の人に委託したりする場合、そのデータが第三者に侵害されないこと、計算が期待どおりに実行されること、さまざまな場所にいる人々によって、ユーザー自身または顧客がデータを取得できて、その際の遅延も予想どおりの分散となることなどを保証する必要がある。現在のクラウドプロバイダの価値提案の中心はこうした保証だ。計算サービスを提供する幅広い個人や組織が簡単に満たせる標準があれば、強力な企業が市場を独占する必要はなくなる。類似の例は「https」の導入だ。これにより、さまざまなウェブホスティングサービスがセキュリティ基準を満たせるようになり、ウェブコンテンツの消費者は、悪意ある監視の心配なしに、そのウェブサイトからデータにアクセスできる。もちろんそうした標準を、各種の性能やセキュリティ機能など、検索やリクエストとマッチングについての標準形式と組み合わせることも可能だ。

しかし右で述べたように、最も厄介な問題はパフォーマンスや第三者からの攻撃ではなく、データコラボレーションの核心にある問題に関係するものだ。つまり、当事者Aが共同作業者Bとデータなどのデジタル資産を共有する場合、BはAのデータについて何を知るべきなのだろうか。当然、これには唯一の正解はないが、参加者がコラボレーションから利益を得られるような方法でパラメータと期待値を設定できるかどうかが、データコラボレーションを実現可能かつ持続可能にするための鍵となる。幸いなことに、このような関係に技術的な足場を提供できそうなツールがいくつか登場している。

これは「4–2団体と⿻公衆」で述べたが、改めてその関連性を指摘しよう。セキュアマルチパーティコンピューティング(SMPC)と準同型暗号化により、複数のパーティが一緒に計算を実行し、各パーティが入力を他のパーティに公開することなく、集合的な出力を作成できるのだ。最も単純な見本としては、平均給与の計算や選挙での投票の集計などがあるが、GFMの訓練や微調整など、はるかに高度な可能性もますます実現可能になっている。これらの野心的なアプリケーションのおかげもあって、「連合学習」と「データ連合」という分野が生まれた。これにより、これらの野心的なアプリケーションのどれかに必要な計算を、分散ネットワーク上にある個人または組織のコンピュータでローカルに実行し、モデルへの入力を安全にやりとりできる。基礎となる訓練データは、通信の各パーティのマシンやサーバーから外に出ることはない。国連などの国際機関は、OpenMinedなどこうしたツールのオープンソースプロバイダと連携して、データコラボレーションを実験的に公開するプラットフォームの構築を増やしている[13]。この分散アプローチの別の手法として、ある計算の実行は検証できるものの、その中間出力に誰もアクセスできない特殊な「機密コンピュータ」を使用する方法もある。ただしこれらのマシンは高価であり、限られた企業にしか作れないので、分散コラボレーションよりも、信頼できる中央組織による制御に適している。

これらのアプローチは、不要な情報が伝達されることを防ぎつつ共同作業を実現するのに役立つが、共同作業で作成された出力(統計やモデルなど)に含まれる情報に対処するには、他のツールが必要となる。モデルは、入力情報を漏らす可能性がある(たとえば、モデルが特定の人物の病歴の詳細を再現してしまうなど)。あるいは逆に、情報源を不明瞭にしてしまう可能性もある(たとえば、ライセンスに違反して、入力された創作テキストを帰属表示なしで再現してしまうなど)。これはどちらも、データ共同作業の大きな障害となる。共同作業者は通常、データの使用についての主体性を持ちたがるからだ。

これらの課題に対処するツールは、暗号よりも統計的なものだ。差分プライバシーは、出力データの集まりから入力データを推測できる程度を制限し、「プライバシーバジェット」を使用して、開示された結果を集めても入力が明らかにならないようにする。透かし/ウォーターマークは、消去、無視、場合によっては検出さえ困難な方法で、コンテンツにその起源を示す「署名」を入れられる。「影響関数」は、あるデータ・コレクションがモデルの出力を生成する際に果たす役割を追跡し、「ブラックボックス」モデルの出力についても、少なくとも部分的な帰属の同定を可能にする[14]

これらの技術はすべて、GFM開発の速度、規模、パワーにやや遅れをとっている。たとえば、差分プライバシーは、事実の文字どおりの統計的回復可能性を主に重視するが、GFMは探偵のように「推論」を実行できることが多く、たとえば、後に通った学校、友人関係などに関する緩く関連した事実の集合から、誰かの最初の学校を推測してしまえる。これらのモデルの能力を活用してこうした技術的課題に取り組み、データ保護と帰属の技術的標準定義を導き出すことこそが、特にモデルがさらに進歩するにつれて、データコラボレーションを持続可能にするための核心的な問題となる。

しかし、データコラボレーションの課題の多くは、純粋に技術的なものというよりも、組織的かつ社会的なものだ。前述したように、ほとんどすべてのデータは関係性に基づくため、データに対する関心が個人だけに対するものであることはめったにない。この最も基本的な点にとどまらず、個人レベルでデータの権利と制御を組織化することが非現実的な理由はいろいろある。たとえば、次のとおり。

・社会的漏洩:データが直接の社会的交流から生じていない場合ですら、ほとんどの場合、そうしたデータには社会的影響がある。たとえば、親族の共通の遺伝子構造により、人口の1%程度の統計サンプルがあれば、遺伝子プロファイルから個人を特定できるため、遺伝子プライバシーの保護はきわめて社会的に重要な取り組みとなる。

・管理上の課題:各種データ共有による金銭的および個人的な影響を個人だけで理解することはほぼ不可能となる。自動化ツールは有益だが、それをつくるのは社会集団なので、そうした社会集団は個人データの信託管理者になる必要がある。

・団体交渉:大規模なデータセットの主な消費者は、世界最大かつ最も強力な企業だ。世界中の何十億ものデータ作成者は、集合的に行動できない限り、彼らとの契約交渉で合理的な条件は達成できないし、そうした企業が誠意をもって交渉するはずもない。

「データ主体[15]」の権利と利益を集団的に代表する役割を担える組織には、データ信託[16]、協働組織[17]、協同組合[18]、または著者グレン・ワイルが提案した「個人データの仲介者」(MID[19])など、さまざまな名前がある。既存の組織の路線をごく自然に踏襲できるものもある。たとえば、コンテンツを代表するクリエイティブワーカーの組合や、ボランティア編集者と寄稿者の集団的利益を代表するWikipediaなどだ。コード生成モデルの学習に使用されているオープンソースコードの貢献者、二次創作の著者、Redditページの執筆者など、新しい形式の組織が必要になる場合もある。これらの組織では、独自の形式の集団的代表をまとめねばならない。

これらの正式な技術、組織、標準以外にも、データコラボレーションの問題を広く理解し、貢献者が公正な合意を結び、協力者に責任を負わせられるように、広範で分散した概念、期待、規範を開発する必要がある。データコラボレーションをめぐる技術変化と適応のペースを考えると、これらの規範はきわめて広範に普及し、適度に安定し、しかも動的で適応的である必要がある。これを達成するには、次章で説明するように、技術の変化に遅れをとらない教育と文化的関与の実践が必要だ。

いったん十分に発展し普及すれば、データコラボレーションツール、組織、およびその慣行はかなり広まって、常識や法律慣行に「財産権」と同じくらい深く組み込まれるだろう。しかし前述のように、それはほぼ間違いなく、土地の私有や株式会社の組織を規定する標準的なパターンとは違う形となる。すでに述べたとおり、そこには多くの技術的および暗号要素、集団ガバナンスと信託義務を重視したさまざまな種類の社会組織、およびMIDのメンバーによる一方的な開示を防止する規範または法律(労働組合に対する一方的なスト破りの禁止と似たもの)を含めるべきだ。これらは、デジタル世界における未来の「財産」を形成するだろう。そしてそれはデータというものの特性にはるかに適合したものになるはずなのだ。

⿻実物財産

⿻財産の実現は困難だが、他の領域でも多くの所有権制度が争われ、流動的であることを忘れてはいけない。ある意味で、データは深い社会的特性を持つので、実物世界の財産とは一線を画しており、そのため所有権や契約制度を設計する既存の方法は、データには簡単に適用できない。しかし別の見方をすると、データの深い社会的特性はまさになじみがないからこそ、従来の所有権制度が今日の実物資産の管理にすら適していない点がいろいろあることを、浮き彫りにしてくれるのだ。

ここでは純粋なデジタル財産の世界から一歩離れて、デジタルにも関係していて財産権レジームが急速に変化している2つの例に目を向けよう。電波周波数帯とインターネットの名前空間だ。

伝統的に、ある地理的範囲内で、ある周波数で放送を行う権利は、(米国を含む多くの国で)事業者に割り当てられたりオークションで売却されたりする。そのライセンスは低コストで更新される。これにより、事実上私有財産のような権利が創出された。そのもとになっているのは、同じ場所にいる多くの事業者が同じ帯域で運用できてしまうと、その電波が干渉し合ってしまうことと、帯域に対する所有権を持つライセンス所有者が帯域を管理するという考え方だ。しかし、この前提はかなり妥当性が怪しくなりつつある。多くのデジタルアプリケーション(Wi-Fiなど)は周波数帯を共有できるし、そうした周波数帯の使われ方が急速に変わって(無線放送から5Gワイヤレスへの移行など)干渉パターンが激変し、周波数帯の再編が必要になっているのに、従来のライセンス保有者がしばしばそれを邪魔しているのだ[20]。このため財産権システムに大きな変化が生じ、米国連邦通信委員会などのライセンス供与機関は、電波オークションを通じて既得権益者たちを整理できるようになった。また、この分野のリーダーからは、「5–7社会市場」で説明するように、レンタルと所有権の要素を組み合わせたさらに過激な設計や、特定の共有用途のために周波数帯を無免許のままにする提案も出ている[21]

インターネットの名前空間における財産権の進化はさらに過激だ。従来、ICANNは、財産権に似た周波数帯のライセンス制度と同様に、比較的低コストでドメイン名を登録し、わずかな料金でそれを更新できるようにしていた。この仕組み自体も進化はしてきたが、もっと根本的な変化として、今日ではほとんどの人が直接のナビゲーションではなく、検索エンジンを通じてウェブサイトにアクセスするようになっている。これらのエンジンは通常、さまざまな(ほとんどは公表されていない)ユーザーとの関連性のシグナルに基づいて、各種の名前に関連付けられたサイトをリストアップし、さらにそこにリアルタイムでオークションされる有料広告もいくつか含める[22]。関連性アルゴリズムの中身は不明だが、考え方としてとっつきやすいのは、Googleの創設者であるセルゲイ・ブリンとラリー・ペイジが最初に考えた「ペイジランク」アルゴリズムだ。これは、ウェブページの「ネットワーク中心性」に基づいてページをランク付けする。これは「5–6⿻投票」で説明するネットワークベースの投票システムとも関連する考え方だ[23]。したがって、一見すると、今日のインターネットの名前空間の事実上の財産権体制は、(ドメイン所有者ではなく)ブラウザの利益を指向する集合的な方向性と、ドメイン所有者のためのリアルタイムオークションの組み合わせだと言える。どちらも伝統的な財産制度とはかけ離れている。

だからといってもちろん、これらが理想的だということではない。どちらも間違いなく、社会的に正当性がない。これらのシステムは、一般の目にほぼ触れないところで、テクノクラート的なエンジニアや経済学者のチームによって、一般の理解なしに設計されてきた。そんな仕組みの存在すら認識している人はほとんどおらず、それが適切だと信じている人はなお少ない[24]。その一方で、創造的な方法で実際の課題に対応する手法であるのは間違いない。そしてその手法で対処できる問題は、電波周波数帯やインターネットの名前空間といった狭い領域をはるかに超える。既得権益者の居座り問題と周波数帯共有への対処は、国民が広く要求し、国家安全保障の問題ですら中心と見なされているデジタル開発を可能にする上で、中核的な役割を果たす。同様の既得権益者の居座り問題は、都市空間の再開発や共通インフラの構築にも広がっており、現在私有財産として保有されている多くの土地は、公園などの共有スペースにできる(その逆もある)。

名前空間を私有財産として扱うことは、争われている名前(例:「ABC.com」)を所有している人がドメイン・スクワッターだったり、限られたユーザー層にサービスを提供する旧所有者だったり、ブランドを悪用する詐欺師だったりする可能性を考えると、あまり意味がない。所有権によってもたらされる安定性と、所有者の支払い意欲に基づく重要性のシグナルは、明らかにある程度は重要だ。だが検索エンジンで使用されるシステムは、安定性という公共の利益と名前空間に支払いをする人からのリアルタイムの要求を明示的に考慮しており、単純な私有財産システムよりも、安定性と支払い意欲のバランスをうまくとっているとさえ言える。繰り返すが、これらの問題は、商標などの知的財産から古代遺物や都市の歴史的場所の所有権まで、「実物世界」の領域でも頻繁に発生する。デジタル領域で進化し、進化し続けている実物財産の革新的な代替手段が、はるかに優れた公共の関与、教育、擁護と組み合わされば、さらに広い意味での実物財産システムを⿻的な方向で見直せるはずだ。このテーマについては、以下の「5–7社会市場」の部分でさらに詳しく検討しよう。


  1. Kate Crawford, Atlas of AI (New Haven, CT: Yale University Press, 2022). Mary Gray, and Siddhath Suri. Ghost Work: How to Stop Silicon Valley from Building a New Global Underclass. (Boston: Houghton Miffilin Harcourt, 2019) .〔『ゴースト・ワーク グローバルな新下層階級をシリコンバレーが生み出すのをどう食い止めるか』メアリー・L・グレイ, シッダールタ・スリ著, 柴田裕之訳, 成田悠輔 監修・解説, 晶文社, 2023〕 ↩︎

  2. Polanyi, op. cit. ↩︎

  3. Licklider, “Memorandum for Members and Affiliates of the Intergalactic Computer Network”, op. cit. ↩︎

  4. Waldrop, The Dream Machine, op. cit. ↩︎

  5. Brian Dear, The Friendly Orange Glow: The Untold Story of the PLATO System and the Dawn of Cyberculture (New York: Pantheon, 2017) ↩︎

  6. Gartner, “Gartner Forecasts Worldwide Semiconductor Revenue to Grow 17% in 2024” (2023) at https://www.gartner.com/en/newsroom/press-releases/2023-12-04-gartner-forecasts-worldwide-semiconductor-revenue-to-grow-17-percent-in-2024. ↩︎

  7. David Graeber and David Wengrow, The Dawn of Everything: A New History of Humanity, (New York: Farrar, Straus And Giroux, 2021). 〔『万物の黎明 人類史を根本からくつがえす』デヴィッド・グレーバー, デヴィッド・ウェングロウ著, 酒井隆史訳, 光文社, 2023〕.同書で著者らは過去10万年にわたり人類が自らを組織化してきた,膨大な政治的創造性と柔軟性を検討している. ↩︎

  8. Hernando de Soto, The Mystery of Capital: Why Capitalism Triumphs in the West and Fails Everywhere Else, (New York: Basic Books, 2000). 同書では,正式な登記や文書記録による抽象的な表象を通じた財産管理は,資産が金融システムの中で借金に使えるようにして,それが富を生み出し経済成長を促進するのだという点を強調している. ↩︎

  9. Henrich, “Part III: New Institutions, New Psychologies,” in op. cit. 参照. ↩︎

  10. Josh Howarth, “34 Amazing Cloud Computing Stats” Exploding Topics, February 19 2024 at https://explodingtopics.com/blog/cloud-computing-stats. Felix Richter, “Amazon Maintains Cloud Lead as Microsoft Edges Closer” Statista February 5, 2024 at https://www.statista.com/chart/18819/worldwide-market-share-of-leading-cloud-infrastructure-service-providers/. ↩︎

  11. Rolf Harms, and Michael Yamartino, “The Economics of the Cloud,” 2010, https://news.microsoft.com/download/archived/presskits/cloud/docs/The-Economics-of-the-Cloud.pdf. ↩︎

  12. Sanford J. Grossman and Oliver D. hart, “The Costs and Benefits of Ownership: A Theory of Vertical and Lateral Integration”, Journal of Political Economy 94, no. 4: 691-719. ↩︎

  13. “The UN is Testing Technology that Processes Data Confidentially” The Economist January 29, 2022. ↩︎

  14. Pan Wei Koh and Percy Liang, “Understanding Black-Box Predictions via Influence Functions”, Proceedings of the 34th International Conference on Machine Learning, 70 (2017): 1885-1894 ↩︎

  15. Jaron Lanier, Who Owns the Future?, (New York: Simon and Schuster, 2014). ↩︎

  16. Sylvie Delacroix, and Jess Montgomery, “Data Trusts and the EU Data Strategy,” Data Trusts Initiative, June 2020. https://datatrusts.uk/blogs/data-trusts-and-the-eu-data-strategy. ↩︎

  17. Data Collaboration Alliance を参照. https://www.datacollaboration.org/ ↩︎

  18. Thomas Hardjono and Alex Pentland, “Data cooperatives: Towards a Foundation for Decentralized Personal Data Management,” arXiv (New York: Cornell University, 2019), https://arxiv.org/pdf/1905.08819.pdf. ↩︎

  19. Lanier and Weyl, op. cit. ↩︎

  20. Paul R. Milgrom, Jonathan Levin and Assaf Eilat, “The Case for Unlicensed Spectrum” at https://papers.ssrn.com/sol3/papers.cfm?abstract\_id=1948257 and Paul Milgrom, “Auction Research Evolving: Theorems and Market Designs”, American Economic Review 111, no. 5 (2021): 1383-1405. ↩︎

  21. E. Glen Weyl and Anthony Lee Zhang, “Depreciating Licenses”, American Economic Journal: Economic Policy 14, no. 3 (2022): 422-448. Paul R. Milgrom, E. Glen Weyl and Anthony Lee Zhang, “Redesigning Spectrum Licenses to Encourage Innovation and Investment”, Regulation 40, no. 3 (2017): 22-26. ↩︎

  22. Benjamin Edelman, Michael Ostrovsky and Michael Schwarz, “Internet Advertising and the Generalized Second-Price Auction: Selling Billions of Dollars Worth of Keywords”, American Economic Review 97, no. 1: 242-259 ↩︎

  23. Sergey Brin and Lawrence Page, “The Anatomy of a Large-Scale Hypertextual Web Search Engine”, Computer Systems and ISDN Systems 30, no. 1-7: 107-117. ↩︎

  24. 実は本書の著者たちはまさにこうした理由のため,これらの設計について強硬な反対を続けてきた. Zoë Hitzig, “The Normative Gap: Mechanism Design and Ideal Theories of Justice”, Economics and Philosophy 36, no. 3: 407-434. Glen Weyl, “How Market Design Economists Helped Engineer a Mass Privatization of Public Resources”, Pro-Market May 28, 2020 at https://www.promarket.org/2020/05/28/how-market-design-economists-engineered-economists-helped-design-a-mass-privatization-of-public-resources/. ↩︎