Fei Fei Li著「The Worlds I See: Curiosity, Exploration, and Discovery at the Dawn of AI」

The Worlds I See

Fei Fei Li著「The Worlds I See: Curiosity, Exploration, and Discovery at the Dawn of AI

機械学習に使われる画期的な大規模画像データセットImageNetを作成したことで知られる中国出身の人工知能(AI)研究者による自叙伝。

著者は中国の北京で生まれ、時間を忘れて自然を観察してしまう子どもみたいな父親と、東西の古典を読むインテリで働き者の母親に成都で育てられる。両親は文化大革命の時代に高等教育を受ける機会を奪われ望むような生き方ができないでいたが、天安門事件をきっかけにアメリカに家族で移住することを決意。先にビザを取得した父親だけ出国し、その三年後、著者が十五歳のときに一家でニュージャージー州に移住する。

アメリカに移り住んだはいいけれど、移民一家の生活は苦しかった。狭い家に三人で住み、言葉も満足に話せず、移民コミュニティのなかでもらった仕事で最低賃金にも満たない額で長時間労働をする毎日が続くなか、著者を見出してくれたのは高校の数学教師。母の勧めで欧米のものを含む古典文学を中国語の翻訳で多数読んでいた著者に驚いた数学教師は理系に興味を示した彼女の生涯のメンターとなった。

高校卒業が近づくと、著者は貧しい自分の家庭にはとうてい私立大学の授業料は払えないと知りつつも、一度訪れて美しいキャンパスに感動した地元の有名大学・プリンストン大学に記念受験のつもりで願書を送る。結果、めでたく合格しただけでなく、十分な奨学金を与えられて思いがけず進学。中国にいたときから興味を持ち、アメリカに来てから英語の専門用語がわからなくて一時諦めかけた物理学を専攻する。その後カリフォルニア大学バークレー校のプログラムに参加するなどのきっかけを経てカリフォルニア工科大学に進学し、人間の視覚をコンピュータで再現する研究にのめり込む。

著者を有名にしたImageNetの作成は、最初はどう考えても無謀な挑戦だった。機械学習に使用するための大規模な画像データセットはただ一千万を超える画像を集めるだけでも当時としては大変なのに、そのすべてについて何が写っているのか二万のカテゴリに手動で分類するという試みは、ほかの研究者に相談しても「それは無理でしょ」と協力を断られる始末。予算ギリギリまで使って学生をアルバイトで雇ってデータ入力させても十九年かかるという試算もあり、早い時期にたくさんの論文を発表しないとテニュアが取れないという制約のあるキャリアの若い研究者たちが敬遠するのも当然。しかしアマゾンのメカニカル・タークが登場してマイクロワークの形で画像の分類を安価に大勢の部外者に外注することができるようになったおかげで数年で完成する。ImageNetが完成し、また著者らがそれを使った画像認識技術のコンテストを毎年開催したことで機械学習の分野は飛躍的に発展し、とくにかつてはデータと処理能力不足から実用に至らなかったニューラルネットワークを使った深層学習が一気に主流に躍り出た。

いっぽう著者の家族は父親が失業したり母親が病に倒れたりした結果、著者が学生のころ自営業としてアジア系移民に多いクリーニング屋をはじめる。著者も週末には家に戻り忙しくなる店を手伝い、また著者がカリフォルニアで仕事をはじめて以降も客の注文や苦情がわからないことなどがあると研究の最中であっても母から電話がかかってきて翻訳をさせられた。病気に苦しむ母親に重労働をさせていることに良心を痛め、家族を支えるために研究をやめてすぐに高収入が得られるウォールストリートでの仕事に転職しようかと悩む著者と、「あなたの夢はあなただけの夢ではない、わたしたち全員の夢なのだ」と訴える両親、という構図は移民家庭ならでは。またこの頃までにはかつての高校教師とは家族ぐるみの付き合いになり、両親がクリーニング店を始めるときには開業資金を一部貸してくれるなどしていて、移民の女の子が人工知能の分野で第一人者の一人となる背後には家族だけでなくたくさんの人の支えがあったことがわかる。

母親の闘病に付き合うなか、彼女から「あなたの研究している人工知能というのはどういう役に立つのか」と問われた著者は、病院内での単純なミスや衛生管理の不備で亡くなる人が少なくないことを知り、移籍した先のスタンフォード大学の医学研究者とともに人工知能を使ってそうしたミスを無くすための研究に取りかかる。その一環として最初はセンサーを使って医療従事者が患者と患者のあいだにちゃんと手洗いをしていることを確認するシステムを考えたが、看護師たちからの猛反発を浴び、人工知能を現実の社会的環境で採用することはプライバシーや労働搾取の問題を引き起こすことになることに気づく。これは今でこそ当たり前な認識だけれど、ほんの少し前までは犬と猫の画像の区別すらつかなかった人工知能の急激な発達に人権やプライバシーの意識や法制度は追いついていなかった。

同じように、グーグルの画像認識技術が黒人の写真を「ゴリラ」と判定したり、アマゾンの人材採用アルゴリズムが女性求職者を差別したこと、ImageNetに含まれていた人物やその職種が人種や性別で偏っていたこと、犯罪者の刑期や保釈の有無を提言するアルゴリズムが過去のデータに含まれている差別を反映すること、白人男性のサンプルを中心に訓練された顔認識システムが非白人の誤認逮捕に繋がったことなど、人工知能を実社会に採用することの問題が次々とメディアで騒がれるようになった。ImageNetを完成させるために不可欠だったアマゾンのメカニカル・タークのようなマイクロワーク・プラットフォーム自体、Phil Jones著「Work Without the Worker: Labour in the Age of Platform Capitalism」にも書かれているように労働条件の悪化をもたらしていることが指摘されている。著者自身、大学から与えられたサバティカル(長期休暇)を利用してグーグルで仕事をした際、グーグルが国防省とのあいだで結んだ人工知能を軍事利用する契約(プロジェクト・メイヴン)をめぐって社内での大論争に遭遇し、契約解除に賛成した。

これらの経験から著者は現在、「人間を中心に据えた人工知能のあり方」を掲げ、人工知能研究に携わる人員の多様化、「説明可能な人工知能」など技術の透明化、そして技術だけでなく倫理や社会科学の専門家も参加する学際的なアプローチによる人工知能の実用化を進めている。著者はあくまで人工知能の将来に楽観的で、人々から職とプライバシーを奪うのではなく人々の命を守り生活を豊かにするための人工知能を信じているのだけれど、民間企業による人工知能の破壊的な利用に対抗できるのかどうか。いくら大学所属の研究者たちが人権やプライバシーに配慮した人工知能を訴えても、Kashmir Hill著「Your Face Belongs to Us: A Secretive Startup’s Quest to End Privacy as We Know It」に書かれているClearview AIのような企業による濫用は止めようがないように思う。

著者がグーグルで働いたとき大学の研究室と比べグーグルでは予算だけでなく使える部下やNVIDIAのGPUの数からして桁違いだったというし、一時期ツイッターの社外取締役を務めていた著者がマスクによるツイッター買収であっという間に取締役会全員と同時に解任されたことに象徴的なように、大学所属の研究者たちの影響力は限定的。彼女が教えている学生たちも途中で休学して民間企業に就職しそのまま戻ってこなくなる人が多いらしく、かつてはほとんど使い物にならないからこそ学問的な研究に任されていた人工知能の分野は、現在では完全に民間企業が中心となっている。政治と学界が協力して人権を守るための適切な規制を整備していかないと。