凄くも怖いAI

去年あたりからAI…人工知能に関する事柄が爆発的に増えた。あちこちのサービスを使ってみたところでは、便利な部分があれば、まだまだ詰めが甘い部分も見受けられるな?というのが第一印象だった。

無料サービスとしてあらゆるユーザーに実体験させることで、その背後では膨大なデータを吸収し続けており、学習スピードは想像している以上のペースで進んでいる。例えば、AI側が提示した答えに対して「それは違う」「正しい答えは…」なんてソース付きで返答しようものなら、それだけで精度が上がるきっかけになっていく。世界中のユーザーがこんな調子で使っていれば、提示される回答の精度が上がっていくのも察することができる。

Googleが開発したGeminiとはどういうものなのか?と、興味本位で使ってみた。今回は画像生成機能を試してみることにして、素材はEK9シビックRを使ってみた。

ベース画像

Xのヘッダー画像として掲載している。この写真をベースに、画像生成をさせてみると、次のイラストが出力された。

生成結果

「なんだこりゃ!」と素で声が出た。

サーキットで走っているEK9シビックRの写真に対し、生成された画像はパドックを思わせる場所に止められており、ドライバー風のキャラクターまで描写されることになった。ツッコミどころはあるものの、それ以上に驚かされる部分が多数あったりする。

フロント周辺

まずフロント周辺。ベース写真はボンネットを開けていないが、生成された画像は開けられている。もちろんエンジンはB16Bとは全く似つかず、配管の形状からK型エンジンにも見えなくはないが、赤いエンジンであることは正解。ボンネットのサポートロッドの位置、ボンネット裏側のフレームは全く違う。

それ以上に目を惹いたのが、背後にいるチャン白のシビックR。サポートスタッフに囲まれて、まるで出走前のワンシーンを見ているかのようだ。

キャラクター

中央に立つキャラクター。画像生成で出力されたキャラは、指の数が多かったり、関節が変なところにあったりと、二次元どころか異次元だったりしたものだが、ここまで精度が高くなっていて逆に引いた。

タイヤが回っているように描写されているが、これはベース画像が走行しているワンシーンだった影響だろう。それでも5穴の7本スポークとエアバルブが再現され、赤くなっているとはいえ片押し式ブレーキキャリパーはしっかりと描写された。ベース画像ではサイドスカート部分にラップタイマーのセンサーを装着していたが、生成画像ではちゃんと削除されている。つまり仮設部品であることがGemini側で把握していることになる。

キャラクターが着るレーシングスーツ、及び車体側面に描かれている『TYPE R』については、若干の学習不足が見受けられる。

リア周辺

最後にリア周辺。助手席側の描写だけあって、給油口がしっかりと再現されている。ベース画像は運転席側から撮影されたものになるので、助手席側には給油口があると学習しているようだ。

こちらもタイヤが回っている描写になっているが、フロント側と同じ傾向。ブレーキキャリパーの位置が間違えており、本来は後端側にある。

背景では遠くに山並みが見えており、フェンスの組まれ方や階段状の描写から、どこか富士スピードウェイの観客席を思わせる。

間違いが多く含まれているとはいえ、たった一枚のベース画像から想像を掻き立てるイラストを生成するとは、人工知能恐るべし。他の誰かが画像をアップロードして、何かしらに使っていた学習の蓄積があり、それが巡りに巡って今回の生成に繋がっていると思うのが自然だろう。

となれば、機密情報をアップロードして、文章の校正や余計な部分を削除した画像の修正といったことに使ってしまうと、元の情報がサービス側に取り込まれてしまうことになる。うまく使っていかないと、将来的に危ないことも起こりうると思った一瞬だった。

休息中

ガレージに戻って休息中。ヘルメットのデザインが引き継がれ、バケットシートを座椅子に転用するアイデアはナイスだが、アンテナカバーが助手席側に装着されているのが惜しい。