グーグルのニューラルネットワークでYouTubeのサムネイルがはずれなしに?
YouTubeのサムネイル写真ってときどきひどいのがありますよね。
でも、グーグルがニューラルネットワークを使ってアルゴリズムを教育中だから、これからはもっと良いプレビューが出せるようになるかもしれません。
もちろんカスタムのサムネイル写真をアップロードすることもできますが、大抵の人はそんなことしませんよね。そんなとき、グーグルはアップした動画の毎秒ごとに1フレームずつをサンプルして、それをさまざまなフィルターでふるいにかけ、1枚に絞ったものをサムネイルとして採用します。でも、グーグルのWeilong YangさんとMin-hsuan Tsaiさんが投稿トップの写真で見せてくれたように、いつもうまくいくとは限りませんでした。
そこで、もっと良い結果を表示するため、グーグルは数あるフィルターの内のひとつに機械学習を採用しました。2人は彼らが実際に行なったことを説明してくれました。
機械にとって、あなたの好きな動物が動画に含まれているかを認識させるのとは異なり、ビデオフレームのビジュアル品質を判断するのは非常に客観的なタスクです。人が動画のサムネイルを選ぶとき、大抵は、まったく別の意見や好みがあります。幸運にもYouTubeにはアルゴリズムで生成されたサムネイルに加えて、多くの動画においてクリエイター自身によって慎重にデザインされてアップロードされたカスタムサムネイルがあります。そういったサムネイルはちょうどよくフレームに収まっていて、焦点があっていて、動画の主役などがセンターに配置されています。人気動画のそのようなカスタムサムネイルを良いお手本、ランダムに選ばれたサムネイルを悪いお手本と考えました。
そんなカスタムサムネイルを練習台に、チームはニューラルネットワークを教育しました。何が良いサムネイルで何が悪いサムネイルかという人間の知覚をより理解できるようにしたんです。その結果、過去のアルゴリズムと比べて明らかに良い写真を提供できるようになりました。投稿トップの写真を見れば、その違いは一目瞭然です。
グーグルはこの結果に満足しているようで、すでにYouTubeサービス全体に適用されています。
Jamie Condliffe - Gizmodo US[原文]
(TOMOYOSHI)