
SSDFans
Facebookは先日、より強力な機械学習モデルの開発を促進するための2つの社内人工知能プロジェクト「Learning from video」と「TimeSformer」の詳細を発表しました。
最初のプロジェクトである「ビデオからの学習」では、ユーザーがアップロードしたビデオを使って、フェイスブックがソーシャルネットワークを強化する機械学習システムを訓練します。 Facebookは、コンテンツの推奨から意思決定の実行まで、さまざまなタスクに人工知能を活用しています。 同社は、機械学習システムをユーザーが作成したビデオでトレーニングすることで、モデルの有効性を向上させたいと考えています。通常、研究者は、個々のファイルが専門家によって特定のタグでタグ付けされた、自分で構築した学習データセットを用いてAIモデルを学習します。 これらのタグは、学習の過程でモデルが正しい方向に進むために役立ちます。
しかし、この方法には問題があります。データセットに専門家がタグ付けするには多くの時間と労力がかかるため、構築されるデータセットのサイズが制限され、学習時にAIモデルの学習能力が制限されてしまうのです。
Facebook社の研究者は、ブログ記事の中で、「タグ付けされていないユーザー作成の動画でAIモデルを学習させることで、従来の手作業で構築されたデータセットよりもはるかに多くの情報からモデルを学習させることができます。 ほぼすべての国と数百の言語をカバーするグローバルな公共ビデオストリームから学習することで、私たちのAIシステムは、精度を向上させるだけでなく、急速に進化する世界に適応し、異なる文化や地域間のニュアンスを認識することができます。”
研究者たちは、このイニシアチブがプライバシー問題に非常に重点を置いていることを強調しています。 彼らは次のように書いています。「私たちは、自動化されたソリューションを使用して、大規模にプライバシー保護を強化する強固なプライバシー体制を構築し、維持しています。 この作業をインフラレベルに組み込むことで、システム全体で一貫してプライバシーニーズに対応することができます」と述べています。
Facebookは、ユーザーの動画を使ってモデルをよりよく訓練するために、「自己教師付き学習」というアプローチを使用しています。このアプローチでは、訓練データにタグを付ける必要はありません。Facebookは、Instagramのリール機能が、自己教師付きAIモデルを使用して、ユーザーに似た動画や最近見た同じような内容のビデオを推奨していることを明らかにしました。
Facebookは、自己教師付き学習の研究に加えて、TimeSformerと呼ばれる別のAIプロジェクトについても詳述しています。 この技術により、TimeSformerは従来のモデルに比べて10分の1以下の計算資源でデータを処理し、以下のような速度で学習することができるという。 3倍の速さです。
フェイスブックによると、彼らのアプローチは他の面でもトレーニングプロセスを改善するという。 同社の研究者は、「現在、最高の3D CNN(機械学習モデル)は、数秒の長さのビデオクリップでしか動作しません」と説明する。 TimeSformerでは、数分程度の動画でもトレーニングが可能です。 これにより、動画の複雑な連続した動きを機械に理解させる研究が大きく前進する可能性があります。”