Adobe が 自社開発の画像生成 AIモデル、Adobe Firefly を発表した。人間の言語指示・プロンプトで画像を生成する AI モデルで、著作権関係がクリアな生成モデルであるのが特徴。
Adobe FIrefly – Adobe独自開発の画像生成 AI
Adobe Firefly(Adobe Firefly サイト)は Adobe が独自開発した画像生成 AI モデルで、機械学習に Adobe Stock やオープンライセンス・著作権期限切れのパブリックドメインコンテンツを活用しているのが特徴。
機械学習を用いる AI では、何で学習したのか、が常に問題になる。Adobe はアーティストサイドのディベロッパーであり、出自が明白な画像で学習を行ったようだ。公開された画像などのデータについて、機械学習に使うことを拒否する DO NOT TRAIN タグを尊重するコンテンツ認証イニシアチブ(CAI)のコンテンツクレデンシャル機能をサポートしていく方針も表明している。ちなみに Firefly の学習に活用した Adobe Stock コントリビューターへのロイヤリティ支払いも検討されているよう。
デモをみる限り、Adobe Firefly は言語プロンプトによる画像・動画生成や似た画像からのバリエーションを生成することができる。生成した画像パターンをブラシに使ったり、画像編集ツールが指定したサイズやレイヤーに調整した形で生成が可能のようだ。当然、言語プロンプトも画像調整系のパラメータが豊富に用意されているんだろう。
Adobe Firefly は Adobe Creative Cloud に統合され、各製品から使えるようになる模様。Adobe Firefly はベータ版のテストが開始される。
ブログのリリースにある通り、Adobe は AI 機能の開発に注力してきている。画像の選択や認識など便利で高度なツールを提供してきていrが、画像パーツそのものを生成することで、素人目からも、商業クリエイティブのワークフローは劇的に効率化することが感じられる。
生成 AI により、メジャーアプリケーションの AI 搭載が進んでいる
Open AI に巨額な投資を行った Microsoft(マイクロソフトと OpenAI がパートナーシップを拡大)は Bing だけでなく、Office アプリケーションに GPT-4 を搭載することを発表した(Microsoft 365 Copilot を発表 – 仕事の副操縦士)。GPT-4 のマルチモーダルな生成機能を活用し、Office アプリケーションのデータ作成・コンテンツの生成・要約などを支援してくれる。当然ながら、ホワイトカラーの生産性はバク上がりするだろう。
Microsoft、そして今回の Adobe の発表で、大手のエンタープライズアプリケーションベンダーの AI 搭載が加速していくと思われる。
そして、AI は OS 搭載機能へ
大規模な学習モデルの構築が実施できるベンダーは限られている。AI 機能が一般的で普遍的な機能になるならば、それは OS レベルで実装されるはずだ。Adobe の画像生成系のような専門領域はともかく、AI がアプリケーションごとに異なるのは、ある意味不便だ。例えば、Siri や Alexa のようなユーザ支援系の AI は、ユーザのプロファイル(ユーザ属性・セキュリティレベル・よく頼み事をする内容など)は共通化しておきたいだろうし、アプリケーションをまたがった指示もすることはあるだろう。
Microsoft は Open AI と提携することで、この波をうまく掴んだと思われる。
Google はそれはもう必死だろうと思う。AI 開発をリードしてきたプライドや株価対策だけでなく、彼らの収益モデルに関係するからだ。ChatGPT は検索の在り方を変えてしまう。ChatGPT が回答するのは学習されたコンテンツの要約であり、検索ワードに関連した Webサイトのリンクではない。Google の高収益を支えてきた Web 広告モデルが崩壊する序章なのだ。
Google が AI 時代にフィットした広告モデルを開発できているかは分からないが、少なくともイニシアティブを他社に握られるのは危険極まりない。Microsoft は少なくとも広告収入モデルに気兼ねなくイノベーションを進めることが出来るのだから。
さて、Apple はどうだろう。古くは Personal Digital Assistant を提唱・実践してきた会社だが、Apple は過去にやってきた事業や技術・文化が現代の Apple にあまりつながらないタイプの会社でもある(実際、PDA を知らない Apple 社員がほとんどだろう)。
正直、あまり変わり映えがしない昨今の macOS だが、間違いなく次のビックイシューは AI 搭載だと思う(VR/AR ではない)。Apple は機械学習系のプロセッサパーツを自社開発していたり、機械学習を使ったモデル構築と活用も進んでいるが、GPT-4 のような巨大な言語モデルを開発している噂は聞かない。
今年の WWDC でその話が出れば、面白いのかもしれないね。期待している。
コメント