【速報】NVIDIAが「ジェネレーティブAI」のクラウドサービス提供を発表!大規模言語モデル/画像生成AI/医療向け生成系AIをビジネス活用する時代へ

今年もディープラーニングとGPUの世界最大級のイベント「GTC」が開催されている。
GTC2023」(GTC23)は日本時間の2023年3月21日から24日にオンラインで開催。最先端技術の現場にいる有識者による650以上のセッションが用意されている。参加登録は無料で、日本語字幕付きのセミナーも用意されている。


そして最も注目されているNVIDIAの創業者/CEOのJensen Huang氏の基調講演(キーノート)が配信された。今回も盛りだくさんの発表が連なっていたが、現在、AI分野で最も注目されている生成系AI(ジェネレーティブAI / Transformer)についての言及があった。それは「ジェネレーティブAI」サービスをクラウドで提供する「NVIDIA AI Foundations」の発表だった。しかも、Googleクラウド、Microsoft Azure、オラクルクラウド(Oracle Cloud Infrastructure)で提供される。

大規模言語モデルを「Nemo」、画像生成AIを「Picasso」、医療分野の生成系AIを「Bionemo」というサービスでクラウドで提供する「NVIDIA AI FOUNDATIONS」を発表




「ジェネレーティブAI」サービスをクラウドで提供

フアン氏は「ジェネレーティブAI は、AIの急速な採用を促進し、無数の業界を再発明している。「NVIDIA AI Foundations」により、企業は独自のデータを使用して基盤モデルをカスタマイズし、人類の最も貴重なリソースである知性と創造性を生み出すことができる」と語り、「ジェネレーティブAIはほとんどすべての産業を変革するでしょう」と付け加えた。


フアン氏が基調講演で紹介したジェネレーティブAIが生成した「宇宙服を着たネコが月を歩いているリアルな絵」(テキストで指示すると画像を生成する)


「NVIDIA AI FOUNDATIONSサービス」の発表

生成系AIが注目されている具体的なユースケースは「ChatGPT」に代表される大規模言語モデル、「Stable Diffusion」などの画像生成AI、そして「創薬分野」などでの新しい分子やタンパク質の発見だ。これらの生成系AIは、多くの企業が注目していて、自身のビジネスにどのように活用するかを急速に検討していくと見られている。


そこで、NVIDIAは、大規模言語モデルを「Nemo」、画像生成AIを「Picasso」、医療分野の生成系AIを「Bionemo」というサービスでグラウド提供する「NVIDIA AI FOUNDATIONS」を発表した。



大規模言語モデルと対話型AI「NeMo」

いま、AI分野で最もホットな話題のひとつである「ChatGPT」について、フアン氏は「ChatGPTで作られたテキスト感動を通り越したものであり、メモや詩を作り、論文をわかりやすく書き換え、数学の問題を解き、契約書の重要な部分を強調表示してくれたり、更にはプログラムのコードも書くことができる」と評価した。

言語生成AIは、文章を生成するだけでなく、対話型AIを進化させ、プログラムコードを書くことができる

「NeMo」クラウドサービスはChatGPTのようにテキストを生成する大規模言語モデルで、数兆単位の単語でトレーニング学習されたもの。Transferモデルでは、単語間の依存関係を学習して重み付けをおこなう技術で、その結果、ChatGPTのような体験の基盤となるモデルができあがる。
独自の言語モデルを組み込むか、トレーニング済みのNemo言語モデルから生成作業を行うことができる。GPTパラメーター数は80億個、430億個、5300億個があり、独自モデルの生成から運用まで、プロセス全体でNVIDIA AIエキスパートが支援するとしている。


ユーザーは「NeMo」をNVIDIA DGX Cloudで実行することでジェネレーティブAIを短期間で導入することができるようになる。


ビジネス活用のための不適切発言を監視機能(NeMo)

NeMoクラウドサービスを使用すると、開発者は重点分野を定義し、ドメイン固有のナレッジを追加し、機能的スキルを教えることで、「大規模言語モデル」(LLM) をビジネスに活用できる。ビジネス活用で最も難しいのは、カスタマイズされたブランド固有のコンテンツを的確に提供するとともに、コンプライアンスに反した言葉を返したり、間違った情報を返答しないシステムを構築することだが、フアン氏は「独自のナレッジベースで構築されたモデルに接続することができる」と拡張性と、「会話が脱線せず、不適切な言葉や偏りの表現を自身で監視する」しくみが備わっているため、短期間でビジネス活用が実現することを強調した。

サービスで利用可能な前述のように、80億から5,300億のパラメータのさまざまなサイズのモデルは、追加のトレーニング データで定期的に更新され、企業は速度、精度、およびタスクの複雑さに関するビジネス要件に合わせたアプリケーションを構築するための幅広いオプションが利用できるという。
また、NeMoクラウドサービスに含まれる情報検索機能を使用すると、顧客はリアルタイムの独自データでLLMを拡張できる。これによって、企業はモデルをカスタマイズして、マーケット インテリジェンス、エンタープライズ検索、チャットボット、カスタマー サービスなどのための正確なジェネレーティブAIアプリケーションを強化できる。


画像や動画の自動生成AI「Picasso」

「Picassoクラウドサービスは画像、ビデオ、3Dにわたるシミュレーションとクリエイティブ デザインを効率化するためにな活用できる生成系AI。高精度なtext-to-image、text-to-video、text-to-3D 機能を備えたジェネレーティブ AI 搭載の画像、ビデオ、3Dアプリケーションを構築したり展開するためのクラウド サービスとなっている。



シンプルなクラウドAPIが用意され、創造性、デザイン、デジタル・シミュレーションの生産性を大幅に向上させる機能をクラウドで提供される。ソフトウェアメーカー、サービス ロバイダー、一般企業であっても、Picassoを使用して独自のデータでNVIDIA Edify基盤モデルをトレーニングして、自然なテキストプロンプトから、製品設計、デジタルツイン、ストーリーテリング、キャラクター作成など、さまざまなユースケースのビジュアルコンテンツを作成するアプリケーションが構築できる。


一般にこの分野で議論の的となっているのが、AIが他者の著作権を侵害したデザインを生成してしまうケースだが、完全にライセンスされたデータで事前トレーニングされたPicassoの一連のEdifyモデルを活用することもできるという。さらに、Picassoを独自の生成AIモデルの最適化や実行に活用することもできる。

AIが生成したリアルな画像

AIが生成したリアルでファンタジーな画像


アドビ、Getty Images、Shutterstockらがパートナーに

フアン氏は、クリエイティブ業界の有力な企業との連携も発表した。
NVIDIA と Adobe はこの日、従来からの研究開発パートナーシップを拡大し、次世代のジェネレーティブAIモデルを作成することを発表した。両社は、Adobe のContent Authenticity Initiativeを活用して、透明性とコンテンツ資格情報に重点を置いてモデルを共同開発する。クリエーターやマーケティング担当者のワークフローを加速するために、これらのモデルのいくつかは共同で開発され、Photoshop、Premiere Pro、After Effects などの Adobe Creative Cloud の主力製品やNVIDIA Picasso を通じて市場に投入される予定だ。


また、ストック写真業界の大手であるGetty Images は、責任あるジェネレーティブな text-to-image および text-to-video の基盤モデルをトレーニングするために協力する。モデルは単純なテキストプロンプトを使用して画像とビデオを作成できるようにし、Getty Images の完全にライセンスされたアセットでモデルをトレーニングする。Getty Images は、モデルから得られた収益に対してアーティストにロイヤリティを提供する。

Shutterstockは、ブランドやメディア企業向けのグローバル クリエイティブ プラットフォームとして知られる。Shutterstock は、詳細な3Dモデルの作成を簡素化し、3Dモデルの構築に必要な時間を数日から数分に短縮するために、Picassoサービスを使用してジェネレーティブな text-to-3D の基盤モデルをトレーニングするために協力する。ライセンス供与されたShutterstock のアセットとメタデータがトレーニングに使用される。Shutterstock はContributor Fund (寄稿者基金) を通じてアーティストに報酬を支払うしくみだ。展開の準備が整ったら、Shutterstock はそのプラットフォームでモデルを提供して、クリエイティブ制作のための3Dアセットの作成を簡素化し、NVIDIA Omniverse での産業用デジタルツインや3D仮想世界構成の開発を加速する予定だという。




医療分野のジェネレーティブAI「BioNeMo」

ジェネレーティブAI「NeMo」の医療分野に特化したクラウドサービスが「BioNeMo」と言えるだろう。フアン氏によれは「生成AIモデルはタンパク質のアミノ酸配列を読み取れるようになり、数秒で標的とするタンパク質の構造が正確に予測できるようになった」という。

そして、体内での薬の挙動を最適化するADME特性を持つ分子が生成できる。そして、生成モデルはタンパク質と分子の3D相互作用を予測し、最適な薬の候補の発見を加速する、と続けた。


既に多くのグローバル企業が「BioNeMo」の導入を始めているという。







アーリーアクセスを提供中

「NeMoジェネレーティブ AIクラウドサービス」はアーリーアクセスを提供中。Picassoサービスはプライベートプレビューを提供している。開発者はそれぞれのリンクより、アクセスを申し込むことができる。
また、詳細の動画はフアン氏の基調講演の中で確認することができる。

GTC 2022 関連記事
ドイツ鉄道がデジタルツイン導入に着手 5,700駅と33,000km路線の鉄道網をNVIDIA Omniverseで構築 次世代の鉄道システム構築へ
ドイツ鉄道がデジタルツイン導入に着手 5,700駅と33,000km路線の鉄道網をNVIDIA Omniverseで構築 次世代の鉄道システム構築へ
ホームセンターのLowe’s、NVIDIAやMagic Leapと共同でインタラクティブな店舗のデジタル ツインを構築 小売業のOmniverse活用事例
NVIDIA「Jetson Orin Nano」のベンチマーク結果を公開 従来NanoやTX2 NXとの性能差は?「GTC 2022」レポート
NVIDIA 自律走行搬送ロボット(AMR)リファレンス プラットフォーム「Nova Orin」のアップデートを発表 Nova Orin詳細を解説
こんなに多くの有名企業が既にデジタルツインに取り組んでいるとは…「GTC 2022」でNVIDIAがOmniverse採用企業を一挙に紹介
【速報】手術支援ロボットにNVIDIA「IGX AI」と「Clara Holoscan」を採用 開発ベンチャー3社が医療用AI開発を加速
【速報】NVIDIA「Isaac」AIロボット開発プラットフォームがクラウドサービスに対応 AWS RoboMakerも利用可能に
【速報】NVIDIA「Jetson Orin Nano」を発表 従来Nanoの約80倍の高性能 超小型AIコンピュータ Orinファミリーは3機種に
いよいよ今夜24時、世界最大級のAIイベント「NVIDIA GTC」ジェンスン フアン氏のキーノート配信 新しいAIと未来
NVIDIA関連記事

ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム