中華製AI「DeepSeek」はNVIDIAを駆逐するか

世界を驚愕させているDeepSeeekとはいったいどんなAIなのか(画像:DeepSeek)

創業からわずか1年余りの中国AI企業「DeepSeek(ディープシーク)」がアメリカの株式市場を大きく揺るがせた。

ここ数年、生成AIブームの象徴と見られたNVIDIA(エヌビディア)の株価は1月27日に17%安と急落。これに引きずられるようにハイテク株中心のナスダック総合指数は3%以上も下落。翌日の日経平均株価も548円安になるなど影響は広がった。

アメリカ製の「10分の1」の開発費

それまで無名だったDeepSeekの何がそれほどの破壊力を生み出したのか? それはChatGPTなどアメリカ製AIに匹敵する高性能AIを、アメリカ製品のわずか「10分の1」程度の開発費で作り上げてしまう並外れた技術力である。

ChatGPTなどアメリカ製AIの基盤となる大規模言語モデル(LLM)の開発には、エヌビディアの「H100」など先端GPUを最低でも何万個と購入し、これらを使ってLLMをトレーニング(機械学習)する必要がある。それによる開発費は数億ドル(数百億円)~10億ドル(約1500億円)に上ると見られている。

これに対しDeepSeekは同じくエヌビディア製の「H800」と呼ばれる格落ちのGPUをわずか2048個使っただけで、OpenAI製の「GPT-4o」や「o1」などトップ製品とほぼ同じ性能のLLMを開発した。

それに要したコストは約560万ドル(約8億7000万円)という。つまりOpenAIなどアメリカ勢よりも、ほぼ2桁小さい開発費で成し遂げたことになる。

これほど高度の技術力を誇るDeepSeekとはいったいどんな会社なのか?

創業したのは、中国のクォンツ・ヘッジファンド「High-Flyer Quant」の創業者でもある梁文峰(リャン・ウェンフェン)氏だ。彼はヘッジファンドの資金運用を高速・高精度に行う投資AI技術を開発するため、2023年にHigh-Flyer Quant傘下の研究機関としてDeepSeekを設立した。

かつて中国浙江省の名門、浙江大学でコンピュータ科学を専攻した梁氏はDeepSeekの設立に際して、北京大学、精華大学、北京航空工科大学など中国のエリート校からコンピュータ科学等の博士号取得者を次々と採用し、生成AIのベースとなる大規模言語モデル(LLM)の開発に当たらせた。

中国国内でAI技術力を養う

これらの博士研究者らは、(前出の)中国国内の大学で高度なAI技術力を養った。

DeepSeekに採用された彼らは当初から、LLMの開発に必要な部品を十分に入手できないなど苦難の道を強いられた。が、こうしたハードウエアの不足が結果的に高度なソフトウエアの技術力を育むことにつながった。

アメリカのバイデン前政権の中国に対する輸出規制により、DeepSeekのような中国企業は(OpenAIなどアメリカ企業が機械学習に使っている)エヌビディア製GPU「H100」など最先端の半導体チップを使うことができない。

その代わりにDeepSeekは(中国への禁輸措置を免れた)「H800」と呼ばれるGPUを多数輸入して、LLMの機械学習に投入した。H800はH100など最先端商品の性能をあえて大幅にダウンさせた、言わば「格落ち製品」である(ちなみに現在では、このH800さえ中国への輸出が禁止されている)。

このように性能が落ちるGPUを多数使って、安くAIを作ることができた理由は開発手法の違いにある。

DeepSeekは「MoE(Mixture of Experts:専門家の集合)」と呼ばれる特殊な手法を採用している。これはLLMのようなAIモデルの全体を使うのではなく、必要に応じて特定のタスク(仕事)に最適化された「専門家(エキスパート)」と呼ばれる部分モデルだけを動かす仕組みだ。このようにしてAIモデルを効率化することで、開発コストを抑えながら性能を向上させることができるという。