Deepseekの台頭、中国のスタートアップは、Openiiのドメインに挑戦しました言語モデルR1、会社が低コストでこのような驚くべき結果を達成する方法についての国際的な議論を引き起こしました。
中国企業であるため、噂が数千のNvidia GPU H100の買収疑惑に焦点を当てたのは時間の問題でした。アレクサンドル・ワン(スケールAIのCEO)や遍在するイーロン・マスクなどのハイテク部門の温かい人物は、ディープシェクが必要なハードウェアを取得するために輸出のチェックを回避したと仮定して、憶測の供給に貢献しました。
Nvidiaの答え
制御されない循環を始めた噂に、「行動」の仮説を再開しますシンガポール経由で米国の商品を中国に持ち込みます、Nvidiaは公式宣言で対応することを決定しました。会社によると、Deepseekは革新的なテクニックを悪用していたでしょう「テスト時間スケーリング」、国際法に完全に準拠して、既存の広く利用可能な計算リソースを使用して、新しい人工知能モデルを開発できるようになりました。
現時点では、X/Twitterには問題があります
また、投稿をロードすることはできません
トレーニング前およびトレーニング後のスケーリング戦略に追加されたこのアプローチは、必ずしも最新世代のハードウェアや違法な慣行に頼る必要なく、高性能を得ることができる方法を示します。推論、または訓練されたモデルの使用には、かなりの数のNVIDIA GPUと高性能ネットワークが必要ですが、禁止されたテクノロジーへのアクセスを意味するものではありません。
Nvidiaの立場は、論争をなだめることを目的としていますが、GPU市場の将来についての疑問も提起しています。 「テスト時間スケーリング」が効果的で簡単に適用可能なソリューションであることが証明された場合、主要なハードウェアの需要は収縮を受ける可能性があり、Nvidia自身などの企業にとって大きな結果。それは偶然ではありません会社の株式は、ニュースの広がりに続いて証券取引所で17%の崩壊を記録しました、Nvidiaに世界で最も資本化された企業のランキングで2位を失います。
現時点では、X/Twitterには問題があります
また、投稿をロードすることはできません
しかし、人工知能業界に対する「テスト時間スケーリング」の長期的な影響はどうなりますか?そして、ますます強力で洗練された言語モデルへのアクセスを民主化することができるでしょうか?以下のコメントであなたのものを教えてください。Deepseek R1はOpenaiに挑戦しました。