DeepSeek-R1 : 最大6710億パラメータで推論能力を飛躍的に向上させたAI
DeepSeek-R1 は、6710億パラメータを持つ、最先端のオープンソース大規模言語モデルです。MITライセンスで公開され、商用利用も可能です。MoEアーキテクチャと強化学習により、数学、コード、推論タスクでGPT-4に匹敵する性能を達成。知識蒸留による小型化も実現し、多様なハードウェアで実行可能です。API経由での利用や、チャットウェブサイトでの試用も可能で、今後のLLM研究開発に大きく貢献すると期待されます。