DeepSeek-R1:一个模型如何学会「思考」

2025 年最大的 AI 突破不是更大的模型,而是一个模型学会了停下来想一想再回答。DeepSeek-R1 登上 Nature,证明了一件事:不需要人类手把手教推理步骤,只需要给对奖励,模型就能自己学会思考。

2026年3月21日 · 6 分钟 · 1218 字 · AI Lab