官方网站-首页
今年年初,中国深度求索公司发布推理型大模型DeepSeek-R1(以下简称DeepSeek)引爆热搜,引起全球广泛关注。
大家跃跃欲试
向它提问专业问题
输出工作方案
甚至聊起了个人情感问题

截图自Deepseek官网聊天对话框
年轻人的“深夜树洞”
不少网友纷纷晒出自己和它的对话,并表示被感动到“泪目”,频频破防。一起来感受下:
Q
连续一周每天只睡4小时改方案,但领导还是不满意,说我没用心。我是不是很差劲?
Deepseek回答:


本回答由 AI 生成,仅供参考,不构成任何专业建议。
Q
毕业三年工资不高,同学晒房晒车,感觉我的人生好失败,没有方向。到底怎么才能跳出现在的困境?
Deepseek回(huí)答(dá):


本(běn)回(huí)答(dá)由(yóu) AI 生(shēng)成(chéng),仅(jǐn)供(gōng)参(cān)考(kǎo),不(bù)构(gòu)成(chéng)任(rèn)何(hé)专(zhuān)业(yè)建(jiàn)议(yì)。
Q
跟(gēn)前(qián)男(nán)友(you)分(fēn)手(shǒu)了(le),但(dàn)睡(shuì)前(qián)还(hái)是(shì)手(shǒu)贱忍不住搜他微博…朋友说我恋爱脑,但没人知道我每晚难过走不出来的心情,我该怎么办?
Deepseek回答:


本(běn)回答由 AI 生成,仅供参考,不构成任何专业建议。
DeepSeek为什么这么火?
DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,依托幻方量化顶尖的金融AI团队,将量化领域高频交易中的算法优化能力(lì)迁(qiān)移(yí)至(zhì)大(dà)模(mó)型(xíng)研(yán)发(fā),其(qí)自(zì)研(yán)AI-HPC架(jià)构(gòu)使(shǐ)训(xun)练(liàn)效(xiào)率(lǜ)提(tí)升(shēng)10-20倍(bèi),形(xíng)成(chéng)技(jì)术(shù)先(xiān)发(fā)优(yōu)势(shì)。
具(jù)体(tǐ)来(lái)说(shuō),火(huǒ)出(chū)圈(quān)的(de)是(shì)DeepSeek-R1推(tuī)理(lǐ)模(mó)型(xíng),擅(shàn)长(zhǎng)处(chù)理(lǐ)复(fù)杂(zá)任(rèn)务(wu)且(qiě)可(kě)免(miǎn)费(fèi)商(shāng)用(yòng)。

图(tú)源(yuán)《DeepSeek从(cóng)入(rù)门(mén)到(dào)精(jīng)通(tōng)-清(qīng)华(huá)大(dà)学(xué)版(bǎn)》
爆(bào)火(huǒ)的(de)其(qí)中(zhōng)一(yī)个(gè)重(zhòng)要(yào)契(qì)机(jī),是(shì)有(yǒu)网(wǎng)友(you)指(zhǐ)出(chū)DeepSeek-R1的(de)成(chéng)功(gōng)可(kě)能(néng)削弱了市场对英伟达AI芯片需求的预期,导致交易员做空英伟达股票,进而引发股价下跌。通过FP8混合精度训练、混合专家(MoE)架构等创新,训练成本仅为GPT系列的1/10-1/20,API定价压至同业1/27,或能破解行业成本困局。
此外,在用户使用过程中确实能感受到,DeepSeek-R1的自然语言、逻辑推理等能力的实现标志着AI技术在认知和应用(yòng)层(céng)面达到了新高度。
AI的“治愈力”从何而来?

喂养海量案例素材
测试显示,当用户倾诉“工作压力大”时,人类常给出“放松点”等模糊回应,而AI会分步骤引导分析压力源,这与AI被“投喂”的海量心理咨询案例训练直接相关。
大模型学习的不只是知识,更是数十亿人的情感表达(如小说对白、心理咨询记录、影视台词)。

deepseek指导生成
像婴儿通过观察大人学习“何时该给拥抱”,AI在被RLHF训练(奖励函数操控)时,标注员会更倾向选择“渐进式引导”的答案,导致AI自动优化出“先认同-再分析-后建议”的三段式结构。
相较于传统大模型以自然语言和多语言交互以及连续对话的方式,实现了从“模糊搜索”到“精准推送”的升级,DeepSeek能够通过构建语义网络和模拟人类逻辑路径,实现从“信息匹配”到“知识推演”的跨越。
双轨训练机制
在海量数据的基础上,DeepSeek-Rl采用独有的双轨训练机制。一方面,它能够深入学习将复杂问题拆解为简单子问题的方法,进而逐步解决复杂问题,显著提升复杂问题的拆解能力。
另一方面,它采用了无监督强化学习技术,突破传统训练范式的局限(通常依赖大量标注数据),使DeepSeek-R1在有限标注数据的情况下,仍能维持卓越的推理性能。

deepseek指导生成
这种创新的技术路径,实现了推理过程的自我反思与迭代优化。如同人类在解决问题时会不断总结经验、反思方法,DeepSeek-R1也会在推理过程中能够持续优化自身推理策略,形成类似人类的问题解决思维链。
AI的“高情商”不是真情感
但值得注意的是,AI不懂悲伤,只能模拟“悲伤时人类最需要的对话流”。RLHF(基于人类反馈的强化学习)让AI从“正确率”迭代到“让人类舒服的回答”,掌握“共情话术”,但无法区分小说剧情与现实困境。
在上述案例中,Deepseek会将“失恋”自动关联到关键词“背叛”“自我价值”……从而触发预设安慰框架,选择大量运算结果中最有可能符合人类情感需求的内容。
例如,当AI说“我理解你的痛苦”,实则是数据统计显示这句话最可能提升用户满意度。

deepseek指导生成
DeepSeek等AI开始展示出其能够站在他人立场思考问题(tí)的能力,即“他者视角”。但机器没有肉身,“自我”情感和冲动也没有根植之处(chù)。我(wǒ)们(men)在(zài)使(shǐ)用(yòng)过程中,应保持理性和辩证思维,避免过度依赖AI导致情感降级(如把AI当心理医生)。
也许真正治愈我们的不是AI的答案
而是在提问的瞬间
我们第一次对自己如此坦诚
作者:蝌蚪君
审核:刘颖 李培元
