写在DeepSeek爆火之后：AI发展得如此之快，未来会越来越快吗？-（南京）软件科技有限公司

动态行业资讯

动态

行业资讯

写在DeepSeek爆火之后：AI发展得如此之快，未来会越来越快吗？

发布时间：2025-03-16 08:30:06 阅读量: 478

出品：

作者：王琛（中国科学院计算技术研究所在读博士）

监制：中国科普博览

编者按：为展现智能科技动态，前沿科技项目推出“人工智能”系列文章，一窥人工智能前沿进展，回应种种关切与好奇。让我们共同探究，迎接智能时代。

最近，DeepSeek作为AI界一位“新顶流”，凭借强大的功能在社交媒体上引发热议。有人说它是未来的生产力工具，有人好奇它能为生活带来哪些改变，也有人担心它会抢走自己的饭碗……

为了让大家更加了解这个备受关注的智能帮手，我们邀请了中国科学院计算技术研究所在读博士王琛，用10个问题全面解答关于DeepSeek的核心原理、使用技巧以及未来趋势等疑问。无论是AI小白还是科技达人，这篇文章都能为你答疑解惑！让我们一起看看，这个“智能帮手”能否成为我们生活中的真正伙伴吧！

DeepSeek在春节期间受到全球的关注，现在许多平台都表示已经接入DeepSeek大模型，它究竟是什么？

DeepSeek是一家位于杭州的人工智能初创公司，由幻方量化联合创始人梁文峰于2023年7月创立，专注于大语言模型的研发。

在春节前，DeepSeek相继发布了两款同名的开源大语言模型：DeepSeek-V3（2024年12月26日）和DeepSeek-R1（2025年1月20日）。它们的性能可以与OpenAI的闭源模型GPT-4o和o1等其它大语言模型相媲美，且成本明显低于其它模型。

DeepSeek-V3模型旨在提供高性价比的服务，能够快速地响应用户的需求，满足自然语言处理、问答翻译、内容生成等日常任务的需求。DeepSeek-R1模型专注于复杂的推理任务，特别是在数学问题、代码生成、逻辑推理等领域具有更强的能力，但响应时间也相对较长。

DeepSeek为什么会受到如此大的关注？

DeepSeek-V3和DeepSeek-R1在春节前发布后，凭借其与OpenAI为首的顶尖大模型相当的性能以及低廉的训练成本和推理费用，迅速引发了全球的广泛关注。DeepSeek的高性价比挑战了美国大模型的垄断地位，它的推出使得更多企业和用户能够以更低的价格体验到最先进的AI成果。

DeepSeek开源了其技术细节和模型权重，使得更多人能够利用其成果进行创新和研发。与此同时，DeepSeek还免费开放了在线服务，吸引了大量用户体验，形成了前所未有的热潮。在DeepSeek-R1正式发布7天后，DeepSeek超越ChatGPT登上了AppStore免费应用下载排行榜的榜首。DeepSeek的成功标志着中国在AI领域的重大进展，提升了中国在全球AI技术竞争中的地位。目前，多个企业和高校已经开始自主部署DeepSeek模型，进一步证明了它的广泛应用潜力。

它为什么能用这么低的成本、这么有限的算法实现这么强大的能力？是只在中文表达上强大，还是各种性能都还不错？

DeepSeek能够以较低的训练成本实现强大的能力，主要得益于DeepSeek长期以来在模型架构和算法层面的持续创新。

具体来说，DeepSeek通过使用混合专家架构（MoE）和多头潜在注意力（MLA）等技术有效降低了推理成本。同时，借助数据蒸馏、分布式训练优化、以及硬件层面的精细调优，DeepSeek进一步提升了资源利用率，从而降低了训练成本。多种创新的优化技术的融合使得DeepSeek在仅拥有较低的训练和推理成本的同时，能够提供强大的性能。

在中文的理解和应用方面，DeepSeek有着突出的表现，它不仅能够理解古文，创作诗词，还能准确掌握时下流行的网络用语。而相比之下，ChatGPT的中(zhōng)文虽(suī)然(rán)语(yǔ)法(fǎ)通(tōng)顺(shùn)，却(què)显(xiǎn)得(de)较(jiào)为(wèi)生(shēng)硬(yìng)。不(bù)过(guò)，DeepSeek的(de)强(qiáng)大(dà)能(néng)力(lì)并(bìng)不(bù)仅(jǐn)限(xiàn)于(yú)中(zhōng)文表(biǎo)达(dá)，在(zài)官(guān)方(fāng)公(gōng)布(bù)的(de)多(duō)项(xiàng)标(biāo)准(zhǔn)评(píng)测(cè)中(zhōng)，DeepSeek在(zài)英(yīng)文、百(bǎi)科(kē)知(zhī)识(shi)、长(zhǎng)文本(běn)、代(dài)码(mǎ)、数(shù)学(xué)能(néng)力(lì)等(děng)领(lǐng)域均(jūn)达(dá)到(dào)了(le)顶(dǐng)尖(jiān)水(shuǐ)平(píng)。

DeepSeek在(zài)不(bù)同(tóng)领(lǐng)域的(de)性(xìng)能(néng)表(biǎo)现(xiàn)

（图(tú)片(piàn)来(lái)源(yuán)：参(cān)考(kǎo)资(zī)料(liào)2）

在(zài)AI的(de)范(fàn)畴(chóu)内(nèi)，使(shǐ)用(yòng)中(zhōng)文是(shì)否(fǒu)代(dài)表(biǎo)着(zhe)更(gèng)高(gāo)的(de)效(xiào)率(lǜ)？

在(zài)AI领(lǐng)域，“效(xiào)率(lǜ)”更(gèng)高(gāo)往(wǎng)往(wǎng)意(yì)味(wèi)着(zhe)处(chù)理(lǐ)速(sù)度(dù)更(gèng)快(kuài)，或(huò)者(zhě)理(lǐ)解(jiě)的(de)准(zhǔn)确(què)性(xìng)更(gèng)高(gāo)，或(huò)者(zhě)生(shēng)成(chéng)的(de)内(nèi)容(róng)质(zhì)量(liàng)更(gèng)好(hǎo)。

首(shǒu)先(xiān)，中(zhōng)文和(hé)英(yīng)文在(zài)结(jié)构(gòu)上(shàng)有(yǒu)很(hěn)多(duō)不(bù)同(tóng)。中(zhōng)文是(shì)表(biǎo)意(yì)文字(zì)，一(yī)个(gè)字(zì)可(kě)以(yǐ)表(biǎo)达(dá)很(hěn)多(duō)意(yì)思(sī)，而(ér)英(yīng)文是(shì)字(zì)母(mǔ)文字(zì)，每(měi)个(gè)单(dān)词由(yóu)多(duō)个(gè)字(zì)母(mǔ)组(zǔ)成(chéng)。中(zhōng)文相(xiāng)比(bǐ)英(yīng)文在(zài)表(biǎo)达(dá)上(shàng)更(gèng)简(jiǎn)洁(jié)、高(gāo)效(xiào)，信(xìn)息(xi)密(mì)度(dù)更(gèng)高(gāo)。在(zài)表(biǎo)达(dá)相(xiāng)同(tóng)的(de)意(yì)思(sī)时(shí)，中(zhōng)文往(wǎng)往(wǎng)能(néng)更(gèng)简(jiǎn)洁(jié)地(de)传(chuán)达(dá)内(nèi)容(róng)。因(yīn)此(cǐ)在(zài)AI领(lǐng)域，使(shǐ)用(yòng)中(zhōng)文可(kě)以(yǐ)提(tí)高(gāo)表(biǎo)达(dá)效(xiào)率(lǜ)，进(jìn)而(ér)降(jiàng)低(dī)成(chéng)本(běn)。

但(dàn)同(tóng)时(shí)，中(zhōng)文多(duō)样(yàng)的(de)语(yǔ)义(yì)和(hé)复(fù)杂(zá)的(de)语(yǔ)法(fǎ)结(jié)构(gòu)也(yě)对(duì)AI的(de)理(lǐ)解(jiě)能(néng)力(lì)提(tí)出(chū)了(le)挑(tiāo)战(zhàn)。比(bǐ)如(rú)，在(zài)中(zhōng)文中(zhōng)，“花(huā)”可(kě)以(yǐ)是(shì)植(zhí)物(wù)，也(yě)可(kě)以(yǐ)是(shì)花(huā)费(fèi)，这(zhè)可(kě)能(néng)让(ràng)AI在(zài)理(lǐ)解(jiě)上(shàng)下(xià)文时(shí)更(gèng)难(nán)。而(ér)英(yīng)文虽(suī)然(rán)也(yě)有(yǒu)同(tóng)义(yì)词和(hé)多(duō)义(yì)词的(de)问(wèn)题(tí)，但(dàn)结(jié)构(gòu)上(shàng)可(kě)能(néng)更(gèng)清(qīng)晰(xī)一(yī)些(xiē)。所以，处理中文的(de)时(shí)候(hou)，AI需(xū)要(yào)更(gèng)多(duō)的(de)上(shàng)下(xià)文信(xìn)息(xi)来(lái)准(zhǔn)确(què)理(lǐ)解(jiě)意(yì)思(sī)。

此(cǐ)外(wài)，数(shù)据(jù)量(liàng)和(hé)模(mó)型(xíng)的(de)设(shè)计(jì)与(yǔ)优(yōu)化(huà)也(yě)应(yīng)当(dāng)纳(nà)入(rù)考(kǎo)虑(lǜ)范(fàn)围(wéi)。如(rú)果(guǒ)AI模(mó)型(xíng)在(zài)训(xun)练(liàn)时(shí)使(shǐ)用(yòng)了(le)大(dà)量(liàng)的(de)中(zhōng)文数(shù)据(jù)，那(nà)么(me)它可能在处理中文任务时(shí)表(biǎo)现(xiàn)更(gèng)好(hǎo)。反过来，如果数据主要来自英文或者其他语言，那么AI在处理这些语言的时候效率可能会更高。某些模型可能是专门为某种语言而设计的，在这种情况下，在该语言上的效率自然就会更高。

关于中文在AI领域是否具有显著的优势，目前尚无定论，未来如何挖掘中文的潜在优势可能将成为重要的研究方向。

为什么在回答用户问题的时候，DeepSeek可以展示其“深度思考过程”？

DeepSeek-R1在回答用户问题时可以展示其深度思考过程是因为它使用了思维链（Chain of Thought, CoT）技术。思维链技术模仿人类的思考方式，它要求模型将复杂任务分解成简单步骤然后再逐步解决，从而增强模型在复杂推理任务中的能力。

OpenAI的o系列模型也使用了思维链技术，但OpenAI并未向用户公开模型的原始思维链，而是仅提供了一个思维链的总结。而DeepSeek-R1作为开源模型，则完全开放了思维链，用户可以清晰地看到模型在解决问题时的全部推理过程。

ChatGPT与(yǔ)DeepSeek分(fēn)别(bié)有(yǒu)哪(nǎ)些(xiē)特(tè)点(diǎn)？它(tā)们(men)是(shì)否(fǒu)代(dài)表(biǎo)AI大(dà)模(mó)型(xíng)以(yǐ)后(hòu)的(de)两(liǎng)种(zhǒng)发(fā)展(zhǎn)方(fāng)向(xiàng)，还(hái)是(shì)会(huì)融(róng)合(hé)发(fā)展(zhǎn)？

ChatGPT基(jī)于(yú)OpenAI的(de)GPT系(xì)列(liè)模(mó)型(xíng)，使(shǐ)用(yòng)了(le)大(dà)量(liàng)多(duō)语(yǔ)言(yán)数(shù)据(jù)进(jìn)行(xíng)训(xun)练(liàn)，支(zhī)持(chí)多(duō)语(yǔ)言(yán)、多(duō)模(mó)态(tài)，能(néng)够(gòu)跨(kuà)语(yǔ)言(yán)和(hé)跨(kuà)领(lǐng)域提(tí)供(gōng)服(fú)务(wu)。作(zuò)为(wèi)闭(bì)源(yuán)模(mó)型(xíng)，它(tā)由(yóu)OpenAI为(wèi)用(yòng)户(hù)提(tí)供(gōng)在(zài)线(xiàn)服(fú)务(wu)。

DeepSeek则(zé)在(zài)中(zhōng)文领(lǐng)域进(jìn)行(xíng)了(le)优(yōu)化(huà)，拥(yōng)有(yǒu)较(jiào)低(dī)的(de)训(xun)练(liàn)和(hé)推(tuī)理(lǐ)成(chéng)本(běn)。DeepSeek是(shì)开(kāi)源(yuán)模(mó)型(xíng)，用(yòng)户(hù)可(kě)以(yǐ)根(gēn)据(jù)需(xū)要(yào)自(zì)行(xíng)部(bù)署(shǔ)并(bìng)进(jìn)行(xíng)定(dìng)制(zhì)化(huà)修(xiū)改(gǎi)。目(mù)前(qián)它(tā)们(men)的(de)技(jì)术(shù)架(jià)构(gòu)和(hé)市(shì)场(chǎng)定(dìng)位(wèi)都(dōu)有(yǒu)所(suǒ)不(bù)同(tóng)，但(dàn)随着技术的发展，未来可能会出现更多相互借鉴融(róng)合(hé)的(de)趋(qū)势(shì)，例(lì)如(rú)DeepSeek可能会借鉴ChatGPT的多模态能力，ChatGPT也可能会优化其本地化服务以应对DeepSeek等竞争对手的挑战。

DeepSeek发布的是开源模型，开源以后，后面应当如何保持领先？

DeepSeek的创始人梁文锋表示，现在的生成式人工智能并不是终点，未来的目标是朝着实现通用人工智能迈进。在AI技术快速发展的当下，大家都没有碾压对手的技术优势，即使闭源也无法阻止被别人赶超。为了应对这一挑战，他们希望将价值沉淀在团队的成长之中，通过持续的(de)创(chuàng)新(xīn)来(lái)保(bǎo)持(chí)领(lǐng)先(xiān)。开(kāi)源(yuán)的(de)决(jué)策(cè)正(zhèng)是(shì)基(jī)于(yú)这(zhè)一(yī)考(kǎo)量(liàng)，开(kāi)源(yuán)可(kě)以(yǐ)打(dǎ)破(pò)技(jì)术(shù)垄(lǒng)断(duàn)，降(jiàng)低(dī)技(jì)术(shù)门(mén)槛(kǎn)，激(jī)发(fā)更(gèng)广(guǎng)泛(fàn)的(de)技(jì)术(shù)合(hé)作(zuò)与(yǔ)创(chuàng)新(xīn)。开(kāi)源(yuán)能(néng)够(gòu)吸(xī)引(yǐn)更(gèng)多(duō)的(de)开(kāi)发(fā)者(zhě)共(gòng)同(tóng)参(cān)与(yǔ)贡(gòng)献(xiàn)，构(gòu)建(jiàn)一(yī)个(gè)开(kāi)放(fàng)与(yǔ)多(duō)元(yuán)化(huà)的(de)技(jì)术(shù)发(fā)展(zhǎn)环(huán)境(jìng)。DeepSeek希(xī)望(wàng)通(tōng)过(guò)这(zhè)种(zhǒng)方(fāng)式(shì)推(tuī)动(dòng)技(jì)术(shù)的(de)长(zhǎng)远(yuǎn)发(fā)展(zhǎn)，保(bǎo)持(chí)领(lǐng)先(xiān)地(de)位(wèi)，成(chéng)为(wèi)AI技(jì)术(shù)的(de)引(yǐn)领(lǐng)者(zhě)。

打(dǎ)开(kāi)使(shǐ)用(yòng)页(yè)面(miàn)，有(yǒu)“深(shēn)度(dù)思(sī)考(kǎo)（R1）”和(hé)“联(lián)网(wǎng)搜(sōu)索(suǒ)”选(xuǎn)项(xiàng)，二(èr)者(zhě)在(zài)使(shǐ)用(yòng)上(shàng)有(yǒu)何(hé)区(qū)别(bié)？如(rú)何(hé)能(néng)更(gèng)好地使(shǐ)用(yòng)这(zhè)种(zhǒng)推(tuī)理(lǐ)型(xíng)大(dà)模(mó)型(xíng)？

打(dǎ)开(kāi)深(shēn)度(dù)思(sī)考(kǎo)（R1）选(xuǎn)项(xiàng)后(hòu)，后(hòu)台(tái)会(huì)切(qiè)换(huàn)到(dào)DeepSeek-R1模(mó)型(xíng)，这(zhè)个(gè)模(mó)型(xíng)专(zhuān)注(zhù)于(yú)需(xū)要(yào)复(fù)杂(zá)推(tuī)理(lǐ)的(de)场(chǎng)景(jǐng)，如(rú)数(shù)学(xué)或(huò)编(biān)程(chéng)方(fāng)面(miàn)的(de)问(wèn)题(tí)。它(tā)能(néng)够(gòu)展(zhǎn)示(shì)详(xiáng)细(xì)的(de)思(sī)维(wéi)过(guò)程(chéng)，提(tí)供(gōng)推(tuī)理(lǐ)步(bù)骤(zhòu)与(yǔ)最(zuì)终(zhōng)结(jié)果(guǒ)。

联(lián)网(wǎng)搜(sōu)索(suǒ)选(xuǎn)项(xiàng)则(zé)允(yǔn)许(xǔ)模(mó)型(xíng)获(huò)取(qǔ)实(shí)时(shí)互(hù)联(lián)网(wǎng)搜(sōu)索(suǒ)的(de)结(jié)果(guǒ)，适(shì)用(yòng)于(yú)时(shí)效(xiào)性(xìng)较(jiào)强(qiáng)、需(xū)要(yào)获(huò)取(qǔ)最(zuì)新(xīn)信(xìn)息(xi)的(de)问(wèn)题(tí)，模(mó)型(xíng)可(kě)以(yǐ)根(gēn)据(jù)搜(sōu)索(suǒ)结(jié)果(guǒ)提(tí)供(gōng)实(shí)时(shí)更(gèng)新(xīn)的(de)答(dá)案(àn)。

在(zài)使(shǐ)用(yòng)深(shēn)度(dù)思(sī)考(kǎo)（R1）功(gōng)能(néng)时，在提问中用户无需额外引导模型进行思考，只需要明确表达自己的需求，避免模糊不清的表述，以便模型更好地理解并提供准确的答案。在深度思考模式下，除了模型的最终答案外，用户还可以关注模型给出的思考过程，从而更好地掌握解决问题的详细方法。

哪些领域的工作受到DeepSeek的可能冲击最大，甚至能被取代？

DeepSeek等大语言模型可能会对那些依赖信息检索、数据分析、重复性高且目标明确的行业产生冲击。例如内容创作、数据处理、翻译校对、人工客服、人力资源管理和财务审计等领域，可能会被自动化的AI技术所替代。AI可以高效地完成用户需求的任务，从而减少对人工的依赖。

然而，对于一些需要创造性、情感智力和人际沟通的工作来说，人工的参与仍然不可或缺。在AI技术飞速发展的当下，人们需要不断提升这些难以被AI轻易替代的能力。这些能力可以帮助个人在职场中保持竞争力，确保在未来的工作环境中，人与AI能实现更好的协作和互补，共同推动社会进步。

AI发展的速度怎么这么快？会越来越快吗？

AI在过去几年中迅速发展，这得益于多个因素的推动。

首先，计算能力的大幅提升，尤其是GPU等硬件技术的发展，使得AI模型能够处理更大规模的数据，训练出更复杂的模型，从而提升了整体性能。

其次，互联网技术的飞速发展为AI训练提供了丰富的数据库。同时，深度学习领域算法架构的突破，也使得AI的能力不断增强。近年来，科技公司和投资者纷纷看到了AI的潜力，并在资金和技术上给予了大力支持，这些因素共同促进了AI技术的飞跃发展。

虽然许多专家认为AI将在未来继续快速发展，但是否能够保持当前的速度仍然存在不确定性。乐观者认为，AI的进步将会呈现指数爆炸的趋势，随着AI智能的增长(zhǎng)，AI迭(dié)代(dài)的(de)速(sù)度(dù)将(jiāng)会(huì)越(yuè)来(lái)越(yuè)快(kuài)，最(zuì)终(zhōng)完(wán)全超(chāo)越(yuè)人(rén)类(lèi)。然(rán)而(ér)，算(suàn)力(lì)和(hé)数(shù)据(jù)可(kě)能(néng)会(huì)成(chéng)为(wèi)制(zhì)约(yuē)AI技(jì)术(shù)发(fā)展(zhǎn)的瓶颈，大型模型的训练需要越来越多的算力，而计算能力的发展目前已经不足以完全满足AI训练的需求。同时，人(rén)类现有的数据在未来几年内可能会被耗尽。

未来AI技术如何突破算力和数据的瓶颈，继续飞速发展，仍然需(xū)要全世界科研人员的共同努力。此外，AI可能引发的伦理、法律与社会问题也逐渐引起了人们的担忧，一些科学家已经呼吁暂停开发更(gèng)强大的AI系统，直至人们可以确保其安全性和可控性。

参考资料：

1.https://en.wikipedia.org/wiki/DeepSeek

2.https://api-docs.deepseek.com/zh-cn/news/news1226

3.https://api-docs.deepseek.com/zh-cn/news/news250120

4.Liu, A., Feng, B., Xue, B., Wang, B., Wu, B., Lu, C., ... & Piao, Y. (2024). Deepseek-v3 technical report. arXiv preprint arXiv:2412.19437.

5.Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). Deepseek-r1: Incentivizing reasoning capability in llms via reinforcement learning. arXiv preprint arXiv:2501.12948.