梁文鋒現(xiàn)身背后，DeepSeek如何加速國產(chǎn)算力進程？

Connor 歐意交易所 2025-02-18 33 0

出品 | 搜狐科技

作者 | 梁昌均

編輯 | 楊錦

過去一段時間，業(yè)界對DeepSeek的討論，不再局限于其技術創(chuàng)新帶來的對大模型發(fā)展范式的改變。更重要的是，它還以一己之力，帶動了中國AI生態(tài)圈的廣泛參與。

從底層算力、云平臺等基礎設施，到中間層的infra廠商，再到下游應用，包括互聯(lián)網(wǎng)、汽車、智能硬件/智能家居、金融、教育、醫(yī)藥、傳媒等領域企業(yè)，從巨頭到創(chuàng)業(yè)公司，DeepSeek朋友圈持續(xù)擴大。

據(jù)不完全統(tǒng)計，目前與DeepSeek合作的企業(yè)已有百余家。2月17日，DeepSeek創(chuàng)始人梁文鋒還出席了民營企業(yè)座談會，這是他近期第二次現(xiàn)身國家高規(guī)格會議。

DeepSeek的熱潮能否持續(xù)？它的技術創(chuàng)新對AI技術發(fā)展會帶來什么影響？國產(chǎn)算力會加快誕生中國版英偉達嗎？

近日，在搜狐科技《AI十二談》沙龍中，燧原科技首席生態(tài)官李星宇、并行科技AI云事業(yè)部總經(jīng)理趙鴻冰、昊問大模型CEO穆澤林、中科加禾CTO陳龍、鼎興量子主管合伙人陳大志、清昴智能市場合伙人何逸豪，圍繞這些問題進行了深入探討。

試解DeepSeek突圍密碼

談及DeepSeek的爆火，嘉賓們對它的推理能力、理解能力、深度思考能力、輸出詳盡程度和流暢程度，以及推理過程的透明度、多輪對話能力等方面的表現(xiàn)印象深刻。

這背后則是DeepSeek在訓練、架構、算法等多個層面上的技術創(chuàng)新，并借此形成低成本、高性能的高性價比優(yōu)勢。

李星宇強調，DeepSeek的創(chuàng)新體現(xiàn)在工程化方面，它并沒有在底層架構上發(fā)生變化，包括OpenAI在內(nèi)，都是工程創(chuàng)新的典范。

展開全文

他認為，漸進式的工程化創(chuàng)新，符合技術周期的發(fā)展節(jié)奏，通過接力的方式，能夠持續(xù)不斷地把新技術推進到商業(yè)化的進程里去。

穆澤林也提到，DeepSeek所做的工程化創(chuàng)新，能夠解決應用最后100米的問題?！斑@能讓整個中國的AI產(chǎn)業(yè)擁有更持久的生命力，讓AI更快走到應用，產(chǎn)生持續(xù)的商業(yè)模式?！?/p>

在陳龍看來，DeepSeek能夠把訓練成本大幅壓縮，經(jīng)過了前期版本的深厚積累和迭代優(yōu)化。他同樣強調，工程化創(chuàng)新在計算機領域也非常重要，大量的工程實踐會催生技術的進步。

趙鴻冰表示，DeepSeek可能達到了顛覆性——它不僅實現(xiàn)了AI能力等級的提升，同時加速了AI的普及，達到1億用戶用了最短的時間。

不過，何逸豪認為，在技術和工程方面，DeepSeek確實有創(chuàng)新，但可能還達不到其所認為的顛覆性。“創(chuàng)新通常包括破壞式創(chuàng)新和延續(xù)性創(chuàng)新，DeepSeek更多是延續(xù)性創(chuàng)新?！?/p>

無論如何，DeepSeek的成功，一定程度代表中國AI有實現(xiàn)反超甚至引領的機會。

在趙鴻冰看來，DeepSeek的出圈離不開三個因素：高人才密度，有理想，不差錢。陳大志則認為，DeepSeek有兩個特點可能是成功的重要因素，一是資金的屬性是自有資金，具有更高的靈活性和自由度；二是其不拘一格的用人理念。

“這使得DeepSeek的可復制性不強?！标惔笾菊J為，如果按DeepSeek的模式再去找同樣的企業(yè)，不一定能找得到第二家，即便找到，也不一定能達得到DeepSeek這樣的高度。

在李星宇看來，DeepSeek現(xiàn)象級的成功，給中國創(chuàng)業(yè)者帶來非常有意義的啟發(fā)。一是要使命愿景驅動；二是要扎扎實實，堅持長期主義；三是反共識的思考；四是開放共贏的心態(tài)。

開源，還是閉源？DeepSeek肯定還有后招

DeepSeek的成功，還離不開它的開源策略。除了數(shù)據(jù)，它將模型代碼、參數(shù)權重、算法架構等重要指標都對外公布，并采用了相對寬松的商業(yè)化開源協(xié)議。

這也使得多家公司紛紛反思或調整起自己的策略，比如山姆·奧特曼認為OpenAI可能站在了歷史錯誤的一邊，百度則迅速宣布文心一言免費，并計劃開源下一代模型。

陳大志從市場的角度談到，未來開源更有優(yōu)勢。“做大模型的目的最終是啥？是拿到用戶，因此開源具有不可比擬的優(yōu)勢?！笔紫纫尶蛻羰褂闷饋恚拍茏尭嗟娜藚⑴c進來共同完善生態(tài)。

陳龍則判斷，開源和閉源將是共存的局面。但從整個社會效益或大眾受益程度上講，開源共享程度更高，間接降低重復開發(fā)的整體社會成本。

“不管是開源還是閉源，核心問題還是怎么能夠形成一個良好的商業(yè)閉環(huán)，包括如何間接去推動算力等整個產(chǎn)業(yè)鏈良性運轉起來?！标慅堈f。

從IT發(fā)展歷史看，開源和閉源共存是主流。李星宇認為，技術開源的意義在于擊敗競爭對手，而商業(yè)上閉源的意義在于形成完整的商業(yè)模式，可以同時存在，比如安卓開源、GMS閉源，就采取了這樣的策略。

他判斷，未來開源是一種基礎性的保證，在開源基礎上，會有大量增值的商業(yè)模式構建出來，從而能夠有雙贏的效果。

趙鴻冰則表示，開源閉源各有優(yōu)劣，OpenAI是否會再次開源，仍有非常大的不確定性。

何逸豪對開源的理解是——技術上的秀肌肉，不怕別人抄?！癉eepSeek敢開源，說明肯定有后招，我覺得沒有誰會一上來把自己的全部武器都掏出來?！?/p>

他認為，開源能夠更好地去促進整個市場和技術的發(fā)展，也會刺激閉源，刺激技術的提升，這是良性的市場競爭。

巨頭囤算力沒有意義了？相反！

DeepSeek的低成本，還引發(fā)了對大模型發(fā)展法則——Scaling Law的質疑。通過堆算力的方式，對大模型技術發(fā)展來說是否還具備可持續(xù)性？

在李星宇看來，DeepSeek對Scaling Law不是顛覆的關系，而是相輔相成的關系。

“Scaling Law有點像武俠里面的氣宗，而DeepSeek有點像劍宗。哪個更重要？實際上都重要，俠之大者是劍氣合一，才能問鼎華山之巔。從這個意義上來講，DeepSeek給大模型技術發(fā)展開辟了第二戰(zhàn)場?！?/p>

他認為，DeepSeek的出現(xiàn)直接改變的是算力結構，并判斷2025年推理算力會反超訓練算力。這并不意味著訓練算力會萎縮。雖然堆算力帶來的邊際效應在遞減，但隨著解鎖更多應用以后，還會把訓練需求再次拉起來。

“只不過，推理算力的增長可能是十倍級別，更夸張?！崩钚怯钫J為，“算力的高速增長還會帶來單價的下降，能夠解鎖更多的應用，從而進入良性循環(huán)，所以我們真的是迎來了算力和模型應用的黃金時代。”

陳龍同樣認為，算力需求會從訓練側往推理側轉移，而且推理側的算力需求，可能比訓練側將是數(shù)量級以上的提升。這會促進對算力多樣性的要求，并催生應用、算力運營、算力優(yōu)化、算力集成等相關產(chǎn)業(yè)發(fā)展，推動行業(yè)分工越來越細。

對于訓練側算力不會萎縮的原因，陳龍解釋到，大模型的能力還沒有達到人們預想的天花板。“我認為，企業(yè)能拿到越多的算力越好，算力需求可能還會持續(xù)?！?/p>

此外，李星宇強調，這并不意味著巨頭囤算力這事兒沒有意義，反而DeepSeek進一步刺激了巨頭通過算力優(yōu)勢，去重新奪回領導權的沖動。

這或許可以很好解釋，為什么科技巨頭，包括微軟、谷歌、亞馬遜、Meta的CEO都對DeepSeek表示震驚，也都紛紛表示，將在今年加大對AI、數(shù)據(jù)中心等基礎設施的資本投入。李彥宏也放話稱，不會停止對AI的投資。

某種程度上，DeepSeek的成功刺激了巨頭們通過加強投入來保持領先的決心。但它對很多創(chuàng)業(yè)公司而言，則提供了一個值得借鑒的發(fā)展樣本。

李星宇就提到，DeepSeek使得算法平權以后，更多的小型玩家可以在市場上立足。陳龍則呼吁，“我們不能人為給自己加枷鎖，覺得自己受限，就不往更大更強的方向去發(fā)展。”

中國版英偉達或將加快誕生

隨著DeepSeek的爆火，國內(nèi)十多家國產(chǎn)芯片廠商，紛紛去做適配。燧原科技在春節(jié)假期后第二天就上線了DeepSeek全量模型的適配，并聯(lián)合并行科技、中科加禾等合作伙伴，持續(xù)推進DeepSeek模型的系統(tǒng)級優(yōu)化。

被寄予厚望的國產(chǎn)算力站到聚光燈下，華為、燧原科技等國產(chǎn)芯片廠商能否借此加快突破，成為業(yè)內(nèi)關注焦點。

談及為何要去做適配DeepSeek，李星宇解釋道，這是國產(chǎn)算力在技術層面第一次有了一個可以不用跟隨英偉達的理由，而是可以跟隨DeepSeek深度進行軟硬協(xié)同的設計。這使得國產(chǎn)算力有信心能夠走出一條獨立發(fā)展的技術道路，而不是完全cosplay英偉達。

“國產(chǎn)算力最大的挑戰(zhàn)是商業(yè)化落地很困難，并不是技術。”李星宇認為，國產(chǎn)算力跟英偉達算力的差距，并不在于性能，而是國產(chǎn)算力沒有建立一個很好的算法生態(tài)。這在過去兩年時間里面，成為整個國產(chǎn)GPU行業(yè)最大的難題。

“DeepSeek的出現(xiàn)極大帶動了國產(chǎn)算力的商業(yè)化進程，且下游應用也已經(jīng)呈現(xiàn)井噴式的發(fā)展，可以說國產(chǎn)算力真正的春天來了?！崩钚怯钫f。

“這是國產(chǎn)算力第一次被廣泛接受，它解鎖了國產(chǎn)算力導入到創(chuàng)新領域的大門。”李星宇認為，未來會看到越來越多的創(chuàng)新公司，采用國產(chǎn)算力去做后訓練，去做思維鏈，去做各種垂類模型應用，這對國產(chǎn)算力和國產(chǎn)模型玩家來講都是雙贏的事情。

他進一步表示，現(xiàn)在模型已經(jīng)透明化，國產(chǎn)算力未來優(yōu)化之路會比原來要平坦很多。從這個意義上，它一定會縮短跟國外算力上的差距。

對是否會有中國版英偉達的出現(xiàn)，陳龍的看法是，國內(nèi)有足夠多的數(shù)據(jù)，也有足夠大的市場，要借鑒英偉達崛起的啟示，首先把算力做上來，然后盡量開放。

“廣大的數(shù)據(jù)、用戶、應用市場一起驅動，可以極大激發(fā)行業(yè)圍繞國產(chǎn)算力去做優(yōu)化的熱情，從而把整個生態(tài)豐富完善起來。”

穆澤林對此表示，在訓練方面還是會傾向英偉達，但中國百分百可以出現(xiàn)一個端側英偉達?！巴评硇酒瑖鴥?nèi)外差別已經(jīng)不是很大，而且中國的生態(tài)，對國內(nèi)做推理芯片的企業(yè)有很大機會?！?/p>

李星宇顯得更加樂觀?！爸灰诙松铣蔀橥跽咭院螅匀粫ㄓ妙I域挺進，最終成為通用王者?！边@也正是英偉達所走的路。