不卡在线播放一区二区三区_国产成人精品在线_亚洲精品无码人妻久久精品_午夜福利国产无码一区_免费无码国产在线观_日韩精品一区二区三区中文精品_中文字幕无线乱码人妻

梁文鋒現(xiàn)身背后,DeepSeek如何加速國產(chǎn)算力進程?

Connor 歐意交易所 2025-02-18 32 0

梁文鋒現(xiàn)身背后,DeepSeek如何加速國產(chǎn)算力進程?

出品 | 搜狐科技

作者 | 梁昌均

編輯 | 楊錦

過去一段時間,業(yè)界對DeepSeek的討論,不再局限于其技術(shù)創(chuàng)新帶來的對大模型發(fā)展范式的改變。更重要的是,它還以一己之力,帶動了中國AI生態(tài)圈的廣泛參與。

從底層算力、云平臺等基礎設施,到中間層的infra廠商,再到下游應用,包括互聯(lián)網(wǎng)、汽車、智能硬件/智能家居、金融、教育、醫(yī)藥、傳媒等領(lǐng)域企業(yè),從巨頭到創(chuàng)業(yè)公司,DeepSeek朋友圈持續(xù)擴大。

據(jù)不完全統(tǒng)計,目前與DeepSeek合作的企業(yè)已有百余家。2月17日,DeepSeek創(chuàng)始人梁文鋒還出席了民營企業(yè)座談會,這是他近期第二次現(xiàn)身國家高規(guī)格會議。

DeepSeek的熱潮能否持續(xù)?它的技術(shù)創(chuàng)新對AI技術(shù)發(fā)展會帶來什么影響?國產(chǎn)算力會加快誕生中國版英偉達嗎?

近日,在搜狐科技《AI十二談》沙龍中,燧原科技首席生態(tài)官李星宇、并行科技AI云事業(yè)部總經(jīng)理趙鴻冰、昊問大模型CEO穆澤林、中科加禾CTO陳龍、鼎興量子主管合伙人陳大志、清昴智能市場合伙人何逸豪,圍繞這些問題進行了深入探討。

試解DeepSeek突圍密碼

談及DeepSeek的爆火,嘉賓們對它的推理能力、理解能力、深度思考能力、輸出詳盡程度和流暢程度,以及推理過程的透明度、多輪對話能力等方面的表現(xiàn)印象深刻。

這背后則是DeepSeek在訓練、架構(gòu)、算法等多個層面上的技術(shù)創(chuàng)新,并借此形成低成本、高性能的高性價比優(yōu)勢。

李星宇強調(diào),DeepSeek的創(chuàng)新體現(xiàn)在工程化方面,它并沒有在底層架構(gòu)上發(fā)生變化,包括OpenAI在內(nèi),都是工程創(chuàng)新的典范。

展開全文

他認為,漸進式的工程化創(chuàng)新,符合技術(shù)周期的發(fā)展節(jié)奏,通過接力的方式,能夠持續(xù)不斷地把新技術(shù)推進到商業(yè)化的進程里去。

穆澤林也提到,DeepSeek所做的工程化創(chuàng)新,能夠解決應用最后100米的問題?!斑@能讓整個中國的AI產(chǎn)業(yè)擁有更持久的生命力,讓AI更快走到應用,產(chǎn)生持續(xù)的商業(yè)模式?!?/p>

在陳龍看來,DeepSeek能夠把訓練成本大幅壓縮,經(jīng)過了前期版本的深厚積累和迭代優(yōu)化。他同樣強調(diào),工程化創(chuàng)新在計算機領(lǐng)域也非常重要,大量的工程實踐會催生技術(shù)的進步。

趙鴻冰表示,DeepSeek可能達到了顛覆性——它不僅實現(xiàn)了AI能力等級的提升,同時加速了AI的普及,達到1億用戶用了最短的時間。

不過,何逸豪認為,在技術(shù)和工程方面,DeepSeek確實有創(chuàng)新,但可能還達不到其所認為的顛覆性?!皠?chuàng)新通常包括破壞式創(chuàng)新和延續(xù)性創(chuàng)新,DeepSeek更多是延續(xù)性創(chuàng)新?!?/p>

無論如何,DeepSeek的成功,一定程度代表中國AI有實現(xiàn)反超甚至引領(lǐng)的機會。

在趙鴻冰看來,DeepSeek的出圈離不開三個因素:高人才密度,有理想,不差錢。陳大志則認為,DeepSeek有兩個特點可能是成功的重要因素,一是資金的屬性是自有資金,具有更高的靈活性和自由度;二是其不拘一格的用人理念。

“這使得DeepSeek的可復制性不強?!标惔笾菊J為,如果按DeepSeek的模式再去找同樣的企業(yè),不一定能找得到第二家,即便找到,也不一定能達得到DeepSeek這樣的高度。

在李星宇看來,DeepSeek現(xiàn)象級的成功,給中國創(chuàng)業(yè)者帶來非常有意義的啟發(fā)。一是要使命愿景驅(qū)動;二是要扎扎實實,堅持長期主義;三是反共識的思考;四是開放共贏的心態(tài)。

開源,還是閉源?DeepSeek肯定還有后招

DeepSeek的成功,還離不開它的開源策略。除了數(shù)據(jù),它將模型代碼、參數(shù)權(quán)重、算法架構(gòu)等重要指標都對外公布,并采用了相對寬松的商業(yè)化開源協(xié)議。

這也使得多家公司紛紛反思或調(diào)整起自己的策略,比如山姆·奧特曼認為OpenAI可能站在了歷史錯誤的一邊,百度則迅速宣布文心一言免費,并計劃開源下一代模型。

陳大志從市場的角度談到,未來開源更有優(yōu)勢?!白龃竽P偷哪康淖罱K是啥?是拿到用戶,因此開源具有不可比擬的優(yōu)勢。”首先要讓客戶使用起來,才能讓更多的人參與進來共同完善生態(tài)。

陳龍則判斷,開源和閉源將是共存的局面。但從整個社會效益或大眾受益程度上講,開源共享程度更高,間接降低重復開發(fā)的整體社會成本。

“不管是開源還是閉源,核心問題還是怎么能夠形成一個良好的商業(yè)閉環(huán),包括如何間接去推動算力等整個產(chǎn)業(yè)鏈良性運轉(zhuǎn)起來。”陳龍說。

從IT發(fā)展歷史看,開源和閉源共存是主流。李星宇認為,技術(shù)開源的意義在于擊敗競爭對手,而商業(yè)上閉源的意義在于形成完整的商業(yè)模式,可以同時存在,比如安卓開源、GMS閉源,就采取了這樣的策略。

他判斷,未來開源是一種基礎性的保證,在開源基礎上,會有大量增值的商業(yè)模式構(gòu)建出來,從而能夠有雙贏的效果。

趙鴻冰則表示,開源閉源各有優(yōu)劣,OpenAI是否會再次開源,仍有非常大的不確定性。

何逸豪對開源的理解是——技術(shù)上的秀肌肉,不怕別人抄?!癉eepSeek敢開源,說明肯定有后招,我覺得沒有誰會一上來把自己的全部武器都掏出來?!?/p>

他認為,開源能夠更好地去促進整個市場和技術(shù)的發(fā)展,也會刺激閉源,刺激技術(shù)的提升,這是良性的市場競爭。

巨頭囤算力沒有意義了?相反!

DeepSeek的低成本,還引發(fā)了對大模型發(fā)展法則——Scaling Law的質(zhì)疑。通過堆算力的方式,對大模型技術(shù)發(fā)展來說是否還具備可持續(xù)性?

在李星宇看來,DeepSeek對Scaling Law不是顛覆的關(guān)系,而是相輔相成的關(guān)系。

“Scaling Law有點像武俠里面的氣宗,而DeepSeek有點像劍宗。哪個更重要?實際上都重要,俠之大者是劍氣合一,才能問鼎華山之巔。從這個意義上來講,DeepSeek給大模型技術(shù)發(fā)展開辟了第二戰(zhàn)場?!?/p>

他認為,DeepSeek的出現(xiàn)直接改變的是算力結(jié)構(gòu),并判斷2025年推理算力會反超訓練算力。這并不意味著訓練算力會萎縮。雖然堆算力帶來的邊際效應在遞減,但隨著解鎖更多應用以后,還會把訓練需求再次拉起來。

“只不過,推理算力的增長可能是十倍級別,更夸張?!崩钚怯钫J為,“算力的高速增長還會帶來單價的下降,能夠解鎖更多的應用,從而進入良性循環(huán),所以我們真的是迎來了算力和模型應用的黃金時代。”

陳龍同樣認為,算力需求會從訓練側(cè)往推理側(cè)轉(zhuǎn)移,而且推理側(cè)的算力需求,可能比訓練側(cè)將是數(shù)量級以上的提升。這會促進對算力多樣性的要求,并催生應用、算力運營、算力優(yōu)化、算力集成等相關(guān)產(chǎn)業(yè)發(fā)展,推動行業(yè)分工越來越細。

對于訓練側(cè)算力不會萎縮的原因,陳龍解釋到,大模型的能力還沒有達到人們預想的天花板。“我認為,企業(yè)能拿到越多的算力越好,算力需求可能還會持續(xù)。”

此外,李星宇強調(diào),這并不意味著巨頭囤算力這事兒沒有意義,反而DeepSeek進一步刺激了巨頭通過算力優(yōu)勢,去重新奪回領(lǐng)導權(quán)的沖動。

這或許可以很好解釋,為什么科技巨頭,包括微軟、谷歌、亞馬遜、Meta的CEO都對DeepSeek表示震驚,也都紛紛表示,將在今年加大對AI、數(shù)據(jù)中心等基礎設施的資本投入。李彥宏也放話稱,不會停止對AI的投資。

某種程度上,DeepSeek的成功刺激了巨頭們通過加強投入來保持領(lǐng)先的決心。但它對很多創(chuàng)業(yè)公司而言,則提供了一個值得借鑒的發(fā)展樣本。

李星宇就提到,DeepSeek使得算法平權(quán)以后,更多的小型玩家可以在市場上立足。陳龍則呼吁,“我們不能人為給自己加枷鎖,覺得自己受限,就不往更大更強的方向去發(fā)展?!?/p>

中國版英偉達或?qū)⒓涌煺Q生

隨著DeepSeek的爆火,國內(nèi)十多家國產(chǎn)芯片廠商,紛紛去做適配。燧原科技在春節(jié)假期后第二天就上線了DeepSeek全量模型的適配,并聯(lián)合并行科技、中科加禾等合作伙伴,持續(xù)推進DeepSeek模型的系統(tǒng)級優(yōu)化。

被寄予厚望的國產(chǎn)算力站到聚光燈下,華為、燧原科技等國產(chǎn)芯片廠商能否借此加快突破,成為業(yè)內(nèi)關(guān)注焦點。

談及為何要去做適配DeepSeek,李星宇解釋道,這是國產(chǎn)算力在技術(shù)層面第一次有了一個可以不用跟隨英偉達的理由,而是可以跟隨DeepSeek深度進行軟硬協(xié)同的設計。這使得國產(chǎn)算力有信心能夠走出一條獨立發(fā)展的技術(shù)道路,而不是完全cosplay英偉達。

“國產(chǎn)算力最大的挑戰(zhàn)是商業(yè)化落地很困難,并不是技術(shù)?!崩钚怯钫J為,國產(chǎn)算力跟英偉達算力的差距,并不在于性能,而是國產(chǎn)算力沒有建立一個很好的算法生態(tài)。這在過去兩年時間里面,成為整個國產(chǎn)GPU行業(yè)最大的難題。

“DeepSeek的出現(xiàn)極大帶動了國產(chǎn)算力的商業(yè)化進程,且下游應用也已經(jīng)呈現(xiàn)井噴式的發(fā)展,可以說國產(chǎn)算力真正的春天來了?!崩钚怯钫f。

“這是國產(chǎn)算力第一次被廣泛接受,它解鎖了國產(chǎn)算力導入到創(chuàng)新領(lǐng)域的大門?!崩钚怯钫J為,未來會看到越來越多的創(chuàng)新公司,采用國產(chǎn)算力去做后訓練,去做思維鏈,去做各種垂類模型應用,這對國產(chǎn)算力和國產(chǎn)模型玩家來講都是雙贏的事情。

他進一步表示,現(xiàn)在模型已經(jīng)透明化,國產(chǎn)算力未來優(yōu)化之路會比原來要平坦很多。從這個意義上,它一定會縮短跟國外算力上的差距。

對是否會有中國版英偉達的出現(xiàn),陳龍的看法是,國內(nèi)有足夠多的數(shù)據(jù),也有足夠大的市場,要借鑒英偉達崛起的啟示,首先把算力做上來,然后盡量開放。

“廣大的數(shù)據(jù)、用戶、應用市場一起驅(qū)動,可以極大激發(fā)行業(yè)圍繞國產(chǎn)算力去做優(yōu)化的熱情,從而把整個生態(tài)豐富完善起來?!?/p>

穆澤林對此表示,在訓練方面還是會傾向英偉達,但中國百分百可以出現(xiàn)一個端側(cè)英偉達。“推理芯片國內(nèi)外差別已經(jīng)不是很大,而且中國的生態(tài),對國內(nèi)做推理芯片的企業(yè)有很大機會?!?/p>

李星宇顯得更加樂觀?!爸灰诙松铣蔀橥跽咭院?,自然會往通用領(lǐng)域挺進,最終成為通用王者?!边@也正是英偉達所走的路。

評論