挖貝網(wǎng)> 產(chǎn)業(yè)> 詳情
重大升級 | SecGPT V2.0:打造真正“懂安全”的大模型
2025 年,AI不再只是內容生成工具,它正成為各行各業(yè)的“第二大腦”。
隨著(zhù)GPT-4.5、DeepSeek等新一代大模型的崛起,我們正進(jìn)入Agentic AI(智能體AI)的時(shí)代—— 它不僅能對話(huà),還能思考、執行和協(xié)作,正在重塑整個(gè)生產(chǎn)力范式:
AI Coding:開(kāi)發(fā)者從寫(xiě)代碼者,變?yōu)榧軜嫀熀椭笓]官
Deep Research:安全研究員配備“超級助手”,漏洞分析效率倍增
Security Copilot:SecGPT不再是提示詞工具,而是實(shí)戰中的“作戰參謀”
“模型即產(chǎn)品”正在成為現實(shí),Agentic AI 正走入你我身邊。
—— 引用自海外獨角獸發(fā)布材料
而這一次,云起無(wú)垠沒(méi)有止步于“能用”,我們在追求“好用”的同時(shí),更關(guān)注真正實(shí)戰可落地的AI安全能力。
從模型訓練、數據構建、能力評測,到安全Copilot應用,我們打造出更聰明、更安全、更懂安全的SecGPT 2.0。開(kāi)源模型可以去github下載使用。
下一站,我們將共同邁入Agentic Security的未來(lái)。
歡迎加入這場(chǎng)由“安全智能體”引領(lǐng)的技術(shù)革新!
01什么是SecGPT?
在通用大模型席卷全球的今天,云起無(wú)垠選擇了一條不同的路:打造真正懂網(wǎng)絡(luò )安全的大模型。
這不是一次“技術(shù)熱潮”的追隨,而是一次面向實(shí)戰的系統性創(chuàng )新。
SecGPT,正是我們在2023年推出的開(kāi)源成果——全球首個(gè)聚焦網(wǎng)絡(luò )安全的大模型。
|我們希望它不只是“會(huì )說(shuō)安全”,而是真正能“做安全”的智能體。
自發(fā)布以來(lái),SecGPT持續受到全球安全技術(shù)社區的高度關(guān)注:
GitHub收獲Star數突破2,300+
HuggingFace下載量超過(guò)10,000+
被數十家安全團隊用于安全問(wèn)答、漏洞歸因、攻防演練等實(shí)戰任務(wù)
SecGPT 能做什么?
SecGPT融合了自然語(yǔ)言理解、代碼生成、安全知識推理等核心能力,已經(jīng)能夠勝任多種關(guān)鍵安全任務(wù):
漏洞分析:識別漏洞成因、評估影響范圍、提出修復建議
日志/流量溯源:輔助分析攻擊鏈、復原攻擊路徑
異常檢測:解析網(wǎng)絡(luò )行為,判斷是否存在潛在威脅
攻防推理:支持紅隊演練/藍隊研判,完成多輪策略分析
命令解析:識別腳本意圖,揭示潛在風(fēng)險操作
知識問(wèn)答:成為團隊“即問(wèn)即答”的安全知識庫
這些能力不再停留在“能回答”,而是可以被“調用”、“組合”、“協(xié)同”執行,支撐起復雜的安全智能任務(wù)流。
SecGPT 的定位:安全智能體的核心引擎
在“云起AI安全大腦”體系中,SecGPT是整個(gè)系統的統一語(yǔ)言理解與推理核心。
理解自然語(yǔ)言:大幅降低使用門(mén)檻,助力非安全專(zhuān)家也能上手
融合安全知識:具備上下文關(guān)聯(lián)與多步推理能力
持續學(xué)習反饋:具備智能體持續優(yōu)化、自我增強的能力
無(wú)論是作為單點(diǎn)智能助手,還是嵌入式任務(wù)引擎,SecGPT都已具備強大的適配性、擴展性與安全可控性。
02為什么我們要持續更新SecGPT?
自2023年SecGPT開(kāi)源以來(lái),大語(yǔ)言模型技術(shù)持續突飛猛進(jìn)。從語(yǔ)言理解到邏輯推理,再到工具調用與多任務(wù)協(xié)同,行業(yè)標準幾經(jīng)更替,邁入智能體(Agentic AI)時(shí)代。與此同時(shí),云起無(wú)垠也在持續推進(jìn)商業(yè)版安全大模型 SecGPT Pro 的多輪迭代,核心能力已實(shí)現代際躍升。
但開(kāi)源版本仍停留在早期階段,在語(yǔ)言表達、安全理解與接口兼容性方面逐漸顯現出技術(shù)邊界,難以應對當前復雜多變的安全任務(wù)需求。因此,我們決定對SecGPT開(kāi)源模型進(jìn)行全面升級,持續回饋全球安全社區,并助推安全智能體在更多場(chǎng)景中的落地與演化。
1)模型基礎設施演進(jìn),舊模型能力邊界逐漸暴露
大語(yǔ)言模型領(lǐng)域的基礎設施已經(jīng)發(fā)生底層變動(dòng)。相比早期模型,新一代模型具備更長(cháng)上下文處理能力、更高效的注意力機制、結構更清晰的工具調用接口,以及支持Agent工作流的任務(wù)控制能力。例如,支持MCP協(xié)議、ReAct思維鏈、Routing插件架構、Function Calling、工具上下文記憶、部署端的量化控制與微調架構等,都已成為安全智能體設計中的“新基礎”。
一旦開(kāi)源模型長(cháng)期不更新,將面臨以下技術(shù)脫節問(wèn)題:
無(wú)法適配新一代推理引擎(如 vLLM、TGI)
無(wú)法兼容結構化插件調用(Function/API 調度)
缺失任務(wù)鏈調度能力(Task-Aware Routing)
微調體系無(wú)法與最新安全數據對齊(SFT+RLHF+RAG混合)
隨著(zhù)智能體形態(tài)的普及,能力缺口將迅速放大,直接影響用戶(hù)體驗和模型落地價(jià)值。
2)安全任務(wù)結構升級,對模型能力提出多維要求
早期模型使用者多集中于問(wèn)答類(lèi)任務(wù),例如安全知識普及、命令解析、腳本理解等。這類(lèi)任務(wù)主要依賴(lài)語(yǔ)言理解能力,結構相對簡(jiǎn)單。然而,當安全模型真正進(jìn)入研發(fā)、攻防、運營(yíng)等實(shí)際場(chǎng)景后,任務(wù)呈現出明顯的結構化、多輪化、工具化趨勢:
漏洞鏈條重建→多日志輸入+多階段因果推理
多語(yǔ)言項目審計→代碼上下文建模+跨文件引用分析
安全知識圖譜構建→抽取實(shí)體/關(guān)系+圖結構生成
安全運營(yíng)協(xié)同→工具調度+狀態(tài)反饋+報告輸出
這類(lèi)任務(wù)要求模型不僅具備語(yǔ)義理解能力,還要具備:
推理路徑構建能力(Chain-of-Thought/Tree-of-Thought)
知識檢索與融合能力(用于語(yǔ)境增強與準確性提升)
任務(wù)規劃與階段控制能力(支持多輪次有狀態(tài)任務(wù)執行)
多工具協(xié)同使用能力(如模糊測試 + 漏洞掃描 + 資產(chǎn)識別)
原有SecGPT模型架構難以完成上述能力組合,僅靠 Prompt 注入或零樣本提示遠遠不夠。
3)現實(shí)挑戰:通用模型無(wú)法替代專(zhuān)業(yè)安全模型
盡管DeepSeek、Qwen、LLaMA等開(kāi)源大模型在通用語(yǔ)言理解、代碼生成等任務(wù)中取得顯著(zhù)進(jìn)展,但在安全場(chǎng)景下,它們面臨以下結構性瓶頸,尤其在企業(yè)級私有部署環(huán)境中更為突出:
(1)知識盲區廣泛,缺乏關(guān)鍵安全語(yǔ)料支撐
通用模型訓練語(yǔ)料以開(kāi)放領(lǐng)域為主,嚴重缺乏如下高價(jià)值安全語(yǔ)料:滲透測試日志、攻擊鏈行為樣本、系統調用軌跡、漏洞利用(PoC/Exp)、紅隊審計報告等。這直接限制了其對實(shí)戰攻防細節的掌握能力。
(2)語(yǔ)義建模能力薄弱,缺乏安全背景意識
在漏洞成因理解、系統語(yǔ)境建模、協(xié)議行為解析等任務(wù)中,通用模型的理解能力多停留在淺層表述,無(wú)法進(jìn)行因果鏈條建模與深層語(yǔ)義推理,缺乏“攻防語(yǔ)境”下的專(zhuān)業(yè)認知。
(3)工具接口調用不精準,缺失系統適配能力
通用模型未針對安全工具(如模糊測試框架、漏洞掃描器、靜態(tài)分析引擎等)進(jìn)行微調和適配,導致在調用第三方接口時(shí)經(jīng)常出現參數配置錯誤、上下文不匹配、調用邏輯混亂等問(wèn)題,嚴重影響任務(wù)可執行性和穩定性。
(4)任務(wù)鏈結構理解缺失,推理與執行脫節
安全任務(wù)往往涉及多步推理(理解→分析→調用工具→收集反饋→修復建議),通用模型缺乏對這類(lèi)“任務(wù)鏈”結構的建模能力,常常出現中途跳躍、邏輯斷裂、輸出不可收斂等現象,無(wú)法勝任復雜工作流調度任務(wù)。
當前通用大模型在安全場(chǎng)景中往往表現為“語(yǔ)言流暢但邏輯混亂,表達順暢但結果失真”。在真實(shí)系統環(huán)境下,其輸出容易出現答非所問(wèn)、指令不收斂、工具調用失敗、上下文錯亂等問(wèn)題,難以支撐企業(yè)對安全智能體高可信、高精度、高可控的實(shí)際需求。
03本次更新,SecGPT能力提升了哪些維度?
本輪升級,我們同步發(fā)布了1.5B / 7B / 14B三個(gè)模型規格,全面適配從低配CPU、本地4090 GPU到企業(yè)級多卡集群等多種運行環(huán)境,實(shí)現大模型能力的普適化落地。更大規模的32B、72B、671B旗艦版也將在后續分批開(kāi)放,進(jìn)一步支撐企業(yè)級復雜安全任務(wù)的多輪推理與智能決策。
本輪更新亮點(diǎn)
1. 更強的基座能力:通用+安全深度融合
我們基于Qwen2.5-Instruct系列與DeepSeek-R1系列基座模型,結合自建安全任務(wù)集與安全知識庫,在8臺A100 GPU集群上持續訓練一周以上,完成大規模預訓練 + 指令微調 + 強化學(xué)習,顯著(zhù)提升模型在安全場(chǎng)景中的理解、推理與響應能力。
下圖展示了一次訓練過(guò)程中各關(guān)鍵指標的演化軌跡:
訓練與驗證損失(train/loss 與 eval/loss):二者均呈現出平穩下降趨勢,說(shuō)明模型在訓練集與驗證集上均持續收斂,未出現過(guò)擬合跡象。
學(xué)習率曲線(xiàn)(train/learning_rate):采用典型的 Warmup + 衰減策略,有效提升了早期訓練的穩定性與收斂速度。
梯度范數(train/grad_norm):整體波動(dòng)平穩,僅在少數步數存在輕微尖峰,未出現梯度爆炸或消失,表明訓練過(guò)程健康穩定。
評估表現:eval/runtime與 eval/samples_per_second波動(dòng)范圍小,說(shuō)明在評估過(guò)程中系統資源使用高效,推理吞吐量穩定。
其他指標:如訓練輪數(train/epoch)、輸入token 數量(train/num_input_tokens_seen)等也表明訓練過(guò)程如期進(jìn)行,達成預期計劃。
模型訓練與評估過(guò)程示例圖
2. 更大的高質(zhì)量安全語(yǔ)料庫:私有 + 公共數據雙輪驅動(dòng)
我們已構建了一個(gè)超大規模、結構完備的網(wǎng)絡(luò )安全語(yǔ)料庫,總量超過(guò)5TB、共計106,721個(gè)原始文件,其中超過(guò) 40%內容為人工精選與結構化處理。私有數據部分系統整合了具備70+字段 / 14類(lèi)結構標簽體系的安全數據資源,經(jīng)過(guò)統一清洗、語(yǔ)義標注與重構,構建出數百億 Tokens 級的高質(zhì)量語(yǔ)料,為大模型深度推理能力提供堅實(shí)支撐。
下圖展示了該語(yǔ)料庫的構成維度,整體采集邏輯遵循“理論支撐 — 實(shí)戰對抗 — 應用落地”三層結構體系:
理論支撐:涵蓋法律法規、學(xué)術(shù)論文、行業(yè)報告等權威資料,為模型提供穩固的知識基座;
實(shí)戰對抗:包括漏洞詳情、CTF題庫、日志流量、惡意樣本與逆向分析等數據,提升模型對真實(shí)攻擊行為的識別與追蹤能力;
應用落地:涵蓋安全社區博客、教育培訓資料、安全知識圖譜與自動(dòng)化策略,增強模型在安全運營(yíng)、輔助決策等場(chǎng)景中的適配能力。
技術(shù)亮點(diǎn):
雙輪驅動(dòng)機制(私有 + 公共數據)保障語(yǔ)料在廣度與深度上的協(xié)同提升;
多維標簽體系使語(yǔ)料具備更強的結構化能力與上下文理解能力;
三層語(yǔ)料構建邏輯覆蓋從知識構建、威脅應對到實(shí)戰部署的完整安全任務(wù)鏈路。
3. 能力躍升:SecGPT正在蛻變?yōu)椤鞍踩帧?/p>
通過(guò)多輪數據優(yōu)化與任務(wù)精調,SecGPT已實(shí)現多個(gè)能力維度的跨越式進(jìn)展:
更懂攻擊鏈、攻防語(yǔ)言與行業(yè)術(shù)語(yǔ)
更擅長(cháng)處理復雜日志與漏洞描述
更適配私有化部署、邊緣推理等現實(shí)場(chǎng)景
核心能力提升詳解
1. 模型能力評測:全面指標躍升,實(shí)戰智能初現
為全面評估 SecGPT 的安全實(shí)戰能力,我們構建了一套覆蓋安全證書(shū)問(wèn)答、安全通識、編程能力、知識理解與推理能力的綜合評估體系,主要采用以下標準化數據集:CISSP、CS-EVAL、CEVAL、GSM8K、BBH。
在與原始模型 SecGPT-mini 的對比中,訓練后的模型在所有指標上均實(shí)現大幅躍升,具體如下:
1)模型橫向評測對比表
能力躍升解讀:
mini→1.5B:具備“能答對”的基礎問(wèn)答能力,適配中低復雜度任務(wù);
1.5B→7B:推理深度、泛化能力顯著(zhù)增強,能理解任務(wù)意圖并構建較為完整的解決路徑;
7B→14B:能力躍遷至“類(lèi)專(zhuān)家”級,能夠處理高復雜度推理、安全策略制定等高階任務(wù)。
模型橫向評測對比
相較于基礎模型 Qwen2.5-Instruct,SecGPT 在所有評測指標上均實(shí)現實(shí)質(zhì)性超越,反映出我們在數據構建、微調范式、安全任務(wù)精調機制上的整體優(yōu)化成效:
洞察亮點(diǎn):
在CISSP和CS-EVAL等安全類(lèi)數據集上,SecGPT 在所有參數規模下均表現優(yōu)于Qwen2.5同規格版本;
表明我們構建的安全任務(wù)指令集與精調策略已顯著(zhù)提升模型的實(shí)戰應用能力與專(zhuān)業(yè)問(wèn)答深度。
2. 安全能力提升:更全、更準、更專(zhuān)業(yè)
本輪升級中,SecGPT在安全知識問(wèn)答方面完成了從信息整合到邏輯輸出的能力躍遷,具體體現在:
知識覆蓋更全面:引入了涵蓋法律法規、攻擊戰術(shù)、逆向分析等14類(lèi)安全知識領(lǐng)域的結構化語(yǔ)料;
答案生成更精準:通過(guò)多輪對話(huà)控制與語(yǔ)義優(yōu)化技術(shù),提升了問(wèn)答對齊率與上下文記憶穩定性;
推理能力更突出:具備多段知識聯(lián)結與復合邏輯推演能力,能完成如攻擊鏈分析、威脅研判等復雜任務(wù)。
1)滲透測試場(chǎng)景能力
SecGPT 能夠模擬滲透攻擊流程,從信息收集、漏洞利用到提權橫向,具備關(guān)鍵工具命令分析、Payload 構造、利用鏈生成等能力。
2)日志分析和流量分析能力
在安全日志與網(wǎng)絡(luò )流量場(chǎng)景下,SecGPT 能自動(dòng)識別異常事件、構建攻擊鏈圖譜、抽取關(guān)鍵 IOC(Indicator of Compromise),輔助完成事件溯源與告警分類(lèi)。
3)逆向分析能力
基于對反匯編、API調用序列、加殼行為等低層數據的理解,SecGPT能輔助完成惡意樣本的靜態(tài)分析、特征提取與家族歸類(lèi),具備一定的逆向輔助解讀能力。
代碼
5)工具使用
04接下來(lái),我們要做的還有很多……
1. 發(fā)布首份網(wǎng)絡(luò )安全大模型基準評測報告
我們即將發(fā)布首份網(wǎng)絡(luò )安全大模型能力評測與選型報告,圍繞威脅情報問(wèn)答、代碼審計、日志分析等典型場(chǎng)景,構建一套系統化、透明且可復現的評測體系,全面對比當前主流模型的能力邊界。這份報告不僅為安全技術(shù)社區提供清晰的對比依據,也將成為合作伙伴制定Fine-tune策略 和智能體架構選型的關(guān)鍵參考材料。
2. 全面復盤(pán):如何訓練一個(gè)真正“懂安全”的大模型
盡管通用大模型在語(yǔ)言理解領(lǐng)域已取得顯著(zhù)進(jìn)展,但能夠真正理解攻擊鏈邏輯、漏洞細節、勝任安全推理與實(shí)戰輔助的大模型仍然稀缺。 我們將以全棧視角,全面復盤(pán)“如何訓練一個(gè)好用的安全大模型”,包括高質(zhì)量安全訓練數據構建、模型架構調優(yōu)、多任務(wù)對齊訓練、能力評測體系設計等關(guān)鍵環(huán)節,打通數據→算法→評測的閉環(huán)路徑,推動(dòng)安全智能體的實(shí)用化落地。
3. 自動(dòng)化 CTF 解題能力建設:邁向安全智能體的第一步
我們正在持續推進(jìn)SecGPT在CTF解題任務(wù)中的自動(dòng)化能力,目標是實(shí)現“理解題意 → 推理思路 → 構造Payload → 完成解題”的閉環(huán)流程。
目前模型已在大量真實(shí)題目中完成微調,具備初步能力:理解題意與還原考點(diǎn),自動(dòng)構造注入、命令執行、ROP等攻擊鏈,解釋與變換攻擊命令含義,同類(lèi)題型的遷移泛化表現良好。
下一步,我們將聚焦標準化數據構建、解題評分指標、自動(dòng)解題Agent原型開(kāi)發(fā),以及聯(lián)合社區開(kāi)展實(shí)戰挑戰驗證。CTF場(chǎng)景將成為安全大模型邁向Agent化的典型突破口。
4. 安全訓練數據集逐步開(kāi)放,共建數據基座
我們正在建設并逐步開(kāi)放一批具備混合結構、場(chǎng)景標簽的高質(zhì)量安全數據集,覆蓋知識問(wèn)答、代碼審計、漏洞挖掘、威脅情報解析、流量分析等關(guān)鍵任務(wù)場(chǎng)景。 未來(lái)將支持多語(yǔ)言、多模態(tài)、多任務(wù)協(xié)同訓練,進(jìn)一步增強安全大模型的泛化能力和實(shí)戰適應性。我們誠邀社區、企業(yè)、高校共同參與數據共建,共同筑牢安全模型的數據底座。
05最后,邀請你一起參與SecGPT的共建
SecGPT的成長(cháng)離不開(kāi)安全社區的反饋與參與。我們歡迎:
安全研究員提供數據、使用場(chǎng)景與測試建議
企業(yè)用戶(hù)參與內測,共同打造實(shí)用、可靠、安全的行業(yè)模型
歡迎關(guān)注我們,即將開(kāi)放下一輪模型內測與插件測試通道!
你最希望SecGPT能替你解決哪些安全難題?歡迎留言討論????
相關(guān)閱讀
- 260萬(wàn)用戶(hù)見(jiàn)證,沃爾沃全新XC60限時(shí)25.49萬(wàn)起,安全健康雙保障
- 2025新國標倒計時(shí):央視揭秘電動(dòng)兩輪車(chē)“非法改裝電池”安全隱患
- 宜信公益“石榴籽助學(xué)金”點(diǎn)亮卓資學(xué)子求學(xué)夢(mèng)
- 優(yōu)化公司治理結構 水晶光電推動(dòng)全球化戰略布局
- 解碼福華化學(xué)的綠色崛起之路
- 星驛付與慧徠店:科技驅動(dòng)升級,賦能數字商業(yè)新發(fā)展
- 高交會(huì )打造“科技強縣展區” 縣域經(jīng)濟迎來(lái)創(chuàng )新發(fā)展新引擎
- AP優(yōu)卡Web3合規先行,打造全球支付的安全護城河
- 西貝斬獲 “中國兒童餐第一品牌”,用溫度與健康詮釋家庭歡聚新內涵
- 華夏幸福高質(zhì)量服務(wù)中國企業(yè)出海:寧德時(shí)代印尼基地開(kāi)工
推薦閱讀
快訊 更多
- 07-09 13:16 | 三重煥新,啟航未來(lái)——Pivotal中文品牌發(fā)布暨喬遷新址、新官網(wǎng)上線(xiàn)
- 04-10 11:21 | 為“首發(fā)經(jīng)濟”注入創(chuàng )新動(dòng)力,CMEF見(jiàn)證寬騰醫學(xué)影像技術(shù)革新
- 02-20 18:53 | 手機也要上HBM芯片?三星計劃推出移動(dòng)版HBM,預計首款產(chǎn)品2028年上市
- 12-30 16:40 | 國產(chǎn)首款DDR5內存問(wèn)世!價(jià)格戰開(kāi)啟,復制長(cháng)江存儲擊敗三星路徑!
- 12-30 16:36 | 華為手機回歸第一年:全年銷(xiāo)量或超4000萬(wàn)臺 有望憑借Mate 70在高端市場(chǎng)擊敗蘋(píng)果
- 11-26 18:19 | 眾興菌業(yè)擬與漣水縣人民政府簽訂《招商引資合同書(shū)》 擬投資設立漣水食用菌產(chǎn)業(yè)園項目
- 11-26 18:16 | 美芝股份中選vivo全球AI研發(fā)中心-精裝工程采購項目(標段二)
- 11-26 18:14 | 健之佳擬用不超1億回購公司股份 維護公司價(jià)值及股東權益
- 11-26 09:53 | 格靈深瞳收購深圳市國科億道科技有限公司部分股權并增資5000萬(wàn)
- 11-26 09:37 | 煒岡科技擬以1.49億購買(mǎi)衡所華威9.33%股權 華海誠科擬發(fā)行可轉債收購煒岡科技所持衡所華威股權