李昕昱
2025年春節(jié)期間,國產(chǎn)大模型DeepSeek異軍突起,一夜之間,舉世關注,各種文章、教程、App及大模型接入方案紛紛涌現(xiàn)。面對“DeepSeek熱”,鋼企應如何立足行業(yè)特性和企業(yè)實際,避免盲目追隨潮流,成為了一個值得深思的問題。筆者認為,其中的關鍵在于精準把握企業(yè)需求,深諳各大模型特性,并將其與實際應用場景融合,以最大化模型效能,加速企業(yè)數(shù)字化轉型與智能化升級。
DeepSeek:
開源、免費、低成本
DeepSeek-R1作為DeepSeek開源的推理模型,擅長處理復雜任務且免費。尤其值得一提的是,在模型的后訓練階段,DeepSeek-R1大規(guī)模運用了強化學習技術,使其推理能力得到極大提升,在數(shù)學、代碼以及自然語言推理等任務上,其性能足以與業(yè)界標桿OpenAI-o1相抗衡。其標簽——國產(chǎn)、免費、開源、強大、高效且成本優(yōu)化,不僅打破了技術壁壘,還大幅降低了進入AI(人工智能)領域的門檻,為全球AI創(chuàng)新者提供了前所未有的參與機會。
在實際應用中,DeepSeek展現(xiàn)出諸多優(yōu)勢。首先,DeepSeek通過創(chuàng)新的算法優(yōu)化和低精度訓練技術(如int8),訓練成本僅為同類產(chǎn)品的1/8,推理成本更是比OpenAI低出不少,這將極大推動AI(人工智能)在鋼企研發(fā)、生產(chǎn)等各個環(huán)節(jié)的廣泛應用。同時,DeepSeek-R1的推理速度實現(xiàn)了飛躍式提升,比傳統(tǒng)GPU(中央處理器)快57倍,結合為鋼鐵行業(yè)量身定制的專用模型,能夠實時響應生產(chǎn)調度、庫存管理等核心需求。
此外,DeepSeek開放模型權重,采用MIT開源協(xié)議(麻省理工學院許可證),允許用戶利用模型進行二次開發(fā)、蒸餾。用戶基于DeepSeek開發(fā)或使用專用模型,能夠精準分析行業(yè)數(shù)據(jù),為庫存管理、供應鏈預測、生產(chǎn)流程優(yōu)化等決策提供科學依據(jù)。值得一提的是,DeepSeek還具備出色的跨平臺兼容性,已順利接入華為云、百度智能云等平臺,用戶無需徹底更換原有系統(tǒng),即可輕松實現(xiàn)混合部署,極大地降低了遷移成本。
然而,DeepSeek也存在一些劣勢。首先,地緣政治限制可能影響其國際業(yè)務。美國已禁止政府設備使用DeepSeek-V3,若鋼鐵企業(yè)涉及國際業(yè)務,需評估數(shù)據(jù)跨境傳輸風險。其次,開源模型可能增加代碼漏洞風險,需加強本地化部署的安全防護。再次,DeepSeek無法像百度等企業(yè)一樣實現(xiàn)數(shù)據(jù)分級分層受控,企業(yè)在引入AI技術時,務必重視數(shù)據(jù)安全與合規(guī)性,嚴格權限管理,確保數(shù)據(jù)不被非法獲取或泄露,避免因技術漏洞引發(fā)經(jīng)濟損失。最后,過度依賴DeepSeek可能導致技術路徑單一,若其后續(xù)閉源或調整策略,企業(yè)需重新評估替代方案。同時,華為、百度等廠商已快速接入DeepSeek,可能通過捆綁服務削弱鋼鐵企業(yè)的議價能力。
需求聚焦:
關注核心,規(guī)避“大而全”誤區(qū)
在大模型落地過程中,我們需時刻保持警惕,避免落入“偽需求”陷阱,不盲目追求“大而全”,而是優(yōu)先聚焦于生產(chǎn)、質量、成本等核心痛點,確保所選場景與DeepSeek的特點高度契合。
具體而言,鋼鐵企業(yè)可以著重關注供應鏈協(xié)同優(yōu)化,通過整合采購、庫存及物流數(shù)據(jù),預測原材料價格波動及運輸風險,從而優(yōu)化采購計劃及庫存管理水平。同時,致力于運營優(yōu)化,借助數(shù)據(jù)驅動的決策機制,大幅提升生產(chǎn)效率與資源配置效率。在設備預測方面,鋼企應結合企業(yè)原有的模型,利用生產(chǎn)設備傳感器數(shù)據(jù),通過先進的大模型分析技術,精準把握設備運行狀態(tài),預測故障周期,特別是對于高爐、軋機等關鍵設備尤為重要。
此外,在企業(yè)管理運營中,鋼企可借助AI技術輔助生成精準文案,構建崗位知識庫,整合行業(yè)資訊與操作手冊,進一步提升工作效率,有效降低人力成本。
數(shù)據(jù)治理:
構建基石,提高質量
企業(yè)數(shù)據(jù)清洗、數(shù)據(jù)標準化建設以及專業(yè)知識庫的搭建,共同為DeepSeek等AI應用的實施構建了穩(wěn)固的數(shù)據(jù)基石。
針對企業(yè)ERP(企業(yè)資源計劃)、MES(制造執(zhí)行系統(tǒng))等核心系統(tǒng)中累積的歷史數(shù)據(jù),首要任務是建立一套統(tǒng)一的數(shù)據(jù)標簽體系,從而清除冗余信息、填補數(shù)據(jù)空白、糾正錯誤數(shù)據(jù),并確保數(shù)據(jù)的兼容性,特別是時序數(shù)據(jù)與結構化數(shù)據(jù)的無縫整合,從而為AI模型的精準訓練提供可靠且高質量的數(shù)據(jù)源。
與此同時,為了深化AI模型對鋼鐵行業(yè)特定應用場景的理解,鋼企需將行業(yè)專有術語(諸如連鑄坯熱送熱裝率、噸鋼綜合能耗等)及工藝標準內嵌于大模型之中?;诖?,DeepSeek依托百度的千帆大模型的行業(yè)知識增強能力,能夠定制化訓練垂直領域的專業(yè)子模型,從而在專業(yè)領域展現(xiàn)出更加卓越的應用效能與精確度。
實施策略:
小步快跑,驗證迭代
鋼鐵企業(yè)在穩(wěn)健推進DeepSeek應用的過程中,可采取“試點先行”策略,根據(jù)企業(yè)特點,選擇一個具體產(chǎn)線或車間(例如煉鋼車間)作為試驗田。
在這一階段,鋼企利用大模型的分析能力,優(yōu)先聚焦于優(yōu)化轉爐配料比例、預測鑄坯質量以及進行根因分析等生產(chǎn)關鍵任務。在評定周期內,鋼企應重點考察一系列關鍵指標,如能耗降低的具體百分比、產(chǎn)品質量的明顯提升幅度等,來評估DeepSeek的應用成效。在試點項目取得顯著成效并經(jīng)過充分驗證后,企業(yè)可采取分階段的方式,逐步將DeepSeek的應用范圍拓展至全企業(yè)。
這一策略旨在避免一次性全面部署可能帶來的資源過度消耗和風險,確保每一步都走得穩(wěn)健而高效,最終推動DeepSeek在整個企業(yè)范圍內實現(xiàn)全面且深入的應用。
技術與組織協(xié)同并進:
避免“重技術、輕管理”
為確保大模型能夠與企業(yè)現(xiàn)有系統(tǒng)實現(xiàn)無縫對接,鋼企必須密切關注數(shù)據(jù)流的連續(xù)性,避免任何可能導致數(shù)據(jù)斷點的環(huán)節(jié)。針對部分老舊或特殊系統(tǒng),鋼企可靈活采用中間件或API網(wǎng)關技術,實現(xiàn)輕量化、低成本集成,確保平穩(wěn)過渡。
在技術推進的同時,鋼企也要深刻認識到員工賦能與變革管理的重要性。為此,鋼企可輔助開展一系列“AI+工藝”融合培訓,幫助工程師深入理解模型輸出的內在邏輯,比如為何在特定情境下,模型會建議調整軋制速度,從而增強他們的主動決策能力,而非僅僅作為被動執(zhí)行者;還可建立一套激勵機制,積極鼓勵一線員工主動反饋模型在實際應用中遇到的問題,通過正面引導和激勵,有效消除員工可能存在的抵觸情緒,確保先進技術能夠真正落地生根,避免技術資源的閑置浪費。
風險管控與成本優(yōu)化:
細致評估,協(xié)商計費
在風險控制與成本優(yōu)化方面,鋼企需細致評估私有化部署DeepSeek所需的硬件升級成本,尤其是針對高性能需求(如GPU服務器集群)的投入,以及組建兼具鋼鐵工藝知識與AI技能的運維團隊所需的資源。
同時,鋼企可通過協(xié)商采用靈活的計費模式,例如按調用量階梯定價,防止成本超支;確保生產(chǎn)數(shù)據(jù)的本地化安全存儲,并運用聯(lián)邦學習等先進技術,實現(xiàn)數(shù)據(jù)的“可用不可見”,既保障數(shù)據(jù)利用的效率,又有效防范供應鏈斷供等安全風險,確保合規(guī)性與業(yè)務連續(xù)性。
總體來看,鋼鐵企業(yè)的AI落地實踐需將技術理性與行業(yè)深度洞察(Know-How)緊密結合。短期內,鋼企應聚焦于設備維護、工藝優(yōu)化等具體且可量化的核心“硬場景”,通過實實在在的降本增效成果,彰顯AI技術的價值;長期來看,則需依托數(shù)據(jù)的持續(xù)積累與組織文化的深刻變革,推動AI深度融入企業(yè)的生產(chǎn)管理體系,避免陷入“技術至上、脫離實際”的誤區(qū)。在此過程中,鋼企通過大模型技術支持,可構建統(tǒng)一的數(shù)據(jù)分析與決策平臺,即構建AI中臺能力,不僅滿足當前需求,更為未來擴展至碳排放管理、數(shù)字孿生等新興領域預留空間。
筆者認為,我們的最終目標是讓大模型真正成為那位“深諳鋼鐵行業(yè)的老師傅”,而非僅僅是擺在那里的“昂貴裝飾品”,從而引領企業(yè)邁向更加智能、高效的未來。
[作者系中天鋼鐵集團(南通)有限公司信息管理處處長]
《中國冶金報》(2025年02月18日 04版四版)