
中國中鐵股份有限公司(China Railway Group Limited,CREC)是集基建建設、勘察設計與咨詢服務、工程設備和零部件制造、房地產開發、鐵路和公路投資及運營、礦產資源開發、物資貿易等業務于一體的多功能、特大型企業集團,也是中國和亞洲最大的多功能綜合型建設集團。
中國中鐵股份有限公司前身是成立于1950年3月的中華人民共和國鐵道部工程總局和設計總局,2007年9月整體重組為中國中鐵。2005年、2006年,中國中鐵股份有限公司分別位列全球第四、第三大建筑工程承包商;2014年,中國中鐵股份有限公司在世界企業500強中排名第86位,在世界品牌500強中排名第417位。2015年,中國中鐵股份有限公司位列2015年中國500強排行榜第7位。2015年9月,中國中鐵發布公告,將與中鐵二局資產整合。


經過多年的信息化進程,軟件與業務的貼合度愈發提高,為業務及業務人員都提供了一定的支持,但是隨著各業務系統的不斷使用和迭代更新,某些數據的問題也漸漸地暴露出來,我們總結了這幾個方面:
1、不一致,即不同分支機構對物資劃分歸類不一致,集團層面不能良好的歸類管理、分析。
2、不規范,即存在同一字段多種填寫方式的情況,例如:規格型號有寫長180cm寬50cm高50cm和180*50*50。
3、不完善,即存在業務系統對錄入數據校驗不嚴謹的情況,存在應為必填項但沒有該方面內容校驗的情況。
4、有冗余,即存在單系統內的重復數據以及多系統間共有數據不能重用的問題。
隨著這些問題的出現,我司也明確的認識到,產業信息化不再僅僅是有系統可用,還要對系統維修保養,需要對數據歸類治理。至此,我們準備從兩個角度去整理維護和明確規范現有及以后會產生的數據。為此,我們制定了數據治理兩步走的計劃。

第一步:制定數據整個生命周期制度
以“明確目標、界定范圍、合理規劃、高效實施”為總體思路。
結合中翰軟件10多年來數據治理的經驗,且參照了國家信息化相關標準體系、相關行業的標準體系以及針對中國中鐵各業務部門的現狀、需求的整理分析、匯總從而進行專項整治。
制定《數據管理標準化管理體系集冊》,包含:《數據管理制度、流程、組織、考核機制文件分冊》、《數據驗證體系分冊》、《數據質量管理體系分冊》、《數據安全管理體系分冊》、《數據交換管理規范分冊》、《數據編碼及模型定稿》(即《編碼手冊》)。
第二步:針對歷史數據進行數據清洗
總體思路為根據時間節點劃分數據,針對不同階段數據進行清洗。
不影響原有數據的準確性,制定數據模型時要達到清晰易懂,按照先進性、可靠性、一致性、通用性進行設計,行業內成熟的企業數據標準體系,形成中國中鐵特色的數據模型基礎。并且保證數據模型的相對穩定,支持數據模型的擴展與優化,進而保證企業信息資源的可持續利用。治理過程中,類別體系和信息模型體系的并行確立,避免類別體系和信息模型串行建立過程中相互調整造成的項目周期的不可控。
數據類型包括:人員數據、部門數據、科目數據物資數據、設備數據、物資類別、設備類別等,這些數據的特點是模型單一,數據清洗較簡單。具體操作為先查重再完善方式,即為先查找重復項,然后進行數據信息的自動和手段完善。查重的方式是根據相似度進行模糊匹配和完全匹配等,信息完善是通過系統自動和手動進行的。排重分為三個部分,排重規則,排重結果,排重詳情。任務:分為單獨、合并兩種模式。編碼:分為單獨、合并兩種模式。追加映射:選中未清洗數據,選擇一條已經清洗的數據作為主任務單,將未清洗數據追加到已經清洗的數據上。

在上述理論與實際落實后,我司基本達到了以下成果:落地了數據治理平臺。建立全集團設備物資數據模型10052個,確立科學規范的大類65個,種類352個,小類10052個,數據清洗23萬條。制定了《數據編碼手冊》,《數據管理制度手冊》,《數據管理流程手冊》,數據治理效果明顯。