近日,山西煤炭工業(yè)互聯(lián)網(wǎng)平臺發(fā)布《山西煤炭工業(yè)互聯(lián)網(wǎng)平臺高質(zhì)量數(shù)據(jù)集清單》(版本U1),以高質(zhì)量數(shù)據(jù)驅(qū)動AI(人工智能)技術(shù)在煤礦的廣泛應(yīng)用,賦能煤礦智能化建設(shè)。此舉旨在幫助生態(tài)企業(yè)解決煤礦智能產(chǎn)品及服務(wù)開發(fā)過程中的用數(shù)難題。
此次發(fā)布的U1數(shù)據(jù)集聚焦井工煤礦安全生產(chǎn)場景,涵蓋綜采、綜掘、安全管控等環(huán)節(jié),包含高質(zhì)量數(shù)據(jù)集及語料庫1016個,數(shù)據(jù)總量28TB(太字節(jié)),涉及結(jié)構(gòu)化、圖片、視頻等數(shù)據(jù)類型。
U1數(shù)據(jù)集突出兩個特色亮點。一是高標(biāo)準(zhǔn)治理,保障數(shù)據(jù)高質(zhì)量。山西煤炭工業(yè)互聯(lián)網(wǎng)平臺通過脫敏、標(biāo)準(zhǔn)化、增強降噪、標(biāo)注、測試驗證等流程對數(shù)據(jù)進行加工治理,保障數(shù)據(jù)質(zhì)量與應(yīng)用效果。二是多場景覆蓋,深度貼合煤炭行業(yè)需求。U1數(shù)據(jù)集覆蓋井工煤礦場景,涵蓋采煤、掘進、主運、輔運、綜合保障、綜合管控、安全管控、生產(chǎn)經(jīng)營8大類子系統(tǒng),包含800多項細分場景數(shù)據(jù),可為煤炭行業(yè)AI模型訓(xùn)練需求提供多樣選擇。
下一步,山西煤炭工業(yè)互聯(lián)網(wǎng)平臺將持續(xù)迭代更新數(shù)據(jù)集,融入露天、洗選等類型,豐富數(shù)據(jù)場景,不斷提升數(shù)據(jù)服務(wù)能力。




