在我看來,質量管理的一個重要思想,是將產品設計、質量要求、設備狀態、工藝控制等看成概率問題。在這個思想的指導下,標準的制定普遍增加了對公差的指標要求。這樣,就把質量管理聚焦到對不確定因素的度量和控制。
這個思想還意味著:偏差或者缺陷率小到規定的范圍之后,就不再去追去它的原因了?!安蝗プ肪吭颉逼鋵嵆3J遣坏靡讯鵀橹?。在數據不完整的前提下,很多問題的原因根本無法去追究。
在鋼鐵生產過程中,連鑄坯的質量缺陷就是一個典型。連鑄坯缺陷一直是個很難控制的問題。對于用戶要求比較高的產品,常常要全面清理。這樣的代價是很大的。我們當然希望只清理有缺陷的產品。但由于坯子的表面很粗糙,很多缺陷不能在線準確檢測。
于是,人們希望能夠根據板坯生產的工藝參數,準確預測缺陷的產生。但很多缺陷只能在最終產品上、甚至用戶使用時才能發現。在這個過程中,有些中間環節可能會把缺陷消除掉、有些雖然坯子有缺陷但在產品上顯現不出來或者用戶基本不在乎。而且,缺陷位置和當時的生產參數、設備狀態也難以準確對應。這些都讓我們無法將工藝參數和缺陷的產生對應起來。
這種現象的本質是:信息不足導致不確定性。信息不足的不確定性,導致分析結果的不確定性。分析結果的不確定性大到一定程度,分析結果根本無法用來創造價值。設想一種典型的情況:
某鋼種缺陷發生率5%。我們把能拿到的數據都來建模。最終發現:在某種最嚴重的條件下,缺陷發生率8%;在最好的情況下,缺陷發生率3%。這就是一個無用的結果:對于質量要求高的產品,不論缺陷率8%還是3%,都要進行清理;對質量要求低的產品,不論8%還是3%,都不需要清理。
很多沒有搞過數據分析的人,總希望模型精度非常高。但是,建模所依據的數據不完整、質量不高,就不可能得到高精度的預報結果——因為任何算法都不能讓原始數據的信息量增加。極端的情況是:生產過程沒有任何的檢測和數據記錄,數據分析能力再強也沒有辦法建立出理想的數學模型。還有一種特殊情況,數據基本完備但精度不夠。這時,即便是完全正確的模型也只能預報一個概率分布——這個觀念我強調了很多年,但真正能理解的人極少。
現在回到本文的開頭:應該怎樣建設工業大數據的基礎。本人認為,理想的工業大數據就是針對特定問題(如板坯的質量缺陷),建立“全息”的數據映像。這時,根據已有的數據,是否發生特定問題是個確定性的。這或許是個永遠都無法實現的理想,卻是我們追求的方向。
(審核編輯: 智匯小蟹)
分享