基于大模型的零部件 在線智能檢測(cè)系統(tǒng)
文:文/浙江工商職業(yè)技術(shù)學(xué)院 吳彤2024年第五期
導(dǎo)語(yǔ): 通過(guò)采用人工智能技術(shù)的視覺(jué)算法,采用基于Transformer大模型的8層隱含層D-RSN神經(jīng)網(wǎng)絡(luò)算法來(lái)解決零 部件形狀缺陷、表面缺陷、包裝缺陷等問(wèn)題。本項(xiàng)目以滿足所有質(zhì)量要求的無(wú)可挑剔產(chǎn)品的圖像樣本為基礎(chǔ), 構(gòu)建了零部件缺陷特征與視覺(jué)圖像之間的物理映射機(jī)制,將產(chǎn)品可以簡(jiǎn)單分類為有缺陷或無(wú)缺陷,還可以使用 監(jiān)督學(xué)習(xí)訓(xùn)練模型,以根據(jù)缺陷的嚴(yán)重性、類型或狀態(tài)對(duì)缺陷進(jìn)行分類,這使得能夠創(chuàng)建更復(fù)雜的智能檢測(cè)反 應(yīng)機(jī)制并收集詳細(xì)數(shù)據(jù)。
1 壓縮機(jī)概述
當(dāng)零部件在制造企業(yè)生產(chǎn)后期發(fā)現(xiàn)質(zhì)量問(wèn)題時(shí),就會(huì) 導(dǎo)致產(chǎn)品需要再次檢測(cè),此時(shí)就會(huì)出現(xiàn)時(shí)間過(guò)長(zhǎng)、浪費(fèi)時(shí) 間和精力,這時(shí)候就會(huì)給企業(yè)帶來(lái)巨大的困擾。同時(shí)在采 用產(chǎn)品抽檢方式的部分企業(yè)中,由于小概率事件的質(zhì)量追 溯問(wèn)題也會(huì)帶來(lái)品牌危機(jī)。這時(shí)候,如果有一種用于產(chǎn)品 缺陷檢測(cè)的“零部件在線智能檢測(cè)系統(tǒng)”,它能實(shí)時(shí)捕獲和 解決產(chǎn)品、包裝或表面缺陷,就能解決用戶的“質(zhì)量缺陷焦 慮問(wèn)題”。
用于產(chǎn)品缺陷檢測(cè)的智能視覺(jué)檢測(cè)裝置主要解決如下 問(wèn)題:
(1) 零部件形狀缺陷。損壞的零部件、缺失的零部 件、畸形的零部件、凹陷的零部件、錯(cuò)誤的組件裝配、尺 寸不符的零部件等。
(2)零部件表面缺陷。顏色檢測(cè)、紋理驗(yàn)證、劃痕和 凹痕檢測(cè)、表面畸形檢測(cè)、不存在/存在驗(yàn)證、表面光潔度 檢測(cè)、穿孔檢測(cè)、撕裂和孔洞檢測(cè)。
(3)零部件包裝缺陷。褶皺檢測(cè)、標(biāo)簽放置驗(yàn)證、標(biāo) 簽撕裂或撕裂、包裝損壞、包裝印刷錯(cuò)誤、蓋子缺失、密 封破損或密封不良、包裝畸形、包裝缺失、瓶蓋缺陷、瓶 蓋傾斜、蓋子安裝檢查、包裝篡改、泄漏檢測(cè)。
2 視覺(jué)大模型架構(gòu)及其算法
早期的視覺(jué)模型采用手工設(shè)計(jì)特征和機(jī)器學(xué)習(xí)方法解決圖像分類等視覺(jué)問(wèn)題。然而,手工設(shè)計(jì)特征局限于像素 層面,損失了過(guò)多圖像信息,導(dǎo)致模型的精度較低。與基 于手工特征的方法不同,基于CNN的模型具有強(qiáng)大的特征 提取能力和相對(duì)較低的計(jì)算復(fù)雜度。2012年,有研究者提 出了基于CNN架構(gòu)的Alex-Net,其在ImageNet圖像識(shí)別挑 戰(zhàn)賽中的識(shí)別精度首次超越手工特征方法。在此基礎(chǔ)上, VGGNet證明了更深的網(wǎng)絡(luò)結(jié)構(gòu)能夠有效提升模型精度。 ResNet提出在每個(gè)模塊中添加殘差連接,以解決深層模型 的優(yōu)化問(wèn)題,同時(shí)引入了瓶頸塊來(lái)減少參數(shù)數(shù)量。簡(jiǎn)單的 實(shí)現(xiàn)和良好的性能使ResNet仍然是當(dāng)今最常用的架構(gòu)。此 外,也有研究者探索了CNN模型的輕量化,MobileNets提 出了深度可分離卷積、反向殘差塊和神經(jīng)架構(gòu)搜索,以實(shí) 現(xiàn)更好的精度——復(fù)雜度權(quán)衡。
在輕量化CNN模型應(yīng)用在汽車鋁鑄件等產(chǎn)品的質(zhì)量檢 測(cè)時(shí),也存在以下兩個(gè)問(wèn)題:原始模型復(fù)雜度較高,難以 直接部署到資源受限的邊緣設(shè)備上;模型在邊緣設(shè)備上進(jìn) 行推理的耗時(shí)較長(zhǎng)難以滿足實(shí)際任務(wù)的需求。
為了解決上述問(wèn)題,引入預(yù)訓(xùn)練技術(shù)來(lái)學(xué)習(xí)通用的視 覺(jué)表示,以減少訓(xùn)練資源的消耗和訓(xùn)練數(shù)據(jù)的收集成本。 隨著大規(guī)模圖像數(shù)據(jù)集(如ImageNet)的出現(xiàn),探索CV領(lǐng) 域的預(yù)訓(xùn)練模型。預(yù)訓(xùn)練視覺(jué)模型在海量圖像數(shù)據(jù)集上進(jìn) 行預(yù)訓(xùn)練,得到通用視覺(jué)特征表示,然后基于較小的下游 標(biāo)注數(shù)據(jù)集對(duì)模型進(jìn)行精細(xì)調(diào)整。在微調(diào)階段,模型只需 要消耗較少的訓(xùn)練資源就能取得比從頭開(kāi)始訓(xùn)練更好的性能,這是因?yàn)閳D像分割是CV 的一項(xiàng)核心任務(wù),需要識(shí)別圖 像像素所屬對(duì)象。2023年,MetaAI提出了通用圖像分割模 型,即Transformer大模型,它是基于超過(guò)10億個(gè)掩模的多 樣化、高質(zhì)量大型分割數(shù)據(jù)集(即SA-1B)進(jìn)行預(yù)訓(xùn)練,利 用Transformer或Prompt Engineering來(lái)處理下游分割任 務(wù),這使其能夠泛化到從未見(jiàn)過(guò)的新對(duì)象和圖像類型,且 不需要對(duì)下游任務(wù)進(jìn)行微調(diào)。
如圖1所示,Transformer大模型以滿足所有質(zhì)量要求 的無(wú)可挑剔零部件產(chǎn)品的圖像樣本為基礎(chǔ),使用大型圖像 數(shù)據(jù)池訓(xùn)練集進(jìn)行訓(xùn)練,深度學(xué)習(xí)模型可以解釋給定圖像 的內(nèi)容,該機(jī)制在制造過(guò)程中用于缺陷和異常檢測(cè)。本項(xiàng) 目所構(gòu)建的拓?fù)浣Y(jié)構(gòu),可以學(xué)習(xí)識(shí)別不同類型的缺陷。設(shè) 備捕獲的圖像將基于其進(jìn)行評(píng)估,如果不匹配,則會(huì)立即 標(biāo)記缺陷,實(shí)現(xiàn)圖像缺陷特征全息感知。
大模型架構(gòu)由多個(gè)編碼器和解碼器疊加構(gòu)成,每個(gè)編 碼器由2個(gè)基本模塊組成,即MSA模塊和前饋全連接(Feed Forward Network,F(xiàn)FN)模塊。MSA模塊利用自注意力 機(jī)制學(xué)習(xí)輸入序列內(nèi)部的相關(guān)關(guān)系,F(xiàn)FN模塊包含激活函數(shù) 和2個(gè)線性層,MSA模塊和FFN模塊均使用殘差連接和層歸 一化(Layer Normialization,LN)結(jié)構(gòu)。
給定輸入序列x 0 ,第k個(gè)編碼器的輸出如下:
式中:xpos表示位置嵌入, x k表示第k個(gè)編碼器的輸 出。解碼器與編碼器的結(jié)構(gòu)稍有不同,由二個(gè)多頭自注意 力模塊和一個(gè)前饋全連接模塊組成,其中一個(gè)MSA模塊增加了單向注意力掩碼,使得輸入嵌入向量只能關(guān)注過(guò)去的 嵌入向量和它本身,確保預(yù)測(cè)結(jié)果只依賴于已生成的輸出 詞元,然后,掩碼多頭注意力模塊的輸出和編碼器的輸出 通過(guò)第二個(gè)MSA模塊進(jìn)行處理。
有了Transformer大模型后就可以創(chuàng)建生成異常檢測(cè) 算法,如采用包含8層隱含層的D-RSN(Deep Residual Shrinkage Networks,即深度殘差收縮網(wǎng)絡(luò))神經(jīng)網(wǎng)絡(luò)算法。
這里先初始化D-RSN的深度、節(jié)點(diǎn)數(shù)、網(wǎng)絡(luò)學(xué)習(xí)速 率、網(wǎng)絡(luò)序列長(zhǎng)度等參數(shù),通過(guò)對(duì)時(shí)間正序數(shù)據(jù)池訓(xùn)練集 分區(qū)進(jìn)行訓(xùn)練,利用內(nèi)部有監(jiān)督機(jī)制進(jìn)行特征微調(diào),持續(xù) 進(jìn)行迭代循環(huán),使先驗(yàn)時(shí)序數(shù)據(jù)可以學(xué)習(xí)到未來(lái)時(shí)序數(shù)據(jù) 的特征,實(shí)現(xiàn)較長(zhǎng)周期內(nèi)的圖像缺陷特征全息自主感知。 為了加快D-RSN的收斂進(jìn)程,避免梯度發(fā)散現(xiàn)象,利用 粒子群優(yōu)化算法對(duì)D-RSN的初始值進(jìn)行反復(fù)優(yōu)化,定義 D-RSN預(yù)測(cè)的均方誤差MSE作為適應(yīng)度函數(shù),則D-RSN預(yù) 測(cè)局部最優(yōu)解的均方誤差(MSEi)和D-RSN預(yù)測(cè)全局最優(yōu) 解的均方誤差(MSEg)分別為:
式(1)、(2)中:P為數(shù)據(jù)池訓(xùn)練集分區(qū)的數(shù)據(jù)數(shù); N為D-RSN的節(jié)點(diǎn)數(shù);N為PSO的粒子數(shù)disy和yisj分別為預(yù) 測(cè)數(shù)據(jù)集和真實(shí)數(shù)據(jù)集。
機(jī)器視覺(jué)圖像缺陷自主檢測(cè)及輸出算法將D-RSN生成 的時(shí)間正序下的機(jī)器視覺(jué)圖像缺陷特征隱性知識(shí)數(shù)據(jù)集作 為學(xué)習(xí)數(shù)據(jù)集,實(shí)現(xiàn)機(jī)器視覺(jué)圖像缺陷自主檢測(cè),引入神 經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)池后置測(cè)試集進(jìn)行圖像缺陷自主檢測(cè),利用 隱性知識(shí)數(shù)據(jù)集對(duì)圖像缺陷檢測(cè)結(jié)果進(jìn)行邏輯修正,借助 圖像缺陷定位及分類函數(shù)輸出檢測(cè)結(jié)果。
此時(shí),定義數(shù)據(jù)池測(cè)試集分區(qū)圖像缺陷輸出函數(shù)為Y (j,k),定義修正過(guò)的數(shù)據(jù)池測(cè)試集分區(qū)圖像缺陷輸出函 數(shù)為X(j,k),神經(jīng)網(wǎng)絡(luò)的激活函數(shù)采用sigmoid函數(shù)并定 義為f,則有:
式(3)、(4)中: ξ為神經(jīng)網(wǎng)絡(luò)的深度;ki,j 為網(wǎng)絡(luò) 核;yi為修正系數(shù);*表示平面網(wǎng)絡(luò)操作;bj為偏置誤差; pj為輸入的圖像缺陷數(shù)據(jù)集;β為修正權(quán)重;down(·)為 池化采樣函數(shù)。
上述公式構(gòu)建了零部件缺陷特征與視覺(jué)圖像之間的物 理映射機(jī)制,將產(chǎn)品可以簡(jiǎn)單分類為有缺陷或無(wú)缺陷,還 可以使用監(jiān)督學(xué)習(xí)訓(xùn)練模型,以根據(jù)缺陷的嚴(yán)重性、類型 或狀態(tài)對(duì)缺陷進(jìn)行分類。這使得能夠創(chuàng)建更復(fù)雜的智能觸 發(fā)反應(yīng)機(jī)制并收集詳細(xì)數(shù)據(jù)。
3 零部件在線智能檢測(cè)系統(tǒng)的應(yīng)用
通過(guò)大模型部署到零部件在線檢測(cè)系統(tǒng)中,取得了預(yù) 期的穩(wěn)定性、可靠性。
以被測(cè)25mm的零部件產(chǎn)品尺寸為例(圖2、3),為 保證0.01mm以下檢測(cè)精度,視覺(jué)相機(jī)采用1200萬(wàn)像素。 該部件為金屬材質(zhì),為避免零部件本身的環(huán)境光與金屬反 光對(duì)測(cè)量的干擾,將采用“黑白相機(jī)+背光光源”的模式進(jìn) 行補(bǔ)光。測(cè)試DEMO如圖4所示。
如圖5、6、7所示,該工作流程如下:
?、?當(dāng)CNC加工完成后通過(guò)桁架式機(jī)器人將成品件運(yùn)輸 至檢測(cè)位置;
?、?三爪氣動(dòng)氣缸將部件球頭部分夾持,中心孔氣缸頂 出定位;
?、?桁架式機(jī)械手離開(kāi)檢測(cè)位置,視覺(jué)傳感器進(jìn)行識(shí)別 檢測(cè);
④ 檢測(cè)完畢后縮回中心孔氣缸和松開(kāi)三爪氣缸,零部 件落入工作臺(tái)的部件中轉(zhuǎn)盒中;
?、輽z測(cè)結(jié)果展示。
檢測(cè)合格:屏幕中顯示“OK”,不報(bào)警;檢測(cè)不合 格:屏幕中顯示“NG”,系統(tǒng)觸發(fā)聲光報(bào)警;不良品處 理:系統(tǒng)觸發(fā)報(bào)警后,聯(lián)動(dòng)上下料機(jī)械手停止運(yùn)行,當(dāng)工 人將不良品移除后系統(tǒng)恢復(fù)運(yùn)行。
4 結(jié)束語(yǔ)
創(chuàng)新點(diǎn)一:采用大模型基礎(chǔ)上的D-RSN算法
借助大模型架構(gòu),可以更有效地評(píng)估其產(chǎn)品質(zhì)量,而 無(wú)需考慮因?yàn)槿斯z測(cè)帶來(lái)的一致性缺乏問(wèn)題。機(jī)器學(xué)習(xí)采用大模型基礎(chǔ)上的D-RSN算法,具體如圖8所示。該方法 避免了對(duì)圖像的復(fù)雜前期預(yù)處理,可以直接將原始圖像輸 入,降低網(wǎng)絡(luò)模型的復(fù)雜度,減少權(quán)值的數(shù)量。采用局部 連接和共享權(quán)值的方式,使網(wǎng)絡(luò)易于優(yōu)化,也降低了過(guò)擬 合的風(fēng)險(xiǎn)。
創(chuàng)新點(diǎn)二:可以個(gè)性化機(jī)器學(xué)習(xí)模型
雖然市場(chǎng)上有很多現(xiàn)成的視覺(jué)檢測(cè)系統(tǒng),但本項(xiàng)目使 用基于大模型的個(gè)性化機(jī)器學(xué)習(xí)模型。原因很簡(jiǎn)單,由于 缺陷檢測(cè)具有不同的特征,個(gè)性化學(xué)習(xí)模型可以使用自己 的訓(xùn)練數(shù)據(jù)集來(lái)訓(xùn)練系統(tǒng),提取缺陷固定區(qū)域以提高準(zhǔn)確 性,而現(xiàn)成的系統(tǒng)通常不提供這種可能性。圖9所示為用于 插接端子的個(gè)性化機(jī)器學(xué)習(xí)模型。
基于大模型的零部件在線智能檢測(cè)系統(tǒng)能夠根據(jù)邊緣節(jié) 點(diǎn)的計(jì)算能力以及檢測(cè)頻率的要求,在單一節(jié)點(diǎn)上同時(shí)運(yùn)行 多個(gè)不同的算法。此外,該系統(tǒng)還允許通過(guò)云平臺(tái)進(jìn)行算法 的升級(jí)和替換等操作,以靈活地應(yīng)對(duì)不同產(chǎn)線質(zhì)量檢測(cè)場(chǎng)景 的需求。這種系統(tǒng)的特點(diǎn)在于其簡(jiǎn)潔的結(jié)構(gòu)、靈活的部署方 式以及可視化的運(yùn)維管理,可以有效地支持傳統(tǒng)零部件產(chǎn)業(yè) 向數(shù)字化智能化轉(zhuǎn)型。
中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:
凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.surachana.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

掃碼關(guān)注小程序
時(shí)刻關(guān)注行業(yè)動(dòng)態(tài)


- 1資訊在線

填寫郵件地址,訂閱更多資訊:
撥打電話咨詢:13751143319 余女士
郵箱:chuandong@chuandong.cn
- 運(yùn)動(dòng)控制
- 伺服系統(tǒng)
- 機(jī)器視覺(jué)
- 機(jī)械傳動(dòng)
- 編碼器
- 直驅(qū)系統(tǒng)
- 工業(yè)電源
- 電力電子
- 工業(yè)互聯(lián)
- 高壓變頻器
- 中低壓變頻器
- 傳感器
- 人機(jī)界面
- PLC
- 電氣聯(lián)接
- 工業(yè)機(jī)器人
- 低壓電器
- 機(jī)柜