音訊辨識的專家|迪威智能

迪威智能,由張智星教授所率領的團隊組成,是從台大資工所獨立出來的新創公司,首席科學家張智星在AI聲學領域中深耕了二十多年,最早於美國攻讀博士學位時,便對於機器學習領域有相當研究,回台之後研究方向便延伸至機器學習的各項應用,如音訊、語音及影像辨識等領域。其餘經營團隊成員皆於聲學相關領域、產業累積不少經驗,以價創計畫為基底,團隊成員決定將技術落地,一起出來創業。

將人聲與音樂分離 用AI解決娛樂需求痛點

迪威智能在聲音領域的AI解決方案目前大概分為三個方向,第一是人聲分離,再來是產線/機台的故障檢測,最後則是產品的聲音檢測。

隨著串流音樂平台的興起,部分平台希望提供使用者卡拉OK伴唱的服務,迪威智能利用他們在音訊辨識上的技術研究,開發出能將音樂及人聲乾淨分離的技術,並成功與串流平台合作。

同時音訊分離技術也是一個很好的解決方案,讓從事音樂/歌唱教學的一般使用者有個方式去檢視教學成果,藉由將使用者的聲音與原唱者的聲音進行比對,進行學習效果或是評分的判斷標準。

迪威智能的音訊分離技術,除了可以辨別人聲外,也可以針對噪音辨識,將不屬於重要內容的的聲音由原有音訊檔案中去除,提升聲音的品質。

跨足智慧工廠及製造領域

在音樂娛樂及教學領域的應用外,他們也針對智慧工廠及智慧製造提出了解決方案,「我們可以做到辨識人聲,也可以做到辨識機器正常運作的聲音,舉例來說,某些工廠的機器可能放置在保護罩內,無法以光學方式來觀測機台狀況,這時候我們就可以藉由蒐集機器運轉的聲音,以機器正常運作的聲音資料去做比對,來判斷說機器是否故障」,技術長葉子雋解釋。

「另外若產品是與聲音相關製品,我們也能協助其檢驗產品品質,減少客戶在產線上的檢測軟硬體及測試人員成本,除了前面量化測試外,另外還需要質化測試,所謂質化測試指的是由『聽音員』來去聽前面量化測試所測不出來東西,而聽音員是需要經過長期的訓練才能正式上場進行產品檢測,而聽音員的工作是採輪班制,一班最多工作兩小時就需要休息,要隔一班才能再輪下一班,所以我們認為我們的解決方案,在解決產品品質測試之外,也能大幅降低對聽音員的需求。」

與AWS聯手擴展市場

在聲音相關領域累積超過廿年的研究經驗,迪威智能除要在音樂娛樂市場上站穩腳步,也正積極尋找各種合作的可能。 迪威智能將他們的服務架構在Amazon Web Service上, AWS除提供技術架構等諮詢服務外,也給予像他們這些科技新創實用的建議及發展方向,目前他們會先選幾個前期應用與企業展開測試合作,展示其技術及服務能夠客戶帶來的效益,而未來也能進一步將服務拓展成為AWS Partner的服務之一,加速全球化的大型業務合作。

You Might Also Like