蘋果產品語音識別能量有什么新的提高呢?蘋果在該公司的《機器學習期刊》上發表了一篇論文,詳細闡述了如何提升Siri識別企業和餐廳等本地興趣點名稱的方法。
簡單來說,蘋果表示公司開發了一種定制語言模型,融合了用戶所在地的知識,也就是所謂的Geo-LM,借此提升Siri的語音識別能力。這些模型讓Siri可以更好地評估用戶的發音內容。
蘋果表示,該公司針對美國的169個聯合統計區逐一設置了Geo-LM,這些統計區是由美國人口統計局設置的,共計涵蓋該國80%的人口。蘋果還構建了一個單獨的全球Geo-LM,以覆蓋沒有聯合統計區覆蓋的所有區域。
當用戶向Siri詢問問題時,該系統就會根據用戶當前所在地區為其定制數據庫。如果用戶處在聯合統計區之外,或者如果Siri無法獲取當地的數據,系統就會默認為全球Geo-LM。
蘋果的論文技術性很強,而且非常詳盡,希望這種方式真的能幫助Siri更好地理解不同地方的興趣點名稱,甚至可以根據用戶所在地更好地區分艾奧瓦州和堪薩斯州的Tom's Restaurant。
蘋果在波士頓、芝加哥、洛杉磯、明尼阿波利斯、紐約、費城、西雅圖和舊金山等8大城市進行測試后發現,這種定制語言模型可以將錯誤率降低41.9%至48.4%之間,但并不包括沃爾瑪這種全國性連鎖超市。
市場研究公司Loup Ventures的新報告顯示,Siri的整體準確率仍然落后于Google Assistant,但這些新的改進或許可以幫助Siri在遇到令人費解的地名時提供更好的答案。