【2021農業智庫報導年報 #6】人機協作AI 建立臺灣菇類跨域知識結構

【2021農業智庫報導年報 #6】人機協作AI 建立臺灣菇類跨域知識結構


從農試所的文獻發表資料,可以幫助團隊快速掌握臺灣科技研究成果的分佈,但此方法仍有其限制,例如文獻書目資料缺乏「關鍵字」(以下稱作者關鍵字,以便和 AI 關鍵字區分)、或是單一文獻關鍵字過少,上述情況皆會導致團隊無法完整的解讀資料。


因此農業智庫報導團隊以網路計量學常用的「人工智慧語意分析方法」,委託悠由數據公司利用自然語言處理演算法,開發出斷詞、資料清理、詞頻計算的語意辨識模組。


這套農業AI產業分析模組能以 300 字以內的文字資料當做文本,重新定義該文本之重要關鍵字(AI 關鍵字)。因此農業智庫報導團隊將農試所過去十年內公開發表文獻的「題名、關鍵字與摘要」作為文本分析目標,便能在缺少文本關鍵字的情況下,根據 AI 關鍵字的統計數值,產出書目分析結果。


農業試驗所作者關鍵字 TF-IDF 重要詞彙網絡



結合傳統書目計量學與人工智慧的資料科學分析方法,不但解決了書目資料缺失的問題,還可以協助團隊釐清跨領域、多學門等性質、或較為模糊議題之知識架構。

農委會機構典藏系統農試所菇類作者關鍵字統計表


舉「菇類」作者關鍵字為例:在農委會機構典藏系統農試所所發表的文獻資料中,大致可看出菇類研究成果以香菇、秀珍菇、杏鮑菇與銀耳為主,但技術有關的關鍵字則只有「太空包」。


菇類AI關鍵字之 TF-IDF 詞彙網路分析結果,連線代表兩個關鍵字有共同出現在文獻資料中


而透過語意分析可產出「AI關鍵字」清單,再將此清單進行詞彙網絡分析,「菇類」在所有文獻資料中與菇類關聯性高的AI關鍵字有:液體菌種、植物工廠、智慧農業、智慧化生產與太空包等,顯示臺灣菇類發展的方向以精準栽培為主,並可透過菌種技術與植物工廠技術建立智慧化的生產環境。


參考文獻



【2021農業智庫報導年報 #4】水稻分子育種與智慧栽培,全球趨勢台灣不缺席 【2021農業智庫報導年報 #2】從農試改單位的書目資料, 繪製「永續農業科技地圖」