【研究前沿】站在巨人的肩膀上,智慧於農
農業研究前沿 Research Fronts for Agriculture
臺灣在2015年將數位經濟列入國家發展願景,也加快了農業生產數位化的腳步,結合農業大數據的「數位農業」得以孕育而生。「大數據」不僅限於農業生產資料,從田間生產、收穫後處理、進入食品加工鏈、直到市場資訊與情報等,只要與農業有關的數位資料都有機會跨預整合演變成「詮釋資料(Metadata)」,「農業研究前沿」就是Metadata的數位農業發展成果。
牛頓:「如果我進一步看到它,是站在巨人的肩膀上」
If I have seen further it is by standing on the shoulders of Giants
「農業研究前沿」是一個解析科技議題與預測發展趨勢的學問,分析人員以書目計量學方法從上萬篇農業科學文獻的文本內容,利用資料探勘技術與文本分析工具梳理其中脈絡,藉此定義跨領域的農業議題「知識結構」;並統計分析知識結構中的主題數量,評估與預測未來農業科學的熱門領域。換言之,運用數位工具洞悉農業科技趨勢的研究前沿,也可說是「站在巨人肩膀上」的數位農業。
▌關鍵字、共詞、引用,3指標洞見農業未來
農業研究前沿大多以「科睿維安」公司的線上文獻分析資料庫「Web of Science, WoS」作為文本資料來源,WoS收納上千筆科學期刊雜誌,擁有超過萬筆文獻書目資料,包含:標題、摘要、作者關鍵字、出版日期、作者資訊、文章內容、以及引用文獻等。其中「作者關鍵字」與「引用文獻」最常作為研究前沿分析的統計資訊,而摘要則可作為共詞分析(co-word analysis)或是語意分析的資料來源。
分析農業資料需須具備「資料科學、農業專業、與知識管理」方能適當解讀數據結果。
資料分析師透過統計方法,計算關鍵字在資料庫中的出現頻率、不同主題在資料庫中的出現次數、以及隨著時間主題出現次數的頻率消長等,加上自身的知識經驗(Domain Knowledge)便可評估科技議題的發展走勢,並做出適當的資料解讀結論。
前端工程師透過資料探勘技術將上萬筆文獻的書目資料爬抓回資料庫,接著再以統計方法計算作者關鍵字的出現次數,就能觀察各項科技主題的熱門趨勢。然而事情沒有想像中的簡單,這些以電腦爬蟲程式爬抓回的資料往往沒有統一的標準格式,還必須經過專家的解讀與資料清理才能進一步的使用這些數據。
例如「crop」與「crops」都是作物的意義,電腦卻會判定為2筆不同的資料,又或是「NGS, next generation sequence」與「next generation sequence」縮寫全名之辭彙,電腦會判定為2筆資料,必須以人為方式修正,統計出的結果才會有意義。
換言之,以資料科技分析書目資料大數據必須先建立「農業專有名詞的關聯性系統」,爾後才能借助電腦運算方式產生自動化的統計報表。2019年農科院的「新興數位工具協助新農業政策擬定與推廣」計畫開始建立「開放的標準化農業辭庫」,將農業科學常見的作者關鍵字整理為標準化的辭庫,透過線上網站將辭庫系統「農業智庫報導(https://www.agrianalytics.tw)」提供給有興趣的專家學者參考。
資料科技的進步與普及化使得國際農企業間的競爭模式由「農業技術戰」演變為「農業資訊戰」,農業研究前除了是企業研發部門的發展參考,更是先進國家智庫團體在決定政策方向與資源分配時的重要依據。
參考文獻:
1. 行政院數位國家創新經濟推動小組(105,12)。數位國家・創新經濟發展方案。https://www.ey.gov.tw/Page/5A8A0CB5B41DA11E/f4d3319a-e2d7-4a8b-8b55-26c936804b5b
2. 林家民(2015, 10)。〈共詞分析於氣候變遷之運用〉氣候變遷在台灣研討會專題。台灣氣候適科技知識平台。http://taiccat.ncu.edu.tw/app/news.php?Sn=105
3. 張家彬(2016, 03)。〈從研究方法角度探討研究前沿〉大學圖書館,20,頁88-112。變遷調4. Aleixandre, J. L., Aleixandre-Tudó, J. L., Bolaños-Pizarro, M., & Aleixandre-Benavent, R. (2015). Mapping the scientific research in organic farming: a bibliometric review. Scientometrics, 105(1), 295–309. doi:10.1007/s11192-015-1677-4
5. Bojovic, Srdjan & Matic, Rada & Popovic, Zorica & Smiljanic, Miroslava & Stefanovic, Milena & Vidaković, Vera. (2014). An overview of forestry journals in the period 2006–2010 as basis for ascertaining research trends. Scientometrics. 98. 1331-1346. 10.1007/s11192-013-1171-9.
6. Malesios, Chrisovalantis & Abas, Zaphiris. (2012). Examination of the impact of animal and dairy science journals based on traditional and newly developed bibliometric indices. Journal of animal science. 90. 5170-5181. 10.2527/jas.2012-5278.
頂尖知名期刊「書目計量學(Scientometrics)」為目前收錄最多文獻的研究前沿報告的線上期刊雜誌,2000年後各類農業書目計量學的研究報告雨後春筍般出現。2011年義大利研究團隊結合傳統分析方法與語意分析法,盤點2000-2011年間1萬多篇水產科學文獻、2013年塞爾維亞最高學府貝爾格勒大學以書目計量學探討2006-2010年間森林科學主題趨勢、同年西班牙團隊以文本分析建構有機農業的知識結構、2014年又有西班牙團隊發表了1945-2011年動物科研趨勢分析,爾後甚至有多篇針對特定地區(例如非洲農業區)的農業科沿趨勢整理的發表紀錄。