2019年1月5日 星期六

資料科學_一年前的今天

剛剛很不情願的離開朋友們的聚會,難得可以相聚的海人...

回實驗室講了一通電話,關於新申請計畫書的建議。
等下改一改,明天就要準備寄出了。
因為正在構思消化到底該改成什麼,想說先來紀錄一下這一年的轉變。

還記得十年前要開始博士班時,希望能建立東岸的資料庫。
其實當時應該沒有很懂到底資料庫是甚麼,該怎麼變成好用的資料庫
只是一直很羨慕外國有些長期的研究單位,有幾十年紮實的野外數據。
可以用數據來評估很多人為活動的影響或自然現象的變遷,
希望能讓台灣也擁有這樣的根基。
當然,剛開始的1-2年寫過幾個計畫書去投國X會農X會漁X署...可以試的大概都試完一輪了。
每個單位都說:  這種基礎的事情不是我們的業務範圍,請找....單位。

反正後來就是用盡一切的辦法...
海鯨號的鼎力相助,突然冒出來的蘭陽博物館計畫,甚至後期的東管處調查案。
這些,讓電腦中的硬碟越塞越滿,Data越來越混亂。

2018年的一月三日,上了為期五天的資料科學密集訓練班。
體悟到一件事: 資料分析是一種專業,也是一種需要合作和持續學習的領域。

以往學習PAPER刊出來的分析方法,軟體套件等 ,等到自己摸熟眉角能運用得很好都太慢了。專業的資訊分析師,能有經驗也有效率的一起把資料抽絲剝繭,回答生態學家關心的問題,好奇的現象是否符合假設,還是有不同的面向?  他們的經驗往往比我們更能中立而且克服資料的限制來探討,這是目前我自己都還做不到的程度。

總之,一年後的今天,開始邁向資料分析的合作,
這一年,會把資料整理好,準備好,也學習基本的視覺化處理。

這一步,是放下過往覺得凡事要自己承擔的心情,
這一步,是要潛到水中埋頭探索
這一步,是發揮團體的力量,跟上時代。



2018年的這週,白天和15個亞洲人一起絞盡腦汁討論分析,
晚上回到冷冷的宿舍中煮食,繼續跑DATA。
又該回到這樣的模式中。

沒有留言: