在進行資料分析時,時常會透過畫折線圖、散佈圖等等將資料視覺化的動作,方便分析者做觀察資料。然而透過圖片來瞭解資料,會出現無法得知精準數字,需要回頭檢視資料找特定筆數值,有時候會讓小編覺得有點麻煩。
Stranity Blog
在進行資料分析時,時常會透過畫折線圖、散佈圖等等將資料視覺化的動作,方便分析者做觀察資料。然而透過圖片來瞭解資料,會出現無法得知精準數字,需要回頭檢視資料找特定筆數值,有時候會讓小編覺得有點麻煩。
在建構模型時,或是模型模擬需要反覆的大量運算時,時間成本常常會高到讓開發者無法忍受。也因此有之前的 Parellel 與 GPU 運算。但前面兩篇可以有效的加速的前提,是建立在資料結構與想要的結果可以使用向量運算的情況下。
整理資料的套件之一,來源 https://github.com/tidyverse/tidyr ,用來取代reshape與reshape2的套件。小編也使用過 reshape2 套件,雖然這兩套件大同小異,但tidyr使用起來更順手。這次主要介紹 tidyr 的三個重要函數來整理台指期的三大法人資料。
小編前一陣子幫忙另一個專案項目進行簡單的資料分析,
繼上次的台指期的籌碼面交易,在2014年2月至2017年1月確實有正的績效,這一次想用一些資料探勘的方法找出是否隔天的漲跌與今天的三大法人留倉資訊有關並且提高交易績效。