在前幾日,小編與同事的機器學習的讀書會中,與同事討論到了關於線性模型的參數最佳解,對於學統計或數學背景的人來說,如果模型存在封閉解,模型參數會存在最佳且唯一解是必然的事。
Stranity Blog
在前幾日,小編與同事的機器學習的讀書會中,與同事討論到了關於線性模型的參數最佳解,對於學統計或數學背景的人來說,如果模型存在封閉解,模型參數會存在最佳且唯一解是必然的事。
在程式交易中有許多數值來評價一個策略的特性或表現,這篇介紹其中一個重要的數值 MDD, 也稱作 “最大回撤" 或 “最大回檔" ,更嚴謹的策略品質分析中不只是看 MDD,也可能會看到2nd DD、3rd DD。發生的時間也是有相當的參考價值。這篇在介紹 MDD 定義與在 R 的應用。
時間序列為統計學的一種方法,最初使用的領域在經濟、財務領域,而後也推廣到像是生物、大氣或是行銷等領域。時間序列架構在時間類型的相關資料,藉由一些數學假設,讓資料達到穩態 ( Stationary ),使得過去的資料得以預測未來的資料。在這篇則會介紹最基本的 ARMA 模型、如何挑選及 R 的實作。
在 2013 年 Google 公布了一個開源項目 word2vec,有別於以往常用的文字探勘的模型 RNN ( recurrent neural network) 或 N-gram model,word2vec 提供了另一個角度來理解非結構化的純文字資料。在這篇會稍微介紹 word2vec 的原理,並分析鉅亨網的頭條新聞。
文字探勘 ( Text mining ) 通常用在擷取非結構化資料,我們的生活中存在著許多非結構化的資料,像是新聞、網路論壇 PTT、Mobile01 、社群網站 Facebook、 Twitter 等等文字相關的資料。
在資料分析的過程中,確認資料的正確性絕對是資料分析的第一個步驟。策略無限所使用的資料來源是向台灣期貨交易所購買的 Tick 資料,所以在資料的正確性是無虞的。