時間序列為統計學的一種方法,最初使用的領域在經濟、財務領域,而後也推廣到像是生物、大氣或是行銷等領域。時間序列架構在時間類型的相關資料,藉由一些數學假設,讓資料達到穩態 ( Stationary ),使得過去的資料得以預測未來的資料。在這篇則會介紹最基本的 ARMA 模型、如何挑選及 R 的實作。
Stranity Blog
時間序列為統計學的一種方法,最初使用的領域在經濟、財務領域,而後也推廣到像是生物、大氣或是行銷等領域。時間序列架構在時間類型的相關資料,藉由一些數學假設,讓資料達到穩態 ( Stationary ),使得過去的資料得以預測未來的資料。在這篇則會介紹最基本的 ARMA 模型、如何挑選及 R 的實作。
說到用R整理資料一定會想到強大的 dplyr 套件,除了必備的 dplyr 套件外,小編也發現一個挺有趣的 reshape2 套件可以做資料的變形,所以想來分享一下。
在 2013 年 Google 公布了一個開源項目 word2vec,有別於以往常用的文字探勘的模型 RNN ( recurrent neural network) 或 N-gram model,word2vec 提供了另一個角度來理解非結構化的純文字資料。在這篇會稍微介紹 word2vec 的原理,並分析鉅亨網的頭條新聞。
台指期從1998年7月21號開始以8131的指數為開盤價,之後的價格曾上漲破10000點,也曾下跌破4000點。在不同的台指期價格,其價格的波動會有所不同嗎?
文字探勘 ( Text mining ) 通常用在擷取非結構化資料,我們的生活中存在著許多非結構化的資料,像是新聞、網路論壇 PTT、Mobile01 、社群網站 Facebook、 Twitter 等等文字相關的資料。