FC2ブログ

フリーのデータマイニングツール Weka

自動売買のアルゴリズムを開発するにあたって、Excelでグラフを書いてデータを眺めるだけでは限界が見えてきました。そこで、Wekaというデータマイニングツールを使ってみることにしました。
WekaはJavaで書かれたフリーソフトです。Windows版はインストーラが付いていて、ほぼ設定なしで動作します(取り扱うデータ量によっては、JavaのVMがメモリ不足になるので、付属のRunWeka.iniファイルを書き換える必要があります)。GUIで扱うことができ、CSVファイルをそのまま読み込んで処理することもできるので、この手のアプリケーションにしては敷居が低いと思います。
まだ決定木を自動生成させる程度のことしかやっていませんが、同種のことをExcel+VBAでやるのは難しいだろうと思います(その手の作りこまれたライブラリが備わっていないことや、速度面や扱えるデータ量の都合で)。
肝心の自動売買については、Wekaでデータを分析させても新しいアルゴリズムを見つけるのは難しそうです。Excel+グラフ+VBAという環境よりは見つけやすいと思いますが、結局は試行錯誤の連続になりそうです。私自身は統計学のことはサッパリわかっていないので出鱈目なやり方になってしまっているというのもあります(参考書みたいなのを買ってきたほうがいいかも)。もとのデータが粗雑なせいもあって、条件を厳しくすると決定木を生成してくれませんし、条件を甘くすると分岐だらけになってしまいます。良さそうな条件が見つかったと思ったら、すでに自動売買に組み込まれている条件だったりします。
とりあえず役に立ちそうなリンクを下に書いておきます。

Weka 3 - Data Mining with Open Source Machine Learning Software in Java
WEKAの配布先です。

How to use Weka tool box
Wekaの動作確認方法、使い方など。

[PDF] WEKAと樹木モデル
Wekaの使い方、主な決定木の簡単な説明。

wekaexample1
線形回帰式のモデル木の使い方。オリジナルなデータによる説明。

weka-jp@weka-jp.info
日本語によるドキュメントらしいのですが、現在繋がりませんorz。

スポンサーサイト