オープンソースなデータサイエンスツール「RapidMiner Studio」を今更ながら触ってみた

RapidMiner Studio
Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInEmail this to someone

11月3日は文化の日です。文化とはWikipediaによれば、

人間が社会の成員として獲得する振る舞いの複合された総体

とありまして(棒読み)、僕にとってマーケティングとは、人とサービスとの密接なつながりを創る事。まさに”文化の創造”とも言える事なので、特別な事もなくいつもと変わらぬ枯れた日常を繰り返すのであります。

そんな本日行き着いたのが、オープンソースなデータサイエンスツール「RapidMiner Studio」です。

screen20161103

RapidMiner自体はどうやら2010年には実務で最も使われたデータマイニングツールとなっていたようで、既に老舗感すら感じさせます。

調べていく中で「Talend」と比較する記事などもあり、どちらかと言うとTalendがトレンドなのかもしれませんが、せっかくの文化を築いたRapidMiner Studioについての情報を残しておいても自分に損はないだろうという事で、この文化の日に簡単に触ってみた感想程度ですがまとめておきます。

RapidMiner Studioとは

オープンソースなデータサイエンスツールと書きましたが、どうやらドイツ製のETL(Extract:抽出・Transform:加工・Load:ロード)ツールのようです。ExcelやCSVなどのデータを読み込み、任意のプロセスで加工しグラフ化する作業を、ノンプログラミングで行えます。RやPythonなどとも連携できます。

日本語の正規代理店サイトもありますが、本家サイト版でも(ドイツ製なのに)英語か日本語かは言語選択できるので、まぁ本家サイト中心に使用してみてよいかと思います。

ちなみにオープンソース版だけでなく、高機能な有償版の「RapidMiner Server」やHadoopと類似した処理が可能な「Rapid Miner Radoop」などがあるようです。

ダウンロード&インストール

こちらのページから、ご自身のOSにあったファイルをDLしてインストールします。またGitHubにソースコードも公開されてます。

早速RapidMiner Studioを使ってみる

初回起動時、アカウント登録をする必要があるのでアカウント作成します。インターフェースに関して言うと、最初はヘルプやチュートリアルパネルが開いているので少しごちゃごちゃした印象を受けるかもしれませんが、それなりにシンプルにまとまっています。

screen2016110302

上部中央にある「デザイン」側でデータの抽出と加工手順を「プロセス」タブに組んで実行すれば、「結果」側でグラフによる視覚化ができます。

サンプルデータもアプリ内に同梱&本家サイトからDLできるので、とりあえず操作性やできる事を確認するには十分ではないかと思います。という事で、使ってみた印象をいくつかあげます。

簡単な集計がとてもスムーズ

データファイルをロードすると、すぐさま単純集計やプリセットされたグラフ出力がされます。

screen2016110303

RやPythonのようにグラフ描画の言語処理も要らなければ、加工も必要ありません。もちろん数量化が必要なデータはクレンジングしてあげないといけませんが、とりあえずノンプログラミングでのこの手軽感はさすがです。k-meansでのクラスタ分析とかまでドラッグ&ドロップでサクサクいけるのありがたい。

チュートリアル動画の充実度がすごい

すでに実績あるツールなので、あとから考えると当たり前とも思えるのですが、本家サイトのチュートリアル動画を見ているだけでも操作性やできることは十分に理解できます。R StudioをUdemyで見てたのと同じ感覚で学べる。機能面だけでなく、こういったサポート面でも学習コストって変わるんですね。

機能拡張についてはこれからだけどすごそう

さすがにそこまで使えてないので分かりませんが、オープンソースだしプラグインが数多くあるのは嬉しいですね。自分の薄っぺらさが出る発言ですがそこは気にしない。気にしない。

日本語サイトのブログも参考に。

ツール自体は本家サイトでも十分な印象と思ってますが、日本語サイトのブログもなかなか面白そうなので参考までに。IoT分析についてやGoogleの機械学習サービス「TensorFlow」なんかにも触れたコンテンツやセミナー情報なども掲載されてました。

そう、今何がしたくてこの辺りを調べてたかというと、IoT & AIと連携できるオープンソースな分析ツールを知りたかったんですよね。RapidMiner Studioでまだそこを試せてたわけではないけれど、かなり面白そうなツールだなぁ…と思いつつ、Talendの件もあるので双方追っかけてみようかと思ってます。

とりあえず、Talendハンズオンセミナー見つけたので応募してみました。文化の日というよりは、勉強の秋…てかもう冬か?今年初めて暖房入れました。急に寒くなってきたし、風邪が流行っているようなので皆さんもお気をつけください。。

Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInEmail this to someone