Kernel/VM Advent Calendar2013 1日目
ヽ('ω')ノ三ヽ('ω')ノもうしわけねぇもうしわけねぇ
先日,jubatusが0.5にアップデートがありました.
そこでfluentdのプラグインも0.5に対応中です.
Jubatus 0.5
Jubatusとは?
Juabtusはオンライン機械学習向け分散処理フレームワークです.
0.5は?
0.5では新しく,クラスタリングが新しくサポートされてます.
とりあえず動かしてみます
$ jubaclustering -c /path/to/jubatus/example/config/clustering/kmeans.json &
これでkmeansがjubatusで動きま始めました.
Jubatusのプロジェクトで公開されてるデータをクラスタリングしてみます.
require 'jubatus/clustering/client' require 'csv' def csv2datum(file, keys) datum = [] CSV.open(file).each do |row| data = Hash[*(keys.zip(row).flatten)] data.each do |key, val| if val =~ /^[+-]?[0-9]*[\.]?[0-9]+$/ data[key.to_s] = val.to_f else data[key.to_s] = val.to_s end end datum << Jubatus::Common::Datum.new(data) end datum end jubatus = Jubatus::Clustering::Client::Clustering.new('127.0.0.1', 9199, '') keys = (0...20).map{|x| x.to_s} csv = csv2datum('baseball.csv', keys) jubatus.push(csv) p jubatus.get_nearest_members(csv.first)
うん?このデータがクラスタリングの評価に向いてるかって?
実行してみればいいじゃない
ヽ('ω')ノ三ヽ('ω')ノもうしわけねぇもうしわけねぇ
いろいろとヽ('ω')ノ三ヽ('ω')ノもうしわけねぇもうしわけねぇ.
Jubatus Casual Talksで話してきた
Jubatus Casual Talksで話してきた
Jubatus Casual Talksで話してきました.mikutter-jubatusとfluent-plugin-jubatusを話しました.mikutter-jubatusについては以前書いたのでここでは割愛します.
fluent-plugin-jubatus
Fluentdに投げられたデータをJubatusに投げて結果を再びFluentdに投げるプラグインです.
Fluentdはリアルタイムで流れるようにデータが得られますので,リアルタイムで評価できるJubatusと相性がよいと考えています.今はサポートしている機能として,分類器と異常値検知のみです.また,分類器では学習はサポートしておらず,判定のみをサポートしています.
異常検知
異常検知については,Jubatus Casual Talks開催中に実装されたのでここで説明をいたします.異常検知では,jubaanomalyを利用してFluentdから流れてくるデータを評価し異常値を算出します.
設定例
<match hoge> type jubatus client_api anomaly host 127.0.0.1 port 9199 str_keys string1, string2 num_keys number1, number2 tag jubatus </match>
上の設定例では異常値検知を用いたfluent-pluginです.
client_apiで機能を設定します.今はclassifierとanomalyのみが設定できます.
host, portはJubatusの起動しているサーバアドレス,ポート番号を指定します.
str_keysとnum_keysではJubatusに渡すデータのキーを指定します.
tagでは結果をFluentdへ渡すために指定します.
このプラグインでは基本的にJubatusにデータを渡すだけですので,精度の高くしたい場合はJubatusのパラメータをきちんと設定する必要があります.
おわり
簡単にですが,fluent-plugin-jubatusについて説明しました.FluentdからJubatusに渡すことでログ解析がより楽になると思います.
最後にプルリクエスト待ってます.
https://github.com/katsyoshi/fluent-plugin-jubatus
大江戸Ruby会議03に参加 && Ninja Talksしてきた
先日の2013年3月16日に大江戸Ruby会議03に参加してNinja Talksしてきました.
Ninja Talksでは「Asakusa.rbに1年間通ったらこうなった」というタイトルで話しました.
で,「Asakusa.rbに1年間通ったらこうなった」のですが,通い続けたら発表することになりまして,その部分についてここで書きたいと思いますよ.
Asakusa.rbに参加して
もともと2011年のRuby会議のあと,なにかRubyコミュニティに参加したいなぁと思ってました.で去年の2月にDave ThomasがAsakusa.rbにくるという話がでてきて,これは行く必要がある!!と思ってたのですが,その日は,色々とやることがあっていけなかったのです.
色々とあり4月から上野周辺で働くことになり,「おおっこれは参加できるぞ!!」と思ったのですが,4月は色々とあり参加できなくて,5月の中旬から参加するようになりました.
参加しはじめてからはほぼ毎週参加してました.あとはかくたにさんの話のようにほとんど話をせずにmikutterをいじったりしてます.そうしたらいきなりかくたにさんから話してよって言われてちょっととまどったのですが,こんな機会そうそうないので話することにしました.
という感じで毎週参加してます.
大江戸Ruby会議03
すごくよかったのですが,発表でいっぱいいっぱいだったので他の参加者のブログとかを見たほうがいいんじゃないでしょうか.
枠アドベントカレンダー7日目
この記事は枠アドベントカレンダー7日目のために書かれています.
枠との出会い
枠さんとの出会いは今年の4月1日にあったカーネルVM探検隊@関西
だと思います.よく覚えてないすまん
二度目
二度目は,枠さんがセキュキャンのために上京?(関西から関東へは下るなのかな?)
来たときに,いっしょに銀座で遊びました.
この日?前日?に枠さんは,ウサギィに遊びにいっててすごく関係
者に怒られてたようなのですごく気になってました.
あってみると大人しくしててごくごく普通のこに見えたました.
おわり
枠さんとあったのは2回(実質1回)でしたがそんなにキチッてないきはします.
情報科学若手の会2012に行ってきた
9月15〜17日に情報科学若手の会があったらしいので行ってきた.
参加した理由は,去年の会がツイッターで流れてきてて面白そうだなと思いコレは是非参加しないと思って参加しました.
1日目
Mac電源壊れる
隣のひとに借りる.GitHubのmikutterをakafukuにupgrade作業
kachamanさんぱねぇ
2日目
昼
電源がないのでyoppi3さんに電源かりる.ねっとわーくが前日より安定した.
よる
さけうめぇ.katsyoshiはえぬかねのおどりを踊った!!
女帝にセクハラ
湯村さんに研究のことちょっとはなした
3日目
寝たのが4時だったのに7時15分ぐらいに起きたので海へ.
飯の時間ちょっとおくれるが10人ぐらいしかきてなかった.
酒まだ残ってる元気でない食欲でない.
楽しい3日間でした.
おわり
真のプログラマーを目指す人が最初に学ぶべきたった一つの言語
Engilsh
hello hatenablog world!!
Hello, HatenaBlog World!!
えむどりさんから招待されたのではじめてみました!!