Kernel/VM Advent Calendar2013 1日目

ヽ('ω')ノ三ヽ('ω')ノもうしわけねぇもうしわけねぇ

先日,jubatusが0.5にアップデートがありました.
そこでfluentdのプラグインも0.5に対応中です.

Jubatus 0.5

0.5は?

0.5では新しく,クラスタリングが新しくサポートされてます.

とりあえず動かしてみます

$ jubaclustering -c /path/to/jubatus/example/config/clustering/kmeans.json &

これでkmeansがjubatusで動きま始めました.
Jubatusのプロジェクトで公開されてるデータクラスタリングしてみます.

require 'jubatus/clustering/client'
require 'csv'

def csv2datum(file, keys)
  datum = []
  CSV.open(file).each do |row|
    data = Hash[*(keys.zip(row).flatten)]
    data.each do |key, val|
      if val =~ /^[+-]?[0-9]*[\.]?[0-9]+$/
        data[key.to_s] = val.to_f
      else
        data[key.to_s] = val.to_s
      end
    end
    datum << Jubatus::Common::Datum.new(data)
  end
  datum
end

jubatus = Jubatus::Clustering::Client::Clustering.new('127.0.0.1', 9199, '')
keys = (0...20).map{|x| x.to_s}
csv = csv2datum('baseball.csv', keys)
jubatus.push(csv)

p jubatus.get_nearest_members(csv.first)

うん?このデータがクラスタリングの評価に向いてるかって?
実行してみればいいじゃない

ヽ('ω')ノ三ヽ('ω')ノもうしわけねぇもうしわけねぇ

いろいろとヽ('ω')ノ三ヽ('ω')ノもうしわけねぇもうしわけねぇ.

Jubatus Casual Talksで話してきた

Jubatus Casual Talksで話してきた

Jubatus Casual Talksで話してきました.mikutter-jubatusとfluent-plugin-jubatusを話しました.mikutter-jubatusについては以前書いたのでここでは割愛します.

fluent-plugin-jubatus

Fluentdに投げられたデータをJubatusに投げて結果を再びFluentdに投げるプラグインです.
Fluentdはリアルタイムで流れるようにデータが得られますので,リアルタイムで評価できるJubatusと相性がよいと考えています.今はサポートしている機能として,分類器と異常値検知のみです.また,分類器では学習はサポートしておらず,判定のみをサポートしています.

異常検知

異常検知については,Jubatus Casual Talks開催中に実装されたのでここで説明をいたします.異常検知では,jubaanomalyを利用してFluentdから流れてくるデータを評価し異常値を算出します.

設定例

<match hoge>
  type jubatus
  client_api anomaly
  host 127.0.0.1
  port 9199
  str_keys string1, string2
  num_keys number1, number2
  tag jubatus
</match>

上の設定例では異常値検知を用いたfluent-pluginです.
client_apiで機能を設定します.今はclassifierとanomalyのみが設定できます.
host, portはJubatusの起動しているサーバアドレス,ポート番号を指定します.
str_keysとnum_keysではJubatusに渡すデータのキーを指定します.
tagでは結果をFluentdへ渡すために指定します.
このプラグインでは基本的にJubatusにデータを渡すだけですので,精度の高くしたい場合はJubatusのパラメータをきちんと設定する必要があります.

おわり

簡単にですが,fluent-plugin-jubatusについて説明しました.FluentdからJubatusに渡すことでログ解析がより楽になると思います.
最後にプルリクエスト待ってます.
https://github.com/katsyoshi/fluent-plugin-jubatus

大江戸Ruby会議03に参加 && Ninja Talksしてきた

先日の2013年3月16日に大江戸Ruby会議03に参加してNinja Talksしてきました.

Ninja Talksでは「Asakusa.rbに1年間通ったらこうなった」というタイトルで話しました.

で,「Asakusa.rbに1年間通ったらこうなった」のですが,通い続けたら発表することになりまして,その部分についてここで書きたいと思いますよ.

Asakusa.rbに参加して

もともと2011年のRuby会議のあと,なにかRubyコミュニティに参加したいなぁと思ってました.で去年の2月にDave ThomasがAsakusa.rbにくるという話がでてきて,これは行く必要がある!!と思ってたのですが,その日は,色々とやることがあっていけなかったのです.
色々とあり4月から上野周辺で働くことになり,「おおっこれは参加できるぞ!!」と思ったのですが,4月は色々とあり参加できなくて,5月の中旬から参加するようになりました.

参加しはじめてからはほぼ毎週参加してました.あとはかくたにさんの話のようにほとんど話をせずにmikutterをいじったりしてます.そうしたらいきなりかくたにさんから話してよって言われてちょっととまどったのですが,こんな機会そうそうないので話することにしました.

という感じで毎週参加してます.

大江戸Ruby会議03

すごくよかったのですが,発表でいっぱいいっぱいだったので他の参加者のブログとかを見たほうがいいんじゃないでしょうか.

枠アドベントカレンダー7日目

この記事は枠アドベントカレンダー7日目のために書かれています.

枠との出会い

枠さんとの出会いは今年の4月1日にあったカーネルVM探検隊@関西
だと思います.よく覚えてないすまん

二度目

二度目は,枠さんがセキュキャンのために上京?(関西から関東へは下るなのかな?)
来たときに,いっしょに銀座で遊びました.
この日?前日?に枠さんは,ウサギィに遊びにいっててすごく関係
者に怒られてたようなのですごく気になってました.

あってみると大人しくしててごくごく普通のこに見えたました.

おわり

枠さんとあったのは2回(実質1回)でしたがそんなにキチッてないきはします.

情報科学若手の会2012に行ってきた

9月15〜17日に情報科学若手の会があったらしいので行ってきた.

参加した理由は,去年の会がツイッターで流れてきてて面白そうだなと思いコレは是非参加しないと思って参加しました.

1日目

自己紹介

ネタとしてGentoo Tシャツ着て行ったら以前Gentoo開発してまして~という人が!!

Mac電源壊れる

隣のひとに借りる.GitHubのmikutterをakafukuにupgrade作業

kachamanさんぱねぇ

2日目

電源がないのでyoppi3さんに電源かりる.ねっとわーくが前日より安定した.

よる

さけうめぇ.katsyoshiはえぬかねのおどりを踊った!!

ZFSとか

田中社長,yoppi3にZFSのうまい運用法聞いたり,Gentoo/Linuxの魅力を宣伝?したり.高速LANの話きくのわすれてた

女帝にセクハラ

湯村さんに研究のことちょっとはなした

3日目

寝たのが4時だったのに7時15分ぐらいに起きたので海へ.
f:id:katsyoshi:20120917073028j:plain
飯の時間ちょっとおくれるが10人ぐらいしかきてなかった.
酒まだ残ってる元気でない食欲でない.

楽しい3日間でした.
おわり