はてなダイアリー、2000日間継続達成


2007/01/01から始めてみたこの取り組みも今日2012/06/21で『2000日連続』となりました。


1500日連続の時にも書いてるように、はてなダイアリーの機能特性上必ずしも『その日のうちにエントリUP×2000日』と言う訳ではありません。(割と3日間位は平気で遅延→後で埋めてたりします)


また、エントリの内容も必ずしも技術的なものであったり、中身のあるエントリでも無かったりします。(多くは日々の記録系。Twilogで日々のつぶやきがまとめられるのを知ってからはとても助かっておりますw)


と言う訳で、2000日間継続エントリを記念して、これまでのエントリの傾向やタグによるエントリ内容の割合を出してみる事にしました。

まずはこれまでの投稿数:おおよそ2800超。2000日連続で書く前にも不定期で書いてたり、1日複数エントリ書く場合もあるのでまぁこんなもんかな〜という数字。

次にデータ内容自体に踏み込んでみます。はてなダイアリーについては、データのインポート・エクスポート機能が付いているので後者の機能でxmlファイルをダウンロードしてみましょう。[管理]→[インポート/エクスポート]→[ブログのエクスポート]から『はてなの日記データ形式』ダウンロードのリンクをクリックしてファイルを落としてきます。

…ファイルの容量ですが、約20MB、13万行近くありました(笑)

そして気になる(?)文字数ですが、なんと合計で1500万字を超えていました。
そこそこ多いだろうな〜とは思ってましたが、この数値にはびっくり。(^_^;)


最後に、上記でダウンロードしたxmlファイルの見出し(レベルにあるタグ情報)からこれまでのエントリの比率等を割り出してみます。用意したのはこちらのGroovyファイル。(HatenaEntryAnalyzer.groovy)

def map = [:]
file = new File('absj31.xml');
int count = 0;
int tagCount = 0;
file.eachLine {
    text = it;
    if (text =~ /.\d{10}.\[/) {
        count++;
        String category = text.find(/(\[.*\])/);
        String[] categoryArray = category.split(/\]/)
        categoryArray.each {
            tx = it.replace('[', '');
            tagCount++;
            map[tx] = (map[tx]==null) ? 1 : (map[tx]+1)
        }
    }
}
println "総エントリ数:" + count;
println "総タグ利用数:" + tagCount;
map.entrySet().sort(){it.value}.reverseEach {
    println "${it.value},[${it.key}] ";
}

何てことは無い、エントリ見出し行に該当する行を抽出後、エントリにあるタグ([Java],[雑記]など)を更に引っこ抜き、種別毎にカウント集計するというものです。

結果をおおよその大分類に振り分けて見た結果がこちらになります。円グラフ作成にはあの『べつやくメソッド』を用いました。(知らない人は関連エントリを見てみよう)

ざっくりな予想はだいたい付いてたが…という感じの結果になりました。以下内訳。

日々の記録・雑記(2627:57%)

1186	[雑記]
681	[Twitter]
375	[健康]
337	[歩]
46	[Sports]

基本的にTwilogでつぶやき記録残す時は雑記と併せて書いてるので、それだけで(700*2=)1400エントリにも上るのか。健康x歩の組み合わせも記録付けてる時は大体ペアで書いてるし。忙しくて時間が取れない時とかネタが出てこない時にはこの手でエントリを埋めて行くことが出来てたので、これには大いに助かっております&これからも使わせて頂く事でしょう(笑)

技術・IT関連(883:20%)

98	[Java]
55	[自宅鯖]
44	[Agile]
40	[Ubuntu]
39	[仕事]
38	[Flex]
34	[Eclipse]
28	[Project]
20	[Scrum]
20	[Javascript]
18	[Groovy]
17	[Android]
17	[Spring]
16	[Flash]
15	[Jenkins]
13	[AIR]
13	[Windows7]
13	[JavaEE]
13	[開発]
12	[Mac]
11	[GlassFish]
11	[WebService]
11	[WebTech]
10	[CSS]
9	[Playframework]
9	[ActionScript]
8	[TDD]
8	[Testing]
8	[GWT]
8	[会社鯖]
7	[CI]
7	[Redmine]
7	[Tomcat]

これ以下も続いてたのですが、長くなり過ぎたので割愛。色々なジャンルやテーマについて、節操無く手を付けているのがこの結果だけでも見てとれますね…。これからは幾らか絞れる所は絞っていって、その上で(総数に占める)技術エントリも増やしていきたい所です。

趣味・購入記録(846:18%)

535	[Book]
131	[Music]
62	[Movie]
57	[CD]
51	[DVD]
6	[Blu-ray]
4	[動画]

ここは主にAmazon等で購入した品物の購入記録がカウントされてます。雑誌とかも含んでるのでこの多さになってるけど、結構な頻度でモノ買ってるんですねぇ…。

参戦レポート(217:5%)

135	[勉強会]
64	[Live]
18	[読書会]

最後はこちら、『参戦記録』。

ブログを書き始めた当初はアーティストのライブに参戦した記録をちょこちょこと残していた程度だったんですが、勉強会に参加するようになってからはそちらの割合が格段に増え、またライブ観賞時に持っていた細かい所まで拾おうとする点(小ネタとか)が、勉強会参戦レポートのそれにも引き継がれて今のスタイルになって行ったのでは、というのも振り返るとあったような気がしてます。一時期勉強会に節操無く出まくっていた時期があったのは、個人的には反省というか改善材料ではある(笑) 出るのは悪くないと思うんだが、その後がね。


そんな感じで2000日分の内容をざっくり振り返ってみました。これが2500日、3000日と続いて言った場合、その時の比重・割合はどれだけ変わってるだろうか?より身のある内容をアウトプット出来るように日々修練して行こうと思います。また、ここまででブログにアクセスして頂いた皆さん、ありがとうごうざいます。今後ともよろしくお願い致します。