トップ «前の日記(2009年02月09日(Mon)) 最新 次の日記(2009年02月12日(Thu))» 編集 RSS feed

shinoのときどき日記


2009年02月10日(Tue)

Essence of Wiki研究会

オープンな公式サイトをネット上に作っていないのですが、クローズドに、Wikiについて研究する会を行っています。勉強会と異なり、メンバがメンバだけに、主に論文を作成し、学会に出すという形式で活動をしています。

「Essence of Wiki」とは、Wikiとはふつう「簡単なもの」という風にとらえられやすいのですが、じつは使いこなすのは、むずかしいのではないか、いや、実際、使っていて、「共同」でコミットするのは難しいぞ、また、Wikiは本来フラットなものだけれど、その中で構造化が行われるのはかなりのリテラシが必要だぞ、というのが、shinoの感触としてありまして、そこら辺を追求したいという目標(?)を持った研究会です。

主要メンバは、etoさん、svslabさん、SHIMADAさん、shinoです。

わたしをのぞいては、プログラミングなり、情報工学なり、情報学についてのエキスパート揃いで、毎回、このメンバでミーティングをするたびに、いかに自分が無知であり、愚かであるかということを思い知らされます。

ミーティングの内容については具体的に書きませんが、いまは、主に、svslabさんのターンで、qwikWebのアクセスログと昨年とったアンケートをもとに、ごにょごにょしています。一応、アウトプットの目安は今年の3月から4月あたり。どこかの学会に提出されると思います。(と、軽くsvslabさんにプレッシャーをかけてみる)。

ちなみにアンケート集計に関して、データマイニングを利用するということで、まったく初学のわたしには、「数式を使わないデータマイニング入門 〜隠れた法則を発見する〜」岡嶋裕史著をすすめられました。(この本の感想についてはまた後で)

毎回、ミーティングのたびに、うまいなぁ、と、思うことをひとつ記します。etoさんの人への仕事(課題)の振り方。毎回、「○○のシナリオはどうなってるの?」という台詞がでます。これは、論文の構成をさしている場合もあるし、プロジェクトの進行をさしている場合もあるし、さまざまな事柄を示していますが、指示をひとつひとつ出すのではなく、担当者に考えさせる。

わたしは、つい、細かにダンドリを考えて、こう動いたら、次はこう動いて、と、指示を出してしまいがちなのですが、これは見習いたい!でないといつまでたっても引継ができないプロジェクトばかり作ることになる、と、思いました。

その後のお茶タイムで、etoさんに、「shinoさんも論文書きなさい」とハンドアックスを投げられ、shino流血 orz.

い、いや、書けるものなら、書きたいですよ!

しかし、mixiをやめて、この日記を再び本拠地として書きはじめて気がつきました。shino、文章力ない……。がくっ。

etoさんには「これだけ書ける人が周りにいる状況だからともかく何か書き始めたら、がんがんハンドアックスが飛んできて、絶対、書けるはずだから」と叱咤されました。

が、がんばります……。(今年は無理だけど!←宣言しておく)

読書会について

その後の帰り道、svslabさんに読書会についていくつかアドバイスをもらいました。そのうちのひとつ。

  •  数学系の書籍を読む場合は、例題のほかに、自分で「例題をつくる」

実際に、使ってみることによって、理解が深まる、ということです。これは他のプログラミング系の本を読むにしても同じことかもしれません。

ひとつの言語で書かれたことが、ほかの言語でどう表現できるか考える、など。

いま、横浜へなちょこプログラミング勉強会では、読書会を開こうとしていますが、進行の仕方に少し仕掛けを作るヒントが与えられたように思えました。

Tags: 勉強会

「数式を使わないデータマイニング入門 〜隠れた法則を発見する〜」

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)
岡嶋 裕史
光文社
¥ 735

データマイニングとは何か、と、一言で表現するならば、大量の情報の中から、「使える」法則性を発見すること、だとshinoは理解しました。

大量の情報から法則を取り出す手法はさまざまにあります。この本は、「数式を使わない」とうたっているので、その手法については大ざっぱに「回帰分析」「決定木」「クラスタ分析」「自己組織化マップ」「連関規則」「ニューラルネット」について概要を説明しています。

もう少し詳しい書籍になると、これらの「数式」や「プログラミング」の例題が出てくるのでしょう。(たとえば「集合知プログラミング」など。未読ですが)。

データマイニングは位置づけ的には、統計分析の延長線上にあるそうですが、決定的に違うのは、「取り扱う情報が、質と量において異なる」(p.10)だそうです。

そして、データマイニングにおいて重要なのは、見つけた「法則」が使えるかどうか、またどう使うかの意味付けを、「人間が行う」(p.31)ことだそうです。

「法則」が見つかったとしても、それが使えるものかどうか、またその「法則」の意味づけは、人間でないと判断がつかないというのが作者の主張です。

データマイニングの手法について、概要を理解するにはわかりやすい本ですが、最後に、現在、データマイニングで採取される情報がインターネットが主流である点から、知らないうちに、自分個人の情報も利用されているという、監視社会問題について警鐘をし、この本は終わります。わたしとしては、もう少し、「法則」の意味付けの例をそのページ分増やしてほしかったなという印象で終わりました。

(しかし、データマイニングの各手法については、もう一度、再読して、消化する必要あり)。

Tags: 読書

トップ «前の日記(2009年02月09日(Mon)) 最新 次の日記(2009年02月12日(Thu))» 編集 RSS feed
2000|03|
2007|01|03|04|05|06|10|12|
2008|01|02|03|04|05|06|07|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|
2012|01|02|03|04|05|06|07|08|09|10|11|12|
2013|01|02|03|04|05|06|07|08|09|10|11|12|
2014|01|02|03|04|05|06|07|08|09|11|12|
2015|01|02|04|05|09|10|12|
2016|01|03|04|05|08|
2017|01|02|04|05|06|07|08|09|10|
2018|05|06|
2019|08|12|
2020|01|03|04|
2021|01|12|
2022|01|09|11|
2023|01|