2004-09-21 テキスト構造のマイニング パソコン・インターネット 文字・言語 HTML構造における頻出パターンのマイニングによるWWWからの情報抽出 どうもタグの構造のパターンを抽出できるらしい(未読)。だとしたら、大量のTEIでマークアップされたテキスト群に対して...なんてことができるかな。