HTML構造における頻出パターンのマイニングによるWWWからの情報抽出 どうもタグの構造のパターンを抽出できるらしい(未読)。だとしたら、大量のTEIでマークアップされたテキスト群に対して...なんてことができるかな。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。