翻訳と辞書
Words near each other
・ C3H4O2
・ C3H6
・ C3H6N2
・ C3H6O
・ C3H6O2
・ C3H7NO2
・ C3H8
・ C3PO
・ C4
・ C4 plant
・ C4.5
・ C40-9
・ C40-9W
・ C401SA
・ C402DE
・ C404S
・ C409CA
・ C40H56
・ C40H56O
・ C40H56O2


Dictionary Lists
翻訳と辞書 辞書検索 [ 開発暫定版 ]
スポンサード リンク

C4.5 : ウィキペディア日本語版
C4.5[しー45]
C4.5はロス・キンランが開発した決定木を生成するためのアルゴリズムである。C4.5はキンランのID3アルゴリズムの拡張である。C4.5が生成する決定木はクラス分けのために使うことができ、このため、C4.5はしばしば統計学的クラス分類器とみなされている。
== アルゴリズム ==

C4.5はID3と同じ方法で情報エントロピーの概念を用いて教師データのセットから決定木を生成する。教師データはS = すでにクラス分けがされているサンプルである。それぞれのサンプル s_i = は属性や特徴を表現するベクトル x_1, x_2, ... である。教師データはそれぞれのサンプルが属するクラスを表現しているベクトルC = で拡張される。
C4.5はそれぞれのデータの属性はデータを更に小さな部分集合に分割する決定に使用できるという事実を利用している。C4.5はデータを分割するための属性を選択した結果による正規化されたインフォメーション・ゲイン(エントロピーの違い)を調査する。最も大きな正規化されたインフォメーション・ゲインを示す属性は決定を行うために使うものである。アルゴリズムはより小さなサブリストに再帰的に適用される。
このアルゴリズムはベースとなるケースが数個であり、最も一般的なベースケースはリスト内のすべてのサンプルが同じクラスに属する場合である。この場合、そのクラスを選択するように示すリーフノードを決定木を生成する。どの特徴もインフォメーション・ゲインにつながらない場合も起こりうり、この場合C4.5ではクラスの期待値を使ってツリーの上に決定ノードを生成する。クラスのインスタンスが一つも生成されない場合もあり、この場合も期待値を使ってツリーの上に決定ノードを生成する。
アルゴリズムの疑似コードは以下のようになる。
Check for base cases
For each attribute ''a''
Find the normalized information gain from splitting on ''a''
Let ''a_best'' be the attribute with the highest normalized information gain
Create a decision node ''node'' that splits on ''a_best''
recur on the sublists obtained by splitting on ''a_best'' and add those nodes as children of ''node''

抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)
ウィキペディアで「C4.5」の詳細全文を読む




スポンサード リンク
翻訳と辞書 : 翻訳のためのインターネットリソース

Copyright(C) kotoba.ne.jp 1997-2016. All Rights Reserved.