PMML Conformance

PMMLドキュメント妥当性

PMMLは分析的なモデルのtrainedな実例を示すXMLドキュメントのための標準です。モデルの次のクラスが名づけられています:

・Association Rules(連想規則)
・Decision Trees(決定木)
・Center-Based & Distribution-Based クラスタリング
・Regression(回帰)
・General Regression(一般的回帰)
・Neural Networks(ニューラル・ネットワーク)
・Naive Bayes(ナイーブベイズ)
・Sequences(シーケンス)

付加的な属性や要素タイプを内的なDTDで定義できる参照DTD(http://www.dmg.org/v2-0/pmml_v2_0.dtdで見出される)と比してXMLドキュメントが妥当であり、かつ、http://www.dmg.org/v2-0/で見出されるモデルの詳細において表\記される制限にしたがっているのであれば、そのXMLドキュメントは妥当なPMML 2.0である。モデルの詳細は、DTDの内では含意されない様々な制限を定義します。例は次のとおりです:

「%FIELD-NAMEの値;データ・ディクショナリー中の、あるいはtransformation dictionary中のフィールドを参照しなければならない。」

あるいは

「DataFieldに高々2つのinterval要素が存在するだけなければならない」

PMML適合

PMMLは、様々なツールによって生み出された分析的なモデルのアプリケーション移植、共有および再利用を可能\にすることを意図しています。適合は、それゆえ、製造者および利用者の両方の観点から指定されるべきである。アプリケーションは、それらが利用することができる分析的なモデルの種類を指定する方法を必要とする。そして、モデリングツールは、それらが生み出す分析的なモデルの種類を指定する方法を必要とする。PMMLドキュメントはtrainedな分析的なモデルを指定するモデリング・ツールによって生成されるもので、そのモデルを展開させるためにアプリケーションが利用するものです。製造者適合規則(conformance rules)を満たすことは、モデル定義ドキュメントが文法的に正しいことを保障し、実際に、モデルの詳細で定義される意味論的基準と整合しているモデル実例を定義することを保証します。利用者適合規則を満たすことは、そのようなモデルが妥当な方法で適用されるだろうということを保証します。

製造者適合(Producer Conformance)

あるツール、もしくはアプリケーションが、モデルの少なくとも一つのタイプのPMMLドキュメントを生成するなら、それは製造者適合をしている。製造者適合ステートメントは、このやり方でサポートされるモデルのどれかのタイプを含んでいなければならない。製造者適合は、データマイニング ツール/アプリケーション ベンダーとユーザーとアプリケーションが供給する種類のモデルを定義するPMMLドキュメントがインテグレート可能\で利用可能\であると主張するアプリケーション供給者の間の「契約」である。

利用者適合(Consumer Conformance)

アプリケーションが、モデルの少なくとも一つのタイプの妥当なPMMLドキュメントを受け入れるならば、それは利用者適合をしている。利用者適合ステートメントは、どのタイプのモデルが受け入れられるかを指し示していなければならない。アプリケーション適合はアプリケーション供給者とユーザー、それらのタイプのモデルを定義するPMMLドキュメントがインテグレート可能\で利用可能\であると主張するデーマイニング ツール/アプリケーション ベンダーの間の「契約」である。アプリケーションが多項式回帰モデル(Polynomial-Regression-model)タイプに対して利用者適合であるなら、異なる製造者によって生み出されたこのタイプのモデルを定義する妥当なPMMLドキュメントが、そのアプリケーションにおいて交換可能\であるだろう。

核および非核特徴(Core and Non-Core Features)

モデルの与えられたクラスに対して、対応するDTDおよび詳細が、すべての適合手続きと利用者がサポートしなければならない核となる特徴を識別し、オプションとしてサポートされるであろう非核な特徴を識別します。