これまでTitanicのデータへAuto Modelを実行し、その結果を保存したファイル構成について見てきました。今回はLocal Repositoryに保存したAuto Modelのscore_setプロセスを利用し、テスト用データにモデルを適用して予測を行います。
まず、新規の Blank Processを作成します。
Local Repositoryに保存したAuto Modelの内容からDecision Tree の「score_set」プロセスを探して現在アクティブなプロセス(画面中央)へドラッグします。
リポジトリパネルからデータ「Titanic Unlabeled」を探してプロセスへドラッグします。ディレクトリは Samples > data > Titanic Unlabeled です。「Generate Attributes」オペレータもオペレータパネルから探してプロセスへドラッグします。
プロセス画面に3つの要素が置かれました。左から「Retrieve Titanic Unlabeled(Retrieve)」オペレータ、「Generate Attributes」オペレータ、「score_set」プロセスの順に配置します。3つを線で繋げておきましょう。
「Retrieve Titanic Unlabeled(Retrieve)」オペレータはTitanic Traningデータのテスト版データです。これから予測する「Survived」カラムは入っていません。「Generate Attributes」オペレータはカラムの追加を行うオペレータです。このオペレータでデータ「Titanic Unlabeled」へ「Survived」カラムを補います。「Survived」カラムが必要な理由は、Auto Model の「score_set」プロセスが予測する列を必要とするためです。列の内容はダミーで構いません。
「Generate Attributes」オペレータは追加する「Survived」カラムの設定が必要です。プロセス上の「Generate Attributes」オペレータを押下し、更にパラメータにある「Edit List」を押下してください。「column name」には「Survived」と入力します。「fuction expressions」はダミーとして「TRUE」と入力してください。これを適用してプロセスを実行します。
結果が表示されました。「prediction(Survived)」、「confidence(xxxxx)」という列が確認できます。「prediction(Survived)」は予測した内容、「confidence(xxxxx)」は予測の信頼度です。
これにて終了です。
コメント
0件のコメント
記事コメントは受け付けていません。