トップ 履歴 一覧 Farm ソース 検索 ヘルプ RSS ログイン

featuretoolsRパッケージで特徴量エンジニアリング


キーワード

最終更新時間:2020年02月22日 16時07分41秒
アフィリエイト・広告について
プライバシーポリシー

はじめに

featuretoolsRパッケージは、Pythonで自動的に (機械学習のための) 特徴量生成を行うfeaturetoolsライブラリをRから呼び出すためのインターフェースです。

機械学習モデルの精度を向上させるために、様々な特徴量を生成し、もとのデータに追加する特徴量エンジニアリングが効果的であることが知られています。featuretoolsライブラリは、既存の特徴量を足し合わせたり、かけ合わせたり、その他様々に加工して新たな特徴量を生成する作業を、(指示するだけで) 自動的に実行できます。

詳しくは、以下のGitHubレポジトリのコードおよび、MyBinderによるデモ環境で確認してください。

この文書はRでfeaturetoolsRパッケージを使用する方法を書いていますが、Pythonでfeaturetoolsライブラリを使った特徴量エンジニアリングの例が、特徴量エンジニアリング・ヒッチハイクガイドにあります。

デモへのアクセス

実際に動作する環境、コードを用意しました。GitHub上にあるコード (RNotebook) を、MyBinderでオンデマンドに実行できるデモ環境で動作を確認できます。以下のURLにアクセスすると、RStudioが起動します。ディレクトリ内の featuretoolsR_example.Rmd を開き、各チャンクを実行してみてください。
https://mybinder.org/v2/gh/ltl-manabi/featuretoolsR_example/master?urlpath=rstudio

RNotebook内にも書いていますが、チャンクを実行し、library(featuretoolsR) とするところで、コンソールにPython環境をインストールするかの質問が表示されます。MyBinderにおけるデモ環境では、すでにPython環境もセットアップしているため、ここでは n と答えてください。


なお、GitHubレポジトリは以下のURLです。
https://github.com/ltl-manabi/featuretoolsR_example


関連ページ: R言語を学ぶための参考書籍リスト, 特徴量エンジニアリング・ヒッチハイクガイド
カテゴリ: [R,機械学習,データサイエンス,データ分析]