特徴量エンジニアリングのおすすめ本ランキング6選!【前処理・時系列】

2021-08-06

特徴量エンジニアリングのおすすめ本ランキング6選!【前処理・時系列】
mono
mono
こんにちは、monoです。

深層学習を除き、機械学習や統計モデルを設計する上で、特徴量エンジニアリングは避けて通れません。

特徴量エンジニアリングのコツを知っているだけでモデルの精度向上や学習時間の短縮に繋がりますので、データサイエンスに携わる人にとって重要なスキルとなります。

この記事では「特徴量エンジニアリングのおすすめ本」というテーマで、特徴量エンジニアリングの勉強におすすめの本を紹介します。

特徴量エンジニアリングにおすすめのライブラリについての本や、前処理・時系列データなどケースに特化した本も紹介するので、自分に合った本が見つかれば幸いです。

特徴量エンジニアリングのおすすめ本ランキング6選!

特徴量エンジニアリングの勉強におすすめの本を6冊ご紹介します。

機械学習のための特徴量エンジニアリング その原理とPythonによる実践

機械学習のための特徴量エンジニアリング その原理とPythonによる実践」は、データから良い特徴量を作る特徴量エンジニアリングについて書かれた本。

初心者に向けて数値「テキスト」「カテゴリ」「変数」の基本的な取り扱い方や、応用した「特徴量ハッシング」「ビンカウンティング」など、機械学習モデルの性能を最大限に生かす方法が詳しく解説されています。

図や例を使いPythonコードによる実行例を数多くあげて解説しているので、実際の業務に適用するための具体的な知識を得たいような人におすすめの本です。

Pythonではじめる機械学習 scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎」は、scikit-learnを使った機械学習の方法を解説する本。

特徴量エンジニアリングや、モデルの評価と改善など、scikit-learnを使った機械学習の方法について詳しく解説されています。

従来の機械学習の解説書にはない特長を備えているので、scikit-learnを使った機械学習の方法を勉強中な人におすすめの本です。

scikit-learnのおすすめ入門本ランキング6選!【2021年】

続きを読む

pandasデータ前処理入門機械学習・データサイエンスで役立つ前処理手法

pandasデータ前処理入門機械学習・データサイエンスで役立つ前処理手法」は、データ処理に必要な定番のライブラリであるpandasを用いた前処理の基本と様々な手法について紹介している本。

初歩的な要約統計量の算出やグループ化やダミー変数、文字列や時系列データの基本操作などについて詳しく解説されています。

初学者向けにシンプルでわかりやすいサンプルを用いて解説されているので、pandasの基本操作方法やデータ構造、さらに前処理の基本理解が必要な人におすすめの本です。

pandasのおすすめ入門本ランキング5選!【2021年】

続きを読む

前処理大全[データ分析のためのSQL/R/Python実践テクニック]

前処理大全[データ分析のためのSQL/R/Python実践テクニック]」は、データサイエンスに取り組む上で欠かせない前処理スキルの効率的な処理方法を網羅的に習得できる本。

様々なデータ処理のレシピや、R,Python,SQLを用いた実装方法など、前処理のテクニックについて詳しく解説されています。

データサイエンスの現場で重宝する内容なので、データサイエンティストやエンジニアでデータ分析に興味があるような人におすすめの本です。

前処理のおすすめ入門本ランキング6選!【2021年】

続きを読む

Kaggleで勝つデータ分析の技術

created by Rinker
¥3,428 (2021/09/19 19:46:07時点 Amazon調べ-詳細)

Kaggleで勝つデータ分析の技術」は、Kaggleの最新のものを整理してまとめた本。

特徴量の作り方や、バリデーション、パラメータチューニングなど、Kaggleのより深いところまで詳しく解説されています。

Kaggleの解説書にはあまり載っていないような手法やテクニックが数多く活用されているので、これからデータ分析の知識をより深めるべく勉強中な人におすすめの本です。

Kaggleのおすすめ入門本ランキング8選!【2021年】

続きを読む

現場ですぐ使える時系列データ分析 データサイエンティストのための基礎知識

現場ですぐ使える時系列データ分析 データサイエンティストのための基礎知識」は、時系列データの扱い方について、初心者にも分かりやすく書いてある本。

時系列分析の基礎知識からプロセスまで、詳しく解説されています。

時系列データの特徴や活かし方について分かりやすく解説されているので、将来データサイエンティスト志望な人におすすめの本です。

時系列データのおすすめ入門本ランキング5選!【2021年】

続きを読む

まとめ

今回は「特徴量エンジニアリングのおすすめ本」について紹介しました。

特徴量エンジニアリングは特定のモデルだけでなく、さまざまなモデルで役に立つスキルです。

機械学習や統計モデリングを生業にしている方であれば知っておいて損のない知識なので、この機会に学習してみてはいかがでしょうか。

では、また。

Pythonの勉強におすすめの入門本ランキングまとめ10選【初心者〜中級者】

続きを読む

  • この記事を書いた人

mono

26歳♂首都圏住みの副業会社員/ギークでズボラないい暮らし/ADHD・HSP傾向/将来はサイドFIREでのんびり暮らしたい/楽天経済圏/リベ大生/インデックス・高配当株投資300万/お仕事の依頼はこちら

スキルを磨く Python・R

おすすめ本

© 2021 monoblog