How to Win a Data Science Competition (Week2-1 part1)
Kaggle 機械学習
Published: 2019-05-25

Exploratory Data Analysis

学習目標

  • Describe the major visualization tools
  • Generate hypotheses about data
  • Inspect the data and find golden features
  • Examine and analyze various plots and other data visualizations

Exploratory data analysis

EDA って何?

データを分析すること。

EDAで必要なこと

  • データをよく理解すること
  • データについての直感を構築する
  • 仮説を立てる
  • 洞察する

コンペで提供されるデータは、匿名化、暗号化、前処理、難読化されていることがある

リーク

コンペの主催者がデータ準備中の誤り。

まとめ

コンペを始めるときは、モデルを構築する前にEDAからやった方が良い。

参考