アンケート分析（２）：スケーリング - ロード・トゥ・ザ・ホワイトハッカー

アンケートデータの場合、5段階の回答を求める場合、質問によっては、１に偏ったりする場合がある。各設問でばらつきがでないように調整するため。

スケーリングには、2種類ある。

数式に書くと。。。眠たくなるので、割愛。

アンケートデータのスケーリングでは、分散を等しくするために、標準化を使う。

pythonのscikit-learnのsklearnを使えば、2-3行のコードで実現できる。

以下が実際のコード

from sklearn import preprocessing
ss = preprocessing.StandardScaler()

#別のデータフレーム作成
questionnaire_s = pd.DataFrame(ss.fit_transform(questionnaire))

fit_transformでヘッダーの情報がなくなるので、コピーする。

#ヘッダー情報のコピー
questionnaire_s.columns = questionnaire.columns

一連を実行すると、以下の結果。

f:id:chikuwamaruX:20210814071836p:plain