pandas のmelt関数の解説 | マサムネの部屋

エクセルにまとめられているような、横長のデータを縦長に変換する関数がpandasにあります。それがmeltです。meltの使い方について解説します。

melt関数を使う
melt関数の説明
コード再読
思ったこと

melt関数を使う

初めにpandas.melt のドキュメントのリンクを貼っておきます。

pandas.melt — pandas 3.0.4 documentation

使うデータは下の画像のようなデータです。¹

データは適当に作ったものです。
想定としては、実験データをexcelにまとめていて、timeからparam3 が実験の条件で、id1からid5が測定結果と、測定ヶ所を表しています。
このデータで、id1からid5という条件にも意味があり、さらに特徴量として扱いたい時にmelt関数が使えます。
例えば以下のように書くと所望の結果が出ます。


pd.melt(df,id_vars=df.columns.values[:4],var_name="id",value_name="massure" )

下記でmelt関数の引数の意味や性質について少し説明します。

melt関数の説明

公式ドキュメントでは以下のように説明されています。

pandas.melt(frame: pandas.core.frame.DataFrame, id_vars=None, value_vars=None, var_name=None, value_name=’value’, col_level=None) → pandas.core.frame.DataFram

Unpivot a DataFrame from wide to long format, optionally leaving identifiers set.

This function is useful to massage a DataFrame into a format where one or more columns are identifier variables (id_vars), while all other columns, considered measured variables (value_vars), are “unpivoted” to the row axis, leaving just two non-identifier columns, ‘variable’ and ‘value’.

分かるような分からないような書き方ですが、以下のようなことが出来ます。²