ベイズ統計学

特徴量選択の話

機械学習において、特徴量エンジニアリングは、モデルを選ぶのと同じくらい重要な作業です。既にある特徴量の中から、いらないモノを捨てる手法を紹介します。主に、統計学の力を使う手法の紹介です。
機械学習

ニューラルネットワークの概要

ニューラルネットワークを大体解説する記事です
機械学習

ロジスティック回帰の概要

理論的な話は置いておいて、ロジスティック回帰で何が出来るか、精度はどう見るのかを説明しています。
機械学習

回帰分析の概要

理論的な話は置いておいて、回帰分析で何が出来るか、精度はどう見るのかまどを説明しています。
未分類

何もない所でデータサイエンティストをすると大変という話

約1年データサイエンティストぽい仕事をしていたのですが、当時の苦労と解決法を書いておく事で、誰かしらの役に立つと思うので、残しておきます。
機械学習

[Excel][VBA]EMアルゴリズムと混合正規分布でデータを分類する1

データをクラスタリングする手法に、混合正規分布モデルがあります。それをVBAで実装する記事第一弾です。混合正規分布モデルとEMアルゴリズムの説明をして、VBAで実装します。
VBA

[Excel][VBA]ホテリングのT2理論で異常値を検出する

データの入力や計算、実行結果の表示など、全てがエクセルだけで完結する記事です。ホテリングのT2理論によって、異常値を検出する処理をVBAで行います。
計算

正規分布の事後分布に関する公式

変数yがxによって線形に生成されていると仮定し、xが正規分布に従っているとすると、p(y|x ) は正規分布に従います。この情報から事後分布を計算する事が出来ますが、事後分布も正規分布に従います。その計算の詳細を書いています。
ベイズ統計学

ベイズ主成分分析の話

次元の大きなデータの次元を圧縮する方法の一つに、主成分分析があります。確率論的に主成分分析を行う方法があり、同様にベイズ流に行う方法もあります。この記事では、簡単なモデルで、パラメーターの推定式を計算します。
Python R

PPCAで画像を圧縮してみる

確率論的主成分分析(PPCA)という手法があります。隠れ変数によってデータが生成されているモデルを考えて、小さな次元のデータから、元のデータを再現したり、似たデータを得る手法です。結果をまとめて、pythonで実装してみます。
タイトルとURLをコピーしました