線形回帰をしたいというか、最小二乗法で直線の傾きを求めたいのです。データとモデルの残差二乗和を定義してあげて、これを最小化するように最適化関数を使えば良いのですが、Rにはlm()という線形モデルを使った回帰分析を行ってくれる関数があります。
Rで回帰分析?
lm(従属変数 ~ 説明変数)で一発で傾きを出してくれて、決定係数なんかも計算してくれています。
統計に疎いので、lm()が出力してくれる結果(summary())の中身を知りたいのですが、いまいち正確に説明してくれるサイトがありません。
傾きと切片は最小二乗法で求めている?決定係数の求め方も書いてある。予測区間・信頼区間はどうやって計算している?p値は?
数ヶ月前にsummary()で返される値の計算方法を全て教えてくれたサイトがあったのですが、検索しても見つかりません。保存しておけばよかった。。
ほしい値
Residuals: 残差
Coefficients: 切片・傾きの推定値・標準誤差・t値?・p値
Residual standard error: 残差標準誤差
Multiple R-squared:
Adjusted R-squared:
F-statistic:
lm()のsummary()の例
Residuals: Min 1Q Median 3Q Max
Coefficients: Estimate Std. Error t value Pr(> | t | ) |
Residual standard error: xxxx on xxxx degrees of freedom
Multiple R-squared: xxxx
Adjusted R-squared: xxxx
F-statistic: xxxx on xxxx and xxxx DF, p-value: xxxx
参考になりそうなサイト
単回帰とグラフ・ビジュアライズ
R / lm 関数による単回帰分析 | R の lm 関数で単回帰を行う方法と信頼区間・予測区間の求め方
詳しい解説(pdfファイル)
回帰まとめ
(線形 or 単)回帰分析まとめ
回帰諸々の計算方法など
R言語サンプルデータまとめ
グラフ!
ggplot2 の stat_smooth で描かれる半透明の帯は標準誤差でなく信頼区間 - 廿TT
lm.R in GitHub
SurajGupta/r-source: R Source Code
lm()のコードを見ながら考えることになりそうです。