統計解析

3分で理解する!エクセルでの重回帰分析手順とエラーの対処法

本来複雑な計算が必要な「重回帰分析」を、エクセルで簡単に行いたくないですか?

この記事ではエクセルユーザではない人でもわかりやすく、エクセルを用いた重回帰分析の手順と結果の見方について図解します。

この記事を読めば、重回帰分析について深い知識が無くても、エクセルで重回帰分析を行えるようになります。

また、エラーが発生した場合の対処法についても解説しますので、参考にしてください。

重回帰分析とは

重回帰分析は、データ分析の一種で、複数の説明変数(影響を受ける要因)が目的変数(予測したい結果)にどのように影響するかを調べる統計手法です。

例えば、自動車の価格(目的変数)を予測するために、年式、走行距離、そしてエンジンの排気量を説明変数として使用する場合を考えてみます。

1.年式:一般的に新しいほど価格が高い傾向にあります。

2.走行距離:走行距離が少ないほど価格が高い傾向にあります。

3.エンジンの排気量:排気量が大きいほど価格が高い傾向にあります。

これらの要因を考慮して、重回帰分析を使って車の価格を予測します。 数式で表現すると、以下のようになります。

 自動車の価格=a×年式+b×走行距離+c×エンジンの排気量+誤差

a、b、cは各説明変数の重要度を表す係数です。これらが大きいほどその要因が自動車の価格に大きな影響を与えることを意味しています。 このように重回帰分析は、複数の要因が結果にどのように影響するのか、を調べるための統計手法です。

エクセルで重回帰分析を行うための事前準備

エクセルで重回帰分析を行うためには、事前準備が必要です。

エクセル上部の「ファイル」「オプション」をクリックして、開いたエクセルのオプション画面で「アドイン」から「Excelアドイン」「設定」をクリックします。

次に、開いたアドイン画面で「分析ツール」にチェックを入れて「OK」をクリックします。「データ」タブに「データ分析」が表示されれば事前準備は完了です。

エクセルで重回帰分析を行ってみる

実際にエクセルで重回帰分析を行ってみましょう。

前述のように、自動車の価格は一般的に、年式が新しい、走行距離が少ない、排気量が大きいほど高い傾向にあります。 それでは、具体的に年式が新しい、走行距離が少ない、排気量が大きいことがどの程度自動車の価格に影響があるのか、について重回帰分析を使って分析します。

以下の20台分の自動車の価格、年式、走行距離、排気量のデータを使用して、実際にエクセルで重回帰分析を行います。

エクセルの「データ」タブの「データ分析」をクリックして、開いたデータ分析ウィンドウで「回帰分析」を選択して「OK」をクリックします。 次に、回帰分析ウィンドウで、入力Y範囲に自動車の価格(目的変数)のセル入力X範囲に年式、走行距離、排気量のセルを入力して、出力オプションを指定「OK」をクリックします。 重回帰分析の結果が指定した出力先に表示されます。 これでエクセルでの重回帰分析は完了です。 次は出力された分析結果をどのように解釈すればよいか、について解説します。

エクセルで重回帰分析を行った結果の見方

エクセルでの重回帰分析の結果を見て、「たくさんの単語と数値が並んでいて、何が何だかわからない」と思う人も多いかもしれません。

そこで重回帰分析の結果で、特に着目すべき項目について解説します。これらの項目が理解できていれば実務で十分活用できますので、参考にしてください。

重決定R2

説明変数が目的変数の変動をどれだけ説明できるかを示す項目です。一般的なR2(決定係数)は説明変数を追加すると必ず増加しますが、重決定R2は説明変数の数やモデルの複雑度を考慮して、適切なモデル選択を可能にします。1に近い値ほど、モデルの適合度が高いことを示します。

補正R2

重決定R2をさらに補正した指標です。追加の説明変数がモデルに本当に貢献しているかを考慮して、モデルの適合度を調整します。モデルが複雑になると、重決定R2が過大評価されることがあるため、補正R2はその評価をよりバランスの取れたものとします。

係数

各説明変数の影響度を示す数値です。正の係数は説明変数が目的変数に正の影響を持ち、負の係数は負の影響を持つことを示します。係数の大きさは、その説明変数が目的変数に与える影響の大きさを示します。

p値

各説明変数の係数が統計的に有意かどうかを評価する指標です。p値が小さいほど、その変数はモデルに対して統計的に有意な影響を持つと言えます。通常、0.05以下のp値は有意とされます。

95%信頼区間の下限・上限

各説明変数の係数に関する信頼性を示す区間です。信頼区間の下限と上限は、その係数の真の値が含まれる範囲を示します。信頼区間が狭いほど、係数の推定値が信頼性が高いことを示し、モデルの予測の信頼性が高まります。

エクセルで重回帰分析を行う際のエラーに対する対処例

重回帰分析をエクセルで比較的簡単に行うことができますが、何らかの理由でエラーとなり、分析ができないケースがあります。ここでは3つのエラーとその対処例について解説します。

エラー例1:回帰分析入力範囲に数値以外のデータがある

このエラーは、入力範囲のデータに数値以外のデータがある場合に発生します。多くの場合は文字列として認識されています。以下では黄色セルが文字列として認識されています。 対処法としては、データ全てを数値に変換して重回帰分析を行う必要があります。文字列から数値への変換は、エクセルのvalue関数を使えば簡単に変換できます。 データ全てを数値に変換して、そのデータに対して重回帰分析を行えば、正常に分析を行うことができます。

エラー例2:回帰分析LINEST()関数エラー

このエラーは、入力範囲に空白がある場合に発生します。以下では黄色セルが空白です。 対処法としては、空白セルまたは行を除いて重回帰分析を行う必要があります。重回帰分析の入力範囲から空白セルまたは行を除いた範囲を指定して実行します。 空白セルまたは行を除いたデータ範囲に対して重回帰分析を行えば正常に分析を行うことができます。

エラー例3:重回帰分析の結果が0や#NUM!と表示される

このエラーは、データポイント数が少ない場合に発生します。以下の赤四角が解析結果にエラー表示があるセルです。 対処法としては、データポイント数を増やして重回帰分析を行う必要があります。一般的な統計的ガイドラインでは、データポイント数は説明変数の数よりも多い必要があり、一般的には最低でも5倍以上がよいとされています。

重回帰分析の活用例

重回帰分析はさまざまな分野で活用されています。ここでは具体的にどのように活用されているのか、5つの例を紹介します。

活用例1:不動産価格の予測

不動産市場では、多くの要因が住宅価格に影響を与えます。立地、築年数、部屋の広さや数、駐車場の有無などがその要因として考えられます。重回帰分析は、立地、築年数、部屋の広さ、部屋の数、駐車場の有無などを説明変数として、目的変数である不動産価格の予測に役立てられます。

活用例2:マーケティング予測

マーケティング分野では、広告費の投資と売上の関係を調査して、将来の売上予測のために重回帰分析が用いられます。広告費、季節性、競合他社の影響などを説明変数として分析が行われます。

活用例3:医療データ解析

医療分野において、患者の症状、治療法、生活習慣、遺伝子情報などが病気の進行や治療効果に影響を与えます。これらの要因を考慮して、病気の進行予測や治療の効果を評価するために、重回帰分析が活用されます。

1からわかる!最小二乗法とエクセルlinest関数を理解するエクセルで最小二乗法を使用して単回帰分析したい方へ、その方法をわかりやすく解説します。関数で解決するためのlinest関数の使い方、そして関数を使わない簡単な方法も考えてみます。...

エクセルで重回帰分析を行う手順まとめ

この記事では、エクセルで重回帰分析を行う手順について解説しました。

エクセルのデータ分析機能を使えば、説明変数と目的変数を設定することで比較的簡単に重回帰分析を実行できます。

結果については①重決定R2、②補正R2、③係数、④P値、⑤95%信頼区間の下限・上限に着目すれば、実務で十分活用できます。

重回帰分析はさまざまな分野で有益な統計手法です。エクセルでの重回帰分析は簡単に実行できる反面、その結果の見方についてある程度把握できていないと誤った分析を行うことにつながるので、この記事で解説した内容は把握して、実務で活用しましょう。