【第５回】調査設計の基本２（設問の完成）

※ 『企業と人材』誌（産労総合研究所発行）に、2019年7月号から2020年6月号までの予定で『人材開発部門のデータ活用』を連載しています。誌面だと小さくなる図表を改めて掲載する他、誌面には掲載しきれない参考文献や参考情報を当ウェブサイトにて紹介します（毎月５日の発行日に合わせて公開）。連載本文PDF

【図１】　ディメンションから導いた設問の回答選択肢

【図２】　その他の設問の回答選択肢

【「そう思う」尺度（リッカート尺度）に関する突っ込んだ議論】

連載の今回では、設問を完成させるにあたり、「そう思う」かどうかを５段階で問う尺度を用いることを推奨しています。そして、それを１点～５点で点数化して、（平均や分散をとることを含めた）集計・分析につなげていくことを推奨しています。

文言を示した上で、それについて合意する度合いを選択させる尺度は一般的に、その考案者であるレンシス・リッカートの名をとって「リッカート尺度」と呼ばれます。（リッカートはサーベイ・フィードバックを創始した人であり、あるべき組織像とともに組織診断項目を開発した人であり、リーダーシップを測定するための「課題志向」と「人間関係志向」の２軸のディメンションを打ち出した人でもあります。）

リッカート尺度をそのまま点数化して（平均や分散を中心とするパラメトリックな）統計分析の基礎にしても良いのか、ということについては、統計学的な見地からは長年の議論がありますが、５段階が等間隔とみなされるよう文言にも配慮した上で（例えば、強くそう思う／ややそう思う／どちらともいえない／あまりそう思わない／全くそう思わない）、集計・分析段階では回答の分布をチェックしつつ（５点と１点に極端に分かれている等、平均をとることにまったく意味が感じられないような分布ということはないかどうか等）、積極的に統計手法を適用してゆけばよい、というのが本連載の立場です。何しろ圧倒的に利便性が高く、それに勝る方法がありません。

この議論を回避するために、５段階を「肯定的回答か／そうでないか」の２値に変換した上で集計したり、最初から５段階でなく「イエス／ノー」の２値で回答させたりする、といった方法もありますが、統計的な手続き上の議論を回避するためにデータの情報量を削減するという、本末転倒なことになってしまいます。経験的に言っても、２値に変換したからといって誤差などが改善するわけではなく、（情報量が低減することから）かえって悪化するのが普通です。一つの設問だけでの集計結果を（パラメトリックな分析に）用いることは避け、複数項目を足し合わせた集計結果だけを用いることが安全、という考え方についても同じことが言えます。

（なお、順序尺度を間隔尺度に変換するための手法として、リッカート尺度を提唱したリッカート自身によって考案された「シグマ値法」という手法も存在します。その手法では、５段階回答であれば、単に１点～５点とあてはめるのではなく、実際に得られた回答分布を正規分布にあてはめて、１から５の点数を調整するのです。しかし、実際の回答が得られてから、設問ごとに尺度を調整することは現実的ではありません。そこでリッカート自身、１点～５点の値をそのまま用いてもよいという簡便法を提案しています。）（2024/9/2補足：シグマ値法を考えるのならば、むしろ５段階回答の点数を全て標準化（Z値（または偏差値）に変換）してしまえばよい。近年私はその方法を採用し、強み／弱みの判定、特徴の判定にはそちらの値を用いることにしている。非常に妥当感の高い結果が得られる。）

◆

青森公立大学経営経済学部の村尾博准教授がこの問題を正面から扱っています。（社会調査において）アンケートの５段階の回答（順序尺度）を単純に１点~５点と数値化（間隔尺度化）して集計に用いる慣行に対して疑問を呈するとともに、順序尺度を間隔尺度として扱っても何ら問題ないという説を紹介しつつも、間隔尺度として扱ってよい根拠と、その条件（元データの分布が正規分布に近いものであること）を提示しています。

村尾博　『リッカート型項目データの間隔データとしての使用』
村尾博　『数段階のリッカート型データを間隔データとして使う場合の理論的根拠について』
村尾博　『リッカート型項目データの回帰への使用と通常最小２乗推定量』

（もっとも私は、「元データの分布は本来正規分布である必要がある」という仮定に疑問を持っています。元の回答分布と推定値の分布が同型の分布でなければならないとしたら、「イエスと答える人の割合」、あるいは「コイン投げで表が出る確率」といった、二項分布による推定値の議論はできなくなってしまうことになります。元の回答データの統計分布がどのようなものであるかによらず、「サンプルの平均値の平均値」である推定値は結局のところ正規分布になる、という「中心極限定理」の原則で考えてよいと思っています。）

◆

その他、リッカート尺度を初めとする尺度、そしてリッカート尺度を用いる上での注意については、楽天インサイト（株）の次のコラムに良くまとまっています。

田中庸介　『マーケティング・リサーチにおける「尺度」と「等間隔性」について』

◆

その他、次のような論文で議論がされていることを念頭に置いておけば、どんなツッコミが入っても万全でしょう。

増田真也・坂上貴之　『調査の回答における中間選択』
（「どちらとも言えない」という中間カテゴリの是非について）

脇田貴文・野口裕之　『Likert法における選択枝数の検討　―各選択肢の尺度値の観点から―』
（選択肢数の数と回答の信頼性との関係について）

脇田貴文　『評定尺度法におけるカテゴリ間の間隔について – 項目反応モデルを用いた評価方法』
井上信次　『選択肢間の距離に関する一考察　―尺度の等間隔性と非等間隔性―』
井上信次　『項目反応理論に基づく順序尺度の等間隔性――質問紙調査の回答選択肢（3～5 件法）の等間隔性と回答のしやすさ――』
織田揮準　『日本語の程度量表現用語に関する研究』
Carifio et al. 『Resolving the 50‐year debate around using and misusing Likert scales.』

【回答案内文面のサンプル】

回答案内の文面については、第３回でも紹介した次の書籍（英語）において、サンプル文面が下記の観点から何種類も掲載されており、参考になります。
John Kador, Katherine Armstrong　『Perfect Phrases for Writing Employee Surveys: Hundreds of Ready-to-Use Phrases to Help You Create Surveys Your Employees Answer Honestly, Complete』

このサーベイで何を問うのか／このサーベイのゴールは何か／サーベイが開始される旨のアナウンス／サーベイがスタートした旨のアナウンス／サーベイ回答にあたっての説明（目的／期待できること／個人は特定されないこと／回答にあたっての説明）／サーベイ回答へのお礼／今後のステップについて

【価値観のディメンション－キャリア・アンカーについて】

連載の本文において、組織や人を評価する設問に加えて、社員の選好や価値観を聞く設問を加えることも時に有益であり、中でも「自身のモチベーション源泉となる価値観を聞く設問」が有益なことを述べています。そのような設問として、キャリア・アンカーすなわち「自らのキャリアを選択する際に最も大切にしたい価値観や欲求」を選択させる設問を推奨しています。価値観の把握は重要であるにも関わらず、価値観の分類や設問の作成は難しいと言われますが、キャリア・アンカーは組織で働く上での価値観の有効な分類方法を与えており、言わば価値観のディメンションであると言えます。そこで、キャリア・アンカーの参考文献について触れておきます。

キャリア・アンカーの概念は、エドガー・シャインによって、次の書籍で提案されました。なおそこでは、キャリア・アンカーは８つでなく５つに分類されています。

エドガー・H. シャイン　『キャリア・ダイナミクス―キャリアとは、生涯を通しての人間の生き方・表現である。』

その後、８つへの再分類を経て、次において、４０項目（８つのキャリアアンカーをそれぞれ５つの文章で言い換えたもの）からなる自己診断テストとともにまとめられています。

エドガー・H. シャイン　『キャリア・アンカー―自分のほんとうの価値を発見しよう』

次では、自己診断テストのみが、若干の文言変更を経た上で、冊子としてまとめられています。

エドガー・H. シャイン　『キャリア・アンカー〈1〉セルフ・アセスメント』

私がこの概念を広く有効と思うのは、この概念は「キャリアの指向性」の分類のみならず、「今この職場でこの仕事をするにあたってのモチベーションの源泉」の分類を示しており、すなわち、「経営や上司が配慮すべき社員の価値観」をうまく分類・整理しているためです。

ただし、キャリア・アンカーは、提唱者のエドガー・シャインによって、経験則として提示されているのみであり、「なぜこの８つなのか」「８つのアンカーそれぞれの本質的な意味内容は何なのか」「８つに集約できるという実証的・統計的な根拠はあるのか」ということについて、答えは提示されてはいません。実証的な研究を経れば、心理的特性が５つにまとまるように、これも何故か「ビッグ・ファイブ」にまとまってしまう、という可能性は大であるように思います。（実際、エドガー・シャインは当初、５つのアンカーとして提示しました。）

よって、エドガー・シャインが提示したキャリア・アンカー概念そのものに厳密に拘る必要はありません。それを参考にしながら、自社独自の社員の価値観の分類を打ち立てることができれば、それでもよいのです。ただ、一般的に確立されている概念に準拠することには、価値観の気づきからその後の行動をガイドするにあたって様々なリソースを参照できるという大きなメリットがあり、その見地から、あえて変更を加えずにそのまま用いることが望ましいと言えます。

「自分自身のキャリア・アンカーが何かということをどのような尺度／質問紙で判定するか」ということについては、「８つのキャリア・アンカーを定義する文言を並べて単に選択させればよい」というのが本稿の立場です。８つのキャリア・アンカーを、文言を超えて実在する構成概念と見なすのであれば（＝実在論）、その実在を正しく表象し、測定するための文言・尺度が開発されなければならず、その尺度は（信頼性を確保するために）複数の尺度から構成されるのが妥当ということになります。心理学ではそのような考え方をとります。しかし、８つのキャリア・アンカーを単に文言として存在する概念と見なすのならば（＝唯名論）、単に８つのキャリア・アンカーの定義を並べて提示し、例えば、「『技術的・機能的能力 – 自分の専門性や技術が高まること』を選択する人が全体の中で○％であった」ということを論ずるだけで、十分であると言えます。（本連載は、科学ではない実務においては、唯名論で十分であり、またそれが（いたずらに抽象性を高めないために）適切であるという立場をとっています。よって、いわゆる「構成概念妥当性」の議論は、終始一貫してスキップしています。）

【第５回】調査設計の基本２（設問の完成）

コラムカテゴリー

最近のコラム