レビュー
16Personalitiesはどれだけ正確か──直接競合からの率直なレビュー
2026年3月4日・11分で読む・Mindshapeチーム
16Personalities(16P)は世界で最も使われている性格診断サイトの一つです。私たち(Mindshape)は直接競合で、率直に書きます。この記事の目的は「16Pを叩く」ことではなく、彼らが何を正しくやっているか、どこに限界があるか、ユーザーがいつ16Pを使うべきで、いつ別を選ぶべきかを誠実に整理することです。
16Personalitiesが正しくやっていること
1. UXとデザイン
16PのUXは業界の標準を作りました。シンプルな受検フロー、視覚的に魅力的な結果表示、共有しやすいタイプカード、深い理解への階層的な導線──多くの後発サービスはこれを模倣しています。MBTI界隈の入り口として、これ以上アクセスしやすいものはほとんどありません。
2. 結果の包括性
タイプごとに、性格特性、強みと弱み、恋愛、友情、子育て、キャリア、職場での振る舞いなど、多角的な解説を提供。これは膨大なコンテンツ作成の成果で、ユーザーが「自分を多面的に理解する」助けになります。
3. 大規模な検証データ
16Pは数千万単位の受検データを持ち、そのスケールで質問項目を継続的に最適化しています。心理測定学的に、これは小規模なテストよりも頑健な基盤を持つということです。
16Personalitiesの限界
1. NERISは独自モデルで、MBTIではない
これは多くのユーザーが知らない最も重要な事実です。16Pが使っているのは「NERIS Type Explorer」という独自モデルで、MBTI(マイヤーズ・ブリッグス)とは厳密には別物。タイプコード(INFJ-Tなど)と「-A/-T」の追加軸は、ビッグファイブの神経症傾向(Neuroticism)に類似した次元を統合した結果で、伝統的なMBTIにはありません。
問題ではないですが、知っていてほしい事実です。16Pで「INFJ-T」と出た人が、別のMBTI診断で「INFJ」(無印)と出ても矛盾ではありません。同じ4文字でも、背景のモデルが違うからです。
2. 査読論文がない
NERISモデルの妥当性に関する査読付き論文は、私たちが調べた範囲では公開されていません。これは「結果が間違っている」を意味しませんが、心理測定の妥当性を独立に検証できる学術的な土台がないということ。学術的な厳密さを求める人にとっては、重要な不足です。
3. 心理機能スタックを返さない
伝統的なMBTI(ユングのタイポロジー)の核は、4文字ではなく、その背後の心理機能スタック(Ni-Fe-Ti-Seなど)です。16Pは4文字(とアサーティブ/タービュレント)しか返さないため、ユング理論の「タイプの深い構造」にアクセスできません。
4. 単一フレームワーク固定
16PはMBTI的な16タイプモデルに固定されています。アタッチメント・スタイル、エニアグラム、ビッグファイブ、臨床的スクリーニング──これらは別途扱われません。複数のフレームワークを組み合わせて自己理解したいユーザーは、複数のサイトを行き来する必要があります。
5. 結果の言葉は時に「読みすぎ」る
16Pの結果は、ユーザーが「自分について読んでいる」と強く感じる書き方が上手です。これはバーナム効果(曖昧で広く当てはまる記述を「自分のことだ」と感じる現象)を活用している側面もあり、批判的なユーザーは「何にでも当てはまる」と感じることがあります。
どんなユーザーに16Pは合うか
性格論を初めて触る人
アクセシブルなUX、わかりやすい結果、無料の包括的な解説──MBTI入門として優れています。
視覚的・物語的な自己理解を求める人
アーキタイプ的なタイプ名(Advocate、Architectなど)と豊富な描写は、自分を物語として理解したい人に響きます。
深い学術的厳密性を求めていない人
「自己理解の出発点」「会話の道具」として使うなら、十分な品質を提供します。
どんなユーザーに別を勧めるか
心理機能スタックを知りたい人
16Pは返しません。ユングのタイポロジーを深く学びたい人は、Mindshape含め機能スタックを返す診断を使ってください。
学術的に検証された測定を求める人
ビッグファイブ(IPIP、HEXACOなど)の方が査読論文に支持された妥当性を持ちます。
複数フレームワークを統合したい人
MBTI、エニアグラム、アタッチメント、ビッグファイブ、臨床スクリーニングを一つの場所で受けたいなら、Mindshapeを含む複合プラットフォームの方が便利です。
臨床的な懸念がある人
16Pは性格診断であり、臨床スクリーニングは扱いません。うつ、不安、ADHD、トラウマなどの懸念がある場合、専用のスクリーニングを別途受ける必要があります。
Mindshapeとの違い(正直に)
Mindshapeは:(1)4文字に加えて8つの心理機能スコアを返す。(2)MBTI、エニアグラム、アタッチメント、ビッグファイブ、ラブランゲージ、ダーク・トライアド、複数の臨床スクリーニングを統合する。(3)すべての臨床スクリーニングは公開済みの研究器具(GAD-7、ITQ、MBI、ECRなど)に基づき、その出典を明示する。
一方、16Pは:(1)UXとビジュアルの磨き込みでMindshapeを大きく上回る。(2)タイプごとの解説の物語的な深さは、まだ16Pの方が豊か。(3)受検データのスケールで、心理測定学的な最適化の歴史が長い。
つまり、競合関係ではあっても、片方が「ダメ」で他方が「優れる」という単純な構図ではありません。何を求めているかで選ぶべきものが変わります。
よくある質問
16Personalitiesは「正確」ですか?
「正確さ」の定義によります。受検者が「自分のことを読んでいる」と感じる主観的な正確さは高い。一方、査読論文に支持された学術的妥当性は限定的で、独自のNERISモデルの心理測定的特性は外部から検証されていません。実用的な自己理解の道具としては有用、学術的な測定としては限界がある、と整理できます。
16PとMBTI公式版は同じですか?
いいえ。16Pは独自の「NERIS Type Explorer」を使っており、MBTI公式(MBTI Step I/Step II)とは別物です。タイプコード(INFJなど)は共通しますが、背景の質問項目、スコアリング、追加軸(-A/-T)は16P独自。
16Pで自分のタイプが出るたびに変わります。なぜ?
MBTI系の診断は、再テスト信頼性に構造的な限界があります。境界付近のスコアを持つ軸は、容易に逆側に出ます。これは16P固有の問題ではなく、MBTI系全般の特性です。詳しくは「MBTIタイプが変わる理由」の記事を参照してください。
「-A」と「-T」は何を測っていますか?
アサーティブ(Assertive)/タービュレント(Turbulent)はNERISが追加した独自の軸で、ビッグファイブの神経症傾向(Neuroticism)に類似した次元を測ります。低神経症傾向がA、高神経症傾向がT。伝統的なMBTIには存在しない軸です。
Mindshapeか16P、どちらを使うべき?
視覚的・物語的なMBTI入門なら16P。心理機能スタック、複数フレームワーク統合、出典明示の臨床スクリーニングを求めるならMindshape。両方を補完的に使うのも完全にありです。私たちは「乗り換えてください」とは言いません──ユースケースで選んでください。
Mindshapeを試す
心理機能スタック、複数フレームワーク統合、出典明示の臨床スクリーニング──Mindshapeのアプローチを実際に試してみてください。すべての診断は無料です。
この記事はMindshapeチームによる執筆です。教育目的の解説であり、医学的助言ではありません。